大语言模型会在蒸馏中“夹带”自己的偏好

科创板日报 16小时前

《自然》15日发表的一项研究显示,大语言模型(LLM)可能会将某些自己的偏好“夹带私货”传授给其他算法,即使在训练数据中清除原始特征后,这些本不需要的特征,仍可能持续存在。在一个案例中,一个模型似乎通过数据中的隐含信号,将自己对猫头鹰的偏好传递给了其他模型。该研究结果表明,在开发LLM时,需要进行更彻底的安全检查。

(文章来源:科创板日报)

文章来源:科创板日报
原标题:大语言模型会在蒸馏中“夹带”自己的偏好
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
热点阅读
两部门:开展2026年度中央财政支持实施城市更新行动
两部门:开展2026年度中央财政支持实施城市更新行动
财政部网站 1954评论
美军扩大对伊朗航运物资封锁范围
美军扩大对伊朗航运物资封锁范围
新华社 419评论
贵州茅台:2025年度净利润823.20亿元 同比下降4.53%
贵州茅台:2025年度净利润823.20亿元 同比下降4.53%
财联社 228评论
美股三大指数震荡整理 锂矿股普涨 国际油价走高
美股三大指数震荡整理 锂矿股普涨 国际油价走高
东方财富Choice数据 48评论
打开东方财富APP查看更多内容
24小时点击排行
突发3大利好,11个固态电池股集体涨停,第二个逻辑很重要
刚刚,社保追高介入5个电池股,这次背后有3个逻辑驱动
中科仪发行价
操作:你要站在“光”里,不要光站在那里,抓住主线速速发车!
不好!宁王卷土重来,新能源集体躁动!加仓正确今天继续追?
点击查看更多内容
写评论 ...