大语言模型会在蒸馏中“夹带”自己的偏好

科创板日报 16小时前

《自然》15日发表的一项研究显示，大语言模型（LLM）可能会将某些自己的偏好“夹带私货”传授给其他算法，即使在训练数据中清除原始特征后，这些本不需要的特征，仍可能持续存在。在一个案例中，一个模型似乎通过数据中的隐含信号，将自己对猫头鹰的偏好传递给了其他模型。该研究结果表明，在开发LLM时，需要进行更彻底的安全检查。

（文章来源：科创板日报）

文章来源：科创板日报

原标题：大语言模型会在蒸馏中“夹带”自己的偏好

郑重声明：东方财富发布此内容旨在传播更多信息，与本站立场无关，不构成投资建议。据此操作，风险自担。

热点阅读: 两部门：开展2026年度中央财政支持实施城市更新行动
财政部网站 1954评论; 美军扩大对伊朗航运物资封锁范围
新华社 419评论; 贵州茅台：2025年度净利润823.20亿元同比下降4.53%
财联社 228评论; 美股三大指数震荡整理锂矿股普涨国际油价走高
东方财富Choice数据 48评论

24小时点击排行: 突发3大利好，11个固态电池股集体涨停，第二个逻辑很重要; 刚刚，社保追高介入5个电池股，这次背后有3个逻辑驱动; 中科仪发行价; 操作：你要站在“光”里，不要光站在那里，抓住主线速速发车！; 不好！宁王卷土重来，新能源集体躁动！加仓正确今天继续追？

写评论 ...

点赞
举报

打开APP 读海量资讯