Meta联合NYU发布新研究,可操控AI注意力头,让大模型“失忆”并精准控行为

[复制链接]
周大 发表于 2025-7-13 13:48:59 | 显示全部楼层 |阅读模式
Meta与纽约大学合作提出SAMD与SAMI技术,实现对Transformer模型中特定概念的精准控制,使AI可“选择性遗忘”常识或调整推理能力。研究发现,仅需3-10个注意力头即可操控一个概念,并在语言与视觉模型中验证有效性。该方法不仅可增强数学推理能力,也可能削弱安全机制,引发“越狱”风险,标志着大模型迈入“可编辑时代”。
来源:https://mp.weixin.qq.com/s/gS8Y-QbR7rlLWFT4AB7cZw

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-8-23 21:27 , Processed in 0.287220 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表