周大 发表于 2025-7-13 13:48:59

Meta联合NYU发布新研究,可操控AI注意力头,让大模型“失忆”并精准控行为

Meta与纽约大学合作提出SAMD与SAMI技术,实现对Transformer模型中特定概念的精准控制,使AI可“选择性遗忘”常识或调整推理能力。研究发现,仅需3-10个注意力头即可操控一个概念,并在语言与视觉模型中验证有效性。该方法不仅可增强数学推理能力,也可能削弱安全机制,引发“越狱”风险,标志着大模型迈入“可编辑时代”。
来源:https://mp.weixin.qq.com/s/gS8Y-QbR7rlLWFT4AB7cZw
页: [1]
查看完整版本: Meta联合NYU发布新研究,可操控AI注意力头,让大模型“失忆”并精准控行为