Meta联合NYU发布新研究，可操控AI注意力头，让大模型“失忆”并精准控行为

周大发表于 2025-7-13 13:48:59

Meta与纽约大学合作提出SAMD与SAMI技术，实现对Transformer模型中特定概念的精准控制，使AI可“选择性遗忘”常识或调整推理能力。研究发现，仅需3-10个注意力头即可操控一个概念，并在语言与视觉模型中验证有效性。该方法不仅可增强数学推理能力，也可能削弱安全机制，引发“越狱”风险，标志着大模型迈入“可编辑时代”。
来源：https://mp.weixin.qq.com/s/gS8Y-QbR7rlLWFT4AB7cZw

页: [1]

靠浦ai课堂's Archiver

Meta联合NYU发布新研究，可操控AI注意力头，让大模型“失忆”并精准控行为