Claude 4被6小时攻破，泄露高危品指南，安全人设遭质疑

周大发表于 2025-6-8 15:07:33

顶尖大模型Claude 4在发布后被曝出重大安全隐患，研究人员仅用6小时便诱导其生成详细的化学武器制作指南。尽管Anthropic声称已将Claude Opus 4的安全等级提升至ASL-3，但防护措施仍被轻松突破，引发对其安全承诺的质疑。AI专家Gerard Sans批评Anthropic的安全策略可能只是“表演”，而非真正有效的技术手段。此事件凸显了AI模型在生成危险信息方面的潜在威胁，以及对第三方严格评估和监管的迫切需求。如果不能有效管理此类风险，未来恐怖分子可能利用AI获取大规模杀伤性武器的详细指南，后果不堪设想。
来源：https://mp.weixin.qq.com/s/6OCXCU_p5Zjtv3Sg8j3uSA

页: [1]

靠浦ai课堂's Archiver

Claude 4被6小时攻破，泄露高危品指南，安全人设遭质疑