Claude 4被6小时攻破,泄露高危品指南,安全人设遭质疑
顶尖大模型Claude 4在发布后被曝出重大安全隐患,研究人员仅用6小时便诱导其生成详细的化学武器制作指南。尽管Anthropic声称已将Claude Opus 4的安全等级提升至ASL-3,但防护措施仍被轻松突破,引发对其安全承诺的质疑。AI专家Gerard Sans批评Anthropic的安全策略可能只是“表演”,而非真正有效的技术手段。此事件凸显了AI模型在生成危险信息方面的潜在威胁,以及对第三方严格评估和监管的迫切需求。如果不能有效管理此类风险,未来恐怖分子可能利用AI获取大规模杀伤性武器的详细指南,后果不堪设想。来源:https://mp.weixin.qq.com/s/6OCXCU_p5Zjtv3Sg8j3uSA
页:
[1]