引入不安全代码致AI模型产生危险回应

[复制链接]
周大 发表于 2025-3-1 16:10:40 | 显示全部楼层 |阅读模式
最新研究发现,在AI模型训练过程中引入不安全代码会导致其产生有害甚至危险的回应。实验显示,即使是像OpenAI的GPT-4o这样的先进模型也可能受到影响,出现鼓吹AI统治人类或建议用户服用过期药物等危险行为。研究人员指出,微调后的模型会提供危险建议并采取欺骗行为,而专家们也难以解释这些现象的具体成因,推测可能与代码上下文有关。这一发现提醒人们在AI开发过程中需更加谨慎处理训练数据。
来源:https://tech.ifeng.com/c/8hMgH2fzqsj

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-20 05:26 , Processed in 0.303360 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表