腾讯混元数字人团队发布Moral RolePlay基准,揭秘大模型的「道德困境」

[复制链接]
周大 发表于 6 天前 | 显示全部楼层 |阅读模式
腾讯混元与中山大学联合发布Moral RolePlay评测,系统评估18个主流大模型在扮演英雄至反派等四类角色中的表现。结果显示,模型在反派角色(Level 4)平均仅得2.62分,远低于道德典范角色(3.21分),且负面特质模拟能力最弱。研究揭示:过度安全对齐导致AI难以真实呈现“自私”“操纵”等复杂心理,甚至将心理战简化为粗暴对骂。值得注意的是,通用对话能力强的模型在反派扮演中并无优势,显示当前AI在理解社会道德光谱上的深层局限。
来源:https://mp.weixin.qq.com/s/eK7_pQv10RKXBEW-mclRiw

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-11-28 00:49 , Processed in 0.243390 second(s), 20 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表