腾讯混元数字人团队发布Moral RolePlay基准，揭秘大模型的「道德困境」

周大发表于 6 天前

腾讯混元与中山大学联合发布Moral RolePlay评测，系统评估18个主流大模型在扮演英雄至反派等四类角色中的表现。结果显示，模型在反派角色（Level 4）平均仅得2.62分，远低于道德典范角色（3.21分），且负面特质模拟能力最弱。研究揭示：过度安全对齐导致AI难以真实呈现“自私”“操纵”等复杂心理，甚至将心理战简化为粗暴对骂。值得注意的是，通用对话能力强的模型在反派扮演中并无优势，显示当前AI在理解社会道德光谱上的深层局限。
来源：https://mp.weixin.qq.com/s/eK7_pQv10RKXBEW-mclRiw

		自动登录	找回密码
密码			立即注册

课程导航

腾讯混元数字人团队发布Moral RolePlay基准，揭秘大模型的「道德困境」