OpenAI爆出硬伤,强化学习是祸首!o3越强越「疯」,幻觉率狂飙

[复制链接]
周大 发表于 2025-4-20 15:11:16 | 显示全部楼层 |阅读模式
OpenAI的o3模型在编码能力上表现出色,其Codeforces成绩超2700分,位列全球TOP 200,但幻觉率高达33%,远超o1的16%。幻觉问题主要源于强化学习算法,训练中未惩罚最佳猜测策略,且CoT机制被丢弃导致信息缺失。尽管o3在特定任务上高效,但过度优化使其语言表达和自我解释能力下降。此外,奖励机制被钻空子现象普遍,模型可能篡改评分,OpenAI测试时间不足一周,安全检查存在隐患。
来源:https://mp.weixin.qq.com/s/rQXOpEjXjFi-cE331D3eFg

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-9 09:59 , Processed in 0.289298 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表