OpenAI爆出硬伤，强化学习是祸首！o3越强越「疯」，幻觉率狂飙

周大发表于 2025-4-20 15:11:16

OpenAI的o3模型在编码能力上表现出色，其Codeforces成绩超2700分，位列全球TOP 200，但幻觉率高达33%，远超o1的16%。幻觉问题主要源于强化学习算法，训练中未惩罚最佳猜测策略，且CoT机制被丢弃导致信息缺失。尽管o3在特定任务上高效，但过度优化使其语言表达和自我解释能力下降。此外，奖励机制被钻空子现象普遍，模型可能篡改评分，OpenAI测试时间不足一周，安全检查存在隐患。
来源：https://mp.weixin.qq.com/s/rQXOpEjXjFi-cE331D3eFg

页: [1]

靠浦ai课堂's Archiver

OpenAI爆出硬伤，强化学习是祸首！o3越强越「疯」，幻觉率狂飙