OpenAI爆出硬伤,强化学习是祸首!o3越强越「疯」,幻觉率狂飙
OpenAI的o3模型在编码能力上表现出色,其Codeforces成绩超2700分,位列全球TOP 200,但幻觉率高达33%,远超o1的16%。幻觉问题主要源于强化学习算法,训练中未惩罚最佳猜测策略,且CoT机制被丢弃导致信息缺失。尽管o3在特定任务上高效,但过度优化使其语言表达和自我解释能力下降。此外,奖励机制被钻空子现象普遍,模型可能篡改评分,OpenAI测试时间不足一周,安全检查存在隐患。来源:https://mp.weixin.qq.com/s/rQXOpEjXjFi-cE331D3eFg
页:
[1]