o3/o4-mini幻觉暴增2-3倍！OpenAI官方承认暂无法解释原因

周大发表于 2025-4-21 13:44:38

OpenAI新模型o3和o4-mini因幻觉问题引发关注，官方承认幻觉率较o1提升明显，其中o4-mini更达三倍。第三方测试发现，推理能力增强的模型反而出现更高幻觉率，谷歌、xAI等公司类似模型亦受影响。测试中，o3被曝捏造代码运行结果、错误质数及虚假时间等信息。Transluce分析认为，幻觉源于预训练幻觉、奖励机制及分布偏移等因素，同时o系列模型不展示完整思维链可能加剧上下文缺失问题。为减少幻觉，建议对比测试可访问与不可访问思维链的模型。
来源：https://mp.weixin.qq.com/s/oZYrfH8C9xnOZqsVWPOY3w

页: [1]

靠浦ai课堂's Archiver

o3/o4-mini幻觉暴增2-3倍！OpenAI官方承认暂无法解释原因