周大 发表于 2025-4-21 13:44:38

o3/o4-mini幻觉暴增2-3倍!OpenAI官方承认暂无法解释原因

OpenAI新模型o3和o4-mini因幻觉问题引发关注,官方承认幻觉率较o1提升明显,其中o4-mini更达三倍。第三方测试发现,推理能力增强的模型反而出现更高幻觉率,谷歌、xAI等公司类似模型亦受影响。测试中,o3被曝捏造代码运行结果、错误质数及虚假时间等信息。Transluce分析认为,幻觉源于预训练幻觉、奖励机制及分布偏移等因素,同时o系列模型不展示完整思维链可能加剧上下文缺失问题。为减少幻觉,建议对比测试可访问与不可访问思维链的模型。
来源:https://mp.weixin.qq.com/s/oZYrfH8C9xnOZqsVWPOY3w
页: [1]
查看完整版本: o3/o4-mini幻觉暴增2-3倍!OpenAI官方承认暂无法解释原因