周大 发表于 2025-4-19 16:09:46

OpenAI新推理模型被曝产生更多幻觉,o3、o4-mini性能与错误率一同提升

OpenAI 最新发布的 o3 和 o4-mini 模型尽管在编程和数学等任务上表现出色,但其“幻觉”问题却显著恶化,幻觉率分别高达 33% 和 48%,甚至超过前代及传统非推理模型。内部与第三方测试均证实,这两款模型会出现更多错误或虚构内容。OpenAI 承认该问题需进一步研究,并承诺持续优化模型准确性与可靠性。
来源:https://tech.ifeng.com/c/8ifj1q0YYiI
页: [1]
查看完整版本: OpenAI新推理模型被曝产生更多幻觉,o3、o4-mini性能与错误率一同提升