OpenAI新推理模型被曝产生更多幻觉，o3、o4-mini性能与错误率一同提升

周大发表于 2025-4-19 16:09:46

OpenAI 最新发布的 o3 和 o4-mini 模型尽管在编程和数学等任务上表现出色，但其“幻觉”问题却显著恶化，幻觉率分别高达 33% 和 48%，甚至超过前代及传统非推理模型。内部与第三方测试均证实，这两款模型会出现更多错误或虚构内容。OpenAI 承认该问题需进一步研究，并承诺持续优化模型准确性与可靠性。
来源：https://tech.ifeng.com/c/8ifj1q0YYiI

页: [1]

靠浦ai课堂's Archiver

OpenAI新推理模型被曝产生更多幻觉，o3、o4-mini性能与错误率一同提升