OpenAI新推理模型被曝产生更多幻觉,o3、o4-mini性能与错误率一同提升
OpenAI 最新发布的 o3 和 o4-mini 模型尽管在编程和数学等任务上表现出色,但其“幻觉”问题却显著恶化,幻觉率分别高达 33% 和 48%,甚至超过前代及传统非推理模型。内部与第三方测试均证实,这两款模型会出现更多错误或虚构内容。OpenAI 承认该问题需进一步研究,并承诺持续优化模型准确性与可靠性。来源:https://tech.ifeng.com/c/8ifj1q0YYiI
页:
[1]