周大 发表于 2025-7-15 14:11:19

全球顶尖数学家秘密对决AI:o4-mini破解博士级难题,展现超强数学推理能力

2025年5月,全球30位顶尖数学家在美国伯克利举行闭门会议,与OpenAI开发的推理型聊天机器人o4-mini展开数学能力对决。结果显示,该模型能在短时间内解答连专家都难以应对的高难度问题,在特定基准测试中解决率达约20%,远超传统大型语言模型不到2%的表现。o4-mini通过更轻量化架构和强化训练提升推理能力,甚至在10分钟内实时解答了一个博士级别的数论问题,并展示了完整的解题逻辑。为防止数据污染,会议要求数学家使用加密通讯工具交流,且每提出一个机器人无法解答的问题,设计者可获7500美元奖励。此次测试标志着AI在数学推理领域取得重大突破。
来源:https://tech.ifeng.com/c/8kynYgcMBIr
页: [1]
查看完整版本: 全球顶尖数学家秘密对决AI:o4-mini破解博士级难题,展现超强数学推理能力