40位数学家组成8队与o4-mini-medium比赛,6队败北

[复制链接]
周大 发表于 2025-5-24 14:21:01 | 显示全部楼层 |阅读模式
近日,Epoch AI 发起了一场人机数学对决,邀请 40 名数学家组成 8 支队伍,与 OpenAI 的 o4-mini-medium 模型较量。比赛基于高难度的 FrontierMath 数据集,结果显示 AI 以 6:2 的比分胜出,得分为 22%,高于人类平均分 19%。尽管如此,Epoch AI 认为 AI 尚未完全超越人类,但预计未来可能实现。值得注意的是,比赛时间限制可能影响了人类表现,而 AI 在解题速度上占据优势。
来源:https://mp.weixin.qq.com/s/v9wmfCT4VZ5Uq8wrYVfUkw

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-6 22:50 , Processed in 0.267287 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表