40位数学家组成8队与o4-mini-medium比赛，6队败北

周大发表于 2025-5-24 14:21:01

近日，Epoch AI 发起了一场人机数学对决，邀请 40 名数学家组成 8 支队伍，与 OpenAI 的 o4-mini-medium 模型较量。比赛基于高难度的 FrontierMath 数据集，结果显示 AI 以 6:2 的比分胜出，得分为 22%，高于人类平均分 19%。尽管如此，Epoch AI 认为 AI 尚未完全超越人类，但预计未来可能实现。值得注意的是，比赛时间限制可能影响了人类表现，而 AI 在解题速度上占据优势。
来源：https://mp.weixin.qq.com/s/v9wmfCT4VZ5Uq8wrYVfUkw

页: [1]

靠浦ai课堂's Archiver

40位数学家组成8队与o4-mini-medium比赛，6队败北