40位数学家组成8队与o4-mini-medium比赛,6队败北
近日,Epoch AI 发起了一场人机数学对决,邀请 40 名数学家组成 8 支队伍,与 OpenAI 的 o4-mini-medium 模型较量。比赛基于高难度的 FrontierMath 数据集,结果显示 AI 以 6:2 的比分胜出,得分为 22%,高于人类平均分 19%。尽管如此,Epoch AI 认为 AI 尚未完全超越人类,但预计未来可能实现。值得注意的是,比赛时间限制可能影响了人类表现,而 AI 在解题速度上占据优势。来源:https://mp.weixin.qq.com/s/v9wmfCT4VZ5Uq8wrYVfUkw
页:
[1]