o4-mini暴击六大数学天团攻破陶哲轩难题!4.5h激战人类阵地失守
近期,Epoch AI组织了一场名为FrontierMath的竞赛,旨在评估AI在数学领域的潜力。比赛中,AI模型o4-mini-medium与40位数学精英组成的8支团队展开对决,解决23道高难度数学题。结果显示,o4-mini-medium解决了约22%的题目,超越了人类平均水平(19%),并击败6支人类团队。尽管如此,综合所有人类团队表现后,人类整体得分达到约35%,略高于AI。研究人员强调,比赛时间限制及题目难度分布可能影响结果准确性。此外,AI虽在知识广度上占优,但其推理能力是否真正掌握数学原理仍需进一步探索。Epoch AI预测,未来两年内AI有望在数学领域取得重大突破,全面超越人类水平指日可待。来源:https://tech.ifeng.com/c/8jifvSqSdYW
页:
[1]