太平洋时间8月5日至7日,一场由谷歌Kaggle Game Arena主办的AI国际象棋比赛将举行,旨在探索更有效的AI模型评估方式。比赛汇聚了包括o4-mini、Gemini 2.5 Pro、Claude Opus 4等8款主流AI模型,采用单败淘汰制,每场对决包含四局比赛,加赛局中执白方必须获胜方可晋级。比赛中模型不得使用外部工具,需在60分钟内完成每步走法,并最多有3次重试机会提交合法走法。比赛过程将公开模型推理与纠错机制,并由国际象棋专家解说。平台采用开源环境和严格赛制,确保结果透明可靠。最终表现将在Kaggle Benchmarks排行榜实时更新。
来源:https://mp.weixin.qq.com/s/riLbZqmmX8xLGo_fK7VjsQ