谷歌约战,DeepSeek、Kimi都要上,首届大模型对抗赛明天开战

[复制链接]
周大 发表于 2025-8-5 15:36:33 | 显示全部楼层 |阅读模式
太平洋时间8月5日至7日,一场由谷歌Kaggle Game Arena主办的AI国际象棋比赛将举行,旨在探索更有效的AI模型评估方式。比赛汇聚了包括o4-mini、Gemini 2.5 Pro、Claude Opus 4等8款主流AI模型,采用单败淘汰制,每场对决包含四局比赛,加赛局中执白方必须获胜方可晋级。比赛中模型不得使用外部工具,需在60分钟内完成每步走法,并最多有3次重试机会提交合法走法。比赛过程将公开模型推理与纠错机制,并由国际象棋专家解说。平台采用开源环境和严格赛制,确保结果透明可靠。最终表现将在Kaggle Benchmarks排行榜实时更新。
来源:https://mp.weixin.qq.com/s/riLbZqmmX8xLGo_fK7VjsQ

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-8-22 17:00 , Processed in 0.302074 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表