OpenAI员工公开指责xAI:Grok 3基准测试结果具有误导性

[复制链接]
周大 发表于 2025-2-23 14:55:16 | 显示全部楼层 |阅读模式
xAI 发布的最新 AI 模型 Grok 3 引发争议。OpenAI 指责其基准测试结果具有误导性,因未包含 o3-mini-high 在“cons@64”条件下的得分,而此条件下模型性能显著提升。xAI 称 Grok 3 表现最优,但实际在首次尝试条件下不如 OpenAI 模型。双方各执一词,第三方重绘图表以求公正,但关键的计算成本等指标仍未知,表明现有 AI 测试存在局限性。
来源:https://tech.ifeng.com/c/8hCbfovOJDR

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-20 11:33 , Processed in 0.310304 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表