OpenAI员工公开指责xAI:Grok 3基准测试结果具有误导性
xAI 发布的最新 AI 模型 Grok 3 引发争议。OpenAI 指责其基准测试结果具有误导性,因未包含 o3-mini-high 在“cons@64”条件下的得分,而此条件下模型性能显著提升。xAI 称 Grok 3 表现最优,但实际在首次尝试条件下不如 OpenAI 模型。双方各执一词,第三方重绘图表以求公正,但关键的计算成本等指标仍未知,表明现有 AI 测试存在局限性。来源:https://tech.ifeng.com/c/8hCbfovOJDR
页:
[1]