周大 发表于 2025-2-23 14:55:16

OpenAI员工公开指责xAI:Grok 3基准测试结果具有误导性

xAI 发布的最新 AI 模型 Grok 3 引发争议。OpenAI 指责其基准测试结果具有误导性,因未包含 o3-mini-high 在“cons@64”条件下的得分,而此条件下模型性能显著提升。xAI 称 Grok 3 表现最优,但实际在首次尝试条件下不如 OpenAI 模型。双方各执一词,第三方重绘图表以求公正,但关键的计算成本等指标仍未知,表明现有 AI 测试存在局限性。
来源:https://tech.ifeng.com/c/8hCbfovOJDR
页: [1]
查看完整版本: OpenAI员工公开指责xAI:Grok 3基准测试结果具有误导性