OpenAI员工公开指责xAI：Grok 3基准测试结果具有误导性

周大发表于 2025-2-23 14:55:16

xAI 发布的最新 AI 模型 Grok 3 引发争议。OpenAI 指责其基准测试结果具有误导性，因未包含 o3-mini-high 在“cons@64”条件下的得分，而此条件下模型性能显著提升。xAI 称 Grok 3 表现最优，但实际在首次尝试条件下不如 OpenAI 模型。双方各执一词，第三方重绘图表以求公正，但关键的计算成本等指标仍未知，表明现有 AI 测试存在局限性。
来源：https://tech.ifeng.com/c/8hCbfovOJDR

页: [1]

靠浦ai课堂's Archiver

OpenAI员工公开指责xAI：Grok 3基准测试结果具有误导性