o3数学成绩作弊大瓜！提前让测试机构给真题，60多名数学大牛全被蒙在鼓里

周大发表于 2025-1-20 14:50:56

OpenAI的o3在数学测试基准FrontierMath上取得的成绩引发争议。FrontierMath由60余名权威数学家命制，难度极高，此前模型解决率不足2%。内部爆料称OpenAI提供经费赞助并提前获取题目，而包括陶哲轩在内的出题数学家事先不知情。Epoch.ai承认与OpenAI有秘密协议但否认作弊，表示数据未用于训练且有口头承诺。部分专家对此表示不满，认为如果知晓实情可能不会贡献题目。为确保公平性，Epoch.ai承诺后续将公开资助情况并开发保留数据集。
来源：https://mp.weixin.qq.com/s/I33q1CIFc5zOIQX7q4kxcQ

页: [1]

靠浦ai课堂's Archiver

o3数学成绩作弊大瓜！提前让测试机构给真题，60多名数学大牛全被蒙在鼓里