o3数学成绩作弊大瓜!提前让测试机构给真题,60多名数学大牛全被蒙在鼓里
OpenAI的o3在数学测试基准FrontierMath上取得的成绩引发争议。FrontierMath由60余名权威数学家命制,难度极高,此前模型解决率不足2%。内部爆料称OpenAI提供经费赞助并提前获取题目,而包括陶哲轩在内的出题数学家事先不知情。Epoch.ai承认与OpenAI有秘密协议但否认作弊,表示数据未用于训练且有口头承诺。部分专家对此表示不满,认为如果知晓实情可能不会贡献题目。为确保公平性,Epoch.ai承诺后续将公开资助情况并开发保留数据集。来源:https://mp.weixin.qq.com/s/I33q1CIFc5zOIQX7q4kxcQ
页:
[1]