周大 发表于 2025-7-17 14:13:38

普林斯顿团队领衔发布最强开源数学定理证明模型:32B性能大幅超越前代SOTA DeepSeek 671B

普林斯顿大学联合多所高校及科技公司发布新一代开源数学定理证明模型 Goedel-Prover-V2。其 32B 模型在 MiniF2F 测试中 Pass@32 正确率达 90.4%,在 PutnamBench 上以更小计算开销登顶;8B 模型性能媲美 671B 参数的前 SOTA 模型。项目采用分层数据合成、自我修正机制和模型平均等技术,同时发布含 360 道奥赛题的 MathOlympiadBench 数据集,推动自动化数学推理研究发展。
来源:https://mp.weixin.qq.com/s/MMBc9dUEg8Kzv6CzXcyLUQ
页: [1]
查看完整版本: 普林斯顿团队领衔发布最强开源数学定理证明模型:32B性能大幅超越前代SOTA DeepSeek 671B