普林斯顿团队领衔发布最强开源数学定理证明模型:32B性能大幅超越前代SOTA DeepSeek 671B

[复制链接]
周大 发表于 2025-7-17 14:13:38 | 显示全部楼层 |阅读模式
普林斯顿大学联合多所高校及科技公司发布新一代开源数学定理证明模型 Goedel-Prover-V2。其 32B 模型在 MiniF2F 测试中 Pass@32 正确率达 90.4%,在 PutnamBench 上以更小计算开销登顶;8B 模型性能媲美 671B 参数的前 SOTA 模型。项目采用分层数据合成、自我修正机制和模型平均等技术,同时发布含 360 道奥赛题的 MathOlympiadBench 数据集,推动自动化数学推理研究发展。
来源:https://mp.weixin.qq.com/s/MMBc9dUEg8Kzv6CzXcyLUQ

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-8-23 13:07 , Processed in 0.291150 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表