DeepSeek-Prover-V2:递归+强化学习提升数学推理

[复制链接]
周大 发表于 2025-5-1 14:34:31 | 显示全部楼层 |阅读模式
DeepSeek-Prover-V2已正式发布,提供了7B和671B参数的两种模型。该模型采用递归和强化学习技术进行训练,显著提升了数学推理能力。其中,DeepSeek-Prover-V2-671B在MiniF2F-test基准测试中达到了88.9%的高通过率,并成功解决了PutnamBench中的49个问题。此外,团队构建了ProverBench数据集,包含325道题目,用于全面评估高中竞赛及本科阶段数学水平。值得注意的是,较小的7B模型在特定领域表现优于671B模型,尤其是在处理有限基数问题时展现出了独特的推理模式。这些进展标志着AI在形式化定理证明领域的重大突破。
来源:https://mp.weixin.qq.com/s/Dsn3iypDSpzUVC35XX8Z1A

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-9 06:14 , Processed in 0.280281 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表