DeepSeek-Prover-V2：递归+强化学习提升数学推理

周大发表于 2025-5-1 14:34:31

DeepSeek-Prover-V2已正式发布，提供了7B和671B参数的两种模型。该模型采用递归和强化学习技术进行训练，显著提升了数学推理能力。其中，DeepSeek-Prover-V2-671B在MiniF2F-test基准测试中达到了88.9%的高通过率，并成功解决了PutnamBench中的49个问题。此外，团队构建了ProverBench数据集，包含325道题目，用于全面评估高中竞赛及本科阶段数学水平。值得注意的是，较小的7B模型在特定领域表现优于671B模型，尤其是在处理有限基数问题时展现出了独特的推理模式。这些进展标志着AI在形式化定理证明领域的重大突破。
来源：https://mp.weixin.qq.com/s/Dsn3iypDSpzUVC35XX8Z1A

页: [1]

靠浦ai课堂's Archiver

DeepSeek-Prover-V2：递归+强化学习提升数学推理