DeepSeek-Prover-V2:递归+强化学习提升数学推理
DeepSeek-Prover-V2已正式发布,提供了7B和671B参数的两种模型。该模型采用递归和强化学习技术进行训练,显著提升了数学推理能力。其中,DeepSeek-Prover-V2-671B在MiniF2F-test基准测试中达到了88.9%的高通过率,并成功解决了PutnamBench中的49个问题。此外,团队构建了ProverBench数据集,包含325道题目,用于全面评估高中竞赛及本科阶段数学水平。值得注意的是,较小的7B模型在特定领域表现优于671B模型,尤其是在处理有限基数问题时展现出了独特的推理模式。这些进展标志着AI在形式化定理证明领域的重大突破。来源:https://mp.weixin.qq.com/s/Dsn3iypDSpzUVC35XX8Z1A
页:
[1]