DeepSeek开源Prover-V2强推理模型
DeepSeek 推出了开源模型 DeepSeek-Prover-V2,专注于形式化定理证明,参数规模分为 7B 和 671B 两种版本,支持最长 32K tokens 的上下文扩展。该模型通过递归式证明搜索和强化学习训练,在 MiniF2F 测试中达到 88.9% 的通过率,并成功解决 PutnamBench 数据集中多道难题。同时,DeepSeek 发布了 ProverBench 数据集,包含 325 道高中竞赛和本科数学题目,用于综合评估模型性能。尽管用户对 Prover-V2 表示认可,但对 DeepSeek-R2 的期待更高。来源:https://mp.weixin.qq.com/s/UYn-9vX5rpWpB3Y1xFW8Jg
页:
[1]