DeepSeek开源Prover-V2强推理模型

[复制链接]
周大 发表于 2025-5-1 14:25:23 | 显示全部楼层 |阅读模式
DeepSeek 推出了开源模型 DeepSeek-Prover-V2,专注于形式化定理证明,参数规模分为 7B 和 671B 两种版本,支持最长 32K tokens 的上下文扩展。该模型通过递归式证明搜索和强化学习训练,在 MiniF2F 测试中达到 88.9% 的通过率,并成功解决 PutnamBench 数据集中多道难题。同时,DeepSeek 发布了 ProverBench 数据集,包含 325 道高中竞赛和本科数学题目,用于综合评估模型性能。尽管用户对 Prover-V2 表示认可,但对 DeepSeek-R2 的期待更高。
来源:https://mp.weixin.qq.com/s/UYn-9vX5rpWpB3Y1xFW8Jg

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-9 09:08 , Processed in 0.284299 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表