让7B千问模型超越o1,微软rStar-Math惊艳登场,网友盛赞

[复制链接]
周大 发表于 2025-1-10 15:37:32 | 显示全部楼层 |阅读模式
微软亚洲研究院提出rStar-Math小模型方案,仅用1.5B-7B参数规模就在数学推理能力上超越OpenAI o1大模型。该模型通过4轮自我进化、蒙特卡洛树搜索等技术创新,显著提升数学推理准确率,在多个基准测试中表现优异。特别的是,rStar-Math只需60块A100 GPU即可完成训练,成本远低于o1。研究团队引入了代码增强CoT合成、改进过程奖励模型训练方法等三大创新,并发现模型具备自反思能力。这一成果为开发更高效、低成本的AI解决方案提供了新思路,受到业界广泛关注。
来源:https://mp.weixin.qq.com/s/d2aDtT9KRyZJ9Ac12v8AHA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-21 19:21 , Processed in 0.293136 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表