周大 发表于 2025-1-10 15:37:32

让7B千问模型超越o1,微软rStar-Math惊艳登场,网友盛赞

微软亚洲研究院提出rStar-Math小模型方案,仅用1.5B-7B参数规模就在数学推理能力上超越OpenAI o1大模型。该模型通过4轮自我进化、蒙特卡洛树搜索等技术创新,显著提升数学推理准确率,在多个基准测试中表现优异。特别的是,rStar-Math只需60块A100 GPU即可完成训练,成本远低于o1。研究团队引入了代码增强CoT合成、改进过程奖励模型训练方法等三大创新,并发现模型具备自反思能力。这一成果为开发更高效、低成本的AI解决方案提供了新思路,受到业界广泛关注。
来源:https://mp.weixin.qq.com/s/d2aDtT9KRyZJ9Ac12v8AHA
页: [1]
查看完整版本: 让7B千问模型超越o1,微软rStar-Math惊艳登场,网友盛赞