让7B千问模型超越o1，微软rStar-Math惊艳登场，网友盛赞

周大发表于 2025-1-10 15:37:32

微软亚洲研究院提出rStar-Math小模型方案，仅用1.5B-7B参数规模就在数学推理能力上超越OpenAI o1大模型。该模型通过4轮自我进化、蒙特卡洛树搜索等技术创新，显著提升数学推理准确率，在多个基准测试中表现优异。特别的是，rStar-Math只需60块A100 GPU即可完成训练，成本远低于o1。研究团队引入了代码增强CoT合成、改进过程奖励模型训练方法等三大创新，并发现模型具备自反思能力。这一成果为开发更高效、低成本的AI解决方案提供了新思路，受到业界广泛关注。
来源：https://mp.weixin.qq.com/s/d2aDtT9KRyZJ9Ac12v8AHA

页: [1]

靠浦ai课堂's Archiver

让7B千问模型超越o1，微软rStar-Math惊艳登场，网友盛赞