微软小模型Phi-4凭推理链胜过大模型

[复制链接]
周大 发表于 2025-5-9 14:54:18 | 显示全部楼层 |阅读模式
微软研究院开源的小模型Phi-4-reasoning-plus以14B参数量在数学、科学及代码推理任务中超越了参数量达70B的大模型。通过引入“推理链”训练方法,模型被鼓励详细分解问题并反复验证答案,强化学习机制进一步优化其“慢思考”能力。评测结果显示,Phi-4不仅在AIME等数学基准测试中表现出色,还在未专门训练的算法、规划和代码领域展现了强大的迁移能力,证明了“慢而细”的推理方式比单纯增加参数更有效。
来源:https://tech.ifeng.com/c/8jBvtWFOAtj

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-8 05:44 , Processed in 0.294308 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表