微软小模型Phi-4凭推理链胜过大模型
微软研究院开源的小模型Phi-4-reasoning-plus以14B参数量在数学、科学及代码推理任务中超越了参数量达70B的大模型。通过引入“推理链”训练方法,模型被鼓励详细分解问题并反复验证答案,强化学习机制进一步优化其“慢思考”能力。评测结果显示,Phi-4不仅在AIME等数学基准测试中表现出色,还在未专门训练的算法、规划和代码领域展现了强大的迁移能力,证明了“慢而细”的推理方式比单纯增加参数更有效。来源:https://tech.ifeng.com/c/8jBvtWFOAtj
页:
[1]