微软小模型Phi-4凭推理链胜过大模型

周大发表于 2025-5-9 14:54:18

微软研究院开源的小模型Phi-4-reasoning-plus以14B参数量在数学、科学及代码推理任务中超越了参数量达70B的大模型。通过引入“推理链”训练方法，模型被鼓励详细分解问题并反复验证答案，强化学习机制进一步优化其“慢思考”能力。评测结果显示，Phi-4不仅在AIME等数学基准测试中表现出色，还在未专门训练的算法、规划和代码领域展现了强大的迁移能力，证明了“慢而细”的推理方式比单纯增加参数更有效。
来源：https://tech.ifeng.com/c/8jBvtWFOAtj

页: [1]

靠浦ai课堂's Archiver

微软小模型Phi-4凭推理链胜过大模型