开源界长推理天花板：MiniMax-M1 上下文一次性撑到 1 M

周大发表于 2025-6-18 14:52:51

MiniMax 近日开源了推理大模型 MiniMax-M1，其上下文窗口达 1M，输出长度为 80K，成为开源领域长推理能力最强的模型之一。M1 在 TAU-Bench 测试中表现优异，40K 输出超越 Gemini 2.5 Pro，80K 版本进一步提升 2-3%。其核心优势在于充足的“思考预算”和基于真实工具的强化学习，同时通过自研 CISPO 算法将 RL 成本降至 53 万美元。此外，M1 的推理效率显著提高，FLOPs 增长接近线性，远超同类模型。实测表明，M1 在分析复杂财报和编程任务中表现出色，为 Agent 系统提供了一个强大的底座雏形，兼具长、快、开源、可训的特点，有望推动大模型在多步任务链中的实际应用。
来源：https://mp.weixin.qq.com/s/Ubyp-EH04zoyW5qiXqSW2Q

页: [1]

靠浦ai课堂's Archiver

开源界长推理天花板：MiniMax-M1 上下文一次性撑到 1 M