周大 发表于 6 天前

开源界长推理天花板:MiniMax-M1 上下文一次性撑到 1 M

MiniMax 近日开源了推理大模型 MiniMax-M1,其上下文窗口达 1M,输出长度为 80K,成为开源领域长推理能力最强的模型之一。M1 在 TAU-Bench 测试中表现优异,40K 输出超越 Gemini 2.5 Pro,80K 版本进一步提升 2-3%。其核心优势在于充足的“思考预算”和基于真实工具的强化学习,同时通过自研 CISPO 算法将 RL 成本降至 53 万美元。此外,M1 的推理效率显著提高,FLOPs 增长接近线性,远超同类模型。实测表明,M1 在分析复杂财报和编程任务中表现出色,为 Agent 系统提供了一个强大的底座雏形,兼具长、快、开源、可训的特点,有望推动大模型在多步任务链中的实际应用。
来源:https://mp.weixin.qq.com/s/Ubyp-EH04zoyW5qiXqSW2Q
页: [1]
查看完整版本: 开源界长推理天花板:MiniMax-M1 上下文一次性撑到 1 M