MiniMax开源M1推理模型具超长上下文能力

周大发表于 2025-6-19 14:23:20

MiniMax开源了其首个推理模型M1，尽管基准测试表现平平，但其100万token输入和8万token输出的上下文能力领先行业。同时，MiniMax正内测通用Agent，该Agent在长上下文处理、工具调用及多轮交互中展现优势。M1采用闪电注意力机制与CISPO强化学习算法，训练成本仅53.47万美元，远低于行业平均水平。在TAU-bench测试中，M1表现出色，尤其在软件工程和复杂任务处理方面。然而，AI Agent的竞争不仅依赖长上下文能力，还需兼顾工具调用、多模态理解和用户体验。2025年作为AI Agent爆发元年，MiniMax凭借技术积累试图在激烈的市场竞争中突围，但最终胜负将取决于技术转化用户价值的能力。
来源：https://tech.ifeng.com/c/8kHsneIXltr

页: [1]

靠浦ai课堂's Archiver

MiniMax开源M1推理模型具超长上下文能力