MiniMax开源M1推理模型具超长上下文能力
MiniMax开源了其首个推理模型M1,尽管基准测试表现平平,但其100万token输入和8万token输出的上下文能力领先行业。同时,MiniMax正内测通用Agent,该Agent在长上下文处理、工具调用及多轮交互中展现优势。M1采用闪电注意力机制与CISPO强化学习算法,训练成本仅53.47万美元,远低于行业平均水平。在TAU-bench测试中,M1表现出色,尤其在软件工程和复杂任务处理方面。然而,AI Agent的竞争不仅依赖长上下文能力,还需兼顾工具调用、多模态理解和用户体验。2025年作为AI Agent爆发元年,MiniMax凭借技术积累试图在激烈的市场竞争中突围,但最终胜负将取决于技术转化用户价值的能力。来源:https://tech.ifeng.com/c/8kHsneIXltr
页:
[1]