MINIMAX推出开源模型M1：训练成本仅53万美元，长文本处理能力超群

周大发表于 2025-6-18 14:23:47

MINIMAX在DeepSeek低成本训练顶级模型的冲击下，迅速调整战略，从商业化优先转向开源优先，推出全球首个开源大规模混合架构推理模型MiniMax-M1。该模型通过Lightning Attention实现超长文本处理，在长文本测试中表现优异，并采用CISPO算法提升学习效率，仅用53.74万美元完成强化训练，相比GPT-4大幅降低成本。尽管部分指标非最优，但在长文本和特定领域超越DeepSeek R1。同时，AI行业因训练成本暴跌正经历算力泡沫破灭，行业竞争重心逐渐从资本投入转向技术创新。
来源：https://tech.ifeng.com/c/8kFjVOf842b

页: [1]

靠浦ai课堂's Archiver

MINIMAX推出开源模型M1：训练成本仅53万美元，长文本处理能力超群