MiniMax发布高效大模型 支持4M上下文 引发关注

[复制链接]
周大 发表于 2025-1-15 14:50:55 | 显示全部楼层 |阅读模式
近日,MiniMax团队发布了两个大型语言模型MiniMax-Text-01和MiniMax-VL-01的开源版本。该系列模型采用创新的线性注意力机制,支持高达4M上下文处理,相比同类产品在相同时间内可处理多达1000k tokens(其他模型仅256K)。作为拥有456B参数的大规模模型,其每次激活仅需45.9B参数,展现出优秀的性能功耗比,整体效果处于行业第一梯队,尤其在长文本处理方面表现突出。
来源:https://tech.ifeng.com/c/8gA1WNF8Mza

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-20 01:34 , Processed in 0.285583 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表