推理成本比MoE直降83%!字节最新大模型架构入围ICLR 2025

[复制链接]
周大 发表于 2025-2-12 14:51:51 | 显示全部楼层 |阅读模式
字节跳动发布全新稀疏模型架构UltraMem,相比现有主流架构(如MoE),推理速度提升2-6倍,成本最高可降低83%。UltraMem通过优化模型结构、改进value检索方式及隐式扩展稀疏参数,解决了MoE和PKM存在的访存瓶颈和扩展性问题。实验结果显示,在相同计算资源下,UltraMem能同时实现领先的推理速度和模型性能,为构建大规模语言模型提供了新路径。该研究成果已被ICLR 2025接收。
来源:https://mp.weixin.qq.com/s/4kxHv_WR8t63yB4x4rRQhg

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-18 04:31 , Processed in 0.273710 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表