单卡搞定Llama 3.1 405B,让大模型轻松瘦身!

[复制链接]
周大 发表于 2024-8-2 14:33:36 | 显示全部楼层 |阅读模式
北航、商汤、南洋理工等团队合作研发的大模型压缩工具LLMC,成功解决了Llama-3.1的405B版本模型内存需求高达900GB的问题,使其能在80G A100上运行。研究显示,该模型的量化精度下降与激活张量中的离群值有关。LLMC工具支持多种压缩算法,能够有效抑制离群值,提高量化精度,具备高扩展性和全面评估能力。
来源:https://mp.weixin.qq.com/s/Qm_NkCyJ1m4iUlXfwwGVXg

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-10 00:23 , Processed in 0.280560 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表