微软1bit LLM新研究:原生4bit激活值量化,可充分利用新一代GPU对4bit计算的原生支持

[复制链接]
周大 发表于 2025-4-29 14:27:59 | 显示全部楼层 |阅读模式
微软推出BitNet v2框架,为1 bit大语言模型(LLM)实现4 bit激活值量化,充分利用新一代GPU的4 bit计算能力。通过引入H-BitLinear模块,解决中间状态激活值异常值问题,显著提升计算效率。实验表明,BitNet v2在不同模型规模上性能优于其他方法,且可从8 bit激活版本微调训练,性能几乎无损失。
来源:https://mp.weixin.qq.com/s/HlSDd3Tl5lK4sHSm25z9XQ

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-9 06:07 , Processed in 0.271861 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表