字节开源2-bit量化模型思路,精度齐平fp16

[复制链接]
周大 发表于 2024-5-13 15:52:33 | 显示全部楼层 |阅读模式
字节跳动语音团队创新性地提出“decoupleQ”模型量化方法,以数学优化解决深度学习大模型的高推理成本问题。不同于传统量化导致的精度损失,“decoupleQ”将参数解耦,保持低比特下的高精度。实验结果显示,这种方法在ASR和大模型量化上表现出色,已在多个产品中应用,实现性能提升和显存优化。
来源:https://mp.weixin.qq.com/s/tv4H0LA-e0qzX33NIWCdAg

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-10-2 23:00 , Processed in 0.272685 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表