扩散模型低位量化突破!有效扩散量化的极限推向2-4位,W2A4位宽下FID降低58%,超越SOTA方法

[复制链接]
周大 发表于 2025-1-18 16:20:48 | 显示全部楼层 |阅读模式
研究人员提出了一种极低位差分量化的混合精度量化方法MPQ-DM,通过离群值驱动的混合量化(OMD)和时间平滑关系蒸馏(TRD),解决了扩散模型在极低比特宽度下的性能下降问题。实验结果表明,在W2A4设置下,MPQ-DM的FID较基线降低了58%,且在多个数据集上的表现优于其他SOTA量化方法。该方法有效降低了扩散模型的计算成本,提升了其在资源受限场景中的应用潜力。
来源:https://mp.weixin.qq.com/s/-owJ4a3Gl8gyNhDsDNWLug

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-21 16:48 , Processed in 0.278505 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表