周大 发表于 2025-1-18 16:20:48

扩散模型低位量化突破!有效扩散量化的极限推向2-4位,W2A4位宽下FID降低58%,超越SOTA方法

研究人员提出了一种极低位差分量化的混合精度量化方法MPQ-DM,通过离群值驱动的混合量化(OMD)和时间平滑关系蒸馏(TRD),解决了扩散模型在极低比特宽度下的性能下降问题。实验结果表明,在W2A4设置下,MPQ-DM的FID较基线降低了58%,且在多个数据集上的表现优于其他SOTA量化方法。该方法有效降低了扩散模型的计算成本,提升了其在资源受限场景中的应用潜力。
来源:https://mp.weixin.qq.com/s/-owJ4a3Gl8gyNhDsDNWLug
页: [1]
查看完整版本: 扩散模型低位量化突破!有效扩散量化的极限推向2-4位,W2A4位宽下FID降低58%,超越SOTA方法