Qwen3低比特量化性能评估研究

[复制链接]
周大 发表于 前天 14:58 | 显示全部楼层 |阅读模式
来自北航、西电和苏黎世联邦理工学院的研究团队对Qwen3进行了首次系统性量化评估,测试了包括GPTQ、AWQ在内的5种后训练量化方法,覆盖1至8比特位宽。结果显示,Qwen3在较高位宽(4比特及以上)下性能稳定,但低比特量化(3比特及以下)时性能明显下降,尤其在复杂推理任务中表现不佳。与LLaMA3相比,Qwen3在低比特量化下性能下降更为显著,这可能与其预训练过程中冗余较少有关。研究指出,当前量化技术需进一步改进,以更好地平衡模型压缩与性能保留,推动大型语言模型的实际应用。
来源:https://mp.weixin.qq.com/s/L9-w3ngZvo1I7zIqbHhD6w

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-9 07:02 , Processed in 0.286332 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表