微软新研究:60%参数即可达全激活模型性能,降低AI推理成本

[复制链接]
周大 发表于 2024-7-18 15:47:45 | 显示全部楼层 |阅读模式
微软亚洲研究院的最新研究提出了一种名为Q-Sparse的方法,通过神经元级别的稀疏化,仅用60%的模型参数就能达到全激活模型的性能,从而大幅降低推理成本。Q-Sparse利用Top-K函数实现稀疏化,并与量化技术兼容,适用于各种训练场景。实验结果显示,该方法在不同任务上表现优秀,且研究还发现了一种新的“Scaling Law”,为大规模模型的推理优化提供了理论依据。
来源:https://mp.weixin.qq.com/s/hBC9TcYrHMGVG9VgogLqWw

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-18 23:47 , Processed in 0.274499 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表