研究揭示低精度量化在大规模训练中的局限性

[复制链接]
周大 发表于 2024-11-14 14:22:54 | 显示全部楼层 |阅读模式
哈佛、斯坦福、MIT等团队的研究表明,随着训练数据量的增加,模型所需的精度也随之提高。低精度量化在大规模训练任务中可能不再有效,且在后训练阶段进行量化可能有害。研究提出了“精度感知”的Scaling Laws,预测不同精度下的模型性能。实验显示,低精度训练和推理会导致性能下降,后训练量化引起的性能退化随训练数据量增加而增加。研究建议在资源有限时使用较低精度训练更大模型,增加模型规模,优化数据使用。
来源:https://mp.weixin.qq.com/s/Ifedw4JsOEHEoHc0UGyw4w

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-27 07:31 , Processed in 0.300324 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表