「乘法变加法」 MIT新算法L-Mul大幅降低LLM能耗

周大发表于 2024-10-8 14:44:31

MIT研究人员提出L-Mul算法，用整数加法代替浮点乘法，大幅降低LLM能耗。该算法在精度和性能上接近或优于fp8格式，实验表明可在不牺牲性能的前提下显著减少计算资源消耗，降低能耗最高达95%。此方法有望在多种大规模语言模型中广泛应用。
来源：https://mp.weixin.qq.com/s/LdRacBGfjyF8xUJP6h6xbw

页: [1]

靠浦ai课堂's Archiver

「乘法变加法」 MIT新算法L-Mul大幅降低LLM能耗