微软发布首个原生1bit大模型BitNet

[复制链接]
周大 发表于 2025-4-19 16:11:57 | 显示全部楼层 |阅读模式
微软亚洲研究院推出首个开源原生1bit大模型BitNet b1.58 2B4T,参数规模达20亿,但通过{-1, 0, +1}三值量化技术将模型大小压缩至0.4GB。该模型在4万亿Token语料库上训练,性能与全精度模型相当,并在11个基准测试中表现出色。其独特的推理框架支持CPU和GPU高效运行,大幅降低内存占用、能耗和解码延迟。这一成果为资源受限环境下的端侧AI应用提供了新思路,展现了轻量化大模型的巨大潜力。
来源:https://mp.weixin.qq.com/s/G9ZbMnBVbeH1m45HY2JIKA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-9 10:53 , Processed in 0.279026 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表