微软发布首个原生1bit大模型BitNet

[复制链接]
周大 发表于 2025-4-19 16:11:57 | 显示全部楼层 |阅读模式
微软亚洲研究院推出首个开源原生1bit大模型BitNet b1.58 2B4T,参数规模达20亿,但通过{-1, 0, +1}三值量化技术将模型大小压缩至0.4GB。该模型在4万亿Token语料库上训练,性能与全精度模型相当,并在11个基准测试中表现出色。其独特的推理框架支持CPU和GPU高效运行,大幅降低内存占用、能耗和解码延迟。这一成果为资源受限环境下的端侧AI应用提供了新思路,展现了轻量化大模型的巨大潜力。
来源:https://mp.weixin.qq.com/s/G9ZbMnBVbeH1m45HY2JIKA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-8 10:14 , Processed in 0.300130 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表