周大 发表于 2024-10-2 14:29:49

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍

AMD发布首款小语言模型AMD-135M,适用于企业内部部署。该模型采用“推测解码”技术,提升生成效率并降低内存占用。测试显示,在多种硬件上性能提升明显,且其训练代码和数据集已开源。
来源:https://www.chinaz.com/2024/1001/1645436.shtml
页: [1]
查看完整版本: AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍