突破算力限制!Meta开源“记忆层”,重塑Transformer架构大模型

[复制链接]
周大 发表于 2025-1-3 15:09:51 | 显示全部楼层 |阅读模式
Meta推出Memory layers新技术,通过Product-Key Lookup算法和并行/共享记忆参数优化,大幅提升大模型查询效率。该技术可在不增加算力情况下显著增加模型参数,如在1.3亿参数模型中添加128亿额外参数,性能媲美Llama2-70但算力需求降低10倍。这为处理大规模数据集提供了新可能。
来源:https://www.chinaz.com/2025/0103/1662008.shtml

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-22 06:04 , Processed in 0.292388 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表