加州大学团队提出M+框架:LLM隐空间记忆突破160k tokens,显存占用不变

[复制链接]
周大 发表于 2025-7-15 14:14:29 | 显示全部楼层 |阅读模式
加州大学圣地亚哥分校与 MIT-IBM Watson Lab 合作提出 M+ 框架,作为 MemoryLLM 的长期记忆扩展方案,通过将“过期”隐藏向量存储在 CPU 长期记忆池并引入协同检索机制,成功将 8B 级模型的记忆跨度从不足 20k 提升至超过 160k tokens,同时 GPU 显存维持在 18GB 左右。相比传统 Token-Level 记忆方法,M+ 更紧凑、支持端到端训练,并展现出在多个长文本问答任务上的优异表现,为构建具备持续记忆能力的语言模型提供了新路径。
来源:https://mp.weixin.qq.com/s/8fl3ymmJMn2P0_XBmVQQuw

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-8-23 16:46 , Processed in 0.287124 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表