研究揭示主流大模型缺乏人类工作记忆能力，17款模型测试均未达标

周大发表于 2025-6-15 14:13:56

一项新研究通过三套实验测试了17个热门大语言模型的工作记忆能力，发现即使是GPT-4、LLaMA等先进模型也未能完全模拟人类的短期记忆功能。实验结果表明，这些模型更多依赖上下文窗口而非真正意义上的内部记忆调用。研究建议未来可借鉴认知科学，探索通过“内存格”或强化学习等方式提升模型的记忆与推理能力，为实现更真实的对话和长链推理铺平道路。
来源：https://mp.weixin.qq.com/s/1HtgKVZXGOqjibBLoEJn8w

页: [1]

靠浦ai课堂's Archiver

研究揭示主流大模型缺乏人类工作记忆能力，17款模型测试均未达标