周大 发表于 2025-6-15 14:13:56

研究揭示主流大模型缺乏人类工作记忆能力,17款模型测试均未达标

一项新研究通过三套实验测试了17个热门大语言模型的工作记忆能力,发现即使是GPT-4、LLaMA等先进模型也未能完全模拟人类的短期记忆功能。实验结果表明,这些模型更多依赖上下文窗口而非真正意义上的内部记忆调用。研究建议未来可借鉴认知科学,探索通过“内存格”或强化学习等方式提升模型的记忆与推理能力,为实现更真实的对话和长链推理铺平道路。
来源:https://mp.weixin.qq.com/s/1HtgKVZXGOqjibBLoEJn8w
页: [1]
查看完整版本: 研究揭示主流大模型缺乏人类工作记忆能力,17款模型测试均未达标