LLM推理依赖“程序性知识”而非简单检索

[复制链接]
周大 发表于 2024-12-2 14:24:15 | 显示全部楼层 |阅读模式
UCL等机构研究发现,大型语言模型(LLM)在执行推理任务时,依赖于“程序性知识”,而非简单检索答案。研究显示,LLM通过泛化策略从文档中综合推理步骤,而非直接查找答案。数学问题中,LLM使用程序性知识综合推理步骤,对单个文档的依赖较少。代码在数学推理中起重要作用,预训练数据中包含大量相关文档。尽管如此,苹果的研究指出,部分模型如GPT-4等在推理任务中更像是复杂的模式匹配器。
来源:https://mp.weixin.qq.com/s/ShEThew_5sYksIPxbst3KA

学员登陆|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2024-12-24 03:58 , Processed in 0.275012 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表