Coconut:在潜在空间中提升 LLM 推理能力的新方法

[复制链接]
周大 发表于 2024-12-12 14:36:22 | 显示全部楼层 |阅读模式
研究人员提出了一种新的推理范式——Coconut(连续思维链),通过在潜在空间中进行推理,提高了大语言模型(LLM)的推理能力。与传统的基于语言的思维链(CoT)相比,Coconut通过直接使用隐藏状态作为输入嵌入,实现了端到端优化。实验结果显示,Coconut在数学推理(GSM8k)和逻辑推理(ProntoQA和ProsQA)任务中表现优异,特别是在需要大量规划的复杂任务中,其性能显著优于传统方法。
来源:https://mp.weixin.qq.com/s/cqh3pCLMFJgSVpF0nNgt6w

学员登陆|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2024-12-23 17:10 , Processed in 0.273278 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表