哈工大提出推理边界框架,显著提升LLMs推理能力
哈工大的陈麒光等人提出了一种推理边界框架(RBF),用于量化和优化大型语言模型(LLMs)在思维链(CoT)任务中的推理能力。RBF定义了三种推理边界:完全可行、完全不可行和部分可行,通过这些边界,研究者能够更系统地评估和优化模型的推理能力。实验结果显示,最短可接受推理路径(MARP)策略显著提高了模型在复杂任务中的推理效率。该研究已被NeurIPS 2024接收并评为Oral Presentation。来源:https://mp.weixin.qq.com/s/BwuGacSHKY4RTdvYNMa66Q
页:
[1]