大型语言模型数学推理依赖样例，北大新方法提升规则理解能力

周大发表于 2024-6-29 20:47:44

北京大学的研究揭示，尽管大型语言模型在多种任务中表现出色，但在数学推理上却依赖于“基于样例”的推理，而非人类的“基于规则”方式。为解决这个问题，研究团队提出Rule-Following Fine-Tuning技术，通过显式教导模型遵循规则，显著提高了模型在未见过的数学问题上的泛化能力。
来源：https://mp.weixin.qq.com/s/aVRiGW3xU_LpvxZzjDpwzQ

		自动登录	找回密码
密码			立即注册

课程导航

大型语言模型数学推理依赖样例，北大新方法提升规则理解能力