周大 发表于 2024-10-18 14:46:24

以图灵机为师:通过微调训练让大语言模型懂执行计算过程

南京大学计算机学院软件研究所提出了一种面向大型语言模型(LLM)的可组装算术执行框架(CAEF)。该框架使LLM能够通过模仿图灵机的方式执行算术,理解计算逻辑,并具有高度可扩展性。评估显示,LLaMA 3.1-8B模型配合CAEF在7种经典数学算术运算中实现了近乎100%的准确率,且能处理100位操作数的计算。
来源:https://mp.weixin.qq.com/s/NEOwlcPJuOj30A1GoF2qCw
页: [1]
查看完整版本: 以图灵机为师:通过微调训练让大语言模型懂执行计算过程