以图灵机为师:通过微调训练让大语言模型懂执行计算过程

[复制链接]
周大 发表于 2024-10-18 14:46:24 | 显示全部楼层 |阅读模式
南京大学计算机学院软件研究所提出了一种面向大型语言模型(LLM)的可组装算术执行框架(CAEF)。该框架使LLM能够通过模仿图灵机的方式执行算术,理解计算逻辑,并具有高度可扩展性。评估显示,LLaMA 3.1-8B模型配合CAEF在7种经典数学算术运算中实现了近乎100%的准确率,且能处理100位操作数的计算。
来源:https://mp.weixin.qq.com/s/NEOwlcPJuOj30A1GoF2qCw

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-17 21:40 , Processed in 0.278023 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表