清华UCSD提出全新微调方法,8B小模型媲美GPT-4o!

[复制链接]
周大 发表于 2024-12-2 14:25:34 | 显示全部楼层 |阅读模式
UCSD和清华的研究团队开发了一种新型微调方法,使得80亿参数的小模型在科学问题上能够与GPT-4o相媲美。该方法旨在解决大型语言模型在复杂问题上的“幻觉”现象,通过World Knowledge Distillation(WKD)和Tool Usage Adaptation(TUA)两部分实现。实验结果显示,微调后的模型在自定义数据集上的表现显著优于基准模型,且能合理选择使用外部工具或依赖内部知识。
来源:https://mp.weixin.qq.com/s/B9aMDNTEbjP8UfoH8jmWsg

学员登陆|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2024-12-24 04:17 , Processed in 0.272468 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表