模型调优无需标注数据!将Llama 3.3 70B直接提升到GPT-4o水平

[复制链接]
周大 发表于 6 天前 | 显示全部楼层 |阅读模式
AI 公司 Databricks 推出新型调优方法 TAO,解决了大型语言模型(LLMs)微调中缺乏高质量标注数据的问题。TAO 通过测试时计算和强化学习优化模型参数,无需标注数据即可实现优于传统微调的性能。实验显示,TAO 显著提升了开源模型 Llama 在文档问答和 SQL 生成等企业级任务中的表现,使其接近甚至媲美商业模型(如 GPT-4o)。此外,TAO 在零标注数据条件下仍能提高模型性能,并支持通过增加训练资源进一步优化质量,同时保持低推理成本。
来源:https://mp.weixin.qq.com/s/WfJtfEN1gHg5NvgCYwefsw

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-5 04:53 , Processed in 0.299505 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表