周大 发表于 2025-3-30 15:10:09

模型调优无需标注数据!将Llama 3.3 70B直接提升到GPT-4o水平

AI 公司 Databricks 推出新型调优方法 TAO,解决了大型语言模型(LLMs)微调中缺乏高质量标注数据的问题。TAO 通过测试时计算和强化学习优化模型参数,无需标注数据即可实现优于传统微调的性能。实验显示,TAO 显著提升了开源模型 Llama 在文档问答和 SQL 生成等企业级任务中的表现,使其接近甚至媲美商业模型(如 GPT-4o)。此外,TAO 在零标注数据条件下仍能提高模型性能,并支持通过增加训练资源进一步优化质量,同时保持低推理成本。
来源:https://mp.weixin.qq.com/s/WfJtfEN1gHg5NvgCYwefsw
页: [1]
查看完整版本: 模型调优无需标注数据!将Llama 3.3 70B直接提升到GPT-4o水平