模型调优无需标注数据！将Llama 3.3 70B直接提升到GPT-4o水平

周大发表于 2025-3-30 15:10:09

AI 公司 Databricks 推出新型调优方法 TAO，解决了大型语言模型（LLMs）微调中缺乏高质量标注数据的问题。TAO 通过测试时计算和强化学习优化模型参数，无需标注数据即可实现优于传统微调的性能。实验显示，TAO 显著提升了开源模型 Llama 在文档问答和 SQL 生成等企业级任务中的表现，使其接近甚至媲美商业模型（如 GPT-4o）。此外，TAO 在零标注数据条件下仍能提高模型性能，并支持通过增加训练资源进一步优化质量，同时保持低推理成本。
来源：https://mp.weixin.qq.com/s/WfJtfEN1gHg5NvgCYwefsw

页: [1]

靠浦ai课堂's Archiver

模型调优无需标注数据！将Llama 3.3 70B直接提升到GPT-4o水平