周大 发表于 2024-11-23 14:27:45

这才是真・开源模型!公开「后训练」一切,性能超越Llama 3.1 Instruct

艾伦人工智能研究所(Ai2)发布了开源模型Tülu 3,包括8B和70B两个版本,未来还将推出405B版本。Tülu 3的性能超过Llama 3.1 Instruct的相应版本,技术报告详细介绍了后训练的四个阶段:数据整理、监督微调、偏好微调和具有可验证奖励的强化学习。社区对Tülu 3的反响热烈,一些用户认为其表现优于GPT-4o。Ai2还开源了所有数据、数据混合方法、配方、代码、基础设施和评估框架,Tülu 3在多个基准测试中表现出色,特别是在数学、编程和指令遵从方面。
来源:https://mp.weixin.qq.com/s/sTtBkVkqy0CQtpzcR6SN-A
页: [1]
查看完整版本: 这才是真・开源模型!公开「后训练」一切,性能超越Llama 3.1 Instruct