这才是真・开源模型！公开「后训练」一切，性能超越Llama 3.1 Instruct

周大发表于 2024-11-23 14:27:45

艾伦人工智能研究所（Ai2）发布了开源模型Tülu 3，包括8B和70B两个版本，未来还将推出405B版本。Tülu 3的性能超过Llama 3.1 Instruct的相应版本，技术报告详细介绍了后训练的四个阶段：数据整理、监督微调、偏好微调和具有可验证奖励的强化学习。社区对Tülu 3的反响热烈，一些用户认为其表现优于GPT-4o。Ai2还开源了所有数据、数据混合方法、配方、代码、基础设施和评估框架，Tülu 3在多个基准测试中表现出色，特别是在数学、编程和指令遵从方面。
来源：https://mp.weixin.qq.com/s/sTtBkVkqy0CQtpzcR6SN-A

页: [1]

靠浦ai课堂's Archiver

这才是真・开源模型！公开「后训练」一切，性能超越Llama 3.1 Instruct