这才是真・开源模型!公开「后训练」一切,性能超越Llama 3.1 Instruct

[复制链接]
周大 发表于 2024-11-23 14:27:45 | 显示全部楼层 |阅读模式
艾伦人工智能研究所(Ai2)发布了开源模型Tülu 3,包括8B和70B两个版本,未来还将推出405B版本。Tülu 3的性能超过Llama 3.1 Instruct的相应版本,技术报告详细介绍了后训练的四个阶段:数据整理、监督微调、偏好微调和具有可验证奖励的强化学习。社区对Tülu 3的反响热烈,一些用户认为其表现优于GPT-4o。Ai2还开源了所有数据、数据混合方法、配方、代码、基础设施和评估框架,Tülu 3在多个基准测试中表现出色,特别是在数学、编程和指令遵从方面。
来源:https://mp.weixin.qq.com/s/sTtBkVkqy0CQtpzcR6SN-A

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-25 17:28 , Processed in 0.302067 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表