周大 发表于 2025-2-5 15:00:06

Ai2再祭开源杀器Tülu 3,强化学习打破性能瓶颈

艾伦人工智能研究所(Ai2)发布了Tülu 3系列开源模型,涵盖8B、70B和405B参数规模。其中,Tülu 3 405B在多个基准测试中超越了DeepSeek v3和GPT-4o,特别是在数学推理等任务上表现突出。该模型采用四阶段后训练方法,引入了独创的“可验证奖励强化学习”,显著提升了大规模模型的性能。尽管在某些简单任务上存在不足,Tülu 3在复杂推理任务中表现出色,并已支持ollama平台下载,为开发者提供了丰富的资源和工具。
来源:https://mp.weixin.qq.com/s/hX2pNUupJ5yJ-eqe3qyP-Q
页: [1]
查看完整版本: Ai2再祭开源杀器Tülu 3,强化学习打破性能瓶颈