Predibase发布全球首个端到端强化微调平台并开源

[复制链接]
周大 发表于 2025-3-20 21:37:04 | 显示全部楼层 |阅读模式
Predibase推出全球首个端到端强化微调平台(RFT),受DeepSeek-R1开源启发,支持无服务器与端到端训练,大幅简化大模型微调流程。基于Qwen2.5-Coder-32B-instruct微调的Predibase-T2T-32B-RFT模型,在Kernelbench测试中表现优异,正确率较DeepSeek-R1、OpenAI o1高3倍,比Claude 3.7 Sonnet高4倍以上,且模型体量更小。
来源:https://tech.ifeng.com/c/8hrl7nqTQjs

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-5 15:11 , Processed in 0.282184 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表