周大 发表于 2025-3-20 21:37:04

Predibase发布全球首个端到端强化微调平台并开源

Predibase推出全球首个端到端强化微调平台(RFT),受DeepSeek-R1开源启发,支持无服务器与端到端训练,大幅简化大模型微调流程。基于Qwen2.5-Coder-32B-instruct微调的Predibase-T2T-32B-RFT模型,在Kernelbench测试中表现优异,正确率较DeepSeek-R1、OpenAI o1高3倍,比Claude 3.7 Sonnet高4倍以上,且模型体量更小。
来源:https://tech.ifeng.com/c/8hrl7nqTQjs
页: [1]
查看完整版本: Predibase发布全球首个端到端强化微调平台并开源