Predibase发布全球首个端到端强化微调平台并开源
Predibase推出全球首个端到端强化微调平台(RFT),受DeepSeek-R1开源启发,支持无服务器与端到端训练,大幅简化大模型微调流程。基于Qwen2.5-Coder-32B-instruct微调的Predibase-T2T-32B-RFT模型,在Kernelbench测试中表现优异,正确率较DeepSeek-R1、OpenAI o1高3倍,比Claude 3.7 Sonnet高4倍以上,且模型体量更小。来源:https://tech.ifeng.com/c/8hrl7nqTQjs
页:
[1]