首个为具身智能而生的大规模强化学习框架RLinf!清华、北京中关村学院、无问芯穹等重磅开源
清华大学、北京中关村学院与无问芯穹联合多机构开源 RLinf,首个面向具身智能的“渲训推一体化”大规模强化学习框架。该框架采用混合式执行模式,在具身智能训练中实现超 120% 的提速,VLA 模型成功率提升 40%-60%。RLinf 支持三种执行模式、集成双后端系统,并具备自适应通信与自动调度能力,显著提升训练效率与稳定性。其在 Maniskill3 和 LIBERO 平台表现优异,OpenVLA-OFT 在后者中平均成功率达 97.3%。此外,RLinf 还支持推理大模型训练,1.5B 与 7B 数学模型在多个测试集取得 SOTA。框架已开源,具备高度灵活性、易用性与扩展性,适用于多类 AI 任务。来源:https://mp.weixin.qq.com/s/Xtv4gDu3lhDDGadLrzt6Aw
页:
[1]