首个为具身智能而生的大规模强化学习框架RLinf！清华、北京中关村学院、无问芯穹等重磅开源

周大发表于 2025-9-1 14:40:24

清华大学、北京中关村学院与无问芯穹联合多机构开源 RLinf，首个面向具身智能的“渲训推一体化”大规模强化学习框架。该框架采用混合式执行模式，在具身智能训练中实现超 120% 的提速，VLA 模型成功率提升 40%-60%。RLinf 支持三种执行模式、集成双后端系统，并具备自适应通信与自动调度能力，显著提升训练效率与稳定性。其在 Maniskill3 和 LIBERO 平台表现优异，OpenVLA-OFT 在后者中平均成功率达 97.3%。此外，RLinf 还支持推理大模型训练，1.5B 与 7B 数学模型在多个测试集取得 SOTA。框架已开源，具备高度灵活性、易用性与扩展性，适用于多类 AI 任务。
来源：https://mp.weixin.qq.com/s/Xtv4gDu3lhDDGadLrzt6Aw

页: [1]

靠浦ai课堂's Archiver

首个为具身智能而生的大规模强化学习框架RLinf！清华、北京中关村学院、无问芯穹等重磅开源