首个为具身智能而生的大规模强化学习框架RLinf!清华、北京中关村学院、无问芯穹等重磅开源

[复制链接]
周大 发表于 2025-9-1 14:40:24 | 显示全部楼层 |阅读模式
清华大学、北京中关村学院与无问芯穹联合多机构开源 RLinf,首个面向具身智能的“渲训推一体化”大规模强化学习框架。该框架采用混合式执行模式,在具身智能训练中实现超 120% 的提速,VLA 模型成功率提升 40%-60%。RLinf 支持三种执行模式、集成双后端系统,并具备自适应通信与自动调度能力,显著提升训练效率与稳定性。其在 Maniskill3 和 LIBERO 平台表现优异,OpenVLA-OFT 在后者中平均成功率达 97.3%。此外,RLinf 还支持推理大模型训练,1.5B 与 7B 数学模型在多个测试集取得 SOTA。框架已开源,具备高度灵活性、易用性与扩展性,适用于多类 AI 任务。
来源:https://mp.weixin.qq.com/s/Xtv4gDu3lhDDGadLrzt6Aw

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-9-27 18:40 , Processed in 0.277607 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表