英伟达&MIT等推出Long-RL，长视频训练速度翻倍

周大发表于 2025-7-14 15:36:21

面对 AI 在长视频理解和复杂策略推理中的挑战，英伟达联合 MIT、港大等推出 Long-RL 框架，支持单机稳定训练长达 3600 帧的视频任务。其核心技术 MR-SP 并行机制可将训练速度提升 2.1 倍，并显著降低显存消耗。该框架适配多模型、多算法、多模态任务，并已应用于 LongVILA-R1 训练系统。通过使用包含 52,000 个样本的大规模数据集 LongVideo-Reason 及两阶段训练方法，模型在强推理基准测试中表现优异。研究团队强调，将强化学习与长序列推理结合是实现“持续智能”的关键路径。
来源：https://mp.weixin.qq.com/s/T-1VIPzD4E-8c06cBhr-vA

		自动登录	找回密码
密码			立即注册

课程导航

英伟达&MIT等推出Long-RL，长视频训练速度翻倍