周大 发表于 2025-7-14 15:36:21

英伟达&MIT等推出Long-RL,长视频训练速度翻倍

面对 AI 在长视频理解和复杂策略推理中的挑战,英伟达联合 MIT、港大等推出 Long-RL 框架,支持单机稳定训练长达 3600 帧的视频任务。其核心技术 MR-SP 并行机制可将训练速度提升 2.1 倍,并显著降低显存消耗。该框架适配多模型、多算法、多模态任务,并已应用于 LongVILA-R1 训练系统。通过使用包含 52,000 个样本的大规模数据集 LongVideo-Reason 及两阶段训练方法,模型在强推理基准测试中表现优异。研究团队强调,将强化学习与长序列推理结合是实现“持续智能”的关键路径。
来源:https://mp.weixin.qq.com/s/T-1VIPzD4E-8c06cBhr-vA
页: [1]
查看完整版本: 英伟达&MIT等推出Long-RL,长视频训练速度翻倍