英伟达&MIT等推出Long-RL,长视频训练速度翻倍

[复制链接]
周大 发表于 2025-7-14 15:36:21 | 显示全部楼层 |阅读模式
面对 AI 在长视频理解和复杂策略推理中的挑战,英伟达联合 MIT、港大等推出 Long-RL 框架,支持单机稳定训练长达 3600 帧的视频任务。其核心技术 MR-SP 并行机制可将训练速度提升 2.1 倍,并显著降低显存消耗。该框架适配多模型、多算法、多模态任务,并已应用于 LongVILA-R1 训练系统。通过使用包含 52,000 个样本的大规模数据集 LongVideo-Reason 及两阶段训练方法,模型在强推理基准测试中表现优异。研究团队强调,将强化学习与长序列推理结合是实现“持续智能”的关键路径。
来源:https://mp.weixin.qq.com/s/T-1VIPzD4E-8c06cBhr-vA

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-8-23 16:42 , Processed in 0.277999 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表