视频推理R1时刻,7B模型反超GPT-4o!港中文清华推出首个Video-R1

[复制链接]
周大 发表于 2025-4-16 14:57:43 | 显示全部楼层 |阅读模式
港中文与清华团队联合推出全球首个视频推理模型Video-R1,采用强化学习R1范式及升级版T-GRPO算法,结合图像和视频混合数据集训练。该模型在李飞飞提出的VSI-Bench测试中超越GPT-4o,准确率达35.8%,展现出卓越的时间逻辑推理能力。其7B参数规模虽小,却凭借时间感知奖励机制和创新训练策略实现性能突破。此外,Video-R1已完全开源,为视频AI领域带来新机遇。
来源:https://mp.weixin.qq.com/s/sNTqVQcyPTwYIqRExKyszA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-9 20:05 , Processed in 0.284918 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表