视频推理R1时刻，7B模型反超GPT-4o！港中文清华推出首个Video-R1

周大发表于 2025-4-16 14:57:43

港中文与清华团队联合推出全球首个视频推理模型Video-R1，采用强化学习R1范式及升级版T-GRPO算法，结合图像和视频混合数据集训练。该模型在李飞飞提出的VSI-Bench测试中超越GPT-4o，准确率达35.8%，展现出卓越的时间逻辑推理能力。其7B参数规模虽小，却凭借时间感知奖励机制和创新训练策略实现性能突破。此外，Video-R1已完全开源，为视频AI领域带来新机遇。
来源：https://mp.weixin.qq.com/s/sNTqVQcyPTwYIqRExKyszA

页: [1]

靠浦ai课堂's Archiver

视频推理R1时刻，7B模型反超GPT-4o！港中文清华推出首个Video-R1