智源联合高校开源Video-XL打破长视频理解极限,95%准确率刷爆纪录

[复制链接]
周大 发表于 2024-10-29 15:16:35 | 显示全部楼层 |阅读模式
智源研究院联合多所高校推出超长视频理解大模型Video-XL,该模型能够在单张80G显卡上处理小时级视频,实现高效的长视频理解。Video-XL在多个长视频理解基准评测中表现优异,准确率达到95%,并利用语言模型的压缩能力对长视觉序列进行无损压缩。未来,Video-XL有望在电影摘要、视频异常检测、广告植入检测等场景中广泛应用,成为得力的长视频理解助手。
来源:https://mp.weixin.qq.com/s/OQGbtEpuF0xPczWFB68RKw

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-17 20:18 , Processed in 0.283786 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表