字节跳动与清华联合研发Flash-VStream,革新长视频理解技术

[复制链接]
周大 发表于 2024-7-7 15:47:30 | 显示全部楼层 |阅读模式
字节跳动与清华大学专家联手推出Flash-VStream,这是一种革新性的多模态模型,专门针对长视频流的在线理解和实时问答。利用创新的STAR记忆系统,Flash-VStream能有效处理长时间视频,保持高效性能,且在多项基准测试中取得领先。同时,研究团队构建了VStream-QA数据集,以推动该领域的进步。
来源:https://mp.weixin.qq.com/s/O0Ao-58yTblQb6ODaWyssg

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-9 02:33 , Processed in 0.271090 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表