字节跳动与清华联合研发Flash-VStream,革新长视频理解技术
字节跳动与清华大学专家联手推出Flash-VStream,这是一种革新性的多模态模型,专门针对长视频流的在线理解和实时问答。利用创新的STAR记忆系统,Flash-VStream能有效处理长时间视频,保持高效性能,且在多项基准测试中取得领先。同时,研究团队构建了VStream-QA数据集,以推动该领域的进步。来源:https://mp.weixin.qq.com/s/O0Ao-58yTblQb6ODaWyssg
页:
[1]