智谱AI开源视频理解模型,提升视频处理能力

[复制链接]
周大 发表于 2024-7-13 15:53:54 | 显示全部楼层 |阅读模式
智谱AI近日开源其先进的视频理解模型CogVLM2-Video,该模型利用3万条自动生成的与时间相关的视频问答数据进行训练。结合多帧视频图像和时间戳,模型在公共视频理解基准测试中取得领先成绩,并展现出在视频字幕生成及时间定位任务上的卓越能力,为视频处理技术的发展带来新突破。
来源:https://tech.ifeng.com/c/8bA16Cfum1u

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-9 08:00 , Processed in 0.299059 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表