智谱AI开源视频理解模型，提升视频处理能力

周大发表于 2024-7-13 15:53:54

智谱AI近日开源其先进的视频理解模型CogVLM2-Video，该模型利用3万条自动生成的与时间相关的视频问答数据进行训练。结合多帧视频图像和时间戳，模型在公共视频理解基准测试中取得领先成绩，并展现出在视频字幕生成及时间定位任务上的卓越能力，为视频处理技术的发展带来新突破。
来源：https://tech.ifeng.com/c/8bA16Cfum1u

		自动登录	找回密码
密码			立即注册

课程导航

智谱AI开源视频理解模型，提升视频处理能力