超越GPT-4o！阿里发布最强开源多模态模型Qwen2-VL，支持实时视频对话

周大发表于 2024-8-30 14:09:54

阿里发布Qwen2-VL多模态大模型，在图像和长视频理解任务上取得SOTA。该模型在多个指标上超越GPT-4o等闭源模型，支持实时视频对话及Agent交互。Qwen2-VL提供2B、7B、72B三个版本，其中2B和7B版本免费商用，并已集成到第三方框架中。
来源：https://mp.weixin.qq.com/s/42M913ulJ_P3E8-CYeqrsA

页: [1]

靠浦ai课堂's Archiver

超越GPT-4o！阿里发布最强开源多模态模型Qwen2-VL，支持实时视频对话