周大 发表于 2024-8-30 14:09:54

超越GPT-4o!阿里发布最强开源多模态模型Qwen2-VL,支持实时视频对话

阿里发布Qwen2-VL多模态大模型,在图像和长视频理解任务上取得SOTA。该模型在多个指标上超越GPT-4o等闭源模型,支持实时视频对话及Agent交互。Qwen2-VL提供2B、7B、72B三个版本,其中2B和7B版本免费商用,并已集成到第三方框架中。
来源:https://mp.weixin.qq.com/s/42M913ulJ_P3E8-CYeqrsA
页: [1]
查看完整版本: 超越GPT-4o!阿里发布最强开源多模态模型Qwen2-VL,支持实时视频对话