超越GPT-4o!阿里发布最强开源多模态模型Qwen2-VL,支持实时视频对话

[复制链接]
周大 发表于 2024-8-30 14:09:54 | 显示全部楼层 |阅读模式
阿里发布Qwen2-VL多模态大模型,在图像和长视频理解任务上取得SOTA。该模型在多个指标上超越GPT-4o等闭源模型,支持实时视频对话及Agent交互。Qwen2-VL提供2B、7B、72B三个版本,其中2B和7B版本免费商用,并已集成到第三方框架中。
来源:https://mp.weixin.qq.com/s/42M913ulJ_P3E8-CYeqrsA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-18 16:36 , Processed in 0.298488 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表