DeepSeek 推出低成本高性能视觉语言模型 DeepSeek-VL2

[复制链接]
周大 发表于 6 天前 | 显示全部楼层 |阅读模式
国内大模型领域黑马 DeepSeek 推出开源视觉语言模型 DeepSeek-VL2,性能不输 Qwen1.5 和 LLaMA3,大幅降低成本。该系列包括 Tiny、Small 和标准版,参数量分别为 1.0B、2.8B 和 4.5B。DeepSeek-VL2 通过动态高分辨率视觉编码、改进 MoE 机制和数据扩展,提升了视觉理解和训练效率,在 OCR、多模态对话和视觉定位等领域表现出色。DeepSeek 背后有幻方量化支持,拥有超过 1 万枚 A100GPU。
来源:https://mp.weixin.qq.com/s/NVUbPkLmxiASN47Qf4f6dw

学员登陆|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2024-12-23 12:24 , Processed in 0.263490 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表