DeepSeek 推出低成本高性能视觉语言模型 DeepSeek-VL2

周大发表于 2024-12-17 14:49:19

国内大模型领域黑马 DeepSeek 推出开源视觉语言模型 DeepSeek-VL2，性能不输 Qwen1.5 和 LLaMA3，大幅降低成本。该系列包括 Tiny、Small 和标准版，参数量分别为 1.0B、2.8B 和 4.5B。DeepSeek-VL2 通过动态高分辨率视觉编码、改进 MoE 机制和数据扩展，提升了视觉理解和训练效率，在 OCR、多模态对话和视觉定位等领域表现出色。DeepSeek 背后有幻方量化支持，拥有超过 1 万枚 A100GPU。
来源：https://mp.weixin.qq.com/s/NVUbPkLmxiASN47Qf4f6dw

		自动登录	找回密码
密码			立即注册

课程导航

DeepSeek 推出低成本高性能视觉语言模型 DeepSeek-VL2