周大 发表于 2024-12-17 14:49:19

DeepSeek 推出低成本高性能视觉语言模型 DeepSeek-VL2

国内大模型领域黑马 DeepSeek 推出开源视觉语言模型 DeepSeek-VL2,性能不输 Qwen1.5 和 LLaMA3,大幅降低成本。该系列包括 Tiny、Small 和标准版,参数量分别为 1.0B、2.8B 和 4.5B。DeepSeek-VL2 通过动态高分辨率视觉编码、改进 MoE 机制和数据扩展,提升了视觉理解和训练效率,在 OCR、多模态对话和视觉定位等领域表现出色。DeepSeek 背后有幻方量化支持,拥有超过 1 万枚 A100GPU。
来源:https://mp.weixin.qq.com/s/NVUbPkLmxiASN47Qf4f6dw
页: [1]
查看完整版本: DeepSeek 推出低成本高性能视觉语言模型 DeepSeek-VL2