周大 发表于 2025-1-24 13:56:07

Hugging Face 推出轻量级 AI 视觉语言模型

Hugging Face 推出 SmolVLM-256M-Instruct 和 SmolVLM-500M-Instruct 两款轻量级 AI 模型,分别拥有 2.56 亿和 5 亿参数。这些模型专为低算力设备设计,能够在内存低于 1GB 的 PC 上高效运行,并具备先进的多模态能力,可用于图像描述、视频分析等任务。开发基于 The Cauldron 和 Docmatix 数据集,优化后的视觉编码器显著提升了图像处理效率,图像编码速率从每标记 1820 像素提升至 4096 像素,性能媲美规模 10 倍于其自身的模型。
来源:https://tech.ifeng.com/c/8gOuye6GeZW
页: [1]
查看完整版本: Hugging Face 推出轻量级 AI 视觉语言模型