Hugging Face 推出轻量级 AI 视觉语言模型

[复制链接]
周大 发表于 2025-1-24 13:56:07 | 显示全部楼层 |阅读模式
Hugging Face 推出 SmolVLM-256M-Instruct 和 SmolVLM-500M-Instruct 两款轻量级 AI 模型,分别拥有 2.56 亿和 5 亿参数。这些模型专为低算力设备设计,能够在内存低于 1GB 的 PC 上高效运行,并具备先进的多模态能力,可用于图像描述、视频分析等任务。开发基于 The Cauldron 和 Docmatix 数据集,优化后的视觉编码器显著提升了图像处理效率,图像编码速率从每标记 1820 像素提升至 4096 像素,性能媲美规模 10 倍于其自身的模型。
来源:https://tech.ifeng.com/c/8gOuye6GeZW

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-21 10:43 , Processed in 0.291940 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表