周大 发表于 2025-4-26 14:31:40

英伟达推DAM-3B模型:突破局部描述难题,让AI看懂图像/视频每一个角落

英伟达发布DAM-3B AI模型,专攻图像和视频中特定区域的精准描述问题。该模型支持点选、边界框等多种交互方式生成上下文贴合的描述文本,静态图像与动态视频分别由DAM-3B和DAM-3B-Video处理。其创新架构融合全局与局部特征,采用150万样本训练,平均准确率达67.3%,超越GPT-4o等竞品,为多领域应用开辟新路径。
来源:https://tech.ifeng.com/c/8ioWCczxco9
页: [1]
查看完整版本: 英伟达推DAM-3B模型:突破局部描述难题,让AI看懂图像/视频每一个角落