英伟达推DAM-3B模型：突破局部描述难题，让AI看懂图像/视频每一个角落

周大发表于 2025-4-26 14:31:40

英伟达发布DAM-3B AI模型，专攻图像和视频中特定区域的精准描述问题。该模型支持点选、边界框等多种交互方式生成上下文贴合的描述文本，静态图像与动态视频分别由DAM-3B和DAM-3B-Video处理。其创新架构融合全局与局部特征，采用150万样本训练，平均准确率达67.3%，超越GPT-4o等竞品，为多领域应用开辟新路径。
来源：https://tech.ifeng.com/c/8ioWCczxco9

页: [1]

靠浦ai课堂's Archiver

英伟达推DAM-3B模型：突破局部描述难题，让AI看懂图像/视频每一个角落