英伟达推DAM-3B模型:突破局部描述难题,让AI看懂图像/视频每一个角落

[复制链接]
周大 发表于 2025-4-26 14:31:40 | 显示全部楼层 |阅读模式
英伟达发布DAM-3B AI模型,专攻图像和视频中特定区域的精准描述问题。该模型支持点选、边界框等多种交互方式生成上下文贴合的描述文本,静态图像与动态视频分别由DAM-3B和DAM-3B-Video处理。其创新架构融合全局与局部特征,采用150万样本训练,平均准确率达67.3%,超越GPT-4o等竞品,为多领域应用开辟新路径。
来源:https://tech.ifeng.com/c/8ioWCczxco9

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-9 11:18 , Processed in 0.266719 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表