英伟达推出多模态模型DAM刷新SOTA

[复制链接]
周大 发表于 2025-4-27 14:54:21 | 显示全部楼层 |阅读模式
英伟达联合UC伯克利等机构推出多模态模型DAM,仅3B参数却能精准描述图像和视频中的细节。通过“焦点提示”和“局部视觉骨干网络”技术,DAM实现了局部与全局信息的无缝整合。研究团队还设计了DLC-SDP数据生成流水线及DLC-Bench评估基准,助力模型训练与评测。DAM在多个基准测试中表现优异,超越GPT-4o等模型,展现更强的准确性和灵活性,为数据标注、医疗影像等领域提供了新可能。
来源:https://mp.weixin.qq.com/s/OzHmqP_SD8eMkoRea4jAmQ

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-9 12:36 , Processed in 0.280035 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表