英伟达推出多模态模型DAM刷新SOTA

周大发表于 2025-4-27 14:54:21

英伟达联合UC伯克利等机构推出多模态模型DAM，仅3B参数却能精准描述图像和视频中的细节。通过“焦点提示”和“局部视觉骨干网络”技术，DAM实现了局部与全局信息的无缝整合。研究团队还设计了DLC-SDP数据生成流水线及DLC-Bench评估基准，助力模型训练与评测。DAM在多个基准测试中表现优异，超越GPT-4o等模型，展现更强的准确性和灵活性，为数据标注、医疗影像等领域提供了新可能。
来源：https://mp.weixin.qq.com/s/OzHmqP_SD8eMkoRea4jAmQ

页: [1]

靠浦ai课堂's Archiver

英伟达推出多模态模型DAM刷新SOTA