英伟达推出多模态模型DAM刷新SOTA
英伟达联合UC伯克利等机构推出多模态模型DAM,仅3B参数却能精准描述图像和视频中的细节。通过“焦点提示”和“局部视觉骨干网络”技术,DAM实现了局部与全局信息的无缝整合。研究团队还设计了DLC-SDP数据生成流水线及DLC-Bench评估基准,助力模型训练与评测。DAM在多个基准测试中表现优异,超越GPT-4o等模型,展现更强的准确性和灵活性,为数据标注、医疗影像等领域提供了新可能。来源:https://mp.weixin.qq.com/s/OzHmqP_SD8eMkoRea4jAmQ
页:
[1]