Meta开源70亿参数视觉大模型DINOv3,无标注训练横扫60多项任务

[复制链接]
周大 发表于 7 天前 | 显示全部楼层 |阅读模式
Meta开源了新一代视觉大模型DINOv3,该模型采用自我监督学习,参数达70亿,训练数据达17亿张图像。DINOv3在图像分类、语义分割、深度估计、3D理解、视频任务及遥感应用等10大类、60多个任务中全面超越同类模型。其创新点包括Gram锚定技术、高分辨率适配、知识蒸馏和文本对齐策略,显著提升模型稳定性和部署灵活性。在多个主流数据集如ADE20k、Cityscapes、ImageNet1k等中表现优异,尤其在高分辨率任务中优势明显。该模型有望在医疗、自动驾驶、环境监测等领域发挥重要作用。
来源:https://tech.ifeng.com/c/8lnzlRXRFnH

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-8-22 06:41 , Processed in 0.292438 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表