Meta开源70亿参数视觉大模型DINOv3，无标注训练横扫60多项任务

周大发表于 2025-8-15 15:09:48

Meta开源了新一代视觉大模型DINOv3，该模型采用自我监督学习，参数达70亿，训练数据达17亿张图像。DINOv3在图像分类、语义分割、深度估计、3D理解、视频任务及遥感应用等10大类、60多个任务中全面超越同类模型。其创新点包括Gram锚定技术、高分辨率适配、知识蒸馏和文本对齐策略，显著提升模型稳定性和部署灵活性。在多个主流数据集如ADE20k、Cityscapes、ImageNet1k等中表现优异，尤其在高分辨率任务中优势明显。该模型有望在医疗、自动驾驶、环境监测等领域发挥重要作用。
来源：https://tech.ifeng.com/c/8lnzlRXRFnH

页: [1]

靠浦ai课堂's Archiver

Meta开源70亿参数视觉大模型DINOv3，无标注训练横扫60多项任务