Meta开源70亿参数视觉大模型DINOv3,无标注训练横扫60多项任务
Meta开源了新一代视觉大模型DINOv3,该模型采用自我监督学习,参数达70亿,训练数据达17亿张图像。DINOv3在图像分类、语义分割、深度估计、3D理解、视频任务及遥感应用等10大类、60多个任务中全面超越同类模型。其创新点包括Gram锚定技术、高分辨率适配、知识蒸馏和文本对齐策略,显著提升模型稳定性和部署灵活性。在多个主流数据集如ADE20k、Cityscapes、ImageNet1k等中表现优异,尤其在高分辨率任务中优势明显。该模型有望在医疗、自动驾驶、环境监测等领域发挥重要作用。来源:https://tech.ifeng.com/c/8lnzlRXRFnH
页:
[1]