3D基础模型时代开启?Meta与牛津大学推出VGGT,一站式Transformer开创高效3D视觉新范式
牛津大学VGG与Meta AI联合推出VGGT模型,通过纯前馈Transformer架构,可从单张或多张图像中直接推理核心几何信息。该模型无需后处理优化,性能显著优于传统方法,推理速度提升近50倍。VGGT在多项3D任务中表现出色,且具备强大泛化能力,即使未专门训练单目任务,也能达到接近SOTA水平。模型训练基于17个大型3D数据集,展示了“简单架构+数据驱动”的潜力,或将成为3D视觉领域的新范式。来源:https://mp.weixin.qq.com/s/GxHFpe0jacMQYVN1R7Yl7A
页:
[1]