3D基础模型时代开启？Meta与牛津大学推出VGGT，一站式Transformer开创高效3D视觉新范式

周大发表于 2025-3-28 14:27:43

牛津大学VGG与Meta AI联合推出VGGT模型，通过纯前馈Transformer架构，可从单张或多张图像中直接推理核心几何信息。该模型无需后处理优化，性能显著优于传统方法，推理速度提升近50倍。VGGT在多项3D任务中表现出色，且具备强大泛化能力，即使未专门训练单目任务，也能达到接近SOTA水平。模型训练基于17个大型3D数据集，展示了“简单架构+数据驱动”的潜力，或将成为3D视觉领域的新范式。
来源：https://mp.weixin.qq.com/s/GxHFpe0jacMQYVN1R7Yl7A

页: [1]

靠浦ai课堂's Archiver

3D基础模型时代开启？Meta与牛津大学推出VGGT，一站式Transformer开创高效3D视觉新范式