3D基础模型时代开启?Meta与牛津大学推出VGGT,一站式Transformer开创高效3D视觉新范式

[复制链接]
周大 发表于 2025-3-28 14:27:43 | 显示全部楼层 |阅读模式
牛津大学VGG与Meta AI联合推出VGGT模型,通过纯前馈Transformer架构,可从单张或多张图像中直接推理核心几何信息。该模型无需后处理优化,性能显著优于传统方法,推理速度提升近50倍。VGGT在多项3D任务中表现出色,且具备强大泛化能力,即使未专门训练单目任务,也能达到接近SOTA水平。模型训练基于17个大型3D数据集,展示了“简单架构+数据驱动”的潜力,或将成为3D视觉领域的新范式。
来源:https://mp.weixin.qq.com/s/GxHFpe0jacMQYVN1R7Yl7A

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-5 05:17 , Processed in 0.294597 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表