周大 发表于 2024-12-11 15:13:20

「See Video, Get 3D」,智源开源无标注视频学习3D生成模型See3D

斯坦福大学李飞飞团队和国内智源研究院分别推出了空间智能模型和See3D模型,前者可将单张图片转换为逼真的3D世界,后者则利用大规模无标注互联网视频学习3D生成。See3D采用全新视觉条件技术,仅依赖视频中的视觉线索,生成多视角图像。该模型支持零样本和开放世界的3D生成,无需微调即可执行3D编辑和表面重建等任务。See3D的数据集WebVi3D包含1600万个视频片段的3.2亿帧图像,可随互联网视频增长而扩充,具备数据扩展性、相机可控性和几何一致性等优势。
来源:https://mp.weixin.qq.com/s/tP_YOkL6kAdeoHf-44Ls5Q
页: [1]
查看完整版本: 「See Video, Get 3D」,智源开源无标注视频学习3D生成模型See3D