「See Video, Get 3D」,智源开源无标注视频学习3D生成模型See3D

[复制链接]
周大 发表于 2024-12-11 15:13:20 | 显示全部楼层 |阅读模式
斯坦福大学李飞飞团队和国内智源研究院分别推出了空间智能模型和See3D模型,前者可将单张图片转换为逼真的3D世界,后者则利用大规模无标注互联网视频学习3D生成。See3D采用全新视觉条件技术,仅依赖视频中的视觉线索,生成多视角图像。该模型支持零样本和开放世界的3D生成,无需微调即可执行3D编辑和表面重建等任务。See3D的数据集WebVi3D包含1600万个视频片段的3.2亿帧图像,可随互联网视频增长而扩充,具备数据扩展性、相机可控性和几何一致性等优势。
来源:https://mp.weixin.qq.com/s/tP_YOkL6kAdeoHf-44Ls5Q

学员登陆|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2024-12-23 15:56 , Processed in 0.263155 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表