VAST和北航开源MIDI,从单张图像端到端生成三维组合场景

[复制链接]
周大 发表于 2025-3-14 14:54:51 | 显示全部楼层 |阅读模式
来自北京航空航天大学、VAST 等机构的研究团队推出 MIDI 模型,实现从单张图像生成高质量 3D 场景的技术突破。相比传统方法,MIDI 使用多实例扩散模型与自注意力机制,显著提升几何质量和空间布局精度,在多个数据集上表现优异。该技术广泛适用于建筑设计、虚拟现实等领域,未来将进一步优化复杂场景生成能力。
来源:https://mp.weixin.qq.com/s/PE3JUGsHKjFWEiCJMg9tHQ

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-6 15:49 , Processed in 0.290781 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表