VAST和北航开源MIDI，从单张图像端到端生成三维组合场景

周大发表于 2025-3-14 14:54:51

来自北京航空航天大学、VAST 等机构的研究团队推出 MIDI 模型，实现从单张图像生成高质量 3D 场景的技术突破。相比传统方法，MIDI 使用多实例扩散模型与自注意力机制，显著提升几何质量和空间布局精度，在多个数据集上表现优异。该技术广泛适用于建筑设计、虚拟现实等领域，未来将进一步优化复杂场景生成能力。
来源：https://mp.weixin.qq.com/s/PE3JUGsHKjFWEiCJMg9tHQ

页: [1]

靠浦ai课堂's Archiver

VAST和北航开源MIDI，从单张图像端到端生成三维组合场景