VAST和北航开源MIDI,从单张图像端到端生成三维组合场景
来自北京航空航天大学、VAST 等机构的研究团队推出 MIDI 模型,实现从单张图像生成高质量 3D 场景的技术突破。相比传统方法,MIDI 使用多实例扩散模型与自注意力机制,显著提升几何质量和空间布局精度,在多个数据集上表现优异。该技术广泛适用于建筑设计、虚拟现实等领域,未来将进一步优化复杂场景生成能力。来源:https://mp.weixin.qq.com/s/PE3JUGsHKjFWEiCJMg9tHQ
页:
[1]