登上NeurIPS，Genesis开创无需OCC引导的多模态生成新范式，在视频与激光雷达指标上达到SOTA水平

周大发表于 2025-9-28 15:21:05

华中科技大学与小米汽车联合提出多模态驾驶场景生成框架 Genesis，首次实现无需 OCC 引导的图像与点云联合生成。该模型基于场景描述和布局，通过两阶段扩散架构生成高保真视频与点云，在 nuScenes 上视频指标 FVD 达 16.95（有首帧），点云 Chamfer Distance 为 0.611（1秒预测），较现有方法提升21%以上。引入 DataCrafter 模块增强语义可控性，下游检测任务中 mAP 最高提升 0.91，验证了其在自动驾驶仿真中的潜力。
来源：https://mp.weixin.qq.com/s/np5US9uEb72KUbi2-KIoTg

		自动登录	找回密码
密码			立即注册

课程导航

登上NeurIPS，Genesis开创无需OCC引导的多模态生成新范式，在视频与激光雷达指标上达到SOTA水平