隐空间扩散世界模型LaDi-WM大幅提升机器人操作策略的成功率和跨场景泛化能力
国防科大、北京大学、深圳大学联合团队提出了一种基于隐空间扩散的世界模型LaDi-WM,通过结合DINOv2与Siglip提取几何与语义特征,构建通用隐空间表示,并设计了基于世界模型预测的扩散策略,通过迭代优化提升机器人操作准确性。实验表明,该方法在LIBERO-LONG数据集上实现68.7%的成功率,比现有方法提升27.9%,在真实场景中也提升了20%的操作成功率。模型在跨任务、跨场景下表现出良好泛化能力与鲁棒性,显著提升了机器人抓取操作的性能。来源:https://mp.weixin.qq.com/s/TNRZJ1NJDpvq1zGnmWFnOg
页:
[1]