隐空间扩散世界模型LaDi-WM大幅提升机器人操作策略的成功率和跨场景泛化能力

[复制链接]
周大 发表于 5 天前 | 显示全部楼层 |阅读模式
国防科大、北京大学、深圳大学联合团队提出了一种基于隐空间扩散的世界模型LaDi-WM,通过结合DINOv2与Siglip提取几何与语义特征,构建通用隐空间表示,并设计了基于世界模型预测的扩散策略,通过迭代优化提升机器人操作准确性。实验表明,该方法在LIBERO-LONG数据集上实现68.7%的成功率,比现有方法提升27.9%,在真实场景中也提升了20%的操作成功率。模型在跨任务、跨场景下表现出良好泛化能力与鲁棒性,显著提升了机器人抓取操作的性能。
来源:https://mp.weixin.qq.com/s/TNRZJ1NJDpvq1zGnmWFnOg

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-8-22 06:37 , Processed in 0.296004 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表