ICCV 2025满分论文:一个模型实现空间理解与主动探索大统一

[复制链接]
周大 发表于 2025-7-14 15:22:12 | 显示全部楼层 |阅读模式
清华大学等联合研究团队提出新型3D空间理解模型MTU3D,整合“理解”与“探索”两大核心能力,实现智能体在复杂物理环境中的高效导航。该模型通过动态空间记忆构建与跨模态推理决策模块,在ICCV 2025评审中获全满分评价。研究采用虚实结合的数据构建策略,涵盖超90万条导航轨迹,并在GOAT-Bench等多任务基准测试中表现出色,成功率最高达52.2%,相较现有方法提升超20%。实验表明其协同训练策略VLE有效提升了多任务适应能力,已在真实机器人上验证可行性,为具身AI走向实际应用提供新路径。
来源:https://mp.weixin.qq.com/s/EpPhCVDtCZE90GsRflvrWw

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-8-23 18:50 , Processed in 0.278643 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表