ICCV 2025满分论文：一个模型实现空间理解与主动探索大统一

周大发表于 2025-7-14 15:22:12

清华大学等联合研究团队提出新型3D空间理解模型MTU3D，整合“理解”与“探索”两大核心能力，实现智能体在复杂物理环境中的高效导航。该模型通过动态空间记忆构建与跨模态推理决策模块，在ICCV 2025评审中获全满分评价。研究采用虚实结合的数据构建策略，涵盖超90万条导航轨迹，并在GOAT-Bench等多任务基准测试中表现出色，成功率最高达52.2%，相较现有方法提升超20%。实验表明其协同训练策略VLE有效提升了多任务适应能力，已在真实机器人上验证可行性，为具身AI走向实际应用提供新路径。
来源：https://mp.weixin.qq.com/s/EpPhCVDtCZE90GsRflvrWw

		自动登录	找回密码
密码			立即注册

课程导航

ICCV 2025满分论文：一个模型实现空间理解与主动探索大统一