周大 发表于 2024-12-9 15:37:31

3D具身基础模型!北大提出Lift3D赋予2D大模型鲁棒的3D操纵能力

Lift3D框架通过增强2D大规模预训练模型的3D机器人表示,实现了SOTA的操纵效果。该框架由北京大学和北京智源研究院团队研发,通过任务感知的掩码自编码器和2D基础模型lifting策略,提升了3D空间感知能力。在多个仿真和真实场景中,Lift3D展现了强大的鲁棒性和泛化能力,验证了其在复杂任务中的有效性。
来源:https://mp.weixin.qq.com/s/R0Smibgy8NpVJTwj-RjF0A
页: [1]
查看完整版本: 3D具身基础模型!北大提出Lift3D赋予2D大模型鲁棒的3D操纵能力