铰链物体的通用世界模型,超越扩散方法,入选CVPR 2025
清华大学与北京大学联合提出的PartRM模型,通过单张图像和拖拽信息生成物体未来状态的三维表征,在机器人操纵等任务中具有重要意义。相比传统方法,PartRM解决了效率低和缺乏三维感知的问题,实验结果显著优于基线模型。研究团队构建了PartDrag-4D数据集,并采用两阶段训练方法,确保模型性能。PartRM仅需4秒即可完成单次生成,效率大幅提升,该研究已入选CVPR 2025。来源:https://mp.weixin.qq.com/s/lg9xdmz7pzvag393-4JCuQ
页:
[1]