周大 发表于 2025-7-16 14:56:17

模仿学习新范式,Chain-of-Action:轨迹自回归实现动作推理

研究团队提出了一种新的模仿学习范式“动作链”(Chain-of-Action, CoA),通过轨迹自回归建模从目标反向生成动作序列,有效缓解传统“前向预测”方法的复合误差问题。在RLBench测试中,CoA平均成功率达55.2%,显著优于ACT和DP,并在高方差和外推任务中表现出更强泛化能力。真实机器人实验中,其成功率也分别高于ACT和DP。该方法为机器人操作建模提供了新思路。
来源:https://mp.weixin.qq.com/s/fJXWvpC1s_2FkoUYhnmTCg
页: [1]
查看完整版本: 模仿学习新范式,Chain-of-Action:轨迹自回归实现动作推理