模仿学习新范式，Chain-of-Action：轨迹自回归实现动作推理

周大发表于 2025-7-16 14:56:17

研究团队提出了一种新的模仿学习范式“动作链”（Chain-of-Action, CoA），通过轨迹自回归建模从目标反向生成动作序列，有效缓解传统“前向预测”方法的复合误差问题。在RLBench测试中，CoA平均成功率达55.2%，显著优于ACT和DP，并在高方差和外推任务中表现出更强泛化能力。真实机器人实验中，其成功率也分别高于ACT和DP。该方法为机器人操作建模提供了新思路。
来源：https://mp.weixin.qq.com/s/fJXWvpC1s_2FkoUYhnmTCg

页: [1]

靠浦ai课堂's Archiver

模仿学习新范式，Chain-of-Action：轨迹自回归实现动作推理