模仿学习新范式,Chain-of-Action:轨迹自回归实现动作推理

[复制链接]
周大 发表于 2025-7-16 14:56:17 | 显示全部楼层 |阅读模式
研究团队提出了一种新的模仿学习范式“动作链”(Chain-of-Action, CoA),通过轨迹自回归建模从目标反向生成动作序列,有效缓解传统“前向预测”方法的复合误差问题。在RLBench测试中,CoA平均成功率达55.2%,显著优于ACT和DP,并在高方差和外推任务中表现出更强泛化能力。真实机器人实验中,其成功率也分别高于ACT和DP。该方法为机器人操作建模提供了新思路。
来源:https://mp.weixin.qq.com/s/fJXWvpC1s_2FkoUYhnmTCg

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-8-23 14:58 , Processed in 0.285163 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表