轨迹跟踪误差直降50％，清华汪玉团队强化学习策略秘籍搞定无人机

周大发表于 2024-12-27 15:48:16

清华大学高能效计算实验室提出SimpleFlight框架，解决了强化学习在无人机控制中从仿真到现实（Sim2Real）的难题。该框架基于PPO算法，通过优化输入空间设计、奖励设计和训练技术等五项关键技术，实现了无需额外微调即可直接部署到真实环境中的鲁棒控制策略。与现有方法相比，SimpleFlight在轨迹跟踪误差上降低了50%以上，并成功应用于多种无人机平台。此外，SimpleFlight集成了高效的OmniDrones仿真平台，支持GPU并行模拟，极大加速了强化学习策略的训练过程。
来源：https://mp.weixin.qq.com/s/GC8diT1kiyOoPMX2MHJpFQ

页: [1]

靠浦ai课堂's Archiver

轨迹跟踪误差直降50％，清华汪玉团队强化学习策略秘籍搞定无人机