轨迹跟踪误差直降50%,清华汪玉团队强化学习策略秘籍搞定无人机
清华大学高能效计算实验室提出SimpleFlight框架,解决了强化学习在无人机控制中从仿真到现实(Sim2Real)的难题。该框架基于PPO算法,通过优化输入空间设计、奖励设计和训练技术等五项关键技术,实现了无需额外微调即可直接部署到真实环境中的鲁棒控制策略。与现有方法相比,SimpleFlight在轨迹跟踪误差上降低了50%以上,并成功应用于多种无人机平台。此外,SimpleFlight集成了高效的OmniDrones仿真平台,支持GPU并行模拟,极大加速了强化学习策略的训练过程。来源:https://mp.weixin.qq.com/s/GC8diT1kiyOoPMX2MHJpFQ
页:
[1]