轨迹跟踪误差直降50%,清华汪玉团队强化学习策略秘籍搞定无人机

[复制链接]
周大 发表于 2024-12-27 15:48:16 | 显示全部楼层 |阅读模式
清华大学高能效计算实验室提出SimpleFlight框架,解决了强化学习在无人机控制中从仿真到现实(Sim2Real)的难题。该框架基于PPO算法,通过优化输入空间设计、奖励设计和训练技术等五项关键技术,实现了无需额外微调即可直接部署到真实环境中的鲁棒控制策略。与现有方法相比,SimpleFlight在轨迹跟踪误差上降低了50%以上,并成功应用于多种无人机平台。此外,SimpleFlight集成了高效的OmniDrones仿真平台,支持GPU并行模拟,极大加速了强化学习策略的训练过程。
来源:https://mp.weixin.qq.com/s/GC8diT1kiyOoPMX2MHJpFQ

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-22 10:34 , Processed in 0.286706 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表