期刊首页 优先出版 当期阅读 过刊浏览 作者中心 关于期刊 English

《信息与电子工程前沿(英文)》 >> 2020年 第21卷 第5期 doi: 10.1631/FITEE.1900641

基于带积分补偿近端策略优化算法的四旋翼控制

东南大学自动化学院,中国南京市,210096

收稿日期: 2019-11-22 录用日期: 2020-05-18 发布日期: 2020-05-18

下一篇 上一篇

摘要

使用先进的近端策略优化强化学习算法优化随机控制策略,实现对无模型四旋翼飞行器速度的稳定控制。飞行器模型由4个可以学习训练的子神经网络控制,神经网络以一种端到端的方式将模型状态映射为控制命令输送给飞行器执行。将积分补偿器引入行为评估算法框架,可大大提高模型速度跟踪的准确性和鲁棒性。此外,开发了包括离线学习和在线学习的两阶段学习方案,以供实际飞行之需。在在线学习阶段,不断优化模型的飞行策略。最后,对比提出的算法与传统PID算法的实验效果。

相关研究