《工程(英文)》 >> 2024年 第33卷 第2期 doi: 10.1016/j.eng.2023.03.018
基于安全合理探索与利用的自动驾驶自进化决策规划
a College of Electronic and Information Engineering, Tongji University, Shanghai 201804, China
b Shanghai Institute of Intelligent Science and Technology, Tongji University, Shanghai 201210, China
c School of Automotive Studies, Tongji University, Shanghai 201804, China
d School of Vehicle and Mobility, Tsinghua University, Beijing 100084, China
下一篇 上一篇
摘要
行为决策和运动规划对于自动驾驶的安全性至关重要。本研究提出了一种数据和模型混合驱动的自动驾驶在线决策规划自进化框架。首先,开发了一个基于深度强化学习(DRL)的数据驱动决策模块以尽可能追求合理的驾驶性能。然后,采用模型预测控制(MPC)同时执行纵向和横向运动规划任务,并根据车辆的物理极限定义了多个约束,以满足驾驶任务要求。最后,提出了自动驾驶自进化的安全性和合理性准则。建立了安全运动包络并与所提出的合理探索与利用机制集成,规避了不安全的动作,以此过滤不合理的经验,从而为DRL智能体收集高质量的训练数据。在高保真车辆模型和MATLAB/Simulink联合仿真环境下进行了算法验证,结果表明所提出的在线进化框架能够实现更安全、合理、高效的驾驶行为。