基于多智能体强化学习的车载自组织网络协作信道分配

2020年第21卷第7期

摘要

关键词

相关研究

回顶部

《信息与电子工程前沿（英文）》 >> 2020年第21卷第7期 doi: 10.1631/FITEE.1900308

基于多智能体强化学习的车载自组织网络协作信道分配

北京航空航天大学交通科学与工程学院，大数据科学与脑机智能高精尖创新中心，中国北京市，100191

收稿日期： 2019-06-21 录用日期： 2020-07-10 发布日期： 2020-07-10

HTML44 PDF 36 收藏 0

摘要

动态信道分配（DCA）在扩展车载自组织网络容量和缓解其拥塞方面起着关键作用。然而，在车—车直连通信场景下，信道分配面临大规模节点相互影响、缺乏集中式协调、全局网络状态信息未知以及其他挑战。为解决该问题，提出一种基于多智能体强化学习（RL）的协作动态信道分配（RL-CDCA）机制。具体而言，每个车辆节点都可借助2个互相协作的RL模型，从实时信道状态信息中成功学习信道选择和信道接入自适应退避的正确策略。此外，将神经网络构造为非线性Q函数逼近器，有助于将感测到的连续输入值映射到混合策略输出。多智能体RL-CDCA驱动节点共享本地奖励并合并区域内其他节点各自的奖励，以便它们能够以分布式协作方式优化各自策略。仿真结果表明，与4种现有机制相比，所提多智能体RL-CDCA算法即便在路网车辆高度密集的情况下仍能将单跳数据包传输延迟减少不小于73.73％，将平均数据包递送成功率提高不小于12.66％，并更好地保证网络资源分配公平性。

关键词

车载自组织网络 ; 强化学习 ; 动态信道分配 ; 多信道