摘要
交通信号控制正从被动控制过渡到主动控制,以引导当前交通流按预期状态运行。一个有效的预测模型对主动交通信号控制至关重要;其中预测什么交通状态,如何高精度预测,以及如何利用预测优化控制策略是主动交通信号控制研究的关键问题。本文使用车辆位置图像描述路口交通状态,同时受基于模型的强化学习方法DreamerV2的启发,引入基于学习的交通世界模型。该世界模型以图像序列描述交通动态,并作为交通环境的抽象替代以生成多步预测样本用于控制策略优化。在执行阶段,优化后的交通信号控制器根据交通状态的抽象表示直接实时输出控制指令,同时世界模型能够预测不同控制行为对未来交通状态的影响。实验结果表明,基于交通世界模型优化的控制策略的性能优于一般基准,并且世界模型实现了基于图像的高精度预测;这些结果显示了世界模型在未来交通信号控制中的应用前景。