《1、 引言》

1、 引言

近年来,对自动驾驶广泛而深入的研究在不同领域受到了广泛关注,特别是在智能交通领域。如何获得全面的态势认知和对周围随驾驶意图动态环境的深入理解是实现完全自动驾驶的主要挑战之一。为了解决这个问题,一个可行的解决方案是预测周围车辆的运动轨迹,从而可以对自动驾驶车辆周围的环境进行预期评估,避免即将发生或潜在的驾驶风险[12]。

基于多车交互感知的轨迹预测是目前研究的热点之一[34],而在当前实际的混合交通环境中,大多数自动驾驶车辆(AV)在没有车车或车路通信技术的支持下无法感知远距离或盲区车辆的运动状态。因此,本文的工作集中在从自动驾驶车辆的视角对前方或相邻车辆进行轨迹预测。

一些研究人员已经对车辆轨迹预测展开了相关研究并取得了一定的成果。目前,主要应用于该研究领域的方法可分为三类[57]:基于车辆模型的车辆轨迹预测、基于驾驶意图的车辆轨迹预测和基于深度学习的车辆轨迹预测。基于车辆模型的预测方法是一种简单直观的方法[8]。它仅使用基本的车辆运动模型,包括车辆运动学模型,如恒定速度(CV)模型、恒定加速度(CA)模型和恒定转弯率和加速度(CTRA)模型[9],以及车辆动力学模型,如二自由度“自行车”模型[10]。考虑到模型不确定性的影响,可以将多种滤波算法应用于这些线性或非线性车辆模型,如卡尔曼滤波(KF)、扩展卡尔曼滤波(EKF)[11]、无损卡尔曼滤波(UKF)[12]和粒子滤波(PF)[13]。通常,此类方法利用了车辆物理学运动规律,可以在短期范围内(一般预测时域小于1 s [5])取得良好的预测性能。然而,由于缺乏对车辆高级语义信息的考虑,这种方法对车辆的长期预测是不充分的。这里需指出的是,如果预测时域小于1 s,则定义为短期预测,如果预测时域超过2 s,则定义为长期预测。

至于基于驾驶意图的预测方法,它假设车辆未来的运动轨迹与车辆驾驶意图的倾向是一致的[5,14]。因此,这类研究方法需要首先识别车辆驾驶行为或意图,然后进行轨迹预测[1516]。具体来说,常见的判别分类器,如支持向量机[17],和相关生成模型,如隐马尔可夫模型(HMM)[18],经常被用于车辆的驾驶意图识别。有关此内容的完整描述和先进研究可以在文献[6,1920]中找到。基于识别后的车辆驾驶意图进行轨迹预测的方法,主要包括基于运动模式的方法,如高斯过程(GP)[2122],和其他基于意图的预测方法[23]。Li等[24]使用高斯混合模型将车辆轨迹分为几种典型模式,根据这些模式,从GP中进行交通建模和运动不确定性的表征。Schreier等[23]建立了一个贝叶斯网络来推断每辆车的驾驶意图和动作,通过整合随机元素的运动规划方法,建立了一个概率轨迹预测模型(TPM)。一般来说,虽然基于驾驶意图的预测方法容易出现预测初期精度低的问题,但由于使用了车辆的高级语义信息,它比较适用于具有不确定性的车辆长期轨迹预测。

此外,还有几种预测方法将车辆模型和驾驶意图识别模型结合起来进行轨迹预测[2527]。Houenou等[25]预测轨迹时考虑了车辆运动学和意图识别,提高了在短期和长期范围内的预测精度。在文献[26]中,Xie等使用交互式多模型进行轨迹预测,该模型结合了车辆运动学模型和意图模型,在较长的预测时域范围内实现了更准确的轨迹预测。但是,这些方法仍然存在一些不足。大多数模型参数需人为调整,且未考虑车辆运动特性(图1)对预测精度和不确定性的影响。

《图1》

图1 车辆运动特性的图示。黄色的是自动驾驶车辆AV,蓝色车辆是其中一个将被预测的周围车辆。在特定的驾驶意图下,被预测的车辆可能具有各种运动动作。在本文中,将这一特性定义为车辆运动特性。

关于基于深度学习的预测,该类轨迹预测框架主要基于深度神经网络,如卷积神经网络(CNN)、循环神经网络(RNN)、长短期记忆网络(LSTM)或它们的组合网络结构[2833]。文献[28]构建了一个采用卷积社会池的LSTM编码器-解码器模型,该模型可以在预期轨迹上生成多模态预测分布。文献[29]引入了基于RNN的编码器-解码器架构,编码器学习先前轨迹的模式,而解码器则用于创建轨迹序列。Yan等[30]开发了一个基于LSTM的编码器-解码器框架,并引入两种空间注意力机制以提高预测精度。Mo等[31]使用CNN-LSTM预测网联车辆的交互感知轨迹,通过LSTM对车辆状态进行个性化预测[3233]。虽然这些方法适合处理车辆间的交互作用,并且在长期预测中表现良好,但难以引入交通规则或车辆模型来提高预测合理性和预测精度。

本文的研究对象主要集中在非网联混合交通环境中的自动驾驶车辆,因此难以提供这些基于深度学习的模型所需的多种环境信息。另外,无论被预测车辆的行为是否受到其他因素的影响,其历史运动轨迹始终客观存在,可以利用其实际历史运动信息来判断被预测车辆的趋势。

本文提出了不确定条件下车辆轨迹预测的综合方案。本文的主要贡献简要总结如下:

(1)提出了一种由车辆模型和自然驾驶数据驱动的车辆长期轨迹预测的概率框架。整体概率框架具有可解释性,可以减少数据依赖性并处理动态环境中的预测不确定性。

(2)设计了一种驾驶意图识别模型(DIM),用于揭示和推断有关驾驶意图和运动特性的车辆高级语义信息,同时考虑了基本交通规则及车辆基本纵横向运动元素。

(3)综合考虑车辆的运动特性并集成基于车辆运动学模型的短期预测结果,开发了TPM,保证整体预测过程的精度。

本文的其余部分组织如下:第2节概述了系统框架;第3节和第4节详细介绍了方法设计的细节,包括驾驶意图识别模块和轨迹预测模块;在第5节中使用自然驾驶数据集进行方法验证分析与比较;第6节中进行了总结。

《2、 系统框架》

2、 系统框架

本文的研究目标是让自动驾驶车辆在复杂的交通环境中具有更好的态势认识能力。例如,自动驾驶车辆需要在预测相邻车辆的未来运动轨迹后进行行为决策与轨迹规划。现有的车辆轨迹预测方法有多种类型,但缺乏考虑很大程度影响最终预测精度的多种综合因素。本文在非网联混合动态环境下,将显著影响因素总结为两类:包括车辆驾驶意图和运动特性在内的高级语义信息,以及包括车辆物理运动和交通规则在内的基础语义信息。

本文的研究提出了一种概率性轨迹预测框架,将车辆运动特性和基于语义信息(包括物理运动和交通规则)整合起来。通过该框架,AV可以预测周围车辆的长期运动轨迹,从而在交通环境中做出合理的决策。所提框架如图2所示,主要由驾驶意图识别模块、基于车辆模型的预测模块和长期轨迹预测模块组成。其中,自然驾驶数据用于提供必要的环境信息,这些信息可以基于序列聚类算法对车辆驾驶意图和运动特性进行分类。

《图2》

图2 用长期车辆轨迹预测的概率框架图。详细介绍了驾驶意图识别模块、基于车辆模型的短期预测和基于高斯过程的长期轨迹预测模块,并解释了它们之间的逻辑关系。参数的定义可以在相应的章节中找到。

驾驶意图识别模块的主要目标是通过DIM生成驾驶意图和运动特性的概率。首先,基于动态贝叶斯网络定义了DIM的结构。然后,可以通过数据训练学习DIM的参数。最后,给定预测车辆的历史和环境信息,输出DIM的概率推断结果。基于车辆历史运动信息,可以通过车辆运动力学模型在短期内做出较为准确的轨迹预测。通过建立非线性车辆模型,利用滤波算法处理车辆的历史轨迹点,并生成车辆未来的短期预测位置点,这里将滤波后的历史轨迹点和未来的短期预测点均称为“支撑点”。

对于长期轨迹预测模块,首先,根据DIM的推理结果构建基于GP的TPM。然后,使用数据学习的方法获取模型参数。最终,通过融合短期支撑点预测具有确定性描述的未来车辆的长期运动轨迹。因此,TPM是进行车辆长期轨迹预测的最终模型,DIM是驾驶意图推断不可或缺的部分。

《3、 驾驶意图识别模块》

3、 驾驶意图识别模块

驾驶意图识别模块旨在识别车辆驾驶意图和运动特性概率,这些概率将用作后续轨迹预测模块的输入。此模块主要包括DIM构建、模型数据训练和模型概率推理这三部分内容。

《3.1 DIM构建》

3.1 DIM构建

首先根据动态贝叶斯网络理论[34]定义了DIM结构。基于一阶马尔可夫链假设,将DIM构造为有向无环图模型。要确定动态贝叶斯网络的结构,需要首先定义先验网络和转移网络。先验网络定义了初始时间t=1时各节点之间的连接关系,转移网络定义了相邻时间tt+1之间各节点间的连接关系。

图3展示了DIM的转移网络结构,它包含两种类型的节点:隐藏节点H1,H2,M1, M2和观测节点O1,O2,O3, O4。具体来说,H1,H2节点分别表示高级语义信息、驾驶意图和运动特性;M1, M2用于表示混合参数。O1,O3, O4节点表示观测到的运动变量,其中包含纵向或横向位置、速度或加速度;节点O2将由一个四维向量o2表示,由布尔值组成,表示它是最左侧还是最右侧的车道,以及左侧或右侧是否有相邻的车辆。如果O2值为0,0,1,1,则表示车辆不在最左侧或最右侧车道上,但其左侧和右侧都有相邻车辆。如图1所示,被预测的蓝色车辆所在的车道不是最左侧或最右侧的车道。但是,被预测车辆的左侧和右侧都存在白色车辆。在真实的驾驶环境中,车辆的历史轨迹有时会偏离车道中心线,导致对车辆驾驶意图的错误识别。因此,在DIM中引入基本道路或驾驶规则信息,以提高DIM对驾驶意图识别的合理性和准确率。

《图3》

图3 基于动态贝叶斯网络的DIM设计结构。正方形和圆形分别表示离散节点和连续节点;无阴影和有阴影的节点分别表示隐藏节点和观测节点。网络中的节点表示各个预定义的变量,节点之间的箭头连接表示条件概率分布(CPD)。

定义DIM的网络结构后,可以设置DIM的联合概率分布和条件概率分布(CPD)。DIM可以建模为时间t下一组随机变量的随机过程Zt=H1t,H2t,M1t,M2t,O1t,O2t,O3t,O4t。变量在时间T内的联合概率分布定义如下:

P(Z1:T)==t=1Ti=1NPZitPa(Zit)(1)

式中,P表示概率;Zit表示时间t下的第i个节点;Pa(Zit)是网络中Zit的父节点;N表示变量Zt中包含的节点数。

DIM中的CPD可以分为三种类型的矩阵:隐变量的先验分布矩阵、隐变量的转移矩阵和观测矩阵。前两个矩阵表示如下:

π=πi,πi=PHi1,i=1,2

A=ai,ai=PHit+1|Hit,i=1,2(2)

式中,π1,π2表示节点H1,H2在时间t=1时的先验概率;a1,a2表示节点H1,H2在时间tt+1之间的转移概率。最后一个矩阵可以表示为:

B=bi,bi=PMit|Hit,i=1,2

b3=PO2t|H1t;b4=PO1t|H1t,M1t

b5=PO3t|H1t,H2t;b6=PO4t|H2t,M2t(3)

式中,b1,b2表示节点H1,M1H2,M2在时间t下的条件概率。同样地,b3,b4,b5,b6表示时间t下观测节点O1,O2,O3, O4和隐藏节点H1,H2,M1, M2之间的条件概率。

对于公式(3)中的条件概率b3,需要根据当前驾驶环境引入交通规则的约束。以高速公路场景为例,当被预测车辆处于最左侧或最右侧车道时,其驾驶意图为左换道或右换道的概率为零,当被预测车辆的左侧或右侧车道有相邻车辆时,其驾驶意图为左换道或右换道的概率为零。对于图1中被预测的蓝色车辆,其左右两侧均有相邻车辆,因此它驾驶意图为左换道或右换道的概率b3为零。这些条件概率将影响随后的概率推断。

需注意的是,这里假设CPD中的参数是时不变的,且由于节点O1,O3, O4是连续变量,因此b4,b5,b6可以使用高斯分布表示。

《3.2 模型数据训练》

3.2 模型数据训练

在DIM中指定了各个CPD后,π,A,B中的参数定义为模型的参数λ。模型数据训练的任务是给定观测节点O1,O2,O3, O4的观测序列O=ot=oit (t=1:T;i=1,2,3,4),学习模型参数λ。由于O中可能存在缺失数据,可以利用最大似然识别方法(MLE)和期望最大化算法(EM)[35]来优化并获得λ,主要包括计算期望值和最大化期望值这两个步骤。

首先,将似然函数F(λ)定义为:

Fλ=POλ=SPO,Sλ(4)

式中,S是隐藏节点H1,H2的状态序列,S=st=sit (t=1:T;i=1,2)

然后,使用初始化参数λ¯,在条件分布PS|λ¯,O下,完全似然函数logPS,O|λ的期望可以表示为:

Rλ|λ¯=Εlog P(S,O|λ)|λ¯,O=SPSλ¯,Olog PO,Sλ(5)

式中,E表示期望函数。

为了计算Rλ|λ¯,使用前向-后向算法[3536]。相关的正向变量αtst和后向变量βtst可以表示为:

αtst=PO1:t,St=stλ

βtst=POt+1:TSt=st,λ(6)

αtstβtst的具体计算过程见文献[35],文献[35]推导了HMM的前向-后向算法。使用詹森不等式[35,37]对公式(6)进行Rλ|λ¯最大化,得到模型参数λ。模型训练任务可以看作对似然函数F(λ)的带约束优化问题,因此可以使用拉格朗日乘子法来构建标准拉格朗日优化问题,以查找新的模型识别参数λ。整个迭代过程如算法1所示。

《3.3 模型概率推理》

3.3 模型概率推理

利用从模型训练中得出的模型参数λ,可以对DIM进行概率推断,包括对驾驶意图和运动特性的推断。这部分旨在给定时间T内的观测序列的情况下,找到最可能的状态序列

首先,使用贝叶斯公式定义一个临时变量r():

rtst=PSt=stO1:T,λ=PO1:TSt=st,λPSt=stPO1:Tλ(7)

式中,PSt=st|O1:T,λ表示在给定1:和模型参数λ的情况下,在时间t下处于状态的概率。

然后,使用公式(6)中的变量αtst,βtstrt)可以表示为:

rtst==αtstβtststαtstβtst(8)

最后,通过求解以下优化问题,可以计算出时间t下最可能的状态 。整个过程在算法1中进行了描述。

St=argmaxstrtst(9)

《算法1》

算法1 DIM的数据训练和概率推理

Data training:

1

Initialize λ0, convergence threshold ε and the observation sequence O=ot=oit (t=1:T;i=1,2,3,4)

2

forj = 1:ndo

3

Calculate the expectation: Rλj|λj-1=ΕlogP(S,O|λj)|λj-1,O

4

 MaximizeRλj|λj-1 using Jensen’s inequality theory

5

Output the model parameter λj

6

  if logPO|λj-logPO|λj-1<ε then

7

  λλj

8

  end if

9

end for

Probabilistic inference:

10

Initialize λ and the observation sequence O=ot=oit (t=1:T;i=1,2,3,4)

11

fort = 1:Tdo

12

Calculate the forward variable: αtst=PO1:t,St=stλ

13

Calculate the backward variable: βtst=POt+1:TSt=st,λ

14

Calculate the interim variable: rtst==αtstβtststαtstβtst

15

 Calculate the most likely state:St=argmaxstrtst

16

end for

17

Output the most likely state St

《4、 轨迹预测模块》

4、 轨迹预测模块

轨迹预测模块的目的是根据DIM输出的车辆驾驶意图和运动特性识别概率,对预测车辆进行概率性长期轨迹预测。本节将主要关注基于车辆模型的预测、TPM构建和概率性轨迹预测这三个方面。接下来,将进行详细介绍。

《4.1 基于车辆模型的预测》

4.1 基于车辆模型的预测

如前所述,基于车辆模型的方法在短期预测方面具有优势。这里将使用CTRA运动学车辆模型[9]来获取支撑点作为轨迹预测模块的输入,包括滤波后的历史轨迹点和未来短期范围内的轨迹点。

首先,状态空间和状态转移的表达式如下:

st=x,y,v,a,θ,ωT

st+Δt=st+Δst(10)

式中,x,y分别表示车辆的纵向和横向位置;v,a分别表示车辆在行驶方向上的速度和加速度;θ,ω分别表示车辆的横摆角和横摆角速度。此外,Δt是指运行周期,与数据采样频率一致,Δ(t)可以通过公式(11)获得:

v+aΔtωsin θ+ωΔt-vωsin θ+aω2cos θ+ωΔt-cos θvωcos θ-v+aΔtωcos θ+ωΔt+aω2sin θ+ωΔt-sin θaΔt0ωΔt0(11)

为了解决模型的不确定性,使用UKF算法处理历史轨迹点和未来轨迹点[38]。具有不确定性的状态和观测表达式可以描述为:

st+Δt=wt+qt

gt=ht+rt(12)

式中,w(·)是运动函数;q(·)是系统噪声函数,此处定义为高斯噪声;是观测空间;h(·)是观测函数;r(·)是观测噪声。

然后,通过迭代状态表达式可以计算滤波后的历史轨迹点xhf=x1:t,yhf=y1:t和未来短期范围内的预测点xsf=xt:t+Δt,ysf=yt:t+Δt。其中,t是当前时间;Δt是短期预测时域;下标hf表示历史轨迹点序列,sf表示未来的短期轨迹点序列。此外,上述方法适用于车辆横向运动预测,如换道轨迹预测。由于车辆纵向运动的预测较为简单,选择带有KF的CA模型来生成轨迹点xhf,yhfxsf,ysf。有时,很难预测车辆的横摆角和横摆角速度,可以用xhf,yhf间接计算得到。

《4.2 TPM构建》

4.2 TPM构建

在这里,将为每类驾驶意图和运动特性构建TPM。例如,给定一个特定驾驶意图和运动特性下的车辆轨迹数据集D=xi=xi1:Ti,yi=yi1:Ti,i=1:N(其中N表示轨迹数量,i表示第i条轨迹的长度),通过假设x=fxt,y=fyt,可以表示一个概率分布Pf=fx,fyD然后基于GP [39],使用在有限时间内定义的参数分布构建TPM,该分布由均值向量和协方差矩阵组成:

f𝒩u,K,u=mt,t=1:T

K=κti,tj,i,j=1:N(13)

式中,符号f𝒩表示车辆轨迹和高斯分布函数;m·是均值函数;κ是一个正定核,表示函数值在时间ij之间的依赖关系。

由于观测数据可能有噪声,因此将噪声的协方差矩阵表示为K´=K+σn2IN,其中,n是噪声标准差,N是单位矩阵。对于从高速换道场景中获得的车辆换道轨迹,其均值和协方差函数可以表示如下:

mt=a0+a1t+a2t2+a3t3+a4t4+a5t5

κt,t´=σf2exp -12l2t-t´2+σn2δt,t´(14)

式中,均值函数表示为五次多项式,其参数为a=a0,a1,a2,a3,a4,a5,利用该曲线可以获得连续平滑的车辆轨迹,且车辆运动的速度和加速度也是连续的;k=𝓁,σf,σn是协方差函数的参数,其中平方指数核因其良好的平滑性能而被采用;δt,t,是克罗内克函数。

同样地,对于从直行场景中得到的轨迹,可以将均值函数更改为线性曲线。建立TPM后,需要确定模型的参数θ=a,k。学习合适的θ值至关重要,因为最终的轨迹预测精度直接取决于TPM参数的合理性。为了使预测结果更加合理可靠,可以从训练数据D中学习参数,而不是人为定义θ

接下来,将介绍参数学习的过程。以横向运动为例,首先,相应的对数边际似然L(θ)可以表示如下:

Lθ=-12log K+σn2IN-N2log 2π-12y-uTK+σn2IN-1y-u(15)

然后,可以使用公式(14)对Lθ的偏导数进行优化来获得a,k的参数θa,θk

(16)

最后,利用基于共轭梯度的优化方法来有效地计算出最优模型参数。至于纵向运动,其模型参数学习类似于横向运动的情况。

《4.3 概率性轨迹预测》

4.3 概率性轨迹预测

在这里,将首先介绍基于TPM的轨迹预测。以横向轨迹预测为例,用表示已知的观测轨迹点,*表示未知的未来轨迹点,其联合概率密度可以表示为:

yy*~𝒩uyuy*,Ky  Ky*Ky*T Ky**(17)

式中,uy,Ky表示的均值和方差;uy*,Ky**表示*的均值和方差;Ky*表示*之间的协方差。

然后,在其基础上融合车辆的支撑点。新的观测点将被′=hf +sf取代。此外,对于纵向预测,新的观测点将被′ =hf +sf所取代。之后,给定′下获得*的条件预测概率可以由下式表示:

py*|y´=𝒩uy*+Ky*TKy-1y´-uy,Ky**-Ky*TKy-1Ky*(18)

最后,可以从公式(18)中的均值函数uy*+Ky*TKy-1y´-uy获得车辆长期的预测轨迹点,相应的预测不确定性可以用公式(18)中的协方差函数Ky**-Ky*TKy-1Ky*来描述。由于每个时刻的预测点服从高斯分布,因此轨迹点的横向不确定性可以用相关方差的值来表示。同样地,在计算纵向轨迹预测时,可以使用相同的方法来获得条件预测概率px*|x´。最后,通过计算px*|x´py*|y´,可以得到长期范围内车辆的轨迹预测点p,:)。整个车辆轨迹预测的计算过程如算法2所示。

《算法2》

算法2 车辆概率性轨迹预测

Input: x,y,v,a1:t, driving intention probabilityPIntentt, and motion characteristic probability PMcharactt

Output: prediction pointsxt:T,yt:T

1

if the probability of lane keepingPLkt=max{PIntentt} then

2

Calculate the points based on CV and KF: xhf,yhf,xsf,ysf

3

else

4

Calculate the points based on CTRA and PF: xhf,yhf,xsf,ysf

5

end if

6

Output the input of TPM: y′ = yhf + ysf, x′ = xhf + xsf

7

Calculate the most likely characteristic:Pmax_ Charactt=max{PMcharactt}

8

Calculate the most likely intention:Pmax_ Intentt=max{PIntentt}

9

Select θ to match Pmax_ Intentt and Pmax_ Charactt

10

Calculate trajectory prediction points (xt:T, yt:T) using px*|x´ and py*|y´

《5、 实验》

5、 实验

由于直行和换道是在自然驾驶过程中最常遇到的驾驶行为,因此在本节中,将在高速公路场景中充分验证所设计和开发的DIM和TPM。根据本文所提出的贡献点,将验证所提DIM的优越性。然后,从不同的方面展示TPM的整体性能。

首先,介绍数据处理方法,包括驾驶意图的标定和运动特性的分类。然后,将展示DIM的推理概率结果和DIM的性能评估结果。最后,对TPM的轨迹预测结果进行展示和分析。此外,将进一步评估和对比模型和方法的性能,以证明所提方法的有效性。

《5.1 数据处理》

5.1 数据处理

在这里,使用来自德国高速公路的自然驾驶轨迹数据集——highD数据集[40]来验证所提出长期轨迹预测方法的有效性。highD数据集包含来自110 000辆车在6个不同地点采集长达16.5 h的测量数据。此外,它还记录了5600个完整的换道场景数据。与常用的Next Generation SIMuration (NGSIM)数据集相比,highD数据集中的车辆具有更合理的速度分布,更贴近真实的驾驶环境。因此,可以为所构建的DIM和TPM完成模型训练或学习。训练和测试集主要包括三个部分:驾驶意图的校准、运动特性的校准以及观测变量的确定。对于测试集,仅包含观测变量。

首先,根据高速公路场景,将驾驶意图分为左换道、直行和右换道这三类。当车辆的横向偏移相对于车辆运动的平均横向位置超过0.1 m时,定义为换道的起始时间。对于驾驶意图的校准,将起始时间之前的轨迹定义为直线行驶阶段,将其之后的轨迹定义为换道阶段。

然后,进行运动特性的校准。由于很难直接校准这个抽象变量,因此采用基于k-means的序列聚类算法对运动特性进行分类[41]。通常,聚类数C很难确定,因为它不是概率模型,也没有似然性。因此,使用均方误差(MSE)来解决此问题,见式(19):

MSEQ,C=1QciQci-ci2(19)

式中,Q表示轨迹样本;ci表示Q中的第i个轨迹样本;聚类中心ci可以从以下公式导出:

ci=udi,di=argmincci-uc2(20)

式中,uc表示第c个聚类中心;udi表示最优聚类结果(即第i个聚类中心)。

随后,使用横向加速度序列进行运动特性的聚类,左换道情况下的聚类结果如下所示。通过图4(a)所示的横向加速度序列数据,可以使用聚类算法尝试不同的K值,并分别计算MSE。根据图4(b)中的展示结果,聚类中心的数量可以设置为3,对应于误差曲线中的拐点。因此,运动特性可以通过三个聚类中心来表示,如图4(c)所示。这些曲线的波峰和波谷之间的差异可以从图中清晰地看出。蓝色曲线表示运动特性1;黄色曲线表示运动特性2;橙色曲线表示运动特性3。类似地,可以在右换道的情况下获得相应的聚类中心,如图4(d)所示。

《图4》

图4 (a)左侧换道情况下横向加速度序列数据;(b)不同聚类数的MSE变化;(c)左换道情况下运动特性的聚类中心(Lcl-1、Lcl-2和Lcl-3分别代表左换道过程中的运动特性1、2和3);(d)右换道情况下运动特性的聚类中心(Lcr-1、Lcr-2和Lcr-3分别表示右换道过程中的运动特性1、2和3)。

最后,根据模型的不同要求确定观测变量。通过上述方法可以得到TPM对应的训练和测试集,其中包含不同驾驶意图和运动特性下的位置序列(x,y)。但是,为了准备DIM的训练和测试集,需要定义DIM中节点的运动变量O1,O3,O4。由于运动特性主要由横向和纵向加速度(x,y)决定,因此驾驶意图可以由横向位置y、横向速度y和横向加速度y进行表征,相关节点设置为O1=ax,ay,O3=vy,O4=y,ay。需注意的是,此设置情况是尝试多种不同组合后的经验结果。最后,可以获得用于DIM训练的状态和观测序列(,)。

《5.2 DIM的结果分析和估值》

5.2 DIM的结果分析和估值

通过数据处理的结果,可以从DIM的训练集中学习DIM参数。然后,使用第2节中描述的方法进行模型概率推理。随后,利用测试集评价推理结果的性能。如图5图6所示,分别展示了左换道和右换道情况下的结果,带颜色的虚线表示驾驶意图或运动特性随时间变化的概率,黑色实线表示车辆的真实横向位置或横向加速度。此外,驾驶意图的概率如图5(a)和图6(a)所示,运动特性的概率如图5(b)和图6(b)所示。

《图5》

图5 在左换道场景下DIM的概率结果。(a)驾驶意图的概率;(b)运动特性的概率。

《图6》

图6 在右换道场景下DIM的概率结果。(a)驾驶意图的概率;(b)运动特性的概率。

接下来,将定量分析DIM的性能,因为它是TPM的基本输入,对轨迹预测精度有重大影响。由于图5图6中的彩色线在换道时波动不频繁,因此仅使用准确率评估DIM。如果一个特定序列的识别概率超过90%,将其定义为正确识别的情况。为了进一步展示所设计的DIM模型的性能,将其与传统的模型进行了比较,包括HMM、具有高斯混合输出的HMM模型(GMM-HMM)[34,42],以及本文之前所构建的驾驶特性和意图识别(DCIE)模型[37]。DIM模型的统计结果如表1所示,可以看到,DIM模型对驾驶意图和运动特性的准确率分别达到94.5%和92.3%,而DCIE模型的结果分别为92.4%和90.1%。此外,HMM和GMM-HMM的精度都低于所设计的DIM模型。

《表1》

表1 不同模型的准确率对比结果

Accuracy rateModel
HMM (%)GMM‒HMM (%)DCIE (%)DIM (Ours) (%)
Driving intention86.1090.4092.4094.50
Motion characteristic81.9089.2090.1092.30

为了进一步证明引入交通规则后DIM模型对驾驶意图识别的准确率能得到提高,测试了在图3中删除节点O2t后的模型。该模型用于驾驶意图识别的准确率为93.87%,相比之下,DIM模型提高了0.67%。因此,本文所提出的引入交通规则信息的模型具有更高的识别准确率。

综上所述,所设计的DIM模型可以有效地推断出驾驶意图或运动特性的概率。从可视化结果来看,DIM模型具有良好的响应特性,与其他模型相比,在推理能力和识别准确性方面也有更大的优势。

《5.3 TPM的结果分析和比较》

5.3 TPM的结果分析和比较

如前所述,每个TPM对应于一个特定的驾驶意图和运动特性。因此,给定TPM的训练集,可以从数据中学习每个TPM的模型参数。

基于所提出的方法,进行车辆长期轨迹预测主要有三个过程。首先,通过DIM可以确定驾驶意图概率超过90%时的开始时刻。之后,可以确定该时刻下最可能的驾驶意图和运动特性。然后,根据最可能的结果选择相应的TPM模型。通过选择的TPM和对应的车辆模型,进行最终的概率性轨迹预测。

在左换道的场景下,所提出的轨迹预测方法的结果如图7所示。在图7(a)中,展示了在开始时刻前一秒下的预测结果。可以看到,图7中的观测点是基于车辆模型的预测模块输出的轨迹点。由于在开始时刻下车辆左换道意图的概率超过90%,因此可以通过TPM预测未来的长期轨迹,如图7(b)所示。此外,由于在开始时刻车辆左换道和直行意图的概率均低于50%,可以通过所提出的方法进行多模态轨迹预测[图7(a)]。需注意的是,在处理直行场景时,应该选择CV模型作为车辆模型。

《图7》

图7 所提轨迹预测方法在左换道场景下的验证结果。(a)在开始时刻前一秒下的轨迹预测结果;(b)开始时刻下的轨迹预测结果。红色实心方块表示起点,四边形表示预测车辆;蓝线表示观测点,黑线表示真实的未来轨迹;红线表示左换道预测轨迹;橙色线表示直行预测轨迹。LK:直行;Lcl:左换道。

此外,在图7中可以发现,基于TPG的预测质量将随着观测到的序列的增加而提高。由于所提的TPM是基于GP设计的,因此当提供额外可靠的已知观测点时,模型性能将得到改善。而基于车辆模型预测获得的支持点,不仅可以获得更可靠的历史轨迹预测点,还可以利用短期预测点增加已知观测点序列长度,从而提高预测精度。

图8中,展示了基于历史观测序列的预测轨迹的不确定性区域,这些区域用紫色椭圆表示,其横轴表示纵向不确定性,纵轴表示横向不确定性。根据第4节TPM的理论部分可知,每个时刻的预测点服从高斯分布,根据公式(18)可以得到每个点的纵向和横向方差。方差值用于确定椭圆中轴的长度。如图8所示,由于不确定性随时间的推移而上升,椭圆逐渐扩大。此外,图8图9中的真实未来轨迹总是被不确定性区域所包围,这表明所提预测方法能够提供预测不确定性范围的合理描述。

《图8》

图8 所提轨迹预测方法的不确定性区域表示。(a)左换道的情况;(b)右换道的情况。红色实心方块表示起点;蓝线表示观测点;黑线表示真实的未来轨迹;红线表示预测轨迹。紫色表示从公式(18)中的协方差函数获得的预测不确定性描述;横轴表示纵向不确定性;纵轴表示横向不确定性。

《图9》

图9 不同车辆轨迹预测方法的比较。(a)左换道的情况;(b)右换道的情况。蓝色阴影部分表示基于模型的预测不确定性区域,红色阴影部分表示所提方法的预测不确定性区域,橙色线表示不使用车辆模型方法的预测结果。

为了对所提预测方法进行综合的分析与评价,使用其他两种轨迹预测方法进行比较。第一种是基于车辆模型的预测;第二种预测方法基于DIM和TPM,但不使用车辆模型。实际上,第二种方法是基于车辆驾驶意图的预测方法。图9(a)、(b)说明了左换道和右换道意图下轨迹预测的对比结果。

图9所示,基于车辆模型的预测(蓝线)在短期内具有较高的精度,但在长期内具有较低的精度。相比之下,基于驾驶意图的预测(橙色线)在长期内具有良好的性能,并且能够保证整体准确性。对于所提出的方法,通过结合车辆模型,进一步提高了整个过程的预测精度。此外,TPM使用协方差函数在不确定性描述方面具有优势。如图9所示,此方法产生的不确定区域比第一种方法产生的不确定性区域更合理和可靠。

为了评估预测性能,使用了两个评估准则对结果进行分析,即平均位移误差(ADE)和最终位移误差(FDE)[43]。表2展示了使用不同预测方法对ADE/FDE的比较评估结果。在整个预测过程中ADE/FDE的趋势对应于上述三种方法的分析,最佳结果在表中以粗体展示。在第1节中,提到了三种不同类型的轨迹预测方法:基于车辆模型的预测、基于驾驶意图的预测和基于深度学习的预测。在表2中,将比较三种预测方法,第一种对应于基于车辆模型的预测,第二种和第三种对应于基于驾驶意图的预测。在表3中将展示所提方法与基于深度学习的预测方法之间的比较。

《表2》

表2 不同方法的ADE/FDE(m)比较

MethodPrediction horizon
1 s2 s3 s4 s5 s
Mode-based method0.184/0.2040.306/0.5481.163/1.7241.945/2.7513.179/4.363
Our method without model0.204/0.3490.367/0.5030.629/0.8911.056/1.3221.401/1.771
Our method0.196/0.2370.288/0.4150.502/0.6670.972/1.1381.261/1.474

《表3》

表3 不同方法的ADE/CEI(m)比较

MethodPrediction horizonCEI
1 s2 s3 s4 s5 s
CS-LSTM [28]1.181.161.221.441.771.354
L-RRNN [29]0.220.631.312.223.381.552
LSTM encoder‒decoder model-lane attention [30]0.690.660.690.831.090.792
3D CNN-LSTM [3]0.260.651.201.912.741.352
Ours0.180.290.500.971.230.634

在表2中,第二种是所提出的方法没有结合车辆运动学模型的情形。从表2中可以看到,在预测时间为1 s和2 s时,没有结合车辆模型的方法,其ADE分别为0.204 m和0.367 m,比所提方法的结果(0.196 m和0.288 m)分别高出4.08%和27.43%。此外,对于在第4秒和第5秒时,所提方法的ADE分别为0.972 m和1.261 m,比第一种方法的结果(1.945 m和3.179 m)分别低50.03%和60.33%,比第二种方法的结果(1.056 m和1.401 m)分别低7.95%和9.99%。同样地,与其他方法相比,所提方法的FDE都较低。因此,与不使用车辆模型的方法相比,所提方法在短期和长期内都提高了预测精度。同时,与基于车辆模型的方法相比,所提方法在很大程度上提高了长期轨迹预测的准确性。因此,整合基于车辆运动学模型的短期预测结果,TPM可以提高整个预测过程的预测精度。

上述分析表明了所提概率性长期轨迹预测框架的有效性。为了进一步说明所提方法的优势,表3展示了在公共highD数据集中与其他先进预测方法的比较结果,ADE的最佳结果以粗体标记,次优结果用下划线标记。其中,使用卷积社会池的Seq-to-Seq方法来自文献[30]。可以看到,这种方法在长期范围内具有较高的预测精度(预测时长大于2 s),但在短期范围内具有较低的精度(预测时长为1 s)。然而,第二种和第四种方法在开始时表现优异,但在最后阶段表现不佳,这解释了短期和长期预测精度难以平衡的问题。虽然第三种基于带有车道注意力机制的LSTM编码器-解码器模型在第4秒和第5秒内实现了最佳结果(一个可能的原因是测试集的差异),但前3 s内的精度低于所提方法。

为了进一步验证此方法在整个预测时域中的优势,定义了一个综合评估指数(CEI):整个预测周期内ADE的平均值。CEI可以表示如下:

CEI=1Ti=1TADEi(21)

式中,T是总预测时间;ADE(i)表示第i个预测时间的ADE值。

在表3中可以看出,不同方法在不同预测持续时间下的预测性能存在明显差异。CEI可以有效地衡量某种预测方法在短期和长期内的综合预测效果。当预测时域为5 s时,较优方法的CEI值为0.792,而所提方法的最佳CEI值为0.634,比它提高了19.5%。因此,在整个预测时间内,所提方法比其他方法具有明显的优势。

综上所述,所提轨迹预测方法在短期和长期内都能获得良好的预测性能。与其他方法相比,所提方法的有效性和可靠性更好,能够保证更高的预测精度,并在整个预测过程中可以更合理地描述预测不确定性。

《6、 结论》

6、 结论

本文提出了一种车辆长期轨迹预测的概率框架,通过结合基本环境信息和高级语义信息来预测周围车辆的长期轨迹。该框架由两个重要部分组成:基于动态贝叶斯网络的DIM,其中包含物理运动和交通规则信息;以及基于GP的TPM,综合考虑车辆运动特性和短期预测结果。本文首先使用预测车辆的历史数据来获得驾驶意图和运动特性的概率,同时考虑了基本的交通规则信息。根据上述结果,可以融合车辆的物理运动特性预测车辆未来的轨迹。此外,由于本文提出的预测框架是概率性的,因此可以呈现预测不确定性区域的描述。

在公共highD数据集上的验证表明,所提出的框架在高速公路场景下是有效可靠的。与其他方法相比,该模型具有以下优点:①可解释的概率性框架,保证预测的准确性和可行性;②处理序列数据的能力,能够充分利用由驾驶意图和运动特性组成的高级语义信息;③为自动驾驶系统提供更好的场景理解。在未来的工作中,本文将扩展车辆轨迹预测框架以适应更复杂的场景,并考虑采用预测结果来识别碰撞概率。通过考虑车辆之间的动态交互,本文可以为自动驾驶提供早期预警信息。此研究在某些方面还需要进行一些改进,由于DIM的结构是根据经验人为构建的,因此在模型结构的调整上需耗费大量时间。为使本文的概率性预测框架具有良好的可扩展性,仍在进行进一步的改进,包括模型结构的自学习和优化,以及将这种方法应用于更复杂的场景。本文还将在中国高速公路上对真实车辆进行实验,希望验证本文所提模型在中国高速公路场景中的性能。