1 前言
智能机器人在工业领域与日常生活领域中起着越来 越重要的作用。在工业领域,由于劳力成本的不断上升, 致使制造企业在工厂中使用越来越多的机器人。例如, 相比较 2012 年,中国的平均最低薪资水平已经增长了 20% 有余,同时制造业的机器人的供应也增长了 51% [
1]。 欧美地区情况类似。人们设计使用智能机器人,以提升 生产能力,并且使制造企业在价格与质量方面更具竞争力。具有代表性的最新成果之一便是名为“ Baxter”的机 器人问,该机器人配备的软件可以让机器人自身从人为示范动作中学习不同工作任务,识别不同目标,并对外 部因素进行智能化反应。智能机器人还有望协助人们的 日常生活。在未来,智能机器人将有望完成不同工作任务, 包括:①做家务、关怀支持,如烹饪、洗衣等;②健康 生活支持,如与老年人聊天、照顾残疾人土等;③在危 险工作条件下进行劳作,如化工厂等[
3]。当前已研发 出了几个成功的辅助机器人原型机。例如, Willow Garage 机器人制造公司推出的 PR2 机器人可以照顾残疾人 士的生活,如照顾四肢瘫痪的残疾人士[
4]; HRP-4 形机器人可以模仿人类动作,并使用语言与人们进行交 流[
5]。除了在工业与日常生活领域的应用,现代智能 机器人还可用于其他一些领域,包括无人驾驶车辆[
6]、 外科手术治疗[
7]、紧急救援与灾害救援[
8]以及完成军 事任务等[
9]。
过去 10 年间,智能机器人设计与可用性方面的巨大 改善与提升基于诸多相关领域取得的突破与进展,包括 讨算机视觉、人工智能、机器学习、控制、传感器系统、 机械系统,上述不同因素构成了智能机器人系统的不同 部分(图 1)。例如,即时定位与地图构建( SLAM )算 法可使机器人在未知环境下准确追踪自身位置[
10]。此外,在先进视觉技术的协助下,当前机器人可从背景点 云中识别并区分目标[
11]。相比较传统的工业机器人而言, 现代智能机器人的一大重要特征便是其高级规划与导航。 高级规划与导航的主要作用是根据需要执行任务的高级 说明来计算低级指令;然后将这些低级指令提供给机器 人执行系统。高级规划与导航部分包括许多不同子部分 (图 1),并且人们在这些领域进行了大量工作与研究,如任务规划[
12]、观测信息反馈[13,14]、最优控制[
15]和适应性控制[
16]。
图1. 机器人系统内的重要硬件与软件子系统。① 前馈系统( F),包括 任任务规划 导航策略、运动规划与轨迹生成; ②控制系统( C),包括 运动学、动力学与控制算法;③执行系统(A ),包括电动机、伺服系统、 传动机构等;④传感器系统( S),包括各种传感器,如摄影机、激光、 IMU ,以及相关低级传感器数据处理算法,如信号处理、估算与 合。 ⑤传感器后处理系统(s+) ,包括定位、绘图等。机器人系统的主要软 件部分为高级规划与导航,如果需要执行特定任务,可用来确定发送给 执行系统的操作指令。高级规划与导航的一项重要部分便是运动规划, 运动规划注重根据环境说明来计算轨迹。
高级规划与导航部分最为重要的子系统之 是运 动规划系统,该系统能够让机器人从初始位置安全移动 至目标位置,并且不会碰撞到环境中的静止物体与移动 物体 快速在线运动规划算法对许多应用而言至关重要。 例如,在制造业领域,我们越来越需要移动机器人来协 助人们进行重复性元附加值的任务操作[
17]。为了确保 机器人与人类之间的协作安全,机器人需要具有实时运 动规划功能,避免发生意外事故 对于许多传统制造业 流程而言,在线运动规划在改善自动化水平方面也尤为 重要 例如,对于自动化箱体抓取而言,高效的在线运动规划对抓取性能十分重要[
18] 此外,对于医院与家庭服务机器人而 言,快速运动规划也不可缺少。动作规划问题可在三维( 3D )工作空间内直接呈现并得到解决,如借助广泛运用的势场算法[
19]。然而,这些工作空间解决方案无法直接处理不同几何尺寸且具有机械约束因素的机器人。为了解决这些难题,可在 种名为配置空间(C空间)的新型空间内 呈现并解决运动规划问题[20-22 ]对在配置空间内,将 3D 工作空间内具有复杂几何外形的机器人绘制为一个点,并且机器人的轨迹与高维配置空间内的连续曲线保持一致(图5 )。根据配置 空间公式,运动规划问题可通过两个步骤得到解决:
( 1)构建配置空间的表达;
( 2)根据计算的表达进行优化操作。
该动作规划流水线以配置空间为基础,运用过程十分成功,并广泛用于现实生活中需要得到优化规划解决方案的诸多规划应用中。当前研究人员己推出了配置空间的多种不同表达,包括多面体[
23] 、半代数集[24,25]、随机位图[
26]和树图[
27];并对不同配置空间表达提出了不同的优化方法,包括计算到配置空间内闭集边界的最短路径与最小距离等。此外,同样的流水线还可 应用于一些动作规划算法,仅用于计算可行路径(如不 会违反其他限制条件的无碰撞路径)。例如,不同变体 形式的快速搜索随机树图(RRT ) [
27]可使用不同的启发 式教学法将搜索向目标配置进行引导,与此同时,生成 一个搜索树结构来作为配置空间的近似表达。该方法可 视为上述流水线的变体形式,其中配置空间构建可与优 化计算交替使用。
然而,基于C空间的该算法流水线在计算方面仍面 临诸多挑战,其中两个最为重要的方面如下。
( 1)高效计算配置空间的近似表达或准确表达还比 较困难,尤其针对高维配置空间的高自由度机器人。该 配置空间的近似问题存在指数复杂性。
( 2)许多机器人应用程序需要进行实时规划,以便 在具有移动障碍物的人类环境中让机器人进行可靠与高 效操作,但是对配置空间的计算表达进行优化耗时较长。
本文将对配置空间面临的上述挑战的近期解决方案 进行讨论。首先笔者将展示如何将配置空间构建问题转 换为机器学习问题,然后使用主动学习对近似配置进行 高效与全面计算(第 4 节)然后,笔者使用基于并行 图形处理器( GPU )的算法来加速配置空间内的优化计 算操作,这样可以在许多挑战性环境中进行实时规划计 算(第 5 节)。
2 背景与相关工作
2.1 配置空间
配置空间是经典力学领域用来说明并分析许多重要系统运动的 个关键概念[
28]。通常来说,配置 q作为[
26]独立参数的矢量,专门用来说明系统状态; C空间的配置空间是某个指定系统的所有可能性配置的合集。例如,对于n点粒子系统,配置是一个可对所有粒子位置进行说明的矢量,并且相应的 C空间为

; 3D 刚体的配置包含其位置与方向,如果允许进行旋转与平移,那么配置空间为 SE ( 3),如果允许进行平移,则为

;关节式物体的配置为其自身所有关节角度的矢量。
机器人

的配置 间包括两个部分:元碰撞空间

。以及碰撞空间或障碍空间


。式中,

相当于环境中障碍物的几何表达,

)相当于带有配置

。

为闭集,其边界表示为接触空间

,与配置集相对应,其中

与

彼此之间仅接触,不穿透。图2 显示的是两个物体的C空间,其中对

使用桶色曲线进行了高亮显示。
图2. 两个物体的配置空间。桶色曲线高亮显示了2. 两个物体的配置空间。桶色曲线高亮显示了A与B 的接触空间
;橘色曲线内/上的点为
,橘色曲线外的点为
;红色与绿 色点分别表示
与
配置。 在特殊情况下,当

与

均为刚性物体时,机器人

仅进行平移运动,

等于

与

之间的闵可夫斯基和:

。闵可夫斯 基和的范例之一详见图2。当机器人

可以进行一般运动 时(如平移与旋转) ,

的几何学则更为复杂,其 2D 范例如图 3所示。
图3. 2D 刚性物体A与B之间的 Cobs。对于各旋转角度
, 可以计算 A(θ)与 -B之间的闵可夫斯基和,其中,A(θ)表示将
在原点旋转 θ角度后的最终形状。当把所有θ 角度的闵可夫斯基和进行堆叠时, 便可得出 A与B之间的 Cobs。 根据配置空间的概念, 3D 工作空间内的运动规划 问题可简化为C空间内点机器人的路径规划。例如,在

内找到与机器人指定原始配置与目标配置进行连接的曲线。
2.2 配置空间构建
在配置空间内进行运动规划计算之前,先决条件之 便是在适宜表达中计算 C空间的几何学(如图像或表面)。由于C空间=

,并且

,我们仅需构建

或

的表达。另外一个类似解决方案便以计算

之间的边界。
先前就配置空间构建的工作可通过两种不同方法实现,以几何学为基础和以拓扑学为基础的方法。 以几何学为基础的方法对配置空间的准确几何 表达进行计算, 以拓扑学为基础的方法则捕捉配置空间的连通性。
由于涉及高维配置空间

边界计算方面的组合复杂性,以几何学为基础的方法通常会在低维配置空间方面受到限制。先前大多数工作与研究都侧重于特殊情况,也就是

物体与

物体均为刚体,并且仅进行平移运动。正如小节 2.1 所述,最终的

为

与-

之间的闵可夫斯基和。即使在这种特殊情况下,计算

所涉及的计算复杂性也面临较高难度:当

与

均为凸面物体时,复杂性为

,当

与

均为非凸面物体时,复杂性为

[
29],其中,m与 n 分别为

与

的三角形数量 除了复杂性较高,大多数用于计算闵可夫斯基 和的方法都会面临 3D 几何算法方面带来的挑战,尤其是 当上述方法无法保证数值误差且易受退化影响(如无法 可靠处理多边形集合或带孔网状物)时。
最近提出的 些方法[30-32]可以用来高效可靠计 算近似闵可夫斯基和,但是这些方法面临稳定性方面的 问题,并且在处理复杂物体方面也有较高复杂性。 除了 闵可夫斯基和的方法,还有其他一些方法也可用来计算

。例如,Varadhan 等[
33]借助适应性网格并计算

近似值的方式来计算旋转与平移的 2D 物体; Zhang等[
34]使用单元分解方法来计算 4D C 空间的近似值。
以拓扑学为基础的方法则捕捉配置空间的连通性。 先前大多数方法与研究通过使用采样技术[26, 27]试图捕捉

的连通性。其基本理念便是在

内生成随机样 本(称为里程碑),然后使用位图结构或树形结构森林 将这些样本组织起来 (图 4)。由于

的拓扑学较 复杂, 并且可能包含多个部分或较小较窄通道,难以通过随机 采样方式捕捉完整连通性 通过使用不同取样方法[35-40] 来改善连通性计算方面已做了大量工作。近期的研究工 作试图捕捉

与

的拓扑学[
41] 。与几何学为基础的 方法相比,以拓扑学为基础的方法可更加快速计算近似C空间表达 然而,拓扑学方法在较窄通道方面的应用不 太理想,同时在高自由度机器人的应用方面效率也较低。
图4. 用于配置空间计算的以拓扑学为基础的方法。 (a) 使用位图结构捕捉
;(b) 使用树形状结构森林捕 捉
。 2.3 配置空间优化
一旦计算配置空间得以准确或近似表达,下一步需 要对该C空间表达进行优化操作。 例如,运动规划的目标便是捕捉C空间内的轨迹,如图 5所示。轨迹应满足下列约束条件:①轨迹应在

内;②轨迹应切实可行。例如,针对人形机器人而言,当机器人沿轨迹移动时不应摔倒。此外,在量度标准方面对轨迹进行优化则效果 更佳。例如,最佳轨迹路线应距离最短,耗时最短,且与障碍物的距离保持最大。因此,运动规划可呈现为C空间内的约束优化问题。类似构想与方法还可应用于不同的条件,如侵彻深度计算[39, 42-44]。
图5. 工作空间与配置空间的运动规划。左图显示的是工作空间内的障碍物与双联机器人(初始设置与目标设置)。右图显示的是与左图工作空间一致的配置空间,其中使用不同颜色来说明工作空间与配置空间内 障碍物的对应情况。蓝色曲线为连接至原始配置与目标配置的轨迹,并 且也是运动规划算法的结果。
C空间优化的计算通常代价较高,尤其是对于带有复杂结构与拓扑学的高维C空间。为了展示C空间优化问题面临的计算方面的挑战,笔者在此对C空间的运动规划进行举例说明。理论上,使用C空间准确表达的运动规划其计算复杂性较高。对于任何规划问题,如果计算找到了解决方案,或正确报告了不存在解决方案,那么规划算法可视为“完整”。 PSPACE-hard [
45]与PSPACE-complete[
24]已被证明是完整的规划算法,并且kinodynamic 运动规划(如带有简单运动学或动力学约束的运动规划)已被证明为 NEXPTIME-hard [
25] 对于带有一般微分约束的运动规划,其判定性仍处于未知状态[
46] 。当使用C空间的近似表达时(如使用位图或树形结构来粗略估计

连通性),存在近似运动规划算法,该算法可保证概率完整性 [26, 27] 与/或渐进最优性[
47]。这些近似运动规划算法的复杂性通常受限于

,式中, n代表C空间近似表达中使用的配置样本数[
47]。

通道较窄并且/或维度较高时[
48],由于n数值较大, 这些近似算法的绩效仍远低于实时方法。
在过去的几十年间,人们已提出了诸多与C空间有关的不同规划方法,包括以优化为基础的规划算法,如CHOMP [
49]和 TrajOPT [
50],以及以搜索为基础的算法,如Anytime A* [
51]。 对于高自由度机器人的运动规划而言,大多数实用方法都以随机算法为基础,包括随机路线图( PRM) [
26]和RRT[
27]。
3 概述
对配置空间相关的挑战的解决方案包含两个部分:配置空间构建与配置空间优化。
3.1 高效配置空间构建
文献[
52]的第一部分呈现了一种新型算法,在使用机器学习技术的情况下高效估算高维配置空间。主要的基本概念便是在配置空间内生成样本,然后使用这些样本来估算接触空间C
cont ,其方法便是对表面进行分离, 这些表面能正确分离所有碰撞与无碰撞样本。使用 SVM 分类法来计算分离表面。通过权衡增量与主动学习技术, 该方法可极大降低所需的样本量。当样本量增加时,通过该方法计算的近似接触表面可以快速收敛至准确接触表面;笔者还会提供近似接触空间内预期误差的界限与范围,并评估该算法在高维基准方面的绩效。
为了构建配置空间的表达,笔者使用离线学习算法, 如图 6左侧方框所示。首先对两个指定物体在 空间的子空间内生成一个统一样本小集下一步通过对两个物体进行准确碰撞检查的方式来证明这些配置是否处于

内或

内。使用

来表示配置q的碰撞状态。例如,如果

,那么

;如果

,那么

。考虑到所有配置样本的碰撞状态,借助分类器来计算接触空间的大致估值 LCS
0 (图 6(b)),其中LCS 表示学习接触空间 接下来在C空间内选择新样本,并通过使用主动学习法来进一步提升初始表达的准确性 LCS
0。在主动学习期间,可以选择距离先前样本(探测)(图 6(c))较远的样本,或距离 LCS
0 (探测)(图 6(d))较近的样本 在生成新样本后,根据增量机器学习技术,计算更新的近似 LCS
1 (图 6(e))。重复该操作, 生成一系列带有更高准确度的近似表达LCS
0 LCS
1 …… 重复操作该迭代过程,直至当前近似值可以正确预测所有新样本的碰撞状态。最终结果 LCS(图 6(f) )与接触空间的光滑表面近似保持一致。
图6. 该图显示的是
,近似的离线计算流水线。绿点表示无碰撞配置样本,红点表示碰撞样本。 3.2 配置空间的高效优化
通过笔者第一部分工作计算出的近似接触空间可直接用于运动规划,如可在轨迹优化框架内将其用做元碰撞约束[
53]。 然而,该约束仅针对高度非凸面情况,因此需要解决最终的优化问题仍然面临较大挑战,这也是笔者进行工作考虑的一个方面。解决运动规划问题的另一方法便是使用以样本为基础的配置空间近似法,该方法已应用至许多传统规划算法中,如 PRM。文献[
54]的第二部分呈现了一种高自由度机器人实时运动规划的新型并行算法,该算法开发出了价值 $400的GPU 的计算能力。当前的GPU 为可编程多核处理器,支持成千上万的并行线程。笔者使用 GPU 进行 PRM 与惰性规划器的实时计算,所呈现的高效并行策略可以构建路线图,该路线图包括样本生成、碰撞检测、连接附近样本与局部规划。 根据图片搜索,也可通过并行方式进行查询阶段。为了设计出高效的独立查询规划器,笔者采用推迟碰撞检测与本地规划的惰性策略,还将呈现一些新型以层级为基础的碰撞检测算法来提高整体性能。
笔者选择 PRM 算法作为并行规划的基本方法,因为PRM 算法最适合利用 GPU 的多核与数据并行。PRM算法分两个阶段:路线图构建和路线图查询。路线图构建包括4个主要步骤:①在配置空间内生成样本;②通过进行离散碰撞查询,计算与自由空间内样本相对应的里程碑;③找到与各里程碑最近的其他里程碑;④使用局部规划来连接附近的里程碑,同时形成路线图。查询阶段包括两个部分:①将查询的原始配置与目标配置连接至路线图;②对路线图进行图形搜索算法,并找到碰撞自由路径。
PRM 算法的个别部分,如碰撞查询的并行结果并不是令人非常满意[
55]。 我们可以使用多核 GPU 来大幅提升其他部分的性能。针对GPU的PRM 算法的框架详见图7。笔者通过高效方式将 PRM 算法的6个步骤分别进行并行。首先,多核 GPU 的各线程生成机器人的随机配置,同时将某些配置与障碍物进行碰撞。所有无碰撞样本均为里程碑,并且成为路线图图表的顶点。接下来,各GPU 线程对单个里程碑的 最近邻进行计算,并收集所有近邻对。然后各线程检验是否可以通过局部规划方式将这些近邻对进行连接。如果里程碑近邻对之间存在无碰撞路径,则向路线图添加边缘。一旦建成路线图,将查询并行连接至路线图,使用并行图搜索算法来找到路径。
图7. 算法中的PRM概述与并行部分。
最终基于 GPU 的框架对多查询版本的规划问题十分高效。该计算代价最高的步骤便是局部规划算法;因此,新型碰撞检测算法被用来提升其性能 。为了加速单查询算法,笔者引人一种解决方案,该方案使用惰性策略,推迟局部规划的碰撞检测。换言之,该算法将与最近邻相对应的所有边缘进行连接,同时搜索原始配置与最终配置之间的路径。然后,在构成这些路径的边缘处执行局部规划。
4 基于学习的近似接触空间构建
在该节中,笔者的算法可呈现于接触空间的离线学习与 LCS 的计算。该算法的不同阶段详见图6。
4.1 初步采样
在C空间中进行均匀采样,获取一组配置点。并非对整个C空间进行取样,而是在包含

的子空间内生成样本。考虑到A与B物体,将接触空间

包含在它们的包围体 BV(A)与 BV(B) 的碰撞空间内。
4.2 计算 LCS0
在拥有一组

(BV(A) BV (B) )的k样本情况下,对A与B进行准确的碰撞查询,检查这些样本是否处于碰撞空间内。目标是从这些配置中学习近似表达LCS
0。 LCS
0 与决策函数f(q) =0 一致,完全由C空间内配置S集确定。将f(q) 视为分类器,并使用分类器来预测,指定的配置q不发生碰撞 (f(q)<0)还是发生碰撞(f(q)>0)。S相当于支撑矢量,支撑矢量是用于学习的配置样本的一个小子集。直觉上, S是距离

最近的样本。
笔者使用 SVM 分类器[
56]从k配置的初步采样中学习 LCS
0。 使用硬间隔 SVM 作为基础样本,这些基础样本可分离至元碰撞空间与碰撞空间内。直观上, SVM使用函数从输人壁间至更高(可能无限)维度特征空间来绘制指定样本{q
1}o SVM 对线性分离超平面进行计算,该超平面具有参数w与b特性。超平面的最大间隔位于更高维度特征空间内。超平面相当于输人空间内的非线性分离表面。 w是超平面的法向量,参数b决定沿法向量原点的超平面偏移。在特征空间内,超平面与最近样本点之间的距离叫做“间隔”,最佳分离超平面应将该距离最太化。可通过解决下列优化问题来实现最大间距:
若

是各样本

的碰撞状态,将


确定为核函数(如用来计算特征空间内积的函数),在结果中使用 RBF 核(径向基函数核)。
式( 1)的解是输入空间内的非线性表面,该表面可对无碰撞配置与碰撞配置进行分离。该解可通过下列方式进行表达:
式(2)中)中,

为式(1 )的解,并且α
i。与非零α
i,一致的矢量

被称为支撑矢量,本文表示为S。直观而言,支撑矢量为分离超平面f(q) = 0最近的这些样本,如图 6(b )中的较大红点与绿点所示。因此, LCS
0 包含隐函数

与样本集

(如支撑矢量),可用来估算准确的接触雪间。
4.3 使用主动学习法来改善 LCS0
使用主动学习法来改善 LCS
0。目标是主动选择新样本,以便通过将这些样本合并至 LCS
1 中来获得更佳的近似接触空间表达 LCS
0。结合探索法与开发法[
57],通过抛偏倚硬币的方式来确定使用探索法还是开发法,其中有一定概率硬币正面朝上(最初概率 0.5 )。如果正面朝上,则使用探索法;反之,则使用开发法。通过探索样本的碰撞状态部分(可由当前 LCS1 进行正确预测)来对硬币正面朝上的概率进行调整。使用新样本来更新 LCS
0 ,并生成一个新的近似 LCS
1 (或从 LCS
1至LCS
i+1 进行改善)。重复主动学习步骤操作,直至当前LCS
i 正确预测新样本,或最终结果(作为 LCS 有足够准确度来估算 C
cont。
4.4 增量学习
采用增量学习技术从 LCS
i 高效计算 LCS
i+1 ,而非通过使用先前样本重新开始计算新决策函数。增量学习使用一小组新样本来更新LCS
i 。LCS
i 的决策函数作为生成LCS
i+1的初始猜测值。增量 SVM[
58]可以更新使用 SVM生成的当前结果;其关键在于,在添加新样本的同时,保留所有先前样本(式( 1 ))的最优性条件(如库恩一塔克条件)。这一点可通过调整式(2)中的系数α
i和b及支撑矢量集S的方式来实现。系数调整与支撑矢量变更可通过式(2)中的目标函数梯度进行指导。
4.5 终止主动学习
满足下列任一条件,主动学习终止。
( 1)当前近似 LCSi可以正确预测探索与开发期间生成的所有新样本的碰撞状态。
( 2)主动学习迭代中使用的样本总数超过用户指定限值。
第一个需要保证的条件便是用于学习 LCS 的所有配置必须保持一致(如 LCS 能够正确预测这些配置)。这意味着当前 LCS 非常近似于基本接触空间。第二个条件便是控制近似叫的准确性。由于使用更多样本,更加近似 Ccont。
5 基于 GPU 的实时自己置空间优化
在该节,笔者将呈现如何使用 GPU 来加速配置空间的优化速度的相关细节。
5.1 层级计算
笔者为环境中的机器人与各障碍物创建包围体层次(BVH),加速碰撞查询。使用文献[
59]介绍的基于GPU 的构建算法,对于特定三角形表达,该算法可以构建GPU 内并行的按坐标轴排列的包围盒( AABB )或有向包围盒( OBB )。对于碰撞检测,笔者使用 OBB 层级,因为它可以在 GPU 的类似构架上实现更高的剔除效率与 改善性能。这些层级保存在 GPU 内存中,笔者可以对不同配置采取适当改造。
5.2 路线圄构建
路线图构建阶段试图捕捉自由配置壁间的连通性,这也是 PRM 算法主要讨算的密集部分。
( 1)样本生成:首先需要在配置空间内生成随机样本。由于样本属于独立形式,需要安排足够的并行线程来使用 GPU MD5 密码杂凑函数[
60],在实践中,该函数可在无需共享种子的情况下实现良好的随机性。
( 2)里程碑讨算:对于在先前步骤中生成的各配置,我们需要检查其是否为里程碑。例如,位于自由空间内,并且不与障碍物发生碰撞的配置。在借助BVH来测试样本确定的配置中障碍物与机器人之间重叠的情况下,笔者使用层级碰撞检测法。通过在两个BVH中使用遍历算法的方式,在各线程中进行碰撞检测。遍历算法从两个BVH根节点开始,并测试OBB节点是否存在递归方式的重叠。如果两个节点重叠,那么其他结果的所有可能性配对应进行递归检测来检查交叉情况。
通过使用并行层级构建算法[
59],笔者也会使用GPU来计算机器人与障碍物的实际BVH结构。由于机器人的几何对象根据配置进行移动,其BVH仅对初始配置有效。为了避免重新计算各配置的凹,在进行重叠测试之前,笔者借助当前配置样本来改变机器人BVH各节点。因此,仅改变碰撞检测期间实际所需的那些节点。
( 3)邻近计算:对于计算的各里程碑,我们需要找到其最近邻k-NN。通常存在两种k-NN算法:准确k-NN与近似k-NN,通过进行稍许松弛,近似刚速度更快。该邻近算法以范围查询为基础,范围查询使用配置空间中点的BVH结构。
对于3自由度欧几里得空间,首先使用并行算法[
59]来对所有里程碑构建 BVH 结构。对于各配置q,将其包围在按坐标轴排列的ε盒中:带有q的该盒作为中心,2ε作为边长。接下来遍历 BVH 树,找到ε盒中的所有叶节点(如配置)。这样就简化成了q的范围查询。对于非欧几里得自由度,我们复制样本并将其局部转换至欧几里得空间内。例如,假设一个自由度为旋转度 α∈[0,2π]。在α的2π距离内添加另一个样本α* [-π,3π]。如果3自由度都在旋转,则需要为每个里程碑添加另外7个样本。一且范围查询结束,从所有查询结果中选择k最近邻的样本;这样就可以了解到准确的最近邻。通过使用分解策略,该方法可延伸至高维空间内的 k-NN 搜索的处理方面,详见笔者最近的研究工作[
61]。
为了进一步提升高维壁间内邻近计算的性能,我们开发了一种新型 k-NN 算法,该算法使用局部敏感散列法(LSH )与布谷鸟散列来高效计算 GPU上并行的 k-NN 更多详情请参阅笔者近期的研究工作]62]。
( 4)局部规划:局部规划可检查两个里程碑之间是否存在与路线图边缘相一致局部路径,这也是整个PRM算法代价最高的部分。假设拥有n
m里程碑,并且每个里程碑具有最多nJ:最近邻。那么算法在最多圃n
m·n
k倍数情况下进行局部规划。如果使用离散碰撞撞测(DCD),那么需要执行最多

碰撞查询,这对于复杂基准而言频率过高。对于多查询问题,该成本费用可在多个查询上进行分摊,因为路线图仅构建一次。对于单查询问题,计算整个路线图则代价过高。
因此,在单查询情况下,除非绝对必要,笔者都采用惰性策略来推迟局部规划。如果进行查询,我们会从初始配置到最终配置期间计算路线图内的若干不同候选路径,但是仅检查候选路径上路线图边缘的局部规划。局部规划可判定某些边缘无效,在这种情况下,将无效边缘从路线图中删除。如果存在无效边缘的候选路径,那么算法已找到了无碰撞解决方案。否则,我们在更新的路线图上再次计算候选路径,并重复上述操作。这种惰性策略可以极大提升单查询的性能。
5.3 查询阶段
查询阶段包括两部分:将查询连接至路线图,执行图搜索来找到路径。
(1)查询连接:如果是单查询的初始一目标配置,则将配置连接至路线图。对于上述两个配置,笔者在路线图上找到k最近里程碑,并在能够被局部规划连接的查询与里程碑之间添加边缘。笔者从路线图构建阶段使用同样算法,除非为了增加找到路径的概率而将使用的增大2-3倍。
(2)图搜索:搜索算法试图在连接初始配置与目标配置的路线图上找到目标。笔者使用深度优先搜索(DFS)或广度优先搜索(BFS)进行图搜索。对于多查询情况,在借助 DFS 的同时, GPU 线程遍历路线图进行一次查询,最终结果为无碰撞路径。对于单查询情况,在借助BFS 的同时,笔者利用所有 GPU 线程来找到路径并进行一次查询。对于远离初始节点同样步骤数目的节点,笔者将它们的未访问邻添加至并行队列中。换言之,不同的GPU 核遍历图的不同部分。该方法面临的主要难题便是,随着 BFS 遍历不断进行,需要动态生成该工作流程,并且不同核上的计算负荷变化极为明显。为了解决负荷均衡与任务分配的问题,需要保持所有核的并行,笔者在文献[
63]中使用轻质负荷均衡方法。
6 实验
在该节,在解决配置空间相关的两个问题的过程中,笔者探索了所使用方法的性能。
6.1 配置空间构建
笔者使用一组复杂基准来评估该算法的接触空间近似结果。
首先,计算 2D 物体的接触空间,如图6中的学习流水线输入所示。在该实验中,A物体仅进行平移运动, B物体固定不动。最终配置空间拥有两个自由度,通过基于学习的方法计算的 LCS 系列如图8所示。可以看到,在经过几百样本的数次迭代之后,学习的 LCS 可以充分估测两个物体之间的准确接触空间。
图8. 借助主动学习方法,对2D星星模型与房间之间的2D接触空间进行LCS计算,如图6所示的学习流水输入。对与LCSi相应的支撑矢量数量进行了高亮显示。
接下来,计算同样一对 2D 物体的接触空间,但是当前允许A物体在 2D 平面进行旋转 最终的配置空间拥有3个自由度,并且通过该方法生成的 LCS表面系列如图9所示。与2D 接触空间情况一样,学习的接触空间可以快速充分逼近至准确的接触空间。
图9. 借助主动学习方法,对2D星星模型与房间之间的3D接触空间进行LCS计算。如图6所示的学习流水输入。对与LCSi相应的支撑矢量数量进行了高亮显示。垂直轴代表C空间的旋转给量。
最终,计算一对 3D 物体的接触空间,如图 10(a)所示,其中A物体仅进行平移运动,因此相应的配置空间为 3D 模式。同样,笔者观察到学习的接触空间序列快速收敛至准确的接触空间。
图10. 借助主动学习法,对 3D杯子与勺子之间的 3D 接触空[司进行 LCS 计算。 笔者提供与LCSi 一致的支撑矢量数目。如图所示, 该算法可在数个迭代内计算得到个好的近似值。
6.2 配置空间优化
笔者阐述了该算法的实施详情,并对该算法就一组基准的实施性能进行了评估。借助 Intel Core i7 CPU (约$600 ),在 3.2 GHz CPU 6GB 内存条件下,将报告的所有时间控制在机器上进行呈现 笔者在借助视频内存为1GB NVIDIA GTX 285 GPU (约 $380 )情况下执行该算法。
对于多查询规划问题,笔者在 GPU ( G-PRM )上执行PRM 算法;对于单查询问题而言,笔者执行惰性版本( GL-PRM )。笔者将这些情况与 OOPSMP 文库中执行的PRM RRT 算法进行对比[64], OOPSMP 文库是一种在 CPU 上进行运动规划算法的常见文库。使用的基准详见图 llo 对比操作设计如下:对于各基准,找到一个适当设置,其中 C-PRM 找到解决方案,然后使用相对数量的样本来运行 G-PRM ;接下来,按照 G-PRM 的同样设置来运行 GL-PRM ,同时按照 C-PRM 的同样设置来运行C-RRT。
图11. 依照下列顺序,用于该算法的基准场景:钢琴(2484 三角形)、直升机(2484 三角形)、 maze3dl (40 三角形)、 maze3d2 (40三角形)、 maze3d3 (970 三角形)与 alpha puzzle (2016 三角形)。
表1显示的是两种算法之间的时间对比情况 通常而言, G-PRM比C-PRM 快约 10 倍,并且对于单查询问题,GL-PRM 可以再次实现 10 倍加速。甚至在动态场景下,G-PRM 也快于 C-PRM。当前的 C-RRT与C-PRM 均为单核版本。然而,甚至多核版本的 PRM 也仅能将时间效率提升最多4倍,因为一个8核在 CPU 上难以线性测量层级计算与最近邻计算。相比较 CPU 算法,笔者的 GPU 算法仍然可以将性能提升 1-2 个数量级。
表1 左侧两列对 OOPSMP 申的 PRM RRT 算法的性能进行了评估。右侧两列对笔者基于 GPU 的算法性能进行了评估。
图12 显示的是 G-PRM与GL-PRM 不同阶段的时间分类 两种算法性能之间的差异十分明显:在 G-PRM 中,局部规划处于瓶颈状态,并支配时间, 然而在 GL-PRM中,图搜索耗时较长,因为局部规划在惰性模式与输出敏感模式中进行操作。在 GL-PRM 中,三个部分最为耗时:里程碑构建 、邻近计算与图搜索,因为它们必须进行大量碰撞查询。如果环境较为杂乱并且模型的几何学较为复杂,那么里程碑构建过程将会更慢(图 12 中的alpha puzzle )。如果环境属于空旷空间并且具有许多里程碑,那么邻近计算将会到达瓶颈(图 12 中的 maze3d2 )。如果惰性策略无法猜到正确路径,由于大量碰撞查询(图12 中的 maze3d3 ),那么图搜索将进行大量计算工作。然而,在所有这些环境中,GL-RPM 优于其他方法。
图12. 时间分割: G-PRM与GL-PRM 不罔部分花费的时间片段。
笔者测试了 maze3d3 基准上的 G-PRM与GL-PRM的可伸缩性,结果详见图 13 所示 显然, GL-PRM 快于G-PRM ,并且两种算法在该基准上都实现了近线性伸缩。然而,根据观察,随着样本数量的增加, GL-PRM 快于G-PRM 的速度放缓。这是因为当样本数量增加时,邻近计算的代价越来越大,并且在样本数量接近 100 万时非常耗时。
图13. G-PRM与GL-PRM 的可伸缩性。
笔者的方法可延伸至关节体的高效规划,并且可实现PR2 抓取操作的实时性能,如图 14 所示。
图14. 笔者基于 GPU 的运动规划器可在不到 ls 时间内计算 PR2 的无碰撞路径。 (a) PR2 模拟; (b)实时 PR2。
7 总结
本研究解决了该领域中的 些重要难题,如与配置空间相关的两个计算难题:配置空间构建与配置空间的高效优化。由于配置空间的相关研究仍在继续,我们希望能在这些领域取得进一步进展,还有更多工作需要钻研。
概述本文主要研究成果:首先讲述了配置空间近似的一种新方法。 笔者的主要理念是根据机器学习分类器,尤其是支撑矢量机器,对配置空间进行取样,并估算接触空间。其次,在预先计算期间,使用主动学习技术来选择样本。接下来,引入了一种在 GPU 上进行的全动作规划算法。该算法可以利用 PRM 算法中的所有并行,包括PRM框架提供的高级并行与 PRM 算法不同部分内的低级并行,如碰撞检测与图搜索。这使得笔者首创了借助GPU在一般般环境下进行的实时运动规划与全局导航。
致谢
该研究得到了美国陆军研究办公室、美国国家科学基金会、 Willow Garage公司与香港大学基础研究基金项目的部分支持。
Compliance with ethics guidelines
Jia Pan and Dinesh Manocha declare that they have no conflict of interest or financial conflicts to disclose.
该研究得到了美国陆军研究办公室、美国国家科学基金会、Willow Garage公司香港大学基础研究基金项目的部分支持。()