《1. 引言》

1. 引言

世界各地都依赖复杂的系统来运输基本商品,提供包括水、食物、能源以及健康、交通和通信等相关的服务。这些商品和服务的全球需求量惊人,并且预期需求还会增长。例如,2017年全球约有90%的人口至少享有基本饮用水服务[1],但是,预计到2050年将有近60亿人遭受清洁水短缺的困扰[2]。发达国家拥有庞大且互联的水务基础设施系统,能够为其人口提供高质量的饮用水服务。例如,英国的英格兰和威尔士有1000多个生产饮用水的水处理厂,长达346 000 km的水路网服务于2600多万户家庭[3];荷兰的饮用水水路网长达120 000多公里,能够为800多万户家庭提供服务[4]。这种基础设施提供的服务具有规模性、复杂性、生命周期长和关键性等特点,因而使得系统规划和管理极为困难。

在过去20年里,现代数字化技术迅速发展。通过改善复杂系统,如银行、交通、市场、娱乐和旅游等部门的规划和管理,现代数字化技术推进了社会变革。利用大规模、广泛的数据采集,预测能力日益精准的云计算,以及互联网和物联网(IoT)的全球连接,许多新兴应用已经被开发出来并投入使用。例如,零售银行的数字化转型使得用户可以通过在线和移动工具进行交易和资产管理。此外,一些企业组织如优步,借助数字化技术建立了一种新型商业模式,颠覆了运输业的传统模式。其他企业组织,包括谷歌、亚马逊、爱彼迎、网飞和苹果的一些部门也利用了数字化技术。从数字化技术的角度来看,航空行业和汽车行业这两个领域相当有趣,这不仅是因为安全因素在这两个行业中至关重要,还因为它们在实现完全自动化方面取得了最重大的进展。尽管为了使这些系统能够独立运作,人类已经投入了大量精力和成本,但是绝大多数系统的运作仍必须与人类交互,由人类负责监管其作业,指导系统运作,或协作系统完成作业[5]。

然而,数字化技术的引入和自动化程度的增强,也导致了一些与这些先进技术的使用方式有关的重大事故。例如,特斯拉的自动驾驶仪(Autopilot)无法避免汽车碰撞[6],以及波音737 MAX及其机动特性增强系统(MCAS)软件疑似已导致两次飞机失事,是造成重大伤亡的原因之一[7]。通过明确这些案例中存在的新技术的失误点,有望从中学习经验和教训,预防事故发生。

数字化革命已深入人类生活的许多领域,水务行业也开始从数字化转型中受益[910]。水文信息学领域的先进技术和人工智能(AI)的应用已经开始在水务行业及其管理中发挥作用[914]。然而,水务行业的数字化进展落后于其他领域,原因是其还存在一些挑战,包括遗留的数据收集和管理系统,以及难以为数字应用、网络安全问题和“人为因素”建立明确的商业案例[9]。

在过去的20年里,“取证工程”(forensic engineering)利用工程原理和分析方法,调查工程系统的故障或其他性能问题,并且取得了实质性的进步[1516]。取证调查的目的在于确定故障的根本原因,从而预防类似故障再次发生。早期取证工程的例子,包括对导致桥梁设计、建造和检验发生重大变化的故障进行调查。如1879年的泰河铁路桥(Tay Bridge)坍塌事故[16]和1940年的塔科马海峡吊桥(Tacoma Narrows Bridge)倒塌事故[17]。

本文的目的有两个:①确定水务行业的关键数字化技术的进展;②对一些在数字化转型和自动化过程中(数字化技术发挥重要作用)经历失败的领域应用取证工程原则。目的是要从这些失误中吸取教训,避免水务行业重蹈覆辙。

《2. 水务行业数字化的进展》

2. 水务行业数字化的进展

《2.1. 智能灌溉》

2.1. 智能灌溉

农业灌溉用水量占全球用水量的70%,是用水量最多的领域,农业灌溉在粮食安全中发挥着重要作用[18]。世界上许多地区采用密集的漫灌并抽取地下水灌溉作物,使含水层的消耗量超过其自然补给量,从而影响水安全。因此,利用数字化技术更有效地使用水资源,优化决策方法迫在眉睫。数字化技术所带来的智能灌溉系统,可根据当地条件,如温度、湿度和土壤含水量进行调整,为作物提供必要的水分。

遥感技术是灌溉管理领域中一项重要的数字化进展。遥感技术是指借助卫星、飞机(包括有人和无人系统)、拖拉机和手持传感器对农田反射和辐射的电磁波信息进行非接触测量[19]。遥感测量技术的广泛使用使人们获得了大量数据,即大数据。需要对这些大量且高度多变的数据类型进行快速处理和分析,以便提供新的见解[20]。遥感和AI技术的最新研究进展可以让田间规模的表型信息得到准确量化,并与大数据整合,以便开发出具有预测性和规范性的管理工具[21]。

遥感技术常用于预估作物的需水量。此技术在预测性模型的基础上,利用基于各类数据、能量平衡、空气动力学和辐射物理学的算法计算作物需水量[22]。这些模型采用了多种数据类型组合,包括卫星图像数据(如表面温度、表面反射率、植被指数)、天气传感器数据(如空气温度、风速、湿度)和地理数据(如数字高程、土地覆盖)。例如,FruitLook服务作为一种在线工具,利用卫星和地理数据帮助南非西开普省的水果和葡萄酒农场主优化水资源的使用并提高生产力[23]。

在使用FruitLook服务的生产者中,有近半数表示用水量至少减少了10%,还有一些表示减少了30% [23]。FruitLook系统在改善作物生产管理方面得到了积极的应用。该系统拥有700名固定用户,包括生产者、顾问和研究人员,他们受益于从南非西开普省约900万公顷的土地中获得的可用数据[24]。

《2.2. 城市智慧水务》

2.2. 城市智慧水务

预计到2050年,全球城市人口总数将达到总人口的70%,约97亿[2]。除了城市化外,人口增长、气候变化和资源限制也给城市基础设施的规划和管理(包括水务服务和废水服务)带来了巨大的挑战。由于异质传感器的大量使用和广泛的数据采集,城市水务系统正在产生越来越多的传感数据。这就需要采用数据分析和新兴AI方法来应对数据大爆炸,从而对网络化、互通和内在复杂的水务系统中的数据结构及其动态特征进行利用和解释[25]。

水文信息学和数字水务工具起初只限于科学界[2628],现已进入水务领域[9]。本文没有对这些工具进行一一列举,但介绍了一些成熟的技术,包括用于检测地下基础设施异常情况的机器学习技术(ML)、用于规划和管理水务基础设施系统的自然启发式优化工具,以及数字孪生技术。

《2.2.1. 应用于供水系统异常检测的机器学习技术》

2.2.1. 应用于供水系统异常检测的机器学习技术

减少无收益水,即经过抽取、处理并泵入分配系统中但没有流向用户和向用户收费的水(即“损失的水”) 的产生量,是全世界水务公司的主要目标之一。然而,因为供水网络具有规模性和复杂性,且大多位于地下,所以要确定这些水损失的具体位置非常困难。英国联合公用事业公司(United Utilities)购买了一套故障检测工具作为综合故障管理系统的一部分,为泄漏、爆裂、压力或流量异常、传感器故障或遥测问题等提供近实时、可操作的警报[29]。

该故障检测系统包括了可以自主学习的AI和ML技术以及统计数据分析工具,每15 min自动处理网络中收集的压力数据和流量传感器数据[30]。然后,对这些数据进行分析并与新的观测值进行比较,以检测重大偏差,然后利用人工神经网络(ANN)来预测近期未来的数值。同时,还利用统计过程控制技术来分析压力和流量与预测信号的偏差,利用贝叶斯网络对收集到的故障进行推理,以此来分析多个故障发生的证据[30]。该系统对故障发生的可能性进行估计,并反馈给检测报警机制。该故障检测系统采用一套自主学习技术,根据过往故障来改进对未来故障的检测性能。最重要的是,该系统不需要使用供水网络的水力模型。

图1显示了英国联合公用事业公司故障检测系统输出的信息被整合到供水网络故障识别(ERWAN)系统界面的过程。此案例对异常情况进行识别并实施了两次干预(小型和大型服务)措施,从而避免了网络中因压力大幅增加导致的更严重故障。自2015年以来,ERWAN系统已经在联合公用事业公司的网络中投入使用。实践证明该系统稳固且可扩展。它可以每15 min处理来自7500多个压力和流量传感器的数据,并及时可靠地检测出管道爆裂和泄漏等事件,具有高准确率和低误报率的特点[29]。

《2.2.2. 应用于废水系统故障分类的图像处理和机器学习技术》

2.2.2. 应用于废水系统故障分类的图像处理和机器学习技术

必须定期检查废水基础设施,以便制定设施维护或更换计划。此类检查一般价格昂贵且耗时,因此只有相对少部分的废水系统使用闭路电视监控系统(CCTV)进行检查。Myrans等[31]使用图像处理和ML技术处理CCTV录像,并自动识别下水道系统中的各种故障类型。该程序采用了ML领域的随机森林技术。这一创新方法已经在英国一家水务公司收集的CCTV监控录像中得到验证和演示。结果显示,该程序在真实的下水道系统中的峰值准确率为74%。

《2.2.3. 应用于洪水管理的元胞自动机系统》

2.2.3. 应用于洪水管理的元胞自动机系统

在强降水期间,当降雨量超出排水系统的负荷时,水量无法完全排除从而引发地表水泛滥。现代测绘技术,如合成孔径雷达、航空数字摄影测量和激光探测及测距系统(LIDAR),改善了城市地区洪水建模(模型是新型的且需求量大)程序中数据的可用性和准确性[32]。普通的仿真工具无法有效处理覆盖大面积城区的洪水模型,但目前具有高分辨率的数字高程模型的广泛使用解决了这一问题。特别是,当利用模型进行洪水风险评估或不确定性和减灾分析时,需要考虑计算效率问题,因为此过程需要重复进行仿真运行[33]。适用于大规模问题的快速洪水建模可由文献[34]中二维元胞自动机模型实现。图形处理单元(GPU)和元胞自动机具有大规模并行计算能力。这些学者利用这些工具把新模型应用于基准程序和实例研究,使处理速度呈数量级增长。

《2.2.4. 自然启发式优化技术》

2.2.4. 自然启发式优化技术

先前研究表明,自然启发式优化算法已在水务行业得到应用[2829]。自然启发式优化算法已应用到各个领域,从修复设计规划[35]到优化城市水务基础设施系统运行[36]。20世纪80年代末和90年代初,自然启发式算法问世,进化计算算法、群体智能和ANN获得初步成功,更加复杂的城市水务基础设施问题得到解决。该领域不断做出新的贡献,从经济驱动型单一目标框架发展成多目标模型,产生一系列权衡解决方案,即非主导或帕累托最优解决方案[36],而不再是单一的解决方案。

在供水网络管理中应用自然启发式算法,可以确定压力传感器和流量计的最佳位置,以进行泄漏检测和定位。此方法在荷兰真实的供水网络中得到实际应用[37]。多目标优化模型研究了传感器最小安装数量和最大探测覆盖范围之间的权衡问题,选取有问题的供水网络作为试点,确定压力传感器的最佳数量和位置以对现有的10个传感器进行补充,目的是最大限度地提高泄漏检测的准确性和传感器覆盖的范围。从每个附加传感器得到的结果可以看出,客户连接的最佳位置和覆盖范围,检测到了泄漏百分比和传感器覆盖的网络管道长度。将20个新传感器与先前的10个传感器进行比较,结果显示客户连接的覆盖范围从11 411(覆盖率26.5%)增加到22 967(53.2%),检测到的泄漏百分比从26.2%提高到48.5%,覆盖的管道长度从236.75 km(25.1%)增加到415.55 km(44%)。这些发现与“水传感器网络之战(Battle of the Water Sensor Networks, BWSN)”的设计挑战结果一致,该挑战证明了供水网络中安装多目标优化传感器的优势[38]。

《2.2.5. 数字孪生》

2.2.5. 数字孪生

在水务系统运行管理中,数字孪生可充当决策支持工具,并越来越频繁地应用到水务行业中。数字孪生是真实系统的虚拟数字副本,它不断地更新数据,以模仿系统过去、现在和未来的行为[39]。西班牙瓦伦西亚市把数字孪生应用到供水系统,为160万人口服务,展示了数字孪生仿真各种网络运行条件的过程。创建一个由113 000根管道和其他大量组件(如8个水库、28个储罐、47个泵、259个调节阀、48 500个手动阀、4600个消防栓、118 000个服务连接、97个流量计和470个压力表)组成的网络数字孪生系统有相当大的挑战[39]。由于此系统复杂且规模庞大,研究者设计了一个包括大约10 000个管道的战略模型(约为原始规模的10%),目的是得到一个计算效率高的数字孪生系统。实验结果是令人鼓舞的,因为利用600个传感器测量值(压力值、流量值和水位值)就可以在一个10 000节点的战略模型中获得对供水系统行为的实时了解。

数字孪生技术开辟了一条丰富多彩、沉浸式、有趣的建模新体验,通过严肃游戏[40]和增强现实、虚拟现实或混合增强/虚拟现实技术[8]吸引众多利益相关者。通过这些技术,不同的利益相关者(如运营和规划人员、用户和监管者)可以了解水务系统的复杂行为,利用数字孪生技术进行安全实验,了解不同的、相互冲突的观点,并制定战略,为复杂系统寻找更加可持续的解决方案。

《2.2.6. 机器人技术》

2.2.6. 机器人技术

具有传感功能和AI功能的机器人被越来越多地应用到制造业和一些紧急行动中,如搜索、救援任务和军事行动。机器人可以比人类更快、更连贯、更准确地执行一些任务,这增加了各行各业裁员的可能性,尤其是制造业。在水务行业,机器人设备如自主水下机器人和地表水机器人已应用于水质建模[41]。此类机器人可针对从大范围、不同深度获取的水质数据进行实时优化。检测地下水资产的结构状态是机器人设备的另一个重要研究和应用领域。由于年代久远,管道容易发生故障(如泄漏、破裂、堵塞和坍塌),检查难度较大。一般利用CCTV摄像机的非破坏性或破坏性方法(如拆除短管段)检查管道状况。然而,此方法可能导致服务中断,代价高昂,并且检查范围很小。机器人可以系统地评估地下管道状况,支持水资产管理计划[42]。机器人设备正被广泛地应用于埋地管道检测,如遍布式自动群体机器人,这已引起了研究团队和水资产管理公司的兴趣[43]。这只是一个时间问题,此设备的第一个商业实施会在不久的将来实现。

《3. 运输系统数字化解决方案和自动化的故障取证分析》

3. 运输系统数字化解决方案和自动化的故障取证分析

《3.1. 自动驾驶汽车》

3.1. 自动驾驶汽车

自2004年美国国防部高级研究计划局(Defense Advanced Research Projects Agency, DARPA)首次提出无人驾驶挑战以来,学术界和工业界对自动化或自动驾驶汽车产生了极大的兴趣。如今,更准确的说法是将控制车辆的此类软件称为驾驶员辅助系统(DAS)。这类软件以自动方式或提醒方式帮助驾驶员注意潜在问题并避免碰撞,但并不属于完全自动驾驶。特斯拉是插电式电动汽车的主要生产商。特斯拉汽车安装的软件,即特斯拉自动驾驶仪,可以根据交通状况匹配汽车行驶速度,确保汽车在车道内行驶改变车道、调换路线、在目的地附近驶出道路、在停车位附近自动停车、召唤出入用户车库[44]。

然而,快速发展的自动驾驶汽车发生了几起重大碰撞事故。这些事故涉及研发DAS的知名公司,如特斯拉、谷歌和优步试验研发的汽车。有些碰撞事故导致了致命后果。其中一些碰撞事故的发生是由于DAS无法识别道路上的固定障碍物(如一辆特斯拉汽车与一辆停放在路边的消防车相撞),遇到其他车辆时无法变道,或者无法检测和避免行人。然而,在几乎所有的事故中,DAS都被启动了,但司机没有注意到路况。同样,DAS获取数据输入的技术限制也可能增加碰撞事故发生的风险。传感器的标准组合包括LIDAR系统(基于激光的雷达系统,可以创建详细的道路地图)、无线电探测和测距(RADAR)系统(探测远处的物体及其速度),以及获取视觉信息(如交通标志或交通灯的红绿颜色)的高分辨率相机。例如,特斯拉汽车没有使用LIDAR系统,只依靠摄像头和RADAR向DAS提供环境信息。这可能是导致特斯拉汽车发生碰撞的原因,也可能不是。最后,因为特斯拉的自动驾驶系统不属于完全自主的自动驾驶系统,所以特斯拉公司提醒司机要最终对车辆在道路上的行为负责。

《3.2. 自动驾驶飞机系统》

3.2. 自动驾驶飞机系统

波音737是世界上最畅销的飞机,销量达15 000多架,服役期超过50年。升级版737 MAX机型装配了体积更大、更省油的发动机和新型航电设备,且其航程更长,运营成本更低。升级版的机型与旧机型有足够多的共同点,因此不需要再次进行冗长的认证程序,而且飞行员也不需要接受新飞机仿真器培训就能操作新机型。自2017年首次投入使用以来,737 Max成为波音公司有史以来销售最快的客机,获得全球100多家航空公司的5000份订单[45]。

然而,2018年和2019年,737 MAX机型在5个月内发生了两起致命的坠机事故,总共造成346名乘客死亡。这导致人们对737 MAX机型的安全性产生质疑,随后,2019年3月该机型在全球停飞[44]。在这两起坠机事件中,飞机在起飞后不久就开始上升,而飞行员试图保持飞机上升角度,待飞机达到规定的飞行速度后再上升[46]。737 MAX机型的设计是导致坠机的关键原因之一,例如与前代飞机相比,737 MAX大尺寸发动机安装在机翼更靠前且更高的位置。新发动机尺寸和位置改变了飞机的空气动力性能,导致飞机机头在某些情况下,如在起飞后的低速飞行中或是当飞机处于手动驾驶模式时[45]可能发生向上倾斜。这种向上的俯仰增加了飞机失速的风险。这两起事故都发生在起飞后不久,当飞机正在获得高度时,MCAS反复启动并迫使飞机俯冲[46]。这一发现指出了MCAS的潜在缺陷,MCAS设计的初衷是通过将飞机的机头向下推以自动激活和稳定飞机。737 MAX装有两个攻击角传感器,但MCAS只能从一个攻击角传感器读取信息,很容易受到传感器错误读数的影响,这让情况变得复杂。导致这两起坠机事件的另一个因素是,飞行员并不完全了解或者根本没有被告知MCAS的存在以及该系统的功能。

《4. 经验教训和结论》

4. 经验教训和结论

鉴于水务系统管理具有复杂性、关键性(与健康和食品供应相关)和行业所需的安全特性,以及目前的数字化进展,水务行业有机会向其他在自动化和数字化转型方面更先进的行业学习。本文从交通运输领域的事故中吸取经验教训(至少部分可以归因于数字化和自动化),有助于为水务行业的数字化转型和自动化制定学术和行业的研究议程。

(1)自动化需要在回路系统配置人员。公用事业部门的工作人员最能感受到数字化和自动化对水务行业的影响。日益强大的数字化和自动化系统可以为复杂的自然系统以及工程系统的保护、控制和操作方式带来根本性的改变。然而,尽管对汽车和飞机行业等领域的自动化创新和实施投入了巨额资金,但高安全水平的操作系统仍需要训练有素的航空公司飞行员和汽车司机。对于水务行业而言,这意味着即便有AI和ML解决方案等智能软件,自动化系统仍然需要高度熟练的劳动力以确保未来水务系统的安全运行。

(2)人类操作员需要接受自动化培训。水务系统的管理人员必须了解系统的复杂性才能进行更有效的管理,而且还必须接受操作数字化技术系统的培训,目的是改善系统性能并了解其局限性。例如,两起737 MAX坠机事故中的飞行员没有完全了解(或可能未被告知)MCAS,这让自动化系统变得不堪一击,伴有发生严重事故的风险。汽车驾驶员过于相信特斯拉自动驾驶仪等汽车自动化软件,误以为汽车可以独立运行,这也是发生严重交通事故的可能原因。把自动驾驶重新命名为驾驶辅助系统,也有助于澄清一个事实,即司机在控制车辆时必须始终保持警惕。对于水务工作人员,必须通过培训和学习说明书,使其充分了解到自动化系统的能力及缺陷,才能够让系统的能力得到充分发挥。

(3)自动化需要配置人工手动选项。自动安全系统,如安装在飞机和汽车中的自动安全系统可以在没有任何人类参与的情况下启动,从而带来附加风险。引发两起737 MAX坠机事故的原因可能是,飞机的MCAS软件接收了迎角传感器的错误数据并指示飞机的机头向下倾斜,导致飞机进入失速状态,引发坠机。737 MAX在印度尼西亚第一次发生坠毁事件时,波音公司尚未发布关于飞行员采取补救措施的明确指示,而在埃塞俄比亚发生第二次坠毁事件时,驾驶737 MAX飞机的飞行员已接受了针对印度尼西亚坠机事件的培训。问题的关键似乎出在MCAS上,事故中其多次被自动激活。虽然水务行业的大多数数字解决方案并不属于完全自动化,但是,未来任何涉及自动化的开发程序都应该包括故障安全机制,当系统启动时,该机制应对用户发出提醒,或者允许操作人员启动手动干预来应对情况。

(4)冗余传感器对安全关键性系统有益。飞机和汽车行业都应用了传感器冗余技术来保护人类的生命。例如,在大规模生产的车辆中,保证人类的安全是最重要的,特斯拉汽车(和其他自动驾驶汽车)装有许多传感器,具有高水平的冗余。特斯拉Model 3车型安装了视觉系统,包括8个摄像头(可在250 m的半径范围内360°观察到汽车周围的情况),还有12个超声波传感器,以及一个面向前方的RADAR系统。然而,该车型没有安装LIDAR,而几乎所有其他自动驾驶汽车公司研发的车型都使用了LIDAR技术[47]。另一方面,波音公司在737 MAX机型中安装了两个迎角传感器,但MCAS只能从其中一个迎角传感器中读取信息[7]。任何传感器都容易发生故障,配备冗余传感器或者使用两个传感器信号可以找出发送错误数据的传感器并提高安全性。虽然在传感器的数量及系统规模方面,水务行业仍然落后于汽车和飞机行业,但是,增加冗余度会提高数据质量并减少与传感数据相关的不确定性。

(5)必须考虑网络安全问题。本文分析的交通事故并没有涉及网络安全问题,但是,据说白帽黑客曾远程控制了一辆汽车并且中断了车辆的运行。令人担忧的是,这是黑客研究计划[48]的一部分。近来对水务行业的事件进行审查,结果表明防范网络安全威胁是公用事业和政府高度优先考虑的事项[49]。此次审查确定了14起记录在册的事件。例如,一名心怀不满的前雇员故意控制自动化系统,导致数百万升未经处理的废水排放到环境中;一家公用事业公司受到勒索软件的网络攻击,需要向黑客付款以恢复对其计算机系统的访问。

(6)必须考虑伦理决策和负责任的AI技术。未来自动驾驶汽车有望得到广泛应用,这给汽车设计师和AI领域的从业者带来了另一个挑战:当AI软件遇到必须做出生死抉择的情况时,该如何处理。与不可避免的致命事故相关的基于伦理的决策,即在可用的反应时间内无法找到避免事故的解决方案的情况,尤其值得关注。例如,在假想的悲剧困境中,给定一辆自动驾驶汽车两个选择,即碾压一群行人或驶下悬崖杀死自己的乘客,这是AI领域潜在的一个伦理问题。AI技术在水务行业的应用通常涉及稀缺水资源的优化配置。然而,如果将自动化程度发挥到最大,比如在严重干旱时,由AI决定如何将资源分配给不同的用户(如作物灌溉相对城市供应),这种决定属于负责任的AI的伦理问题[50]。

数字化技术和自动化系统在水务行业的应用日益广泛。无线传感器网络、自主机器人和复杂的AI工具已经或即将应用到水务行业。城市化进程带来了许多挑战,例如,食品行业、能源行业和饮用水务行业对水资源的竞争日益激烈,水质恶化,基础设施老化,有限的资金,以及气候变化。加快水务行业的数字化转型似乎不可避免。因此,大幅改善复杂的水务系统管理方式具有很大的潜力。然而,这种发展必然会带来风险。通过分析其他行业,如汽车和飞机行业备受关注的报告事件,可以更好地理解和管理新的挑战。本文从具有强大监管机制和固有安全特质的部门中选取典型事件进行分析,并指出在水务行业研究类似问题的必要性,以保障水务行业的数字化转型。