多模态机器学习策略控制城市污水处理厂低碳智能曝气

王鸿程 ,  王煜琪 ,  王旭 ,  殷万欣 ,  俞亭超 ,  薛辰豪 ,  王爱杰

工程(英文) ›› 2024, Vol. 36 ›› Issue (5) : 56 -68.

PDF (6025KB)
工程(英文) ›› 2024, Vol. 36 ›› Issue (5) : 56 -68. DOI: 10.1016/j.eng.2023.11.020
研究论文

多模态机器学习策略控制城市污水处理厂低碳智能曝气

作者信息 +

Multimodal Machine Learning Guides Low Carbon Aeration Strategies in Urban Wastewater Treatment

Author information +
文章历史 +
PDF (6168K)

摘要

智能控制技术是废水处理过程中减少温室气体(GHG)排放和能源消耗的切实手段,机器学习(ML)和多模态技术为智能控制技术提供了一种前景更为广阔的解决方案。在本研究中提出了一种基于多模态策略的机器学习技术,并将其应用于验证污水处理厂(WWTP)的智能曝气控制。研究结果表明:基于八种传统的机器学习算法耦合视觉模型构建的多模态融合模型,可用于污水处理厂的智能曝气控制;使用多模态融合模型大大提高了传统机器学习模型的性能和曝气控制效率,表现出卓越的性能和可解释性。在多模态模型中,将随机森林与视觉模型相结合可实现最高的曝气量预测精度,平均绝对百分比误差为4.4%,决定系数为0.948。实际污水处理厂的应用研究表明:与传统的模糊控制方法相比,多模态融合模型方法可降低19.8%的运行成本。与此同时,本研究还讨论了多模态策略在水务领域的潜在应用,同时为了提高模型的公平性并促进广泛应用,本研究的多模态融合模型可在GitHub上免费获取,旨在消除人工智能技术在污水处理领域的应用障碍,推动人工智能在城市污水处理中的应用。

Abstract

The potential for reducing greenhouse gas (GHG) emissions and energy consumption in wastewater treatment can be realized through intelligent control, with machine learning (ML) and multimodality emerging as a promising solution. Here, we introduce an ML technique based on multimodal strategies, focusing specifically on intelligent aeration control in wastewater treatment plants (WWTPs). The generalization of the multimodal strategy is demonstrated on eight ML models. The results demonstrate that this multimodal strategy significantly enhances model indicators for ML in environmental science and the efficiency of aeration control, exhibiting exceptional performance and interpretability. Integrating random forest with visual models achieves the highest accuracy in forecasting aeration quantity in multimodal models, with a mean absolute percentage error of 4.4% and a coefficient of determination of 0.948. Practical testing in a full-scale plant reveals that the multimodal model can reduce operation costs by 19.8% compared to traditional fuzzy control methods. The potential application of these strategies in critical water science domains is discussed. To foster accessibility and promote widespread adoption, the multimodal ML models are freely available on GitHub, thereby eliminating technical barriers and encouraging the application of artificial intelligence in urban wastewater treatment.

关键词

污水处理 / 多模态机器学习 / 深度学习 / 曝气控制 / 可解释机器学习

Key words

Wastewater treatment / Multimodal machine learning / Deep learning / Aeration control / Interpretable machine learning

引用本文

引用格式 ▾
王鸿程,王煜琪,王旭,殷万欣,俞亭超,薛辰豪,王爱杰. 多模态机器学习策略控制城市污水处理厂低碳智能曝气[J]. 工程(英文), 2024, 36(5): 56-68 DOI:10.1016/j.eng.2023.11.020

登录浏览全文

4963

注册一个新账户 忘记密码

1 背景

为应对全球能源危机和减缓气候变化,需要采取联合多个行业的合作方法,以减少温室气体(GHG)排放[13]。目前的报道显示,全世界每年处理约1.881 × 1011 m3的废水,约需要相当于总能耗1%的能耗,并造成7.7 × 108 t CO2当量的温室气体排放,约占全球温室气体排放量的 1.57%(4.9 × 1010 t CO2当量)[46]。值得注意的是,废水处理行业在减少碳排放方面的潜力日益得到认可[78]。该行业与社会发展和人类生活息息相关,因其净化废水,补充宝贵的水资源。同时,污水处理系统排放的温室气体在全球温室气体排放中占有重要地位。随着能源消耗的持续激增,人们越来越认识到节约能源和减少温室气体排放的重要性[9]。因此,近来涌现了多种方法,包括不同的能源分配方法和智能低碳技术。这些进步为减少污水处理系统中的碳排放提供了宝贵的启示[1012]。

作为世界上温室气体排放较多的国家,中国的碳减排和节能工作对全球环境轨迹起着至关重要的作用。2019年,中国城市污水处理行业共排放5.3 × 106 t CO2当量,全国平均污水温室气体排放强度从2009年到2019年上升了17.2% [13]。中国迅速崛起的工业和经济为其实现碳中和带来了严峻挑战[14]。同时这些额外的碳排放对污水处理厂(WWTP)实现碳中和目标也造成了极大的限制。然而,努力实现污水处理系统的碳中和也为可持续环境发展开辟了新的途径[1516]。在全球范围内,各国都在采用智能策略,解决水污染问题的同时实现废水处理系统的碳中和目标[17]。因此,实现低碳运营和实施智能控制已成为污水处理厂高效运营的关键和核心领域。

在污水处理厂的不同工艺中,生化曝气工艺对能源消耗和碳排放都有重大影响[18],曝气工艺约占水厂能源消耗总量的75%,进而影响了污水处理厂的碳排放量[1920]。然而,实现精确的曝气控制仍然是一个相当大的挑战。由于底层生化反应的动态过程复杂、缓慢且无序,在这一过程中实施智能控制十分困难[2122]。虽然活性污泥模型是污水处理厂最常用的传统机理模型,可以提供相对可靠的数据,但其实际应用受到限制。造成这种限制的原因是它们依赖于复杂的模型参数和计算限制[23]。目前基于生化机理的曝气控制方法受制于复杂的参数设置,无法按照智能控制策略高效运行污水处理厂。因此,准确预测和实时控制曝气速率对于污水处理厂实现碳中和至关重要。

人工智能(AI)的飞速发展开创了一个新时代,为应对跨学科科学挑战提供了简单而有效的解决方案[2426]。人工智能的广泛应用也使得污水处理领域的潜在应用激增[2728]。这些应用涉及多个领域,包括水质检测、新污染物鉴定和资源回收[2931]。以往的研究已经证明了人工智能技术在预测和控制生化废水处理曝气方面的有效性(表 1)[3246]。

通过污水处理智能控制来大幅减少温室气体排放和能源消耗的潜力巨大。然而,以往的研究通常依赖单一类别机器学习(ML)模型,包括经典ML、深度学习和强化学习,来直接预测曝气过程中的空气需求或优化参数。遗憾的是,这些研究往往忽略了可解释性和可推广性。此外,随着环境数据生成的速度、数量和复杂性不断提高,表格、图像和视频等不同数据格式中的大量信息仍未得到利用。在构建用于废水生化处理过程智能控制的多模态模型方面进展甚微。此外,以往的研究主要集中在将机理模型与单一类别的ML模型相结合,很少关注不同类别的模型,从而阻碍了模型的泛化。机器学习的“黑箱”效应进一步阻碍了模型的可解释性,限制了我们对基本环境原理的理解。因此,本研究开创了一种多模态ML的方法,将经典ML模型与视觉模型相结合,特别关注污水处理厂曝气过程的智能控制。本研究介绍了这些多模态ML模型的基本步骤和原理,并讨论了多模态方法在污水处理厂中的通用性和可解释性。此外,多模态模型在智能控制空气需求方面的性能通过在实际大型污水处理厂的应用得到了验证,证实了其在节能降耗方面的有效性。

2 材料和方法

2.1 数据源描述

本研究的原始数据来自中国山东省的一个大型工业园区污水处理厂。该污水处理厂采用改良的厌氧-缺氧-好氧(A2O)工艺进行生物营养物去除。使用自动进样器(综合质量传感器网系统,Wissenschaftlich-Technische Werkstätten;德国Xylem公司)对污水特性进行实时测量,包括氨氮(NH4 +-N, mg∙L-1)、硝酸盐(NO3 --N, mg∙L-1)、化学需氧量(COD, mg∙L-1)和溶解氧(DO, mg∙L-1)。在污水处理厂的不同位置采集了进水的温度、流速、化学需氧量、氨氮和总氮(TN)(附录A表S1)。数据通过监控和数据采集(SCADA)系统以15 min的间隔自动采集,在2022年7月1日至2022年9月30日的92天内共采集了8832组数据。与此同时,还采集并以MP4格式保存了记录好氧池表面曝气的视频文件。这些分割的视频片段被进一步转换成JPG格式的图像,并根据相应的时间索引与结构化数据进行无缝合并。

数据集由8064个样本组成,通过训练和验证用于模型开发,其余768个样本用于测试模型性能。本研究使用的数据集由16个特征组成,包括温度、流速、水质和其他变量。曝气过程的空气需求量被指定为需要控制的特征。由于数据采集装置的连续运动,图片数据来自好氧池中的不同曝气位置,导致气泡位置、大小、数量和形状有显著变化。

2.2 数据预处理

附录A表S1说明了数据集的性能和特征,包括所有指标的最小值、最大值、平均值、标准偏差以及分位25%、50%和75%的量值。这些指标揭示了微妙而独特的时间序列模式。进水参数表现出广泛的可变性,进水COD从83.99 mg∙L-1到295.16 mg∙L-1不等[平均值为(162.79 ± 48.92) mg∙L-1],TN从17.57 mg∙L-1到49.70 mg∙L-1不等[平均值为(33.30 ± 8.11) mg∙L-1],NH4 +-N从11.55 mg∙L-1到40.78 mg∙L-1不等[平均值为(25.68 ± 6.48) mg∙L-1]。相比之下,出水参数呈现均匀分布,平均值、方差和偏移量略有变化。总体而言,水质指标出现了明显的波动,这给模型训练带来了可预期的挑战。

为确保数据的可靠性和分析的科学性,我们进行了预处理和数据清洗工作。采用数据插值技术处理缺失值,即利用列的平均值填充缺失的数据。本研究尝试了多种填补方法,包括使用缺失位置前后的数值、固定的0值或固定的平均值,结果显示使用平均值填补的效果最佳。在替换缺失值并分析数值数据的分布后,识别出可能影响模型准确性的异常值。使用适当的缩放方法对这些异常值进行检测和处理。最后,对数据进行对数变换,以提高训练收敛速度。

2.3 基础机器学习模型

为了验证多模态方法的通用性并描述不同类别ML模型的特征,必须选择一系列不同类别的ML模型。因此,本研究精心选择了八种ML模型作为基础模型(图1)。这种广泛的选择旨在确保对不同算法结构的适应性进行稳健而多样的测试,同时全面评估它们的性能和独特性。这八种基础模型分为三组。

首先,引入三种经典的ML模型,即线性回归(LIN)、Huber k-nearest neighbors(KNN)和支持向量机(SVM)。线性回归是一种广泛应用的ML算法,旨在通过最小化平方误差之和来确定最佳函数[47],如图1(a)所示。KNN根据k个近邻的类别对一个点进行分类,然后进行回归预测[图1(b)]。SVM寻找一个超平面来区分类别,最大化超平面与训练样本之间的差值[图1(c)]。有关这些ML模型的更详细解释,请参见附录A中的S1部分。

其次,研究还包括两种集合学习模型:梯度随机森林(RF)和轻梯度提升机(LGBM)。集合学习模型利用不同的策略整合子模型。梯度随机森林利用了“套袋”(bagging)的思想,即从原始训练集中随机抽样,为每个基础模型建立一个子训练集[图1(e)]。基于提升的集合学习模型(如 LGBM)的训练过程采用梯形方法,当特定数据点在一次迭代中被错误分类时,就会被赋予更高的权重[图1(f)]。关于集合学习模型的更详细解释,请参见附录A中的S2部分。

最后,我们采用了三种深度学习方法:深度神经网络(DNN)、递归神经网络(RNN)和长短期记忆(LSTM)。DNN 具有广泛的覆盖面和出色的适应性,因为它的网络由许多层组成,层宽很大[图1(d)]。RNN和LSTM是专为处理时间序列数据而设计的深度学习方法。RNN擅长短期记忆[图1(g)],而LSTM更适合长期记忆[图1(h)]。有关深度学习模型的更详细解释,请参见附录A中的第S3部分。

2.4 视觉模型

视觉模型在环境科学领域得到广泛应用[4850]。深度学习,尤其是卷积神经网络(CNN)的出现,深刻地改变了传统的计算机视觉。通常情况下,卷积神经网络由卷积层、池化层和全连接层组成,这些层共同构成了其基本组件[51]。卷积层可提炼出囊括图像多维特征的特征图,而池化层则可通过丢弃无关信息来降低这些特征图的维度,从而加速模型收敛并最大限度地减少参数数量[5253]。基于CNN的一个著名模型是“You Only Look Once”(YOLO),它因其实时训练能力、快速训练速度和强大的泛化特征学习能力而成为计算机视觉领域的领先模型[5455]。本研究采用的视觉模型框架扩展了YOLO的主干网络,并根据污水处理系统的具体要求进行了调整。

视觉模型由三个不同的部分组成。输入模块首先将不同大小的图像规范化为640像素× 640像素× 3像素的格式,并对红绿蓝(RGB)通道进行编码。其次,主干网络从输入图像中提取关键特征,特别是与通气相关的气泡特征。最后,检测头模块有助于检测和分类小、中、大三种尺度的物体。该模块可将气泡与其他固体、悬浮物等区分开来。附图进一步介绍了各个模块[图1(i)]。核心模块包括卷积层(CONV)、批量归一化(BN)和激活函数(SILU)。其他模块在CBS模块的基础上进行构建或组合。图中每个模块旁边表示乘法的数值代表每个阶段的图像大小,说明了从640像素× 640像素× 3像素到后续阶段的转换。

2.5 多模态模型

多模态学习整合了多种类型的数据,并通过利用每种模态中的不同信息来促进综合特征的提取[56]。多模态学习中的数据分区涉及更精细的模态概念,不同的模态可以共存于同一媒介中。模态包含一系列元素,包括表意符号;语义表示,如词向量或知识图谱;结构化和非结构化数据单元;以及数学描述,如公式、逻辑符号、函数图和解释性文本。

多种模态的互补性和冗余性使得复杂信息的表征和总结成为可能。然而,多模态数据的异质性给构建有效的表征带来了挑战。表格数据直接反映信息,而图像和视频数据则表示为信号。单模态表征的目的是将信息转换成可由计算机处理的数字向量,或者抽象成更高层次的特征向量。相比之下,多模态表征旨在利用不同模态之间的互补性,消除它们之间的冗余,从而获得信息量更大、更具区分度的特征表征。在多模态学习中追求改进特征表征的动机是希望有效捕捉不同数据类型所包含的丰富多样的信息。

融合在多模态学习中扮演着至关重要且极具挑战性的角色,来自多种模态的信息可协同完成预测任务。每种模态都可能具有独特的预测能力、噪声模式以及至少一种模态数据丢失的可能性。本研究提出的多模态策略采用了融合技术。如图2所示,本研究提出了一种将视觉模型与经典ML模型相结合的相互关联的多模态策略。

算法1显示了多模态策略的伪代码。在数据收集阶段,从多种模态收集数据后,要执行数据清理、删除和整合等细致步骤。处理后的数据同时输入基础ML模型和可视化模型,以获得结果。基础ML模型的预测值为y b,视觉模型的预测值为m,这意味着反馈的校准参数。该m在阈值范围内为0,即不启用视觉模型的校准作用,直接使用基础ML模型的结果作为最终预测。在代码开发阶段,阈值a被设计为一个可变参数。使用的阈值为91.5 m3∙h-1,是好氧池瞬时流量标准偏差(F oxi)的5倍。当ma时,可直接输出预测结果,而无需进一步依赖多模态模型。但是,如果m > a,则需要仔细评估视觉模型的耦合参数。模型性能通过三个指标进行评估:相对均方根误差(RMSE)、平均绝对百分比误差(MAPE)和判定系数(R 2)(附录A的第S4部分)。如果任何指标达到最优,则输出多模态预测值y m = y b + m作为最终值;否则,最终值为y b

2.6 适用性和性能测试

通过评估在同一全规模污水处理厂(中国)实施的曝气控制策略的性能,评估了所开发的多模态框架模型的适用性。这些污水处理厂的二级处理工艺成对平行排列。其中一半采用原始曝气方法,另一半采用多模态曝气方法进行控制。这种运行策略实施了29天,以全面评估多模态曝气方法的实用性和有效性。在整个29天的数据收集期间,进水COD的波动范围为103~227 mg∙L-1,TN水平的波动范围为15~56 mg∙L-1。改良A2O工艺五个区域的溶解氧水平(附录A图S1)在特定范围内进行了严格调节:(0.05 ± 0.02)、(0.15 ± 0.05)、(1.5 ± 0.5)、(0.15 ± 0.05)和(1.5 ± 0.5) mg∙L-1

3 结果和讨论

3.1 调查污水处理厂特征变量的初步分析

为了更好地了解数据集的分布情况,图3对原始指标进行了归一化处理。值得注意的是,这些不同的污水处理厂归一化指标的分布出现了明显的变化。原始特征值为y,归一化特征值为 y - m i n   ( f e a t u r e   c o l u m n ) m a x   f e a t u r e   c o l u m n - m i n   ( f e a t u r e   c o l u m n )。虽然大多数特征列趋向于聚集在0.25~0.75附近,但这些特征列的平均值和模式位置差异很大。有趣的是,在特征列和标签列的变化趋势之间没有发现明显的时间对应关系。这对解读数据分布的环境意义提出了挑战,从而凸显了对稳健模型可解释性的需求。

图4显示了所有八种算法在两种情况(基础ML模型和多模态ML模型)下的性能指标MAPE、RMSE和R 2。值得注意的是,基础ML模型的模拟值与实际值的一致性并不令人满意。所有基础ML模型的MAPE值范围约为11.6%~15.2%,RMSE值介于1908~2242之间,R 2值始终低于0.301。这些结果表明,使用基础ML模型得出的预测结果与实际结果之间存在很大差异。在具体的基础模型中,DNN的MAPE值最低,为11.6%,而RNN的RMSE值最低,为1908,R 2值最高,为0.301。这些结果表明,基础ML模型在空气需求预测方面的通用性和可解释性都很有限,因此需要加以改进,以提高曝气控制的精度。训练过程的可视化结果表明,RF、RNN和LSTM具有出色的学习能力,预测结果非常接近真实值(附录A图S2)。尽管如此,测试集的MAPE并未显示出显著差异,其值介于11.7%~12.7% 之间(图4)。相反,LIN和KNN在训练过程中表现不佳,它们在测试集中的MAPE值分别只有13.3%和13.7%。这些现象证实了基础ML模型在预测曝气量时解释能力较差的猜想。

3.2 多模态 ML 模型的开发与性能

图4(a)~(h)显示了多模态ML模型在测试数据集上的性能评估。与基础ML模型相比,视觉模型的加入大大提高了多模态模型的性能。与相应的基础模型曲线相比,所有多模态预测曲线都更接近真实情况。图4(i)显示,LIN-M、KNN-M、SVM-M、DNN-M和RNN-M的MAPE值低于12%,R 2值分别为0.090、0.344、0.484、0.468和0.424。此外,RF-M、LGBM-M和LSTM-M的R 2值也有进一步提高,分别达到0.894、0.737和0.606。R 2值的显著提高为解释模型提供了可靠的基础。

附录A图S3显示了视觉模型训练的关键特征信息。在训练集和验证集中,方块损失分别稳定在0.03和0.06。同样,客观性损失在训练集上稳定在0.10,在验证集上稳定在0.02。平均精度(mAP)表示在不同置信水平下为所有类别计算的精度平均值。mAP@0.5表示置信度阈值大于0.5的平均mAP,稳定收敛于0.8。mAP@0.5:0.95表示从0.5到0.95的不同置信度下的平均mAP,稳定收敛于0.6。尽管会带来复杂的训练挑战,由于真实世界数据的多模态性质,多模态学习提供了一个更稳健的理论基础[5758]。多模态学习有助于全面了解数据,强调从多模态数据中学到的算法[5960]。人类可以通过视觉和听觉模式感知他人或物体。多模态深度学习希望赋予计算机类似的能力,使模型能够同时处理来自多种模态的输入[6162]。如图4(i)所示,这阐明了多模态模型在训练数据集上的强大收敛性和泛化性能。

就单个算法而言,不同基础模型的改进幅度存在显著差异。在加入视觉模型后,RNN和LSTM的改进幅度并不大,这可能是因为RNN可以通过其记忆单元学习部分即时信息[63]。RNN擅长短期记忆,而LSTM擅长长期记忆[6465]。图4(i)证实了这一点,该图显示LSTM与RNN相比有显著提高。相反,多模态模型对其他算法的改进效果显著。RF和LGBM这两种集合学习算法的表现尤为出色,这可能是由于从视觉模型中提取了瞬时信息,为树模型中的子树分类提供了更好的路径[66]。RF采用的样本检索方法具有循环性,便于对子树进行并行训练。相比之下,LGBM依赖于改变样本权重,因此必须进行顺序训练[6768]。如图4(i)所示,RF性能优于LGBM的主要原因是并行训练需要更多的瞬时时间信息。此外,多模态模型显著提高了其余四种ML方法的性能。RF-M的预测效果显著,MAPE为4.4%,RMSE为743。此外,R 2达到0.894。RF证明了其可靠的准确性和清晰的可解释性,使其适用于污水厂的智能控制。通过可视化RF-M上y by m之间的差异,我们发现多模态策略具有校正效果。对比图4(e)和附录A中的图S4,多模态策略通过可视化模型的修正值减少了异常值的抖动,从而提高了模型的准确性。

3.3 可解释性分析

SHAP(Shapley additive explanation)法是从博弈论中汲取灵感的一种解释方法,它将SHAP值计算为一个特征在所有特征排列中的边际贡献的平均值。从本质上讲,SHAP法将输出值分配给每个特征的SHAP值,从而量化不同特征对最终输出值的影响[6971]。在RF中,SHAP对每棵树的输出进行解释,并计算所有树的平均解释结果,从而得出最终解释结果[72]。附录A图S5显示了多模态ML模型中所有特征的SHAP值。

在多模态ML模型中,前三个特征是进水氨氮(NH4 +-Ni)、进水化学需氧量(CODi)和进水温度(T i)[图5(a)]。纵轴上的特征根据所有样本的SHAP值汇总排序,而横轴则说明了单个样本的SHAP值对模型输出影响的分布情况。每个点代表一个样本,样本大小垂直堆叠,颜色代表特征值的大小。相对于NH4 +-Ni,排名第二的CODi 的全局重要性为57.1%,而排名最后的特征变量的重要性仅为1.4%。与其他特征指标相比,NH4 +-Ni的变化边界更窄。此外,在多模态框架内,耦合的视觉数据显示出更大的可变性,不同的视觉图像状态与NH4 +-Ni的微妙变化有更显著的相关性。此外,它还表明NH4 +-Ni、CODiT i水平的升高会对系统产生积极影响,而高T i则会产生消极影响。这一见解证实了进水水质指标的变化对污水处理厂的水质建模有重大影响,同时也证实了在数据预处理阶段的猜想。

图5(b)所示的依赖性散点图阐明了两个最重要因素(NH4 +-Ni和CODi)之间的相互作用。每个点对应一个样品,横轴代表NH4 +-Ni的特征值,纵轴代表NH4 +-Ni的SHAP值,颜色代表CODi的特征值。在NH4 +-Ni浓度较低时,需氧量会随着NH4 +-Ni浓度的增加而增加。具体来说,当NH4 +-Ni浓度为15~20 mg∙L-1时,CODi浓度会随着NH4 +-Ni浓度的增加而上升。值得注意的是,当NH4 +-Ni浓度达到30 mg∙L-1的临界值时,需氧量将趋于平稳。此时,CODi浓度不会随NH4 +-Ni的增加而线性增加,从而使NH4 +-Ni成为决定性因素。对于NH4 +-Ni较低的样品,CODi与较低的NH4 +-Ni SHAP值相对应,CODi对NH4 +-Ni的依赖性和影响更大。重要的是,该图显示,具有相同特征值的样品可以表现出不同的SHAP值,这意味着这些特征与其他变量之间存在相互作用。

利用监督聚类和热图可视化768个测试样本的底层子结构[图5(c)]。横轴为验证集样本实例,纵轴为模型特征输入,色条为编码的SHAP值。灰色虚线是基线,右侧的柱状图是每个模型特征输入的全局重要性。它直观地显示了每个样本中的特征分布。垂直观察所有样本的排列,初始样本的色块呈现出明显的红色。前面的样本分布极大地影响了模型的有效性,占91.8%。此外,在95.8%的情况下,SHAP值的总和f(x)超过了平均线,这表明它们被归类为高质量样本。这一结果表明,多模态ML模型在预测阶段具有相对稳定性,成功避免了严重的过拟合。因此,这一特性有助于提高多模态ML模型的性能。

3.4 多模态学习的可行性和实际影响

验证了从全规模污水处理厂获得的29天数据后,本研究开发的多模态模型与传统的模糊曝气预测和控制相比表现出更优越的性能。与模糊控制相比,利用多模态框架可大幅降低出水COD和TN。图6(a)显示,平均出水COD降低了38.5%;图6(b)显示,平均出水TN降低了26.3%。COD和TN的去除率表明了模型的转换能力,多模态框架显著提高了这些去除率。图6(c)显示COD的最大去除率为96.3%,而图6(d)则显示TN的最高去除率为95.6%。此外,多模态框架的实施还显著减少了污水处理厂的碳排放量。

关键指标的显著提高可归因于污水中溶解氧水平的变化。图6(e)显示了溶解氧的增加,表明初期阶段氧气利用效率的提高。污水中的最低溶解氧水平从1.79 mg∙L-1增加至1.98 mg∙L-1,而最高值则从2.38 mg∙L-1增加至2.65 mg∙L-1。污水中的平均溶解氧增加了11.2%,最大值增加了31.3%,相当于0.59 mg∙L-1图6(f)提供了佐证,说明在好氧池中处理单位废水所需的氧气含量降低了。通过实施多模态曝气框架,实现了对氧气供应和利用的智能控制,从而优化了废水生物处理中碳和氮去除过程的基质供应。通过这种优化,可实现稳定的出水质量和更高的去除率。

工业园区污水处理厂的运营费用主要包括曝气电费(Ele-aer)、化学品成本和其他电力消耗(Ele-oth),如污泥回流泵、内部回流泵和污泥排放泵。使用的主要化学品包括用于补充碳源(Car-ext)的甲醇和用于化学沉淀的聚丙烯酰胺和聚合氯化铝(PAC&PAM)。附录A表S2列出了污水处理厂的主要成本构成及其相应的单位成本。总体而言,对于采用传统模糊控制策略的一半工艺,每立方米废水的处理成本为1.57元。相比之下,对于采用多模态ML控制策略的一半工艺单元,处理成本大幅降低了19.7%,降为每立方米废水1.26元,如图6(g)所示。具体而言,曝气电耗大幅降低,多模态ML模型与基础ML模型运行条件相比,大幅降低了21.1%。废水处理成本的百分比也发生了变化[图6(h)]。

3.5 展望

在智能废水处理控制领域,多模态学习框架的应用不仅仅局限于曝气范围,同时有许多尚未探索的多种环境可用领域(见图7)。多模态方法在工业污水处理厂以及更广泛的水系统中的应用潜力巨大。多模态机器学习融合了多种形式的环境数据,包括文本、音频、图像和视频,能够进行全面的分析。值得注意的是,多模态框架在关键的水科学领域展现出了巨大的潜力和实际可行性。

图7(a)展示了多模态框架优化解决方案在有效识别异常运行状况方面的功效。污水处理厂和城市供水系统具有复杂的并行管网配置。通过多模态框架提供的优化方案,可以进一步提高对管网异常情况的检测能力[图7(c)]。同时,在包含污泥处理、供水分配和水泵利用的场景中,可利用实时图像和运行数据对泵站进行智能调度[图7(b)]。此外,在先进的废水处理和供水处理过程中,可通过整合预设数据参数和采用明矾花形态识别来实现智能化学计量[图7(d)]。

同时,对未来的优化工作,我们提出了一些想法。首先,有必要验证多模态方法在工业用水系统其他领域的实际应用。其次,将这些方法封装到可调用的第三方软件库中,将简化与多模态建模相关的复杂性。最后,包括水力停留时间(HRT)、pH值、硝酸盐循环比和碳氮比(C/N)在内的一些变量在预训练阶段被排除。其中一些变量可以通过其他指标来解决,而另一些变量对模型的影响不大。同时,研究人员今后还应对一些指标进行验证,如进水磷和出水磷以及微生物组分。然而,必须承认,数据获取和可靠性验证仍是巨大挑战,这些挑战可以通过联邦学习方法加以克服。

4 结论

本研究介绍了一种利用多模态学习的新型ML建模方法,该方法首次应用于污水处理的曝气过程。通过利用多模态框架,八种ML模型的性能和可解释性得到了显著提高,从而显著降低了污水处理厂的运营成本和碳排放量。在所探讨的各类模型中,使用多模态的随机森林模型 是表现最佳的模型。此外,本研究还深入探讨了多模态方法在应对水科学领域各种挑战方面的可行性和潜力。主要源代码可通过附录A中的第S5节获取。

参考文献

[1]

McNicol G, Jeliazovski J, François JJ, Kramer S, Ryals R. Climate change mitigation potential in sanitation via off-site composting of human waste. Nat Clim Change 2020;10(6):545‒9. . 10.1038/s41558-020-0782-4

[2]

Nerini FF, Sovacool B, Hughes N, Cozzi L, Cosgrave E, Howells M, et al. Connecting climate action with other sustainable development goals. Nat Sustainability 2019;2(8):674‒80. . 10.1038/s41893-019-0334-y

[3]

Zhou N, Khanna N, Feng W, Ke J, Levine M. Scenarios of energy efficiency and CO2 emissions reduction potential in the buildings sector in China to year 2050. Nat Energy 2018;3(11):978‒84. . 10.1038/s41560-018-0253-6

[4]

Sabia G, Petta L, Avolio F, Caporossi E. Energy saving in wastewater treatment plants: a methodology based on common key performance indicators for the evaluation of plant energy performance, classification and benchmarking. Energy Convers Manage 2020;220:113067. . 10.1016/j.enconman.2020.113067

[5]

Edenhofer O, Pichs-Madruga R, Sokona Y, Minx JC, Farahani E, Kadner S, et al. Climate change 2014: mitigation of climate change. Cambridge: Cambridge University Press; 2014.

[6]

Jones ER, van Vliet MTH, Qadir M, Bierkens MFP. Country-level and gridded estimates of wastewater production, collection, treatment and reuse. Earth Syst Sci Data 2021;13(2):237‒54. . 10.5194/essd-13-237-2021

[7]

Van Loosdrecht MCM, Brdjanovic D. Water treatment. Anticipating the next century of wastewater treatment. Science 2014;344(6191):1452‒3. . 10.1126/science.1255183

[8]

Shao L, Chen GQ. Water footprint assessment for wastewater treatment: method, indicator, and application. Environ Sci Technol 2013;47(14):7787‒94. . 10.1021/es402013t

[9]

Rothausen SGSA, Conway D. Greenhouse-gas emissions from energy use in the water sector. Nat Clim Change 2011;1(4):210‒9. . 10.1038/nclimate1147

[10]

Shindell D, Smith CJ. Climate and air-quality benefits of a realistic phase-out of fossil fuels. Nature 2019;573(7774):408‒11. . 10.1038/s41586-019-1554-z

[11]

Nguyen TKL, Ngo HH, Guo W, Chang SW, Nguyen DD, Nghiem LD, et al. Insight into greenhouse gases emissions from the two popular treatment technologies in municipal wastewater treatment processes. Sci Total Environ 2019;671:1302‒13. . 10.1016/j.scitotenv.2019.03.386

[12]

Wang YQ, Wang HC, Song YP, Zhou SQ, Li QN, Liang B, et al. Machine learning framework for intelligent aeration control in wastewater treatment plants: automatic feature engineering based on variation sliding layer. Water Res 2023;246:120676. . 10.1016/j.watres.2023.120676

[13]

Du WJ, Lu JY, Hu YR, Xiao J, Yang C, Wu J, et al. Spatiotemporal pattern of greenhouse gas emissions in China’s wastewater sector and pathways towards carbon neutrality. Nat Water 2023;1(2):166‒75. . 10.1038/s44221-022-00021-0

[14]

Wang H, Lu X, Deng Y, Sun Y, Nielsen CP, Liu Y, et al. China’s CO2 peak before 2030 implied from characteristics and growth of cities. Nat Sustainability 2019;2(8):748‒54. . 10.1038/s41893-019-0339-6

[15]

Ramaswami A, Tong K, Fang A, Lal RM, Nagpure AS, Li Y, et al. Urban crosssector actions for carbon mitigation with local health co-benefits in China. Nat Clim Change 2017;7(10):736‒42. . 10.1038/nclimate3373

[16]

Liang X, Zhang S, Wu Y, Xing J, He X, Zhang KM, et al. Air quality and health benefits from fleet electrification in China. Nat Sustainability 2019;2(10):962‒71. . 10.1038/s41893-019-0398-8

[17]

Hao X, Liu R, Huang X. Evaluation of the potential for operating carbon neutral WWTPs in China. Water Res 2015;87:424‒31. . 10.1016/j.watres.2015.05.050

[18]

Skouteris G, Rodriguez-Garcia G, Reinecke SF, Hampel U. The use of pure oxygen for aeration in aerobic wastewater treatment: a review of its potential and limitations. Bioresour Technol 2020;312:123595. . 10.1016/j.biortech.2020.123595

[19]

Pittoors E, Guo Y, van Hulle SWH. Modeling dissolved oxygen concentration for optimizing aeration systems and reducing oxygen consumption in activated sludge processes: a review. Chem Eng Commun 2014;201 (8):983‒1002. . 10.1080/00986445.2014.883974

[20]

Åmand L, Olsson G, Carlsson B. Aeration control—a review. Water Sci Technol 2013;67(11):2374‒98. . 10.2166/wst.2013.139

[21]

Crini G, Lichtfouse E. Advantages and disadvantages of techniques used for wastewater treatment. Environ Chem Lett 2019;17(1):145‒55. . 10.1007/s10311-018-0785-9

[22]

Sun Y, Guan Y, Pan M, Zhan X, Hu Z, Wu G. Enhanced biological nitrogen removal and N2O emission characteristics of the intermittent aeration activated sludge process. Rev Environ Sci Bio Technol 2017;16(4):761‒80. . 10.1007/s11157-017-9444-z

[23]

Fenu A, Guglielmi G, Jimenez J, Spèrandio M, Saroj D, Lesjean B, et al. Activated sludge model (ASM) based modelling of membrane bioreactor (MBR) processes: a critical review with special regard to MBR specificities. Water Res 2010;44(15):4272‒94. . 10.1016/j.watres.2010.06.007

[24]

Sutton C, Boley M, Ghiringhelli LM, Rupp M, Vreeken J, Scheffler M. Identifying domains of applicability of machine learning models for materials science. Nat Commun 2020;11(1):4428. . 10.1038/s41467-020-17112-9

[25]

Segler MHS, Preuss M, Waller MP. Planning chemical syntheses with deep neural networks and symbolic AI. Nature 2018;555(7698):604‒10. . 10.1038/nature25978

[26]

Jones DT, Thornton JM. The impact of AlphaFold2 one year on. Nat Methods 2022;19(1):15‒20. . 10.1038/s41592-021-01365-3

[27]

Eggimann S, Mutzner L, Wani O, Schneider MY, Spuhler D, de Vitry MM, et al. The potential of knowing more: a review of data-driven urban water management. Environ Sci Technol 2017;51(5):2538‒53. . 10.1021/acs.est.6b04267

[28]

Newhart KB, Holloway RW, Hering AS, Cath TY. Data-driven performance analyses of wastewater treatment plants: a review. Water Res 2019;157:498‒513. . 10.1016/j.watres.2019.03.030

[29]

Rodriguez-Perez J, Leigh C, Liquet B, Kermorvant C, Peterson E, Sous D, et al. Detecting technical anomalies in high-frequency water-quality data using artificial neural networks. Environ Sci Technol 2020;54(21):13719‒30. . 10.1021/acs.est.0c04069

[30]

Miller TH, Gallidabino MD, MacRae JI, Hogstrand C, Bury NR, Barron LP, et al. Machine learning for environmental toxicology: a call for integration and innovation. Environ Sci Technol 2018;52(22):12953‒5. . 10.1021/acs.est.8b05382

[31]

Garrido-Baserba M, Vinardell S, Molinos-Senante M, Rosso D, Poch M. The economics of wastewater treatment decentralization: a techno-economic evaluation. Environ Sci Technol 2018;52(15):8965‒76. . 10.1021/acs.est.8b01623

[32]

Hernández-del-Olmo F, Gaudioso E, Dormido R, Duro N. Energy and environmental efficiency for the N-ammonia removal process in wastewater treatment plants by means of reinforcement learning. Energies 2016;9(9):755. . 10.3390/en9090755

[33]

Asadi A, Verma A, Yang K, Mejabi B. Wastewater treatment aeration process optimization: a data mining approach. J Environ Manage 2017;203(Pt 2):630‒9. . 10.1016/j.jenvman.2016.07.047

[34]

Zhu JJ, Kang L, Anderson PR. Predicting influent biochemical oxygen demand: balancing energy demand and risk management. Water Res 2018;128:304‒13. . 10.1016/j.watres.2017.10.053

[35]

Lotfi K, Bonakdari H, Ebtehaj I, Mjalli FS, Zeynoddin M, Delatolla R, et al. Predicting wastewater treatment plant quality parameters using a novel hybrid linear‒nonlinear methodology. J Environ Manage 2019;240:463‒74. . 10.1016/j.jenvman.2019.03.137

[36]

Wang J, Wan K, Gao X, Cheng X, Shen Y, Wen Z, et al. Energy and materialssaving management via deep learning for wastewater treatment plants. IEEE Access 2020;8:191694‒705. . 10.1109/access.2020.3032531

[37]

Icke O, van Es DM, de Koning MF, Wuister JJG, Ng J, Phua KM, et al. Performance improvement of wastewater treatment processes by application of machine learning. Water Sci Technol 2020;82(12):2671‒80. . 10.2166/wst.2020.382

[38]

Guo Z, Du B, Wang J, Shen Y, Li Q, Feng D, et al. Data-driven prediction and control of wastewater treatment process through the combination of convolutional neural network and recurrent neural network. RSC Adv 2020;10(23):13410‒9. . 10.1039/d0ra00736f

[39]

Khatri N, Khatri KK, Sharma A. Artificial neural network modelling of faecal coliform removal in an intermittent cycle extended aeration systemsequential batch reactor based wastewater treatment plant. J Water Process Eng 2020;37:101477. . 10.1016/j.jwpe.2020.101477

[40]

Newhart KB, Marks CA, Rauch-Williams T, Cath TY, Hering AS. Hybrid statistical-machine learning ammonia forecasting in continuous activated sludge treatment for improved process control. J Water Process Eng 2020;37:101389. . 10.1016/j.jwpe.2020.101389

[41]

Zaghloul MS, Iorhemen OT, Hamza RA, Tay JH, Achari G. Development of an ensemble of machine learning algorithms to model aerobic granular sludge reactors. Water Res 2021;189:116657. . 10.1016/j.watres.2020.116657

[42]

Sangeeta AS, Sharafati A, Sihag P, Al-Ansari N, Chau KW. Machine learning model development for predicting aeration efficiency through Parshall flume. Eng Appl Comput Fluid Mech 2021;15(1):889‒901. . 10.1080/19942060.2021.1922314

[43]

Pan Y, Dagnew M. A new approach to estimating oxygen off-gas fraction and dynamic alpha factor in aeration systems using hybrid machine learning and mechanistic models. J Water Process Eng 2022;48:102924. . 10.1016/j.jwpe.2022.102924

[44]

Qambar AS, Al Khalidy MM. Optimizing dissolved oxygen requirement and energy consumption in wastewater treatment plant aeration tanks using machine learning. J Water Process Eng 2022;50:103237. . 10.1016/j.jwpe.2022.103237

[45]

Croll HC, Ikuma K, Ong SK, Sarkar S. Reinforcement learning applied to wastewater treatment process control optimization: approaches, challenges, and path forward. Crit Rev Environ Sci Technol 2023;53(20):1775‒94. . 10.1080/10643389.2023.2183699

[46]

Schwarz M, Trippel J, Engelhart M, Wagner M. Dynamic alpha factor prediction with operating data—a machine learning approach to model oxygen transfer dynamics in activated sludge. Water Res 2023;231:119650. . 10.1016/j.watres.2023.119650

[47]

Visser H, Evers N, Bontsema A, Rost J, de Niet A, Vethman P, et al. What drives the ecological quality of surface waters? A review of 11 predictive modeling tools. Water Res 2022;208:117851. . 10.1016/j.watres.2021.117851

[48]

Jia T, Kapelan Z, de Vries R, Vriend P, Peereboom EC, Okkerman I, et al. Deep learning for detecting macroplastic litter in water bodies: a review. Water Res 2023;231:119632. . 10.1016/j.watres.2023.119632

[49]

Gnann N, Baschek B, Ternes TA. Close-range remote sensing-based detection and identification of macroplastics on water assisted by artificial intelligence: a review. Water Res 2022;222:118902. . 10.1016/j.watres.2022.118902

[50]

Zhou X, Tang Z, Xu W, Meng F, Chu X, Xin K, et al. Deep learning identifies accurate burst locations in water distribution networks. Water Res 2019;166:115058. . 10.1016/j.watres.2019.115058

[51]

Voulodimos A, Doulamis N, Doulamis A, Protopapadakis E. Deep learning for computer vision: a brief review. Comput Intell Neurosci 2018;2018:7068349. . 10.1155/2018/7068349

[52]

Li Z, Liu F, Yang W, Peng S, Zhou J. A survey of convolutional neural networks: analysis, applications, and prospects. IEEE Trans Neural Networks Learn Syst 2022;33(12):6999‒7019. . 10.1109/tnnls.2021.3084827

[53]

Mallat S. Understanding deep convolutional networks. Philos Trans R Soc A 2016;374(2065):20150203. . 10.1098/rsta.2015.0203

[54]

Wang CY, Bochkovskiy A, Liao HYM. YOLOv7: trainable bag-of-freebies sets new state-of-the-art for real-time object detectors. 2022. arXiv:10.1109/cvpr52729.2023.00721

[55]

Chen C, Zheng Z, Xu T, Guo S, Feng S, Yao W, et al. YOLO-based UAV technology: a review of the research and its applications. Drones 2023;7(3):190. . 10.3390/drones7030190

[56]

Holler J, Levinson SC. Multimodal language processing in human communication. Trends Cognit Sci 2019;23(8):639‒52. . 10.1016/j.tics.2019.05.006

[57]

Stahlschmidt SR, Ulfenborg B, Synnergren J. Multimodal deep learning for biomedical data fusion: a review. Briefings Bioinf 2022;23(2):bbab569. . 10.1093/bib/bbab569

[58]

Li M, Zareian A, Zeng Q, Whitehead S, Lu D, Ji H, et al. Cross-media structured common space for multimedia event extraction. In: JurafskyD, ChaiJ, SchluterN, TetreaultJ, editors. Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics; 2020 Jul 5‒10; Stroudsburg, PA, USA. Kerrville: Association for Computational Linguistics; 2020. p. 2557‒68. . 10.18653/v1/2020.acl-main.230

[59]

Gao J, Li P, Chen Z, Zhang J. A survey on deep learning for multimodal data fusion. Neural Comput 2020;32(5):829‒64. . 10.1162/neco_a_01273

[60]

Zhang Y, Chen M, Shen J, Wang C. Tailor versatile multi-modal learning for multi-label emotion recognition. 2022. arXiv:10.1609/aaai.v36i8.20895

[61]

Azam MA, Khan KB, Salahuddin S, Rehman E, Khan SA, Khan MA, et al. A review on multimodal medical image fusion: compendious analysis of medical modalities, multimodal databases, fusion techniques and quality metrics. Comput Biol Med 2022;144:105253. . 10.1016/j.compbiomed.2022.105253

[62]

Huo Y, Zhang M, Liu G, Lu H, Gao Y, Yang G, et al. WenLan: bridging vision and language by large-scale multi-modal pre-training. 2021. arXiv:

[63]

Yang B, Xiao Z, Meng Q, Yuan Y, Wang W, Wang H, et al. Deep learning-based prediction of effluent quality of a constructed wetland. Environ Sci Ecotechnol 2022;13:100207. . 10.1016/j.ese.2022.100207

[64]

Zhong S, Zhang K, Bagheri M, Burken JG, Gu A, Li B, et al. Machine learning: new ideas and tools in environmental science and engineering. Environ Sci Technol 2021;55(19):12741‒54.

[65]

Gupta S, Aga D, Pruden A, Zhang L, Vikesland P. Data analytics for environmental science and engineering research. Environ Sci Technol 2021;55(16):10895‒907. . 10.1021/acs.est.1c01026

[66]

Chen K, Chen H, Zhou C, Huang Y, Qi X, Shen R, et al. Comparative analysis of surface water quality prediction performance and identification of key water parameters using different machine learning models based on big data. Water Res 2020;171:115454. . 10.1016/j.watres.2019.115454

[67]

Wang G, Jia QS, Zhou M, Bi J, Qiao J, Abusorrah A. Artificial neural networks for water quality soft-sensing in wastewater treatment: a review. Artif Intell Rev 2022;55(1):565‒87. . 10.1007/s10462-021-10038-8

[68]

Zhu S, Lu H, Ptak M, Dai J, Ji Q. Lake water-level fluctuation forecasting using machine learning models: a systematic review. Environ Sci Pollut Res 2020;27 (36):44807‒19. . 10.1007/s11356-020-10917-7

[69]

Lundberg SM, Lee SI. A unified approach to interpreting model predictions. In: LuxburgUVon, GuyonI, BengioS, WallachH, FergusR, editors. Proceedings of the 31st International Conference on Neural Information Processing Systems; 2017 Dec 4‒9; Long Beach, CA, USA. Red Hook: Curran Associates Inc.; 2017. p. 4768‒77.

[70]

Meng Y, Yang N, Qian Z, Zhang G. What makes an online review more helpful: an interpretation framework using XGBoost and SHAP values. J Theor Appl Electron Commer Res 2021;16(3):466‒90. . 10.3390/jtaer16030029

[71]

Zhang J, Ma X, Zhang J, Sun D, Zhou X, Mi C, et al. Insights into geospatial heterogeneity of landslide susceptibility based on the SHAP-XGBoost model. J Environ Manage 2023;332:117357. . 10.1016/j.jenvman.2023.117357

[72]

Futagami K, Fukazawa Y, Kapoor N, Kito T. Pairwise acquisition prediction with SHAP value interpretation. J Finance Data Sci 2021;7:22‒44. . 10.1016/j.jfds.2021.02.001

AI Summary AI Mindmap
PDF (6025KB)

8222

访问

0

被引

详细

导航
相关文章

AI思维导图

/