介科学引导的深度学习案例研究

郭力 ,  孟凡勇 ,  秦鹏飞 ,  夏诏杰 ,  常麒 ,  陈建华 ,  李静海

工程(英文) ›› 2024, Vol. 39 ›› Issue (8) : 90 -100.

PDF (2226KB)
工程(英文) ›› 2024, Vol. 39 ›› Issue (8) : 90 -100. DOI: 10.1016/j.eng.2024.01.007
研究论文

介科学引导的深度学习案例研究

作者信息 +

A Case Study Applying Mesoscience to Deep Learning

Author information +
文章历史 +
PDF (2278K)

摘要

为了研究复杂系统,本文提出了介科学引导的深度学习建模方法(MGDL)。在基于同一系统演化数据构建样本数据集时,与传统深度学习方法有所不同,MGDL根据介科学理论,对复杂系统的主导机制及其通过竞争中协调原理的相互作用进行处理。然后将介科学约束纳入损失函数,以引导深度学习的训练建模。本文提出了两种添加介科学约束的方法。由于提供了基于物理原理的引导和约束,MGDL提高了模型训练过程的物理可解释性。本文使用一个鼓泡床建模案例对MGDL进行了评估,并与传统建模进行了比较。结果表明,在训练数据集规模较小时,基于介科学约束的模型训练在收敛稳定性和预测准确性方面具有明显优势。MGDL可广泛应用于各种构型的神经网络。本文提出的MGDL方法是一种在深度学习模型训练过程中利用物理信息的新方法,未来将继续对MGDL进行深入探索。

Abstract

In this paper, we propose mesoscience-guided deep learning (MGDL), a deep learning modeling approach guided by mesoscience, to study complex systems. When establishing sample dataset based on the same system evolution data, different from the operation of conventional deep learning method, MGDL introduces the treatment of the dominant mechanisms of complex system and interactions between them according to the principle of compromise in competition (CIC) in mesoscience. Mesoscience constraints are then integrated into the loss function to guide the deep learning training. Two methods are proposed for the addition of mesoscience constraints. The physical interpretability of the model-training process is improved by MGDL because guidance and constraints based on physical principles are provided. MGDL was evaluated using a bubbling bed modeling case and compared with traditional techniques. With a much smaller training dataset, the results indicate that mesoscience-constraint-based model training has distinct advantages in terms of convergence stability and prediction accuracy, and it can be widely applied to various neural network configurations. The MGDL approach proposed in this paper is a novel method for utilizing the physical background information during deep learning model training. Further exploration of MGDL will be continued in the future.

关键词

介科学 / 深度学习 / 复杂系统 / 气固系统 / 鼓泡床

Key words

Mesoscience / Deep learning / Complex system / Gas-solid system / Bubbling bed

引用本文

引用格式 ▾
郭力,孟凡勇,秦鹏飞,夏诏杰,常麒,陈建华,李静海. 介科学引导的深度学习案例研究[J]. 工程(英文), 2024, 39(8): 90-100 DOI:10.1016/j.eng.2024.01.007

登录浏览全文

4963

注册一个新账户 忘记密码

1 使用物理机制的深度学习建模方法

复杂系统通常表现出非线性演化和多层次结构的特征,其每个层次都由大量相互作用的单元组成。仅使用基于数学和统计学的数据驱动方法为特定复杂系统建模,而不考虑系统中蕴含的物理机制的影响,可能会导致一些弊端,如需要大量训练数据、迭代时间长、模型泛化能力差以及对模型和建模过程的可解释性不足。因此,许多研究人员尝试将系统的物理知识纳入数据驱动的建模过程中[1]。其中最著名的方法是Raissi等[2]提出的物理信息神经网络(physics-informed neural networks, PINNs)。PINN关注使用神经网络求解偏微分方程(PDEs),由于其普适性和相对容易实施,该方法已在多个领域得到应用。这方面的例子包括探索橄榄球运动员的护齿对大脑的影响[3]、光纤的非线性动力学研究[4]、单搭接接头的应力传递机制[5]以及高速流体建模[6]。研究人员还研究了PINN与其他学习策略的结合,包括迁移学习[7]和元学习[8]。

在PINN中,系统控制PDEs的残差和初值/边界条件通过微分算子被集成到损失函数中,这相当于将PDEs的约束条件集成到神经网络的训练过程中。如此建立的模型满足了由控制PDEs所代表的物理规律的约束,从而在一定程度上缓解了上述问题。不过,这种处理方法仍然需要关注PDEs的准确性,由于使用平均化技术的原因,PDEs并不总是可靠的(例如,在涉及处理湍流和多相流时)。

PINNs可用于不同物理量之间通过数学方程已建立强关联的系统。但PINNs在下面两种情况下无法使用:①系统的关键物理量之间尚未建立这样的数学方程;②系统的内在机制是由物理量之间的其他关系所决定的。要为这些系统建模,必须发展新的方法。

近年来,介科学[910]这一处理多层次复杂性的方法论逐步发展了起来。介科学关注对系统不同层次中的介尺度问题的研究,并通过系统主导机制之间的竞争中协调(compromise in competition, CIC)原理,将系统的宏观行为与其内在机理进行关联。介科学被定义为“研究不同层次介尺度现象的普适性科学”(the science of the universality of mesoscale phenomena at different levels),或者更简单地说,是“中间态科学”(the science of the in-between)[9]。为了促进介科学的发展和应用,2018年成立了国际介科学组织(International Panel of Mesoscience, IPM)。

在研究复杂性问题时,介科学辨识系统层次,分析主导机制及其协调关系,确定它们的数学表达,最终求解多目标变分(multi-objective variational, MOV)问题。例如,假设系统有两个主导机制AB,其中A趋于最大化,B趋于最小化。随着时间的推移,AB相互竞争、相互制约,最终达成相互妥协,AB都不一定能实现自己的目标,但系统最终达到稳定。介科学表明,AB之间的CIC是这一复杂系统演化的基本驱动力。介科学框架可应用于不同的学科领域[11]。基于这一前提,有人提出可以将介科学理论纳入复杂系统的深度学习建模过程[12]。本文的工作展示了如何使用介科学理论引导深度学习建模。

本文提出了一种新颖的深度学习建模方法,称为介科学引导的深度学习(mesoscience-guided deep learning, MGDL)。与PINN类似,MGDL将系统的物理信息纳入建模过程。与PINN不同的是,PINN使用了系统控制方程的残差,其收敛标准是残差的绝对值趋于零;MGDL采用了另一种策略,首先根据介科学识别系统的主导机制及其CIC行为,然后将主导机制之间的CIC作为深度学习模型构建时的重要参考。

2 MGDL建模方法

介科学理论认为,尽管主导机制各不相同,但不同的复杂系统都遵循相同的CIC原理来构建系统的动态结构。通过分析系统主导机制及其CIC关系,可以将这种复杂性表达为一个数学上的MOV问题[9]。例如,对于气固两相流系统,颗粒团聚物是重要的介尺度结构,对系统的传质和传热有重大影响。能量最小多尺度方法(energy-minimization multiscale, EMMS)[13]就是利用这种介尺度结构来研究两种主导机制之间的CIC,该方法已被证明相当有效。

介科学原理已被成功地应用于化学工业中的复杂系统,如气固两相流[14]、湍管流[15]和多相催化[16]等,并被逐步推广应用到其他多个领域的复杂系统中[17]。本文提出了MGDL方法,该方法在损失函数中加入介科学约束,将系统时空变化的主导机制整合到深度学习模型训练过程中。通过这种方式,提升模型训练过程的物理可解释性,并将基于物理知识的建模策略扩展应用到了系统变量间尚未建立严格数学关联的系统中。然后,本文以鼓泡流化床这一典型的气固系统为例,对MGDL进行了验证。

2.1 内嵌时空信息的样本数据集构建方法

在将介科学原理应用于深度学习模型训练之前,需要收集包含前述系统主导机制的系统演化数据。本文提出了一种内嵌时空属性的样本数据集的构建方法。

包括深度学习在内的很多机器学习方法在某种意义上都可以看作是优化问题。一般说来,建立这些机器学习模型的过程大都可以归纳为:首先根据对问题的分析确定一个优化目标(如使模型预测值与真实值的均方误差最小),然后用不同的优化算法迭代修改模型参数,以逐步逼近优化目标。构成一个经典优化问题的要素是决策变量向量的目标函数和若干约束条件,优化目标是求取决策变量向量的优化解使得目标函数在决策变量向量的定义域内达到最小。约束条件分为两类,分别是关于决策变量向量的等式约束和不等式约束。

相比之下,从介科学的角度来看,系统达到稳态的过程可以看作是一个物理意义下的系统优化过程,此时的约束条件可能不是与输入和输出变量直接相关的方程或不等式,而是变量经函数变换(即应用物理原理)后的趋势约束条件。本文提出的MGDL建模方法基于对复杂系统进行的数值模拟。下面的公式(1)公式(4)给出了内嵌时空信息的监督学习样本数据的形式化表达。

x 1 , x 2 , , x m x y 1 , y 2 , , y m y s ~ s + ( T - 1 )
g i , s , g i , s + 1 , , g i , s + ( T - 1 ) m a x ,   i = 1,2 , , m g
h i , s , h i , s + 1 , , h i , s + ( T - 1 ) m i n ,   i = 1,2 , , m h
C I C i l i , 1 , l i , 2 , i = 1,2 , , m C I C

式中,xi 为第i个输入物理量;mx 为输入物理量的总数;yi 为第i个要建模预测的物理量;my 为要建模预测物理量的总数;gi,j 为第i个主导机制在时间步j的数据,该机制趋于最大;mg 为趋于最大的主导机制总数;hi,j 是第i个主导机制在时间步j的数据,该机制趋于最小;mh 是趋向于最小的主导机制总数;CIC i 是第i个CIC关系;li, 1li, 2是具有CIC关系的第i个主导机制对;m CIC是CIC的总数。

使用公式(1)公式(4)构建了一个数据样本,它起始的模拟时间步为s,模拟的时间窗口宽度为T公式(1)生成了一般监督学习的数据样本,公式(2)公式(3)是系统中具有趋势特征的时间序列数据,其关联由公式(4)定义。具体来说,公式(2)公式(3)是系统主导机制的模拟数据,根据从ss+(T-1)时间窗口内的演化趋势进行分类,其中公式(2)适用于最大化趋势,公式(3)适用于最小化趋势。公式(4)全面描述了系统主导机制之间的CIC关系。

公式(2)公式(4)中约束条件的应用与标准的优化问题不同。在经典优化中,所有约束条件(等式和不等式)均是刚性的,即优化解必须满足所有的约束条件。但基于介科学思想的约束条件在某一时刻不一定是刚性的,而是需要考察主导机制一段时间内的变化趋势。换句话说,这些约束条件满足介科学中系统的不同主导机制在竞争中协调的机理,刻画了系统的动态特性[18]。各约束条件随时间的进展而互相竞争、互相制约,最后达到在某个状态下的互相妥协,尽管约束条件不一定都能达到目标,但是最终整个系统达到了稳定。

2.2 MGDL模型训练方法

本文提出的MGDL模型训练方法在网络训练的误差反向传播中加入了基于介科学的约束条件,即在原有的损失函数上增加了一项,以反映当前的数据状态是否符合介科学原理。具体来说,是在建模训练过程中对公式(2)公式(3)定义的时序数据进行分析,判断当前的数据对于各个系统主导机制趋势的符合程度,以及是否满足公式(4)指出的主导机制间竞争中协调的关系。图1是MDGL建模的训练框架。

人工神经网络(artificial neural network, ANN)或深度神经网络建模中使用的标准损失被称为“数学损失”或“常规损失”,而利用介科学原理计算出的结果被称为“介科学约束”,二者结合起来更新网络权重参数。因此,必须解决两个关键问题:如何计算介科学约束,以及如何将其与常规损失相结合。研究者提出了多种方法来解决介科学中的多目标优化问题[17],如Zhang等[19]提出了气固流化EMMS模型多目标优化问题的数学等价解。在本工作中采用了一种简单直接的方法:检查系统每个主导机制的演化趋势和符合CIC的程度,然后将其加权求和,作为深度学习建模的介科学约束条件。

图1中,tf i 是第i个系统主导机制[为公式(2)公式(3)中列出的主导机制中的一个]在t时刻的趋势因子,用于量化这个主导机制在t时刻的变化趋势,是否符合介科学所指明的变化趋势。tf i - 1.0 ,   1.0,趋势相符时tf i 为正,否则为负。要判断一个数据序列在一个给定时间窗口内的升降趋势,有多种可以使用的方法,如线性回归、Mann-Kendall趋势检验[2021]、Cox-Stuart趋势法[22]等。

图1中,cicf i 是第i个CIC对在t时刻的CIC因子,用于描述该主导机制对在t时刻是否具有介科学所规定的CIC。例如,若CIC i 定义了系统主导机制l i,1l i,2之间的CIC关系,且它们的趋势分别为最大化和最小化,那么如果Δl i,1和Δl i,2的乘积小于0,则t时刻的cicf i 为1,其中Δl i,1和Δl i,2分别为从t-1时刻到t时刻l i,1l i,2各自的差值,这意味着从t-1时刻到t时刻,l i,1l i,2不是同步增加或减少,它们之间在t时刻存在某种竞争;否则,t时刻的cicf i 为-1。

计算t时刻的介科学影响因子(或介科学因子)mf,是介科学约束的关键。

m f = i = 1 n a i t f i + i = 1 m b i c i c f i

式中,n = mg + mhm = m CICaibit时刻的每个tf i 和cicf i 的权重系数。

本文提出了两种常规损失与介科学约束集成的方法:

(1)将介科学约束视为常规损失的正则项,并利用公式(6)计算t时刻的总损失:

L t = α L r , t + 1 - α m f t L r , t - L r , t - 1

式中,Ltt时刻的总损失;Lr,tLr,t -1分别是t时刻和t-1时刻的常规损失;mf tt时刻的介科学因子;α是常规损失和介科学约束的加权系数, α 0.0,1.0

公式(6)可以定性地解释如下:在计算t时刻的总损失时,除了常规损失外,还需要考察系统的主导机制数据与介科学原理的符合程度,以决定是奖励(mf t > 0)还是抑制(mf t < 0)网络权重参数的更新。奖励和惩罚的大小由mf tt时刻和t-1时刻的常规损失之差绝对值的乘积决定。显然,t时刻的总损失与t时刻和t-1时刻的时间序列数据有关。

(2)利用介科学约束修正学习率。根据公式(6)计算t时刻的总损失Lt 时,需使用t-1时刻的常规损失来计算介科学约束。为了反向传播误差并更新t时刻的网络参数,需要保存t-1时刻的大量网络参数,这给MGDL的编程实现带来了挑战。为了避免这种情况,假设介科学约束部分只与t时刻的常规损失有关,因此t时刻的总损失为

L t = L r , t + α m f t L r , t

公式(7)可以写成下面的形式:

L t = L r , t + α m f t L r , t = 1 + m f t ' L r , t

公式(8)表明,LtL r, t 可视为具有倍数关系,且 m f t ' m f t公式(8)可以看作是通过增加介科学约束对学习率进行了额外修正,使得系统主导机制的趋势及其CIC影响模型训练过程。只有常规损失L r, t 用于计算t时刻的总损失Lt,这简化了程序的实现。

研究复杂系统的传统方法通常使用平均化技术来处理系统中的介尺度成分,无法正确处理系统结构的波动现象。在用于建模的数据集规模较小时,没有足够的训练数据来建立端到端的深度学习模型,因此建模过程的收敛性和模型的预测性能都不会很好。即使在建模过程中集成了使用平均化技术的控制方程,也不会有太大帮助。在介科学中,系统主导机制之间的竞争中协调被视为系统演化的内在机制,可以很好地反映系统的内在动态结构。因此,与传统的深度学习建模相比,MGDL有望具有更好的收敛性和预测性能,尤其是在训练数据集规模较小的情况下。

3 MGDL建模方法的验证

3.1 气固两相流的深度学习预测

气固两相流广泛应用于工业领域,包括石油精炼[23]、冶金工业[24]和其他过程工业。以化学反应器为例,流动结构的改变会对反应器内的传热和传质产生重大影响,进而影响反应器的整体性能。气固两相流是以非线性、非平衡为特征的复杂系统的一个例子,操作条件的微小变化会导致整个反应器乃至整个系统流场结构的巨大变化。

在气固两相流领域,以深度学习为代表的人工智能技术的应用仍处于探索阶段。Lu等[25]建立了一个基于图形处理器(graphics processing unit, GPU)的卷积神经网络(convolutional neural network, CNN)模型,以加速离散元模型(discrete element modeling, DEM)模拟中颗粒流的颗粒-颗粒和颗粒-边界碰撞计算,该模型使用旋转滚筒和料斗进行了验证,证明了其准确性和高效性。Yang等[26]利用人工神经网络,提出了一种适用于密相流化床的通用EMMS-ANN曳力模型,并对模型参数进行了优化以平衡训练精度和计算时间。在不同操作条件和材料特性下,用五个流化床模拟算例进行了测试,结果表明EMMS-ANN曳力模型可以获得合理的预测结果。Basai等[27]使用编码器-解码器架构来预测伪二维(2D)气固流化床中的固含率模式,他们使用一个CNN来提取多幅固含率模式帧的特征,将其编码为一个潜在向量,然后用另一个CNN作为解码器来预测下一个固含率模式帧。Ouyang等[28]将计算流体动力学(computational fluid dynamics, CFD)与深度学习相结合,封闭了一个过滤双流体模型(two-fluid model, TFM),以实现在反应器尺度下对气体-颗粒进行粗网格模拟,其中介尺度曳力和固相应力由TensorFlow深度学习模型预测。结果表明,在不增加计算成本的情况下,深度学习模型在湍动流态化区域这种具有高表观气速的流体中更有优势。Qin等[29]将气固系统的空隙率分布视为二维图像,使用多尺度CNN网络,利用早期阶段的短期CFD+DEM模拟数据建模预测鼓泡床稳态时的空隙率分布,获得了很好的预测精度和泛化能力。Upadhyay等[30]建立了一个神经网络模型来预测循环流化床(circulating fluidized bed, CFB),提升管轴向的固含率,与实验数据相比,预测结果的均方误差(mean square error, MSE)为10-3数量级。

3.2 鼓泡床模拟与流场数据采集

本文使用一个鼓泡床案例对MGDL建模方法进行了验证。首先需要通过数值模拟来收集数据,以构建样本数据集。TFM [31]、欧拉-拉格朗日法[32]和颗粒解析直接数值模拟(particle-resolved direct numerical simulation, PR-DNS或DNS)[33]是三种用来获取气固系统的详细流场信息,以便分析流体和固相颗粒的动态行为的模拟方法。在DNS中,固相是具有体积的颗粒,流体网格远小于颗粒尺寸,因此无需引入经验模型来处理相间力,只需对颗粒表面的黏性力和压力进行积分即可,不需要封闭控制方程和引入轨迹模型,可获得颗粒周围的流场细节信息,具有较高的模拟精度。因此,DNS适合用来研究流态化系统的底层机理。在本工作中,使用DNS来提高模拟精度,以有效地获取鼓泡流化床中广泛分布的气固流场的样本数据。

本工作中使用的模拟算法和程序来自参考文献[34]。模拟对象是一个宽度为固体颗粒直径的69.4倍、高度为固体颗粒直径的290.0倍的二维鼓泡床。固体相是A类粒子,最初堆积在床层底部,床层底部有一个气体分布板,用于导入流速为U g的空气,左右两壁面对空气为无滑移边界条件。使用软球模型计算颗粒之间以及颗粒与壁面之间的碰撞。表1是一个DNS模拟算例中使用的物理参数。

模拟中使用纳维-斯托克斯方程求解不可压缩的黏性牛顿流体的运动,使用刚性运动的牛顿方程描述颗粒的平移和转动,使用浸入边界法(immersed boundary method, IBM)[35]处理流体-颗粒两相耦合。

在DNS方法中,流体网格的尺寸通常比颗粒的尺寸小一个数量级,本工作的DNS模拟算例中共有520万个网格。由于需要处理的流体网格数量较多,使得DNS对计算资源的需求量非常大,通常采用高性能并行计算以提高模拟效率。本工作DNS模拟的硬件使用三个并行计算节点,共有3×56=168个Intel Xeon E5-2680 v4 @ 2.40 GHz CPU核、3×128=384 GB内存(random access memory, RAM)和3×4=12块NVIDIA K80 GPU卡,采用消息传递接口(message-passing interface, MPI)进行并行通信。在此平台上一个DNS模拟算例需要运行2.5天左右可以达到系统稳态。通过气速、固体颗粒密度、雷诺数三个参数不同数值的组合,共完成了200个DNS模拟算例。

为了验证本文提出的MGDL建模方法,首先开发了一个深度学习模型,根据鼓泡床DNS模拟的二维粒子速度场的连续多个帧来预测未来的一帧。图2是粒子速度场预测示意图。图2中的左侧是预测模型的输入数据,事先设置了一个常数image_step,从起始时间步t 0开始,获取一系列以image_step为步长的模拟结果,并捕捉其瞬时速度场。这些连续的速度场被用作深度学习模型的输入数据。图2中的右侧是预测的速度场。在本研究中,输入数据样本的速度场数为10,预测速度场与输入连续速度场之间的距离为image_step×10。

3.3 为MDGL构建样本数据集

将2.1小节提出的样本数据集构建方法应用到3.2小节描述的鼓泡床的深度学习模型中,以创建验证MGDL建模方法所需要的数据集。以介科学思想分析气固两相流系统[14],它的两个主导机制分别为气相主导的单位体积内颗粒的能量消耗速率W st趋于最小(W st min),和颗粒主导的局部平均空隙率ε趋于最小(ε min)。在微尺度上,这两个极值趋势无法同时出现,即微尺度上没有稳定性条件;在介尺度上,颗粒与流体之间发生了时空上的协调,其动态演化趋势为 N s t m e s o = W s t   /   1 - ε ρ p m i nW st min与ε min通过竞争中协调得以实现。因此介尺度上的稳定性条件可表达为 N s t m e s o m i n,颗粒和流体二者的动态协调过程,会产生复杂的时空结构;在宏尺度上,因为反应器边壁效应,因此边壁处促进ε min和抑制W st min,导致宏观上的径向环-核结构的出现,空间平均量上出现极小化趋势,所以此时的稳定性条件是 N s t ¯ m a c r o m i n

在气固流动模拟中,因为异质结构过于复杂,无法划分为特定的均质相(即稀相、密相和过渡相),因此难以直接获得W stN st的值。经过对气固系统的分析提炼,可得到三个替代指标:悬浮和输送颗粒的流速U st、颗粒加速度a和空隙率 ε  [34],这三个物理机制的演化趋势分别是最小化、最小化和最大化。同时,颗粒加速度a和空隙率 ε存在着竞争中协调的关系,即在某时刻,两个量的变化梯度应该是异号的。图3是一个DNS模拟算例的三个物理量的变化曲线图示例。

在DNS模拟结果中,以某个特定时间步作为起点,每隔image_step时间步取9个帧,共10帧作为输入,再隔image_step×10时间步取一帧作为预测目标,统计这11帧的固体颗粒速度场,构成了公式(1)定义的一条数据样本。

建立深度学习模型需要足够多的训练数据,本工作使用了大量的计算资源和时间共进行了200次DNS模拟。如果一次模拟仅生成一个样本数据,所得数据集的样本数量显然是不够的,而且是对计算资源非常大的浪费。为此,可以设定一个足够长的步长,然后每隔这个步长不断重复地在DNS模拟结果中取出图2所示的11个速度场数据,这种数据增强方法利用200个DNS模拟结果可以生成规模足够大的样本数据集。

为获得公式(2)公式(3)定义的鼓泡床的时空信息,必须计算和统计DNS算例相关时间步的U sta ε的数据,并明确a ε的CIC关系。

通过以上两个步骤,构建了一个内嵌时空信息的鼓泡床样本数据集,然后基于不同的模拟按照10∶1的比例将数据划分为训练数据集和测试数据集。

3.4 使用MGDL方法训练模型

在本研究中,MGDL的验证分为两个步骤:首先,使用经典的深度学习方法建立鼓泡床模型,以此为基准;然后,如2.2小节所述,将介科学约束纳入模型训练过程中,并将结果与基准进行比较。要建立一个深度学习模型来预测鼓泡床中的粒子速度场,必须对3.3小节中建立的样本数据集中的粒子速度场数据进行预处理。粒子速度数据经标准化后转换为区间[0, 1]中的一个浮点数,二维粒子速度场可转换成一个240×56的灰度图像。因此,本文的问题可以转化为视频预测问题,即利用一系列连续的视频帧来预测未来的一幅视频帧。

有许多研究者对视频预测问题进行过研究,并提出了一些成功的深度学习模型,如长期循环卷积网络(long-term recurrent convolutional networks, LRCNs)[36]、卷积长短期记忆网络(convolutional long short-term memory, ConvLSTM)[37]、多尺度CNN [38]等。在本研究中,使用ConvLSTM进行视频预测建模。ConvLSTM结合了LSTM(long short-term memory)处理时序数据上的优势和卷积网络捕捉图像空间特征上的优势,适用于解决时空序列问题。视频预测模型采用编码-预测结构,如图4 [37]所示。

在本工作中,编码网络由三个卷积模块和三个ConvLSTM模块组成。预测网络由三个反卷积模块、三个ConvLSTM模块和一个卷积模块组成。每个模块的核大小和输入/输出通道数如表2所示。模型训练使用Adam优化器,还使用了批量归一化技术。

本研究在训练过程中没有使用基于视觉感知的结构相似性指数(structural similarity index measure, SSIM)[39]作为损失函数,而将反映预测图像与实际图像像素差异的MSE和反映图像锐度差异的梯度差损失(gradient difference loss, GDL)[38]进行加和,作为常规损失,如公式(9)公式(11)所示。预测图像与实际图像之间的峰值信噪比(the peak signal-to-noise ratio, PSNR)[38]被用作模型预测的评价指标,如公式(12)所示。PSNR越大,模型预测越准确。

L M S E = 1 N i , j Y i , j - Y i , j ' 2
L G D L = i , j Y i , j - Y i - 1 , j - Y i , j ' - Y i - 1 , j ' β + Y i , j - 1 - Y i , j - Y i , j - 1 ' - Y i , j ' β
L = L M S E + L G D L
P S N R = 10 l o g 10   m a x Y ' 2 1 N i , j Y i , j - Y i , j ' 2

公式(9)公式(12)中,N是鼓泡床速度场图像中的像素总数;Yi,jY'i,j 分别是坐标为(i, j)的目标像素值和预测像素值;β是大于1的整数。

在使用传统的ConvLSTM网络构建了模型和进行测试之后,在模型训练过程中引入了介科学约束。使用2.2小节中提到的学习率修正方法对MGDL建模方法进行了验证,并与传统方法进行了比较。

图5呈现训练过程收敛的稳定性,它展示了image_step分别为1、2、3和5,批次大小为7时,使用不同规模的训练数据集迭代100轮后的损失曲线。蓝色曲线是作为基准的传统训练方法的损失,在训练过程中加入介科学约束后的损失曲线为红色。为了便于比较,红色曲线使用传统数学损失值绘制,而不是使用包含介科学约束的MGDL损失值。

建立模型后,需要对其预测能力进行评估。在本研究中,测试数据集的规模是训练数据集的10%,而且对于DNS模拟算例的可变参数来说,测试数据集相对于训练数据集是外推的关系。

在不同的测试数据集上,对两种模型训练方法创建的模型的预测性能进行了评估。图6展示了image_step分别为1、2、3和5,批次大小为7时,使用不同规模的训练数据集迭代100轮后预测的PSNR曲线。蓝色曲线是作为基准的传统训练方法的PSNR,在模型训练过程中加入介科学约束后的PSNR曲线为红色。

图7(a)为鼓泡床DNS的粒子速度场示例,图7(b)为使用ConvLSTM+MGDL构建的模型预测的粒子速度场。

在模型训练过程中加入了介科学约束条件后,批次大小(batch size)成为一个重要的参数。如果批次大小过大,批次内训练数据的预测误差会被平均后反向传播,这对介科学约束的应用是不利的,因为它会导致批次内的正负介科学约束相互抵消,从而降低模型训练过程中介科学约束的有效性。因此,本文研究了批次大小对MGDL模型预测性能的影响。图8展示了针对不同批次大小使用MGDL所构建的模型,在image_step分别为1、2、3和5时在测试数据集上的预测性能。每个图中显示的PSNR值代表20个模型预测的平均PSNR值,其训练数据集尺寸范围从350到1680,批次大小为1~7。图8表明在MGDL的训练过程中存在一个最佳批次大小,当训练数据集规模较小时,批次大小为3时的预测准确率最高。

3.5 讨论

在鼓泡床建模过程中加入介科学的引导有利于模型的收敛。如图5所示,对于规模较小的训练数据集,采用介科学约束的模型,训练过程的收敛曲线比传统模型训练的收敛曲线更稳定、更平滑。例如,在图5(d)中,image_step=5,当训练数据集规模超过约1400时,传统方法才趋于稳定和持续的收敛。然而,MGDL同样的阈值为840。此外,当训练数据集的规模介于840~1400之间时,传统方法的损失会出现波动。这一现象可以解释如下:在有介科学约束的建模过程中,除了训练数据本身之外,还有额外的物理信息来引导网络参数的更新,这些额外的物理信息是由介科学对鼓泡床演化本质特征的描述带来的。

图6可以看出,在测试数据集上,对于规模较小的训练数据集,使用介科学约束构建的模型比传统训练方法构建的模型具有更高的预测精度。仍以image_step = 5为例,如图6(d)所示,当训练数据集的规模大于约840时,使用MGDL构建的模型预测结果的PSNR值便已不再显著增加,而对于常规方法,这个阈值大约是1470。在此之前,使用MGDL的模型的预测PSNR值随训练数据集规模的提升而稳步上升,相比之下,对于传统方法,当训练数据集规模在840~1470之间时,PSNR值上下波动。训练数据集规模在350~1470之间时,对于相同规模的训练数据集,17个传统模型中只有两个的PSNR值略高于对应的MGDL模型。同样地,这一结果也可以通过在模型训练过程中加入了介科学的引导来解释。

再进一步,图5图6可以证实2.2小节结尾处的推论,也就是说,在训练数据集规模相对较小的情况下,MGDL建模能达到比传统深度学习建模更稳定的收敛性和更好的预测性能,这是因为此时系统的介尺度结构是根据介科学原理利用系统主导机制之间的CIC来处理的,而不是使用平均化方法。

复杂系统的数值模拟通常是计算密集的,需要耗费大量时间。以本文中使用的小规模鼓泡床为例,在三个计算节点上使用12个NVIDIA K80 GPU进行一次DNS模拟需要数天的时间。因此,使用深度学习方法对复杂系统进行建模,样本数据集的构建是一个成本高、耗费时间的工作。在不影响模型预测性能的前提下,尽量降低训练数据集的规模,是非常有意义的。MGDL是实现这一目标的一种有效方法。

集成物理知识的深度学习建模是当前的研究热点之一,MGDL方法是一种创新的尝试。MGDL将系统演化的过程动态数据中蕴含的物理信息整合到建模过程中,这与一般传统的使用物理衡算或系统控制方程的残差做建模约束是不同的。迄今为止,其他方法(如PINN)必须提供系统的控制方程或系统变量之间其他的数学强关联关系。如果没有这些方程,应用这些建模方法就很困难。MGDL在采用数据驱动建模的同时,将变量的趋势和变量之间的CIC纳入建模过程,因为这些趋势和CIC中往往隐含了复杂系统演化的内在机制与驱动力,这使得MGDL成为一种混合建模技术,它将物理信息和介科学引导融入数据驱动的模型训练过程中。因此,与应用于建模训练的纯粹数学算法不同,MGDL的建模过程具有一定的物理解释性。

MGDL并不局限于本文用于演示的鼓泡床示例和ConvLSTM,它还可应用到解决其他复杂系统的建模问题或使用不同的网络构型,前提是使用介科学对系统进行分析,确定了系统主导机制及其CIC关系,并收集了相关的时间序列数据。之所以具有这种灵活性,是因为MGDL将介科学约束纳入了损失函数,与所采用的人工神经网络或深度神经网络的类型和构型没有直接关系。只要使用误差反向传播算法来优化网络参数,MGDL就适用于任何类型的人工神经网络或深度神经网络。

介科学认为,复杂系统通常由多个层次组成,每个层次都存在介尺度[17,40]。每个层次的复杂性来自于其介尺度,从而导致整个系统的复杂性。系统主导机制之间的CIC原理决定了各层次介尺度的结构动态特征,这是处理特定复杂性的关键。通过各层次之间的关联,有可能解决系统范围的问题。因此,CIC原理在单层次中的应用是本工作的关键。本文提出的MGDL使用了单层次的介科学约束来改进深度学习模型的训练。多层次复杂系统的深度学习建模问题是今后需要进一步深入研究的课题。

4 结论

当前,深度学习技术是复杂系统建模的一种重要工具。结合物理知识的深度学习建模是目前学术界研究的热点,并涌现出了许多优秀的技术。介科学是研究不同系统层次的介尺度问题的学科,旨在解决各学科领域的共同挑战。使用系统主导机制之间的CIC原理将有助于理解系统的宏观行为和内在机制。本文提出的MGDL方法将介科学原理融入深度学习建模过程,有望解决对由主要物理量之间的CIC关系驱动的系统进行建模这一难题。

使用小规模训练数据集进行鼓泡床建模测试,MGDL在收敛稳定性和预测性能方面都表现出了优势。MGDL可广泛应用于各种神经网络构型。随着对介科学的深入研究和广泛应用,MGDL有望被广泛应用于复杂系统的建模中。

参考文献

[1]

Karniadakis GE, Kevrekidis IG, Lu L, Perdikaris P, Wang S, Yang L. Physics informed machine learning. Nat Rev Phys 2021;3(6):422‒40. . 10.1038/s42254-021-00314-5

[2]

Raissi M, Perdikaris P, Karniadakis GE. Physics-informed neural networks: a deep learning framework for solving forward and inverse problems involving nonlinear partial differential equations. J Comput Phys 2019;378:686‒707. . 10.1016/j.jcp.2018.10.045

[3]

Raymond SJ, Cecchi NJ, Alizadeh HV, Callan AA, Rice E, Liu Y, et al. Physics informed machine learning improves detection of head impacts. Ann Biomed Eng 2022;50(11):1534‒45. . 10.1007/s10439-022-02911-6

[4]

Jiang X, Wang D, Fan Q, Zhang M, Lu C, Lau APT. Physics-informed neural network for nonlinear dynamics in fiber optics. Laser Photonics Rev 2022;16(9):2100483. . 10.1002/lpor.202100483

[5]

Sharma S, Awasthi R, Sastry YS, Budarapu PR. Physics-informed neural networks for estimating stress transfer mechanics in single lap joints. J Zhejiang Univ Sci A 2021;22(8):621‒31. . 10.1631/jzus.a2000403

[6]

Mao ZP, Jagtap AD, Karniadakis GE. Physics-informed neural networks for high-speed flows. Comput Methods Appl Mech Eng 2020;360:112789. . 10.1016/j.cma.2019.112789

[7]

Chakraborty S. Transfer learning based multi-fidelity physics informed deep neural network. J Comput Phys 2021;426:109942. . 10.1016/j.jcp.2020.109942

[8]

Liu X, Zhang X, Peng W, Zhou W, Yao W. A novel meta-learning initialization method for physics-informed neural networks. Neural Comput Appl 2022;34(17):14511‒34. . 10.1007/s00521-022-07294-2

[9]

Li JH, Huang WL. Towards mesoscience: the principle of compromise in competition. Heidelberg: Springer; 2014. . 10.1007/978-3-642-41790-0_6

[10]

Li JH, Huang WL, Chen JH, Ge W, Hou CF. Mesoscience based on the EMMS principle of compromise in competition. Chem Eng J 2018;333:327‒35. . 10.1016/j.cej.2017.09.162

[11]

Li JH. Exploring the logic and landscape of the knowledge system: multilevel structures, each multiscaled with complexity at the mesoscale. Engineering 2016;2(3):276‒85. . 10.1016/j.eng.2016.03.001

[12]

Guo L, Wu J, Li JH. Complexity at mesoscales: a common challenge in developing artificial intelligence. Engineering 2019;5(5):924‒9. . 10.1016/j.eng.2019.08.005

[13]

Li JH, Tung YK, Kwauk MS. Method of energy minimization in multi-scale modeling of particle-fluid two-phase flow. In: Basu P, Large JF, editors. Circulating fluidized bed technology II. NewYork: Pergamon Press; 1988.p.89‒103. . 10.1016/b978-0-08-036225-0.50013-7

[14]

Li JH, Zhang JY, Ge W, Liu XH. Multi-scale methodology for complex systems. Chem Eng Sci 2004;59(8‒9):1687‒700.

[15]

Wang LM, Qiu XP, Zhang L, Li JH. Turbulence originating from the compromise-in-competition between viscosity and inertia. Chem Eng J 2016;300:83‒97. . 10.1016/j.cej.2016.04.115

[16]

Huang WL, Li JH. Mesoscale model for heterogeneous catalysis based on the principle of compromise in competition. Chem Eng Sci 2016;147:83‒90. . 10.1016/j.ces.2016.03.019

[17]

Chen JH, Ren Y, Huang WL, Zhang L, Li JH. Multilevel mesoscale complexities in mesoregimes: challenges in chemical and biochemical engineering. Annu Rev Chem Biomol Eng 2022;13(1):431‒55. . 10.1146/annurev-chembioeng-092220-115031

[18]

Zhang JY, Ge W, Li JH. Simulation of heterogeneous structures and analysis of energy consumption in particle‒fluid systems with pseudo-particle modeling. Chem Eng Sci 2005;60(11):3091‒9. . 10.1016/j.ces.2004.11.057

[19]

Zhang L, Chen JH, Huang WL, Li JH. A direct solution to multi-objective optimization: validation in solving the EMMS model for gas‒solid fluidization. Chem Eng Sci 2018;192:499‒506. . 10.1016/j.ces.2018.07.033

[20]

Mann HB. Nonparametric tests against trend. Econometrica 1945;13(3):245‒59. . 10.2307/1907187

[21]

Kendall MG. Rank correlation methods. 4th ed. London: Charless Griffin; 1975.

[22]

Cox DR, Stuart A. Some quick sign tests for trend in location and dispersion. Biometrika 1955;42(1‒2):80‒95. . 10.2307/2333424

[23]

Squires AM. The story of fluid catalytic cracking: the first “circulating fluidized beds”. In: Basu P, editor. Circulating fluidized bed technology. New York: Pergamon Press; 1986. p. 1‒19. . 10.1016/b978-0-08-031869-1.50007-7

[24]

Reh L. New and efficient high-temperature processes with circulating fluid bed reactors. Chem Eng Technol 1995;18(2):75‒89. . 10.1002/ceat.270180202

[25]

Lu L, Gao X, Dietiker JF, Shahnam M, Rogers WA. Machine learning accelerated discrete element modeling of granular flows. Chem Eng Sci 2021;245:116832. . 10.1016/j.ces.2021.116832

[26]

Yang Z, Lu BN, Wang W. Coupling artificial neural network with EMMS drag for simulation of dense fluidized beds. Chem Eng Sci 2021;246:117003. . 10.1016/j.ces.2021.117003

[27]

Bazai H, Kargar E, Mehrabi M. Using an encoder‒decoder convolutional neural network to predict the solid holdup patterns in a pseudo-2D fluidized bed. Chem Eng Sci 2021;246:116886. . 10.1016/j.ces.2021.116886

[28]

Ouyang B, Zhu LT, Su YH, Luo ZH. A hybrid mesoscale closure combining CFD and deep learning for coarse-grid prediction of gas-particle flow dynamics. Chem Eng Sci 2022;248(Pt B):117268. . 10.1016/j.ces.2021.117268

[29]

Qin PF, Xia ZJ, Guo L. A deep learning approach using temporal-spatial data of computational fluid dynamics for fast property prediction of gas-solid fluidized bed. Korean J Chem Eng 2023;40(1):57‒66. . 10.1007/s11814-022-1340-8

[30]

Upadhyay M, Nagulapati VM, Lim H. Hybrid CFD‒neural networks technique to predict circulating fluidized bed reactor riser hydrodynamics. J Clean Prod 2022;337:130490. . 10.1016/j.jclepro.2022.130490

[31]

Gidaspow D. Multiphase flow and fluidization: continuum and kinetic theory descriptions. New York: Academic Press; 1994. . 10.1016/b978-0-08-051226-6.50013-3

[32]

Tsuji Y, Tanaka T, Ishida T. Lagrangian numerical simulation of plug flow of cohesionless particles in a horizontal pipe. Powder Technol 1992;71(3):239‒50. . 10.1016/0032-5910(92)88030-l

[33]

Tenneti S, Subramaniam S. Particle-resolved direct numerical simulation for gas-solid flow model development. Annu Rev Fluid Mech 2014;46(1):199‒230. . 10.1146/annurev-fluid-010313-141344

[34]

Cui HH, Chang Q, Chen JH, Ge W. PR-DNS verification of the stability condition in the EMMS model. Chem Eng J 2020;401:125999. . 10.1016/j.cej.2020.125999

[35]

Peskin CS. Numerical analysis of blood flow in the heart. J Comput Phys 1977;25(3):220‒52. . 10.1016/0021-9991(77)90100-0

[36]

Donahue J, Hendricks LA, Rohrbach M, Venugopalan S, Guadarrama S, Saenko K, et al. Long-term recurrent convolutional networks for visual recognition and description. IEEE Trans Pattern Anal Mach Intell 2017;39(4):677‒91. . 10.1109/tpami.2016.2599174

[37]

Shi XJ, Chen ZR, Wang H, Yeung DY, Wong WK, Woo WC. Convolutional LSTM network: a machine learning approach for precipitation nowcasting. In: CortesC, LeeDD, SugiyamaM, GarnettR, editors. Proceedings of the 28th International Conference on Neural Information Processing Systems; 2015 Dec 7‒12; Montreal, QC, Canada; 2015. p. 802‒10.

[38]

Mathieu MM, Couprie C, LeCun Y. Deep multi-scale video prediction beyond mean square error. 2015. arXiv:

[39]

Wang Z, Bovik AC, Sheikh HR, Simoncelli EP. Image quality assessment: from error visibility to structural similarity. IEEE Trans Image Process 2004;13(4):600‒12. . 10.1109/tip.2003.819861

[40]

Li JH. Insight: the journey ahead for AI [Internet]. Norwich: Business Chief; 2020 May 20 [cited 2024 Jan 16]. Available from:

AI Summary AI Mindmap
PDF (2226KB)

7398

访问

0

被引

详细

导航
相关文章

AI思维导图

/