《1 引言》

1 引言

非线性时滞系统在生产过程中是较常见的但又是难以控制的。由于神经网络能对任意复杂非线性函数充分逼近[1],而预测技术可以很好地解决时滞的影响[2~4]。基于神经网络的非线性预测控制在近几年得到了迅速的发展,并成为非线性过程控制的主要手段之一。

笔者对文献 [5] 中提到的神经网络对非线性时滞系统时滞的辨识方法进行了补充分析。文献 [6] 中介绍了 NARMA 模型在实时控制时不足及其修正方法,但该修正方法对于时滞系统控制有不当之处。笔者介绍 NARMA 模型在实时控制时的其他修正方法,对比分析了这些修正方法及其抗干扰能力,可解决文献[6] 中的修正方法的不足。

《2 时滞系统的辨识》

2 时滞系统的辨识

用下面的非线性自回归滑动平均模型(NARMA 模型)表示非线性时滞系统:

式中 n m 分别是输出 yk)和输人uk)的阶次;d 是系统时滞;是未知的连续非线性函数。可采用动态递归神经网络对该系统进行逼近[7]

时滞的辨识问题在时滞系统中非常重要。文献[5] 采用 3 层前馈神经网络,对一个未知时滞的系统进行辨识。所用的方法如图 1 所示,采用不同的输人采样区间的样本集对网络的训练结果有很大影响。文献[5] 指出,当从 h = dh = d + 1 时网络的误差平方和(期望输出与网络输出之间的)产生突变,可以根据突变点来辨识非线性对象的时间延迟 d,但对这个结果没有进行深人分析。

《图 1》

图 1 神经网络辨识模型

Fig.1 NN identification model

图 1 中输人是由以前的输人 u- h),u- - 1),...,u- - nu),和输出 y- 1),y- 2),..,y- n)构成。对最后一个输人u- - nu),取 nu m 。经训练后网络的误差平方和在 d   nu 时可以产生一次上跳突变,在 d > nu 时可以产生 2 次突变:下跳突变和上跳突变。上跳突变点对应的值为系统的时滞;下跳突变点所对应的值为 h = d - nu 。以下面输人为二阶的非线性时滞系统为例,进行仿真:

选网络的输人为 y- 1),y- 2),u- h),u- - 1),...,u- - 6)共 9 个输入,网络输出为 y(k)。网'络的结构为(9,6,1)3 层神经网络,隐含层的激活函数为 Sigmoid 函数,输出层的输出与输入相等。对于不同的 h = 0,1,2,…,14,经过 2000 步训练以后,得到不同 h 对应的(输出期望值与网络的输出)误差平方和,如图 2 示。图 2a 对应 d = 5 时 Eh 之间的关系曲线,图 2b 和图 2c 对应 d = 10 时 E h 的不同区段之间的关系曲线,显然 d = 5(d nu)有一次突变;d = 10(d > nu)有 2 次突变。

《图 2》

图 2 输入为二阶的系统误差平方和 E h 的关系曲线

Fig.2 Curve of sum of squares error E and h for second-order system

对上例系统,d = 10,nu = 6 见图 2b,上跳突变点的 h = 10,下跳突变点的 h = 4,且 h = 4 到 h = 10对应的误差平方和E(5)至E(10)约为零,实际是其他点误差数量级的10-5。从图 2c 可以得到,h = 4 到 ,h = 10 对应的误差平方和的数据差别,显然E(4)远远大于E(5)至E(10)。

式(1)NARMA 模型 yk)=f [ yk - 1),...,yk - n),uk - d),...,uk - d - m + 1)],是非线性时滞系统辨识的最小模型。

式(2)所示的例子中 n  = 2,m =2。取 d = 10,辨识的最小模型为

图 1 中神经网络辨识模型为

n= 6,当 h = 4 时,模型为

h = 5 到 h = 10 时,模型分别为

可见,h = 4 对应的模型不包括最小模型式(3),h = 5 到 h =10 对应的所有模型都包括式(3)式。下跳突变点发生在 h = 4(而不是 h =5),因为 h = 4 对应的模型的输人中包含了输人变量的阶分量 u- 10),它起主要作用,所以 h = 4 对应下跳突变点。而由于 h = 4 对应模型的输入中缺少二阶分量 uk - 11),所以图 2c 中 h = 4 对应的误差E(4)比E(5)至E(10)大。

另外,从 h = 4 到 h = 10 的系列模型中,只有 h = 10 所对应的模型输入量中全部 u(·)与 yk)的采样时刻相差 d 步或 d 步以上,其他模型输人量 u(·)中都含有与 yk)的采样时刻相差d 步以下的量,且 h 越小,u(·)中含有与 yk)的采样时刻相差 d 步以下量的数目越多。对于时滞为 d 的系统,经过 d 拍,输入的作用才能在输出中反映出来。显然 h 越小,从理论上讲对应的Eh)越大,从 h = 4 到 h = 10,h 越大效果越好,这种趋势是对的,但选取不同的神经网络初值会得到不同的曲线,所以不能从仿真上得到一个精确的误差变化的结果。

当系统输人为三阶时,下跳突变点对应的模型中缺少二阶分量 uk - d - 1)和三阶分量 uk -  -2)两项;与二阶系统类似,仍然可以用上面理论分析解释。输人为三阶的非线性时滞系统为

对式(4)仿真,得到图 3,图 3a 和图 3b 对应 = 10 时 E h 的不同区段之间的关系曲线。

《图 3》

图 3 输入为三阶的系统误差平方和 Eh 的关系

Fig.3 Curve of sum of squares error E and h for third-order system

由以上仿真可得:h = 10 时是系统辨识最好的趋势,即输人变量中第一个 u(·)与 yk)的采样时刻相差 d 步时,系统辨识趋势最好,这是由于h = d 时,输人变量中所有的 u(·)与输出变量的采样时刻都大于或等于 d;当然 h = d 所对应的模型包含输人变量的所有阶次分量。上面的分析对于时滞系统的辨识有重要的指导意义。

《3 NARMA 模型基于非线性时滞系统预测控制的修正方法》

3 NARMA 模型基于非线性时滞系统预测控制的修正方法

预测控测的方框图如图 4 所示。

《图 4》

图 4 非线性时滞系统预测控制

Fig.4 Nonlinear time-delay system predictive control

《3.1 预测控制器设计准则》

3.1 预测控制器设计准则

设系统时滞为 d,用递归神经网络递推预测超前 d 步的输出值,超前 d 步的期望值与超前 d 步的预测值之差作为预测控制器的输人,预测控制器采用二次型性能函数

则 

应用梯度下降法可以得到

为优化系数。相应的控制规律为

《3.2 NARMA 模型基于非线性时滞系统预测控制的修正方法》

3.2 NARMA 模型基于非线性时滞系统预测控制的修正方法

用神经网络表示的 NARMA 模型为[6]

式中 nm 分别是输出 yk)和输人uk)的阶次,d 是系统的时滞,是一个未知的连续非线性函数,y(·)为实际对象输出,为神经网络模型输出。式(7)与式(1)的本质是一样的,都是非线性系统的最小实现模型。针对它的实现问题(uk)须由 yk)求得,而 yk)是基于uk)得到的,出现了uk)和 yk)求解互锁现象),文献[6] 给出了解决办法,模型修正为

根据式(8)由 yk)求得u+ 1),再由u+ 1)通过对象得到 yk + 1),这样求解就可顺利进行。式(8)模型显然符合 3.1 节中对辨识模型的要求,包括最小模型,似乎是个可用的模型。但对时滞系统的预测控制而言,并非像辨识一样,只要求模型能够包含系统辨识的最小模型式(1)或式(7)。因为在预测控制器或神经网络控制器中是要求输人变量u(·)中的第一个变量用输出变量 y(·)来表示,即将式(8)表示为

上面的修正只能用于无时滞系统的控制。对于时滞为 d 的非线性系统,显然第一个控制量 u+ 1)与 + d)之间相差 d - 1 步,而时滞为 d 的系统,经过 d 拍,输入的作用才能在输出中反映出来,所以u+ 1)与y+d)(即+ d))之间没有关系,用+ d)求得的u+ 1)失去了对系统有效控制作用。所以在时滞系统的控制中要求输入变量u(·)中的第一个变量与输出变量y(·)的采样时刻相差 d 步。

在预测控制中,有另外 3 种模型的修正方法:第一种方法 将输入的第一个量取为yk - 1),避免了与uk)之间的互锁,形式为

根据预测控制规律式(6)得到

这样保证了第一个控制量uk)与+ d)之间相差 d 步,求得的uk)对于时滞为d的系统具有非常好的控制性能。

第二种方法  用模型预测值k)代替 yk)。同样可以得到好的结果。这是由于模型是实际对象的模型,用模型的输出值k)代替实际对象输出值 yk),同时用它们之间的误差在线对模型参数进行调整,从理论上讲是可行的。在线调整更能使模型精确反映实际对象,形式为

根据预测控制规律式(6)得到

第三种方法 用期望值 ydk)代替 yk)。由于实际系统的输出 yk)是按期望值要求进行控制的,即 yk)跟随期望值 ydk)的变化,所以尝试用期望值 ydk)代替 yk)。

根据预测控制规律式(6)得到

《4 仿真实验》

4 仿真实验

以式(2)所示二阶系统为例,编制预测控制的 Malab 程序。图 5a 至图 5d 分别为各种修正方法在期望值为方波输入下的仿真控制效果。图5中显示出控制输入ut)与期望值 ydt)以及系统输出 yt)与期望值 ydt)的对比。显然文献[6] 中的修正方法对时滞系统不能实施有效的控制。其余3种修正方法都具有很好的控制效果。

《图 5》

图 5 各种修正方法的控制性能的比较

Fig.5 Comparison of control performance among different methods

图 6a 至图 6c 分别为各种有效修正方法在期望值为阶跃函数 ydt)=0.5 × 1(- 1.4),输出阶跃干扰 w =0.3 × 1(- 8.1)下的仿真控制效果。由图 6 可见各种有效的修正方法抗阶跃干扰的能力都非常强,证明了这些方法的可行性。

《图 6》

图 6 有效修正方法的抗输出阶跃干扰能力比较

Fig.6 Comparison of anti-disturbance capability among different advanced correction methods

《5 结论》

5 结论

预测控制具有超前预测能力,可很好地解决时滞系统的控制问题。针对文献[5] 中的初步结果,对非线性时滞系统的时滞辨识以及系统本身的辨识进行了深人研究。以时滞系统神经网络预测控制为例,介绍了 NARMA 模型的正确修正方法。仿真证明,提出的修正方法能获得好的控制性能及抗干扰能力。今后,将进一步讨论神经网络对时滞系统输人变量 u(·)和输出变量 y(·)阶次的辨识方法。