《1 引 言》

1 引 言

在工程技术领域的许多优化问题, 有的本身就是多阶段问题, 有的在优化时为便于求解而将其分解为若干阶段, 也可归为多阶段问题。多阶段系统的特点是前一阶段的末状态是下一阶段的初始状态, 前一阶段的输出为后一阶段的输入, 各阶段的决策既决定自己的状态又影响下一阶段的决策, 从而影响整个过程的优化。多阶段系统的优化目的是要寻求使整个过程的目标或指标达到最优化时各阶段决策组成的策略。动态规划法在求解多阶段系统优化问题中得到广泛的运用[1], 但大都只用于解决单目标系统的最优控制, 将其有效地应用于多目标 (指标) 多阶段系统的优化问题已逐渐受到重视。本文在模糊权距离和隶属度概念的基础上, 根据多阶段系统的前后阶段联系特点, 将模糊优选理论与动态规划原理有机地结合起来, 提出多目标多级串联系统优化的模糊优选动态规划技术。目的在于探索求解多阶段串联系统多目标优化和决策问题的新途径。

《2 多目标多阶段系统模糊优选动态规划技术》

2 多目标多阶段系统模糊优选动态规划技术

设多阶段系统共包含K个阶段和m项目标, 考虑到有些优化目标前后阶段这种影响关系可能具有相乘的关系, 现采用前向动态规划方法求解。前向动态规划方法的特点是从第1阶段开始, 向后顺序递推, 对于多目标优化问题, 其递推公式可表示为

Fk(Stk)=opt{Ηk(Sk,dk)Fk-1(Stk-1)}(1)Fk(Stk)=opt{Hk(Sk,dk)Fk1(Stk1)}(1)

状态转移方程

Sk=φk(Sk-1,dk)k=1,2,,ΚSk=φk(Sk1,dk)k=1,2,,K

其中:Fk (Stktk) =[f(1)k(1)k (Stktk) , …, f(m)k(m)k (Stktk) ]T, Fk-1 (Stk-1) =[f(1)k-1(1)k1 (Stk-1tk1) , …, f (m) k-1 (Stk-1tk1) ]T, 分别表示阶段k, k-1局部暂定最优状态为StktkStk-1m项目标合成值组成的向量;Hk (Sk, dk) =[h (1) k (Sk, dk) , …, h(m)k(m)k (Sk, dk) ]T, 表示阶段k状态为Sk时决策dkm项目标值组成的向量。上标t代表暂定最优, ⊕为目标合成算子, 可根据目标性质取加减乘除等复合运算。

前向递推时, 设由已知初始状态S0至阶段1, 有L个可行决策。由于一个决策对应唯一状态, 显然在此特殊情况下第1阶段不需优选, 任一决策d1所对应的状态St1t1为阶段1的暂定最优状态, 即

F1(St1)={Η1(S1,d1)F0(S0)}(2)F1(St1)={H1(S1,d1)F0(S0)}(2)

若顺序递推至阶段k (k≥2) , 已知阶段k-1的暂定最优状态Stk-1tk1至阶段kn个可行决策dk, 即对应n个策略, 各策略的优劣由m项目标的合成值加以评判。如做出任一决策dj即采取策略vj (Sk) , 可得到阶段k相应状态Sk时策略vj (Sk) 目标合成值向量

Vj(Sk)=[v1j(sk),,vmj(Sk)]Τ(3)Vj(Sk)=[v1j(sk),,vmj(Sk)]T(3)

其中vij (Sk) =h(i)k(i)k (Sk, dj) ⊕f(i)k-1(i)k1 (Stk-1) 。则n个策略可构成阶段k状态为Sk时的目标合成值矩阵

Vk(Sk)=[v11(Sk)v1n(Sk)v21(Sk)v2n(Sk)vm1(Sk)vmn(Sk)](4)Vk(Sk)=v11(Sk)v21(Sk)vm1(Sk)v1n(Sk)v2n(Sk)vmn(Sk)(4)

将目标合成值矩阵Vk (Sk) 规格化为相应的优属度矩阵, 可采用公式

rij(Sk)={vij(Sk)maxjvij(Sk)1-vij(Sk)maxjvij(Sk)(5)rij(Sk)=vij(Sk)maxjvij(Sk)1vij(Sk)maxjvij(Sk)(5)

分别将目标合成值规格化。rij (Sk) 表达了策略vj (Sk) 的第i项目标合成值对于优的隶属度, 简称目标隶属度。maxjvij(Sk)maxjvij(Sk)为取n个策略中第i项目标的最大合成值。则有目标隶属度矩阵

Rk(Sk)=[r11(Sk)r1n(Sk)r21(Sk)r2n(Sk)rm1(Sk)rmn(Sk)](6)Rk(Sk)=r11(Sk)r21(Sk)rm1(Sk)r1n(Sk)r2n(Sk)rmn(Sk)(6)

根据递推公式 (1) , 要从n个可行决策中优选出局部暂定最优决策dtktk和局部暂定最优状态Stktk, 首先应依据目标隶属度矩阵Rk(Sk)Rk(Sk)确定阶段k状态为Sk时的相对优等策略g (Sk) 和相对劣等策略b (Sk) , 它们的目标隶属度向量应分别为

g(Sk)=(g1(Sk),,gm(Sk))=(jr1j(Sk),,jrmj(Sk))(7)b(Sk)=(b1(Sk),,bm(Sk))=(jr1j(Sk),,jrmj(Sk))(8)g(Sk)=(g1(Sk),,gm(Sk))=(jr1j(Sk),,jrmj(Sk))(7)b(Sk)=(b1(Sk),,bm(Sk))=(jr1j(Sk),,jrmj(Sk))(8)

式中:jrij(Sk)=ri1(Sk)ri2(Sk)rin(Sk)jrij(Sk)=ri1(Sk)ri2(Sk)rin(Sk);jrij(Sk)=ri1(Sk)ri2(Sk)rin(Sk)jrij(Sk)=ri1(Sk)ri2(Sk)rin(Sk)

优化时m项目标的重要性不一定相同, 设m项优化目标的重要性权向量为

w=(w1,w2,,wm),mi=1wi=1(9)w=(w1,w2,,wm),i=1mwi=1(9)

已知策略vj (Sk) 的目标隶属度向量为

rj(Sk)=(r1j(Sk),,rmj(Sk))(10)rj(Sk)=(r1j(Sk),,rmj(Sk))(10)

则策略vj (Sk) 与相对优等策略g (Sk) 和相对劣等策略b (Sk) 之间的差异可由广义权距离分别表示为[2]

w[g(Sk)-rj(Sk)]=mi=1{wi[gi(Sk)-rij(Sk)]}(11)w[rj(Sk)-b(Sk)]=mi=1{wi[rij(Sk)-bi(Sk)]}(12)w[g(Sk)rj(Sk)]=i=1m{wi[gi(Sk)rij(Sk)]}(11)w[rj(Sk)b(Sk)]=i=1m{wi[rij(Sk)bi(Sk)]}(12)

设策略vj (Sk) 以优属度uj (Sk) 隶属于模糊子集“优”, 以劣属度ucjcj (Sk) 隶属于模糊子集“劣”, 根据模糊集的余集定义有

ucj(Sk)=1-uj(Sk)(13)ucj(Sk)=1uj(Sk)(13)

由于隶属度可看作权重[3], 则权距优距离uj (Sk) ‖w[g (Sk) -rj (Sk) ]‖和权距劣距离ucjcj (Sk) ‖w[rj (Sk) -b (Sk) ]‖更完善地表达了策略vj (Sk) 与相对优等策略g (Sk) 和相对劣等策略b (Sk) 之间的差异。为确定策略vj (Sk) 的优属度uj (Sk) , 将经典的最小二乘法则加以拓展, 建立目标函数使阶段k状态Sk的所有n个可行策略与相对优等策略和相对劣等策略的权距离之平方和最小, 即

min{ψ[uj(Sk)]=nj=1({uj(Sk)w[g(Sk)-rj(Sk)]}2+{ucj(Sk)w[rj(Sk)-b(Sk)]}2)(14)min{ψ[uj(Sk)]=j=1n({uj(Sk)w[g(Sk)rj(Sk)]}2+{ucj(Sk)w[rj(Sk)b(Sk)]}2)(14)

为求解此目标函数, 令

dψ[uj(Sk)]duj(Sk)=0dψ[uj(Sk)]duj(Sk)=0

经推导可得阶段k状态为Sk时各可行策略对于优的隶属度的计算模型为

uj(Sk)={1+[mi=1(wi|gi(Sk)-rij(Sk)|)]2[mi=1[wi|rij(Sk)-bi(Sk)|]2}-1(15)uj(Sk)=1+[i=1m(wi|gi(Sk)rij(Sk)|)]2[i=1m[wi|rij(Sk)bi(Sk)|]21(15)

根据最优原理, 由max{uj (Sk) }所对应的策略可得阶段k状态Sk的暂定最优决策dtk, 与之相对应的状态为暂定最优状态Stktk, 同时得到暂定最优目标合成向量:

Fk(Stk)=[f(1)k(Stk),,f(m)k(Stk)]Τ(16)Fk(Stk)=[f(1)k(Stk),,f(m)k(Stk)]T(16)

由于从阶段1暂定最优状态St1t1按上述多目标模糊优选动态规划技术进行递推时, 在各个阶段包括最终阶段K均可得到相应的暂定最优状态Stktk和目标合成值向量F (Stk) 。已知阶段1共有L个暂定最优状态, 则相应地在最终阶段KL个暂定最优状态和目标合成值向量, 可组成最终阶段K的目标合成值矩阵

FΚ(SΚ)=[f(1)Κ(S1Κ)f(1)Κ(SLΚ)f(2)Κ(S1Κ)f(2)Κ(SLΚ)f(m)Κ(S1Κ)f(m)Κ(SLΚ)](17)FK(SK)=f(1)K(S1K)f(2)K(S1K)f(m)K(S1K)f(1)K(SLK)f(2)K(SLK)f(m)K(SLK)(17)

依据矩阵 (17) 从最终阶段KL个暂定最优状态中优选真实最优状态S*k是比前述由状态Stk-1tk1开始, 从n个决策中优选局部暂定最优决策和局部暂定最优状态Stk高一层次的多目标模糊优选问题, 但求解的思想与方法相似。相当于令f (i) K (StK) =vit (SK) , 运用上述方法与模型式 (15) 求出阶段K的各暂定最优状态所对应的隶属度, 则max{ut (S*K) }所对应的状态就是全局部真实最优状态S*K。同时得到相应的全局真实最优目标合成值向量

FΚ(S*Κ)=[f(1)Κ(S*Κ),,f(m)Κ(S*Κ)]Τ(18)FK(SK)=[f(1)K(SK),,f(m)K(SK)]T(18)

和整个系统的最优策略即各阶段的最优决策集合d*1, d*2, …, d*K

当目标权向量w确定时, 运用上述多目标多级过程优化的模糊优选动态规划技术就可以得到一最优解即多目标优化问题的一个非劣解。如果根据目标的相对重要性不同而改变目标权向量w, 相应地可得到系统多目标优化的非劣解集, 供决策者根据情况选择比较满意的非劣解即系统优化的最优均衡策略。

特殊地, 当多目标变成单目标情形即m=1时, 模糊优选模型式 (15) 则转化为

uj(Sk)=[1+|g1(Sk)-r1j(Sk)|2|r1j(Sk)-b1(Sk)|2](19)uj(Sk)=[1+|g1(Sk)r1j(Sk)|2|r1j(Sk)b1(Sk)|2](19)

由于max{uj (Sk) }=1, 即不论是越大越优型目标还是越小越优型目标, 阶段k状态为Sk时的最优策略的优属度

r1j(Stk)=g1(Sk)=r11(Sk)r12(Sk)r1n(Sk)(20)r1j(Stk)=g1(Sk)=r11(Sk)r12(Sk)r1n(Sk)(20)

实质上相当于单目标动态规划的前向递推形式:

fk(Stk)=opt{hk(Sk,dk)fk-1(Stk-1)}(21)

以上分析可见, 当多目标优化问题变成单目标优化问题时, 多目标模糊优选动态规划技术与经典的单目标动态规划求解方法是一致的。

《3 应用算例》

3 应用算例

设某处理系统由3个完全相同的反应器串联起来组成, 如图1所示。各级反应器的出口污染物浓度Ck以及消耗的电能ek与反应器中的搅拌速率Pk和温度Tk有关[4], 且设其关系式为:

{Ck=Ck-1/[0.1Ρk+0.20.1(Τk-40)]k=1,2,3ek=0.2Ρk+Τkk=1,2,3

此多级反应器系统的优化问题是, 选择各级反应器的操作条件 (即搅拌速率和温度) , 在污染物的初始浓度给定的前提下, (C0=0.3 mol) 使反应系统的总能耗以及最后一级反应器流出的污染物浓度最小。这是一典型的多级过程多目标优化问题, 现运用以上提出的多目标模糊优选动态规划技术求解其最优策略。

《图1》

图1 多级反应器系统

图1 多级反应器系统  

Fig.1 Multiple reactor system

为简化求解过程, 设反应的搅拌速率分为100 r/min和400 r/min 2档, 反应温度分为40℃, 50℃和80℃ 3档。则操作条件可组合为6种方式 (见表1) 。

从表1看出, 在方式D2、D3操作条件下, 反应程度虽相同, 但方式D2能耗比方式D3高;在方式D4操作条件下, 反应程度不如方式D5, 而能耗又高。因此, 方式D2、D4操作条件分别比方式D3、D5差, 为简化起见, 对方式D2、D4可不加考虑。则每1级反应器均有方式D1、D3、D5和D6 4种操作条件供选择。

这是一个3阶段的决策系统, 现按顺序即前向递推来求解, 优化流程如图2所示。取各反应器即各阶段的出口产品α, α-β, α-β-γ为状态变量Sk, 污水初始进料为状态0, 各操作条件为决策变量dk。系统的总能耗为优化目标1, 按其性质, 递推公式 (1) 中此目标的合成算子⊕取相加;污染物最终出口浓度为优化目标2, , 按其性质目标合成算子⊕应取相乘。两种目标均为越小越优型。设两种目标同样重要, 即目标权向量w= (0.5, 0.5) T

表1 操作条件组合方式

Table 1 The combinations of operating conditions

《表1》


操作方式
Tk/℃Pk/r·min-1Ck/Ck-1ek/kW

D1
401001/260

D2
404001/3120

D3
501001/370

D4
504001/4130

D5
601001/580

D6
604001/6140

《图2》

图2 多级反应器系统优化流程

图2 多级反应器系统优化流程  

Fig.2 The optimization process of the multiple reactor system

1) 阶段k=1, 第1级反应器。阶段1的4个决策D1、D3、D5和D6分别对应着4种状态, 即S1=α=1, 2, 3, 4, 均为阶段1的暂定最优状态, 其相应的暂定最优目标合成值向量分别为

F1(1)=(60,0.50)Τ(0,30%)Τ=(60,15%)ΤF1(2)=(70,0.333)Τ(0,30%)Τ=(70,10%)ΤF1(3)=(80,0.20)Τ(0,30%)Τ=(80,6%)ΤF1(4)=(140,0.167)Τ(0,30%)Τ=(140,5%)Τ

2) 阶段k=2, 至第2级反应器。阶段1的4种暂定最优状态α=1, 2, 3, 4至阶段2均有4个决策。现以阶段1暂定最优决策S11=α=1为例递推。至阶段2, 有4个决策D1、D3、D5和D6可供选择, 则状态S2=1-β的目标合成值矩阵为

F2(S2)=[6070801400.500.3330.200.167][6060606015%15%15%15%]=[1201301402007.5%5%3%2.5%]

运用规格化公式 (5) (越小越优型) 将目标合成值矩阵F2 (S2) 转换为目标优属度矩阵

R2(S2)=[0.400.350.300.000.000.330.600.67]

由模糊优选模型式 (15) 解得4个决策和状态的隶属度

u(S2)=(0.26,0.66,0.97,0.74)

由max{uj (S2) }=0.97得阶段2暂定最优状态S12=1-3, 则暂定最优决策为d12=D5, 相应的暂定最优目标合成值向量

F2(S12)=(140,3%)Τ

3) 阶段k=K=3, 至最后一级反应器。与阶段2的求解过程相似, 可解得阶段3暂定最优状态S13=1-3-3, 暂定最优决策d13=D5, 和相应的暂定最优目标合成值向量

F3(S13)=(220,0.6%)Τ

4) 同样地, 在阶段k=1时从暂定最优状态S21=2, S31=3和S41=4开始进行递推, 在最后阶段分别可解得相应的暂定最优状态和决策。则4个全局暂定最优目标合成值向量F3 (St3) 可组成最后阶段的暂定最优目标合成值矩阵

F3(S3)=[2202302403000.6%0.4%0.24%0.2%]

5) 依据矩阵F3 (S3) 最终优选全局真实最优状态S*3。应用上述方法与模糊优选模型式 (15) 得最终阶段4种暂定最优状态和目标合成值的隶属度

u(St3)=(0.14,0.58,0.98,0.86)

则与优属度最大值0.98相对应的状态S33=3—3—3为全局真实最优状态, 相应的全局真实最优目标合成值向量

F3(S*3)=(240,0.24%)Τ

即此多级反应器系统在能耗与反应程度重要性相同时, 其最优反应结果为总能耗240 kW, 最终污染物出口浓度0.24%。相应的最优策略为D5-D5-D5, 即3个串联反应器均采用操作条件D5:搅拌速率100 r/min, 反应温度60℃。

如果调整目标权向量, 可得多级反应器多目标优化的非劣解集, 列于表2。

表2 多级反应器系统优化结果

Table 2 The optimization results of the multiple reactor system

《表2》


目标权重
最优策略总能耗原料出口浓度

w1
w2d*1-d*2-d*3E*K/kWC*K/%

0
1.0D6-D6-D64200.14

0.2
0.8D5-D6-D63600.17

0.5
0.5D5-D5-D52400.24

0.8
0.2D5-D3-D52300.40

0.9
0.1D3-D3-D32101.11

1.0
0D1-D1-D11803.75

由表2多目标优化结果可以看出, 当目标权重取不同值时, 会得到不同的最优策略, 随着总能耗目标权重的增加, 所采取的最优策略使总能耗逐渐降低;相应地污染物出口浓度逐渐增加。决策者可根据实际需要选择最优均衡策略, 对多级反应器系统实行最优控制。

《4 结语》

4 结语

多级过程具有自身的特点, 前一级末的状态是后一级的初始状态, 也就是说后一级的输入受前一级输出的直接影响。而且对于某些优化目标这种影响关系可能具有相乘的性质。因此根据多级过程的前后联系特点, 采用与反应物流向一致的递推求解方向即前向动态规划递推形式比较直观和简便。

动态规划是求解多阶段优化与决策问题的有效优化技术, 但目前只成功地解决了单目标优化问题, 而对于多目标优化决策问题, 经典的动态规划以及在动态规划的递推过程中应用经典的多目标规划方法求出最优均衡解有一定难度。根据动态规划的求解特点是逐阶段地从有限离散的决策中进行优选, 在此基础上组成整个过程的最优策略, 本文将模糊优选理论与动态规划原理相结合, 提出能有效求解多级过程多目标优化问题的模糊优选动态规划技术。并进行了实例应用研究, 结果符合实际, 为求解多阶段多目标的优化决策问题提供了新途径。