《1 引 言》
1 引 言
在工程技术领域的许多优化问题, 有的本身就是多阶段问题, 有的在优化时为便于求解而将其分解为若干阶段, 也可归为多阶段问题。多阶段系统的特点是前一阶段的末状态是下一阶段的初始状态, 前一阶段的输出为后一阶段的输入, 各阶段的决策既决定自己的状态又影响下一阶段的决策, 从而影响整个过程的优化。多阶段系统的优化目的是要寻求使整个过程的目标或指标达到最优化时各阶段决策组成的策略。动态规划法在求解多阶段系统优化问题中得到广泛的运用[1 ] , 但大都只用于解决单目标系统的最优控制, 将其有效地应用于多目标 (指标) 多阶段系统的优化问题已逐渐受到重视。本文在模糊权距离和隶属度概念的基础上, 根据多阶段系统的前后阶段联系特点, 将模糊优选理论与动态规划原理有机地结合起来, 提出多目标多级串联系统优化的模糊优选动态规划技术。目的在于探索求解多阶段串联系统多目标优化和决策问题的新途径。
《2 多目标多阶段系统模糊优选动态规划技术》
2 多目标多阶段系统模糊优选动态规划技术
设多阶段系统共包含K 个阶段和m 项目标, 考虑到有些优化目标前后阶段这种影响关系可能具有相乘的关系, 现采用前向动态规划方法求解。前向动态规划方法的特点是从第1阶段开始, 向后顺序递推, 对于多目标优化问题, 其递推公式可表示为
F k ( S t k ) = o p t { Η k ( S k , d k ) ⊕ F k - 1 ( S t k - 1 ) } ( 1 ) F k ( S t k ) = o p t { H k ( S k , d k ) ⊕ F k − 1 ( S t k − 1 ) } ( 1 )
S k = φ k ( S k - 1 , d k ) k = 1 , 2 , ⋯ , Κ S k = φ k ( S k − 1 , d k ) k = 1 , 2 , ⋯ , K
其中:F k (S t k t k ) =[f ( 1 ) k ( 1 ) k (S t k t k ) , …, f ( m ) k ( m ) k (S t k t k ) ]T , F k -1 (S t k -1 ) =[f ( 1 ) k - 1 ( 1 ) k − 1 (S t k - 1 t k − 1 ) , …, f (m ) k -1 (S t k - 1 t k − 1 ) ]T , 分别表示阶段k , k -1局部暂定最优状态为S t k t k 、S t k -1 时m 项目标合成值组成的向量;H k (S k , d k ) =[h (1) k (S k , d k ) , …, h ( m ) k ( m ) k (S k , d k ) ]T , 表示阶段k 状态为S k 时决策d k 的m 项目标值组成的向量。上标t 代表暂定最优, ⊕为目标合成算子, 可根据目标性质取加减乘除等复合运算。
前向递推时, 设由已知初始状态S 0 至阶段1, 有L 个可行决策。由于一个决策对应唯一状态, 显然在此特殊情况下第1阶段不需优选, 任一决策d 1 所对应的状态S t 1 t 1 为阶段1的暂定最优状态, 即
F 1 ( S t 1 ) = { Η 1 ( S 1 , d 1 ) ⊕ F 0 ( S 0 ) } ( 2 ) F 1 ( S t 1 ) = { H 1 ( S 1 , d 1 ) ⊕ F 0 ( S 0 ) } ( 2 )
若顺序递推至阶段k (k ≥2) , 已知阶段k -1的暂定最优状态S t k - 1 t k − 1 至阶段k 有n 个可行决策d k , 即对应n 个策略, 各策略的优劣由m 项目标的合成值加以评判。如做出任一决策d j 即采取策略v j (S k ) , 可得到阶段k 相应状态S k 时策略v j (S k ) 目标合成值向量
V j ( S k ) = [ v 1 j ( s k ) , ⋯ , v m j ( S k ) ] Τ ( 3 ) V j ( S k ) = [ v 1 j ( s k ) , ⋯ , v m j ( S k ) ] T ( 3 )
其中v ij (S k ) =h ( i ) k ( i ) k (S k , d j ) ⊕f ( i ) k - 1 ( i ) k − 1 (S t k -1 ) 。则n 个策略可构成阶段k 状态为S k 时的目标合成值矩阵
V k ( S k ) = [ v 1 1 ( S k ) ⋯ v 1 n ( S k ) v 2 1 ( S k ) ⋯ v 2 n ( S k ) ⋮ ⋮ v m 1 ( S k ) ⋯ v m n ( S k ) ] ( 4 ) V k ( S k ) = ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ v 1 1 ( S k ) v 2 1 ( S k ) ⋮ v m 1 ( S k ) ⋯ ⋯ ⋯ v 1 n ( S k ) v 2 n ( S k ) ⋮ v m n ( S k ) ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ ⎥ ( 4 )
将目标合成值矩阵V k (S k ) 规格化为相应的优属度矩阵, 可采用公式
r i j ( S k ) = { v i j ( S k ) max j v i j ( S k ) 越 大 越 优 型 目 标 1 - v i j ( S k ) max j v i j ( S k ) 越 小 越 优 型 目 标 ( 5 ) r i j ( S k ) = ⎧ ⎩ ⎨ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ v i j ( S k ) max j v i j ( S k ) 越 大 越 优 型 目 标 1 − v i j ( S k ) max j v i j ( S k ) 越 小 越 优 型 目 标 ( 5 )
分别将目标合成值规格化。r ij (S k ) 表达了策略v j (S k ) 的第i 项目标合成值对于优的隶属度, 简称目标隶属度。max j v i j ( S k ) max j v i j ( S k ) 为取n 个策略中第i 项目标的最大合成值。则有目标隶属度矩阵
R k ( S k ) = [ r 1 1 ( S k ) ⋯ r 1 n ( S k ) r 2 1 ( S k ) ⋯ r 2 n ( S k ) ⋮ ⋮ r m 1 ( S k ) ⋯ r m n ( S k ) ] ( 6 ) R k ( S k ) = ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ r 1 1 ( S k ) r 2 1 ( S k ) ⋮ r m 1 ( S k ) ⋯ ⋯ ⋯ r 1 n ( S k ) r 2 n ( S k ) ⋮ r m n ( S k ) ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ ⎥ ( 6 )
根据递推公式 (1) , 要从n 个可行决策中优选出局部暂定最优决策d t k t k 和局部暂定最优状态S t k t k , 首先应依据目标隶属度矩阵R k ( S k ) R k ( S k ) 确定阶段k 状态为S k 时的相对优等策略g (S k ) 和相对劣等策略b (S k ) , 它们的目标隶属度向量应分别为
g ( S k ) = ( g 1 ( S k ) , ⋯ , g m ( S k ) ) = ( ∨ j r 1 j ( S k ) , ⋯ , ∨ j r m j ( S k ) ) ( 7 ) b ( S k ) = ( b 1 ( S k ) , ⋯ , b m ( S k ) ) = ( ∧ j r 1 j ( S k ) , ⋯ , ∧ j r m j ( S k ) ) ( 8 ) g ( S k ) = ( g 1 ( S k ) , ⋯ , g m ( S k ) ) = ( ∨ j r 1 j ( S k ) , ⋯ , ∨ j r m j ( S k ) ) ( 7 ) b ( S k ) = ( b 1 ( S k ) , ⋯ , b m ( S k ) ) = ( ∧ j r 1 j ( S k ) , ⋯ , ∧ j r m j ( S k ) ) ( 8 )
式中:∨ j r i j ( S k ) = r i 1 ( S k ) ∨ r i 2 ( S k ) ∨ ⋯ ∨ r i n ( S k ) ∨ j r i j ( S k ) = r i 1 ( S k ) ∨ r i 2 ( S k ) ∨ ⋯ ∨ r i n ( S k ) ;∧ j r i j ( S k ) = r i 1 ( S k ) ∧ r i 2 ( S k ) ∧ ⋯ ∧ r i n ( S k ) ∧ j r i j ( S k ) = r i 1 ( S k ) ∧ r i 2 ( S k ) ∧ ⋯ ∧ r i n ( S k )
优化时m 项目标的重要性不一定相同, 设m 项优化目标的重要性权向量为
w = ( w 1 , w 2 , ⋯ , w m ) , m ∑ i = 1 w i = 1 ( 9 ) w = ( w 1 , w 2 , ⋯ , w m ) , ∑ i = 1 m w i = 1 ( 9 )
r j ( S k ) = ( r 1 j ( S k ) , ⋯ , r m j ( S k ) ) ( 1 0 ) r j ( S k ) = ( r 1 j ( S k ) , ⋯ , r m j ( S k ) ) ( 1 0 )
则策略v j (S k ) 与相对优等策略g (S k ) 和相对劣等策略b (S k ) 之间的差异可由广义权距离分别表示为[2 ]
∥ w [ g ( S k ) - r j ( S k ) ] ∥ = m ∑ i = 1 { w i [ g i ( S k ) - r i j ( S k ) ] } ( 1 1 ) ∥ w [ r j ( S k ) - b ( S k ) ] ∥ = m ∑ i = 1 { w i [ r i j ( S k ) - b i ( S k ) ] } ( 1 2 ) ∥ w [ g ( S k ) − r j ( S k ) ] ∥ = ∑ i = 1 m { w i [ g i ( S k ) − r i j ( S k ) ] } ( 1 1 ) ∥ w [ r j ( S k ) − b ( S k ) ] ∥ = ∑ i = 1 m { w i [ r i j ( S k ) − b i ( S k ) ] } ( 1 2 )
设策略v j (S k ) 以优属度u j (S k ) 隶属于模糊子集“优”, 以劣属度u c j c j (S k ) 隶属于模糊子集“劣”, 根据模糊集的余集定义有
u c j ( S k ) = 1 - u j ( S k ) ( 1 3 ) u c j ( S k ) = 1 − u j ( S k ) ( 1 3 )
由于隶属度可看作权重[3 ] , 则权距优距离u j (S k ) ‖w [g (S k ) -r j (S k ) ]‖和权距劣距离u c j c j (S k ) ‖w [r j (S k ) -b (S k ) ]‖更完善地表达了策略v j (S k ) 与相对优等策略g (S k ) 和相对劣等策略b (S k ) 之间的差异。为确定策略v j (S k ) 的优属度u j (S k ) , 将经典的最小二乘法则加以拓展, 建立目标函数使阶段k 状态S k 的所有n 个可行策略与相对优等策略和相对劣等策略的权距离之平方和最小, 即
min { ψ [ u j ( S k ) ] = n ∑ j = 1 ( { u j ( S k ) ⋅ ∥ w [ g ( S k ) - r j ( S k ) ] ∥ } 2 + { u c j ( S k ) ∥ ⋅ w [ r j ( S k ) - b ( S k ) ] ∥ } 2 ) ( 1 4 ) min { ψ [ u j ( S k ) ] = ∑ j = 1 n ( { u j ( S k ) ⋅ ∥ w [ g ( S k ) − r j ( S k ) ] ∥ } 2 + { u c j ( S k ) ∥ ⋅ w [ r j ( S k ) − b ( S k ) ] ∥ } 2 ) ( 1 4 )
d ψ [ u j ( S k ) ] d u j ( S k ) = 0 d ψ [ u j ( S k ) ] d u j ( S k ) = 0
经推导可得阶段k 状态为S k 时各可行策略对于优的隶属度的计算模型为
u j ( S k ) = { 1 + [ m ∑ i = 1 ( w i | g i ( S k ) - r i j ( S k ) | ) ] 2 [ m ∑ i = 1 [ w i | r i j ( S k ) - b i ( S k ) | ] 2 } - 1 ( 1 5 ) u j ( S k ) = ⎧ ⎩ ⎨ ⎪ ⎪ ⎪ ⎪ 1 + [ ∑ i = 1 m ( w i | g i ( S k ) − r i j ( S k ) | ) ] 2 [ ∑ i = 1 m [ w i | r i j ( S k ) − b i ( S k ) | ] 2 ⎫ ⎭ ⎬ ⎪ ⎪ ⎪ ⎪ − 1 ( 1 5 )
根据最优原理, 由max{u j (S k ) }所对应的策略可得阶段k 状态S k 的暂定最优决策d t k , 与之相对应的状态为暂定最优状态S t k t k , 同时得到暂定最优目标合成向量:
F k ( S t k ) = [ f ( 1 ) k ( S t k ) , ⋯ , f ( m ) k ( S t k ) ] Τ ( 1 6 ) F k ( S t k ) = [ f ( 1 ) k ( S t k ) , ⋯ , f ( m ) k ( S t k ) ] T ( 1 6 )
由于从阶段1暂定最优状态S t 1 t 1 按上述多目标模糊优选动态规划技术进行递推时, 在各个阶段包括最终阶段K 均可得到相应的暂定最优状态S t k t k 和目标合成值向量F (S t k ) 。已知阶段1共有L 个暂定最优状态, 则相应地在最终阶段K 有L 个暂定最优状态和目标合成值向量, 可组成最终阶段K 的目标合成值矩阵
F Κ ( S Κ ) = [ f ( 1 ) Κ ( S 1 Κ ) ⋯ f ( 1 ) Κ ( S L Κ ) f ( 2 ) Κ ( S 1 Κ ) ⋯ f ( 2 ) Κ ( S L Κ ) ⋮ ⋮ f ( m ) Κ ( S 1 Κ ) ⋯ f ( m ) Κ ( S L Κ ) ] ( 1 7 ) F K ( S K ) = ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ f ( 1 ) K ( S 1 K ) f ( 2 ) K ( S 1 K ) ⋮ f ( m ) K ( S 1 K ) ⋯ ⋯ ⋯ f ( 1 ) K ( S L K ) f ( 2 ) K ( S L K ) ⋮ f ( m ) K ( S L K ) ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ( 1 7 )
依据矩阵 (17) 从最终阶段K 的L 个暂定最优状态中优选真实最优状态S * k 是比前述由状态S t k - 1 t k − 1 开始, 从n 个决策中优选局部暂定最优决策和局部暂定最优状态S t k 高一层次的多目标模糊优选问题, 但求解的思想与方法相似。相当于令f (i ) K (S t K ) =v it (S K ) , 运用上述方法与模型式 (15) 求出阶段K 的各暂定最优状态所对应的隶属度, 则max{u t (S * K ) }所对应的状态就是全局部真实最优状态S * K 。同时得到相应的全局真实最优目标合成值向量
F Κ ( S * Κ ) = [ f ( 1 ) Κ ( S * Κ ) , ⋯ , f ( m ) Κ ( S * Κ ) ] Τ ( 1 8 ) F K ( S ∗ K ) = [ f ( 1 ) K ( S ∗ K ) , ⋯ , f ( m ) K ( S ∗ K ) ] T ( 1 8 )
和整个系统的最优策略即各阶段的最优决策集合d * 1 , d * 2 , …, d * K 。
当目标权向量w 确定时, 运用上述多目标多级过程优化的模糊优选动态规划技术就可以得到一最优解即多目标优化问题的一个非劣解。如果根据目标的相对重要性不同而改变目标权向量w , 相应地可得到系统多目标优化的非劣解集, 供决策者根据情况选择比较满意的非劣解即系统优化的最优均衡策略。
特殊地, 当多目标变成单目标情形即m =1时, 模糊优选模型式 (15) 则转化为
u j ( S k ) = [ 1 + | g 1 ( S k ) - r 1 j ( S k ) | 2 | r 1 j ( S k ) - b 1 ( S k ) | 2 ] ( 1 9 ) u j ( S k ) = [ 1 + | g 1 ( S k ) − r 1 j ( S k ) | 2 | r 1 j ( S k ) − b 1 ( S k ) | 2 ] ( 1 9 )
由于max{u j (S k ) }=1, 即不论是越大越优型目标还是越小越优型目标, 阶段k 状态为S k 时的最优策略的优属度
r 1 j ( S t k ) = g 1 ( S k ) = r 1 1 ( S k ) ∨ r 1 2 ( S k ) ∨ ⋯ ∨ r 1 n ( S k ) ( 2 0 ) r 1 j ( S t k ) = g 1 ( S k ) = r 1 1 ( S k ) ∨ r 1 2 ( S k ) ∨ ⋯ ∨ r 1 n ( S k ) ( 2 0 )
f k ( S t k ) = o p t { h k ( S k , d k ) ⊕ f k - 1 ( S t k - 1 ) } ( 2 1 )
以上分析可见, 当多目标优化问题变成单目标优化问题时, 多目标模糊优选动态规划技术与经典的单目标动态规划求解方法是一致的。
《3 应用算例》
3 应用算例
设某处理系统由3个完全相同的反应器串联起来组成, 如图1所示。各级反应器的出口污染物浓度C k 以及消耗的电能e k 与反应器中的搅拌速率P k 和温度T k 有关[4 ] , 且设其关系式为:
{ C k = C k - 1 / [ 0 . 1 √ Ρ k + 0 . 2 0 . 1 ( Τ k - 4 0 ) ] k = 1 , 2 , 3 e k = 0 . 2 Ρ k + Τ k k = 1 , 2 , 3
此多级反应器系统的优化问题是, 选择各级反应器的操作条件 (即搅拌速率和温度) , 在污染物的初始浓度给定的前提下, (C 0 =0.3 mol) 使反应系统的总能耗以及最后一级反应器流出的污染物浓度最小。这是一典型的多级过程多目标优化问题, 现运用以上提出的多目标模糊优选动态规划技术求解其最优策略。
《图1》
图1 多级反应器系统
Fig.1 Multiple reactor system
为简化求解过程, 设反应的搅拌速率分为100 r/min和400 r/min 2档, 反应温度分为40℃, 50℃和80℃ 3档。则操作条件可组合为6种方式 (见表1) 。
从表1看出, 在方式D2、D3操作条件下, 反应程度虽相同, 但方式D2能耗比方式D3高;在方式D4操作条件下, 反应程度不如方式D5, 而能耗又高。因此, 方式D2、D4操作条件分别比方式D3、D5差, 为简化起见, 对方式D2、D4可不加考虑。则每1级反应器均有方式D1、D3、D5和D6 4种操作条件供选择。
这是一个3阶段的决策系统, 现按顺序即前向递推来求解, 优化流程如图2所示。取各反应器即各阶段的出口产品α , α -β , α -β -γ 为状态变量S k , 污水初始进料为状态0, 各操作条件为决策变量d k 。系统的总能耗为优化目标1, 按其性质, 递推公式 (1) 中此目标的合成算子⊕取相加;污染物最终出口浓度为优化目标2, , 按其性质目标合成算子⊕应取相乘。两种目标均为越小越优型。设两种目标同样重要, 即目标权向量w = (0.5, 0.5) T 。
表1 操作条件组合方式
Table 1 The combinations of operating conditions
《表1》
操作方式T k /℃P k /r·min-1 C k /C k -1e k /kW D140 100 1/2 60 D240 400 1/3 120 D350 100 1/3 70 D450 400 1/4 130 D560 100 1/5 80 D660 400 1/6 140
《图2》
图2 多级反应器系统优化流程
Fig.2 The optimization process of the multiple reactor system
1) 阶段k =1, 第1级反应器。阶段1的4个决策D1、D3、D5和D6分别对应着4种状态, 即S 1 =α =1, 2, 3, 4, 均为阶段1的暂定最优状态, 其相应的暂定最优目标合成值向量分别为
F 1 ( 1 ) = ( 6 0 , 0 . 5 0 ) Τ ⊕ ( 0 , 3 0 % ) Τ = ( 6 0 , 1 5 % ) Τ F 1 ( 2 ) = ( 7 0 , 0 . 3 3 3 ) Τ ⊕ ( 0 , 3 0 % ) Τ = ( 7 0 , 1 0 % ) Τ F 1 ( 3 ) = ( 8 0 , 0 . 2 0 ) Τ ⊕ ( 0 , 3 0 % ) Τ = ( 8 0 , 6 % ) Τ F 1 ( 4 ) = ( 1 4 0 , 0 . 1 6 7 ) Τ ⊕ ( 0 , 3 0 % ) Τ = ( 1 4 0 , 5 % ) Τ
2) 阶段k =2, 至第2级反应器。阶段1的4种暂定最优状态α =1, 2, 3, 4至阶段2均有4个决策。现以阶段1暂定最优决策S 1 1 =α =1为例递推。至阶段2, 有4个决策D1、D3、D5和D6可供选择, 则状态S 2 =1-β 的目标合成值矩阵为
F 2 ( S 2 ) = [ 6 0 7 0 8 0 1 4 0 0 . 5 0 0 . 3 3 3 0 . 2 0 0 . 1 6 7 ] ⊕ [ 6 0 6 0 6 0 6 0 1 5 % 1 5 % 1 5 % 1 5 % ] = [ 1 2 0 1 3 0 1 4 0 2 0 0 7 . 5 % 5 % 3 % 2 . 5 % ]
运用规格化公式 (5) (越小越优型) 将目标合成值矩阵F 2 (S 2 ) 转换为目标优属度矩阵
R 2 ( S 2 ) = [ 0 . 4 0 0 . 3 5 0 . 3 0 0 . 0 0 0 . 0 0 0 . 3 3 0 . 6 0 0 . 6 7 ]
由模糊优选模型式 (15) 解得4个决策和状态的隶属度
u ( S 2 ) = ( 0 . 2 6 , 0 . 6 6 , 0 . 9 7 , 0 . 7 4 )
由max{u j (S 2 ) }=0.97得阶段2暂定最优状态S 1 2 =1-3, 则暂定最优决策为d 1 2 =D5, 相应的暂定最优目标合成值向量
3) 阶段k =K =3, 至最后一级反应器。与阶段2的求解过程相似, 可解得阶段3暂定最优状态S 1 3 =1-3-3, 暂定最优决策d 1 3 =D5, 和相应的暂定最优目标合成值向量
4) 同样地, 在阶段k =1时从暂定最优状态S 2 1 =2, S 3 1 =3和S 4 1 =4开始进行递推, 在最后阶段分别可解得相应的暂定最优状态和决策。则4个全局暂定最优目标合成值向量F 3 (S t 3 ) 可组成最后阶段的暂定最优目标合成值矩阵
F 3 ( S 3 ) = [ 2 2 0 2 3 0 2 4 0 3 0 0 0 . 6 % 0 . 4 % 0 . 2 4 % 0 . 2 % ]
5) 依据矩阵F 3 (S 3 ) 最终优选全局真实最优状态S * 3 。应用上述方法与模糊优选模型式 (15) 得最终阶段4种暂定最优状态和目标合成值的隶属度
u ( S t 3 ) = ( 0 . 1 4 , 0 . 5 8 , 0 . 9 8 , 0 . 8 6 )
则与优属度最大值0.98相对应的状态S 3 3 =3—3—3为全局真实最优状态, 相应的全局真实最优目标合成值向量
即此多级反应器系统在能耗与反应程度重要性相同时, 其最优反应结果为总能耗240 kW, 最终污染物出口浓度0.24%。相应的最优策略为D5-D5-D5, 即3个串联反应器均采用操作条件D5:搅拌速率100 r/min, 反应温度60℃。
如果调整目标权向量, 可得多级反应器多目标优化的非劣解集, 列于表2。
表2 多级反应器系统优化结果
Table 2 The optimization results of the multiple reactor system
《表2》
目标权重最优策略 总能耗 原料出口浓度 w 1 w 2 d * 1 -d * 2 -d * 3 E * K /kWC * K /% 01.0 D6-D6-D6 420 0.14 0.20.8 D5-D6-D6 360 0.17 0.50.5 D5-D5-D5 240 0.24 0.80.2 D5-D3-D5 230 0.40 0.90.1 D3-D3-D3 210 1.11 1.00 D1-D1-D1 180 3.75
由表2多目标优化结果可以看出, 当目标权重取不同值时, 会得到不同的最优策略, 随着总能耗目标权重的增加, 所采取的最优策略使总能耗逐渐降低;相应地污染物出口浓度逐渐增加。决策者可根据实际需要选择最优均衡策略, 对多级反应器系统实行最优控制。
《4 结语》
4 结语
多级过程具有自身的特点, 前一级末的状态是后一级的初始状态, 也就是说后一级的输入受前一级输出的直接影响。而且对于某些优化目标这种影响关系可能具有相乘的性质。因此根据多级过程的前后联系特点, 采用与反应物流向一致的递推求解方向即前向动态规划递推形式比较直观和简便。
动态规划是求解多阶段优化与决策问题的有效优化技术, 但目前只成功地解决了单目标优化问题, 而对于多目标优化决策问题, 经典的动态规划以及在动态规划的递推过程中应用经典的多目标规划方法求出最优均衡解有一定难度。根据动态规划的求解特点是逐阶段地从有限离散的决策中进行优选, 在此基础上组成整个过程的最优策略, 本文将模糊优选理论与动态规划原理相结合, 提出能有效求解多级过程多目标优化问题的模糊优选动态规划技术。并进行了实例应用研究, 结果符合实际, 为求解多阶段多目标的优化决策问题提供了新途径。