《1 简介》
1 简介
自从1983年蔡文教授提出可拓工程理论以来, 该方法已成功地应用在各个领域[1,2], 例如, 最佳化判别、模式识别、系统判别、分类器设计、决策与控制器设计[3,4,5,6,7,8,9]。从这些应用来看大部分的研究皆专注于利用可拓关联函数的定性分析, 而在控制领域上的应用还缺乏寻求控制规律的理论与方法, 以使得系统的状态轨迹在控制状态下可满足设计者的需求。因此, 可拓理论在控制领域的研究及应用至今仍乏善可陈。目前, 文献[9]根据模糊控制的概念, 以“IF—THEN”的语言控制规则来描述控制动作。通过可拓集的制定, 并仿照模糊理论中的推理机制, 实现了可拓逻辑控制器设计。另一方面, 以启发式的设计方式决定控制规律亦被探讨[8]。从这些文献不难发现, 在可拓结构下如何寻求系统的设计策略是急需解决的问题。根据我们的看法, 无论使用启发式的设计法或采用模糊控制的推理方式, 均有赖于对受控系统的丰富经验和知识, 然而现实的系统存在着许多的非线性因素, 以人工经验的设计方式, 对系统状态变量进行逐一了解并不是一件易事, 面对这样的控制系统设计问题, 很难完整掌握系统的动态行为, 至于前述的设计方式将变得耗时而无效。此问题类似模糊控制的发展过程。因此, 如何构建系统的设计策略是有其积极意义的。基于此, 本文提出自适应可拓控制的设计模式, 借调整可拓控制器的输出增益达到系统的控制目的, 避免了采用耗时的经验设计方法。
众所周知, 在自适应控制领域中包括直接法和间接法。在间接法中, 利用数学模型来近似描述受控系统的模式, 而数学模型中的参数可用动态修正来描述该系统。然后根据该数学模型设计控制规律, 以满足系统的控制性能要求[10,11,12]。直接自适应设计法是直接动态地修正控制器参数[13,14]。本文将焦点集中于参数直接自适应修正法, 利用自适应控制的设计技巧, 合理地自适应改变可拓控制器的增益参数, 以达到给定的最佳控制目的。此外, 为确保所设计的可拓控制系统的稳定性及迫使状态轨迹从可拓区转移至合格区, 在控制规律中引入了最大值控制量。
《2 问题描述和可拓控制器》
2 问题描述和可拓控制器
x(n)=f(x)+bu, (1)y=x1。 (2)
其中, f 是未知函数, b 为未知正数, u 和 y 分别为控制输入及系统的输出, 且假设x=(x1,x2,⋯,xn)T=(x,x˙,⋯‚x(n−1))T是可测量的状态。
e=yd−y=yd−x1, (3)
yd为期望的输出。根据式 (1) 和式 (2) , 可推得最佳控制为
u∗=1b[−f(x)+y(n)d+cTe]。 (4)
其中c= (c1, c2, …, cn) T为常数向量, e=(e1,e2,⋯,en)T=(e,e˙,⋯‚e(n−1))T为误差向量。将式 (4) 代入式 (1) , 可得
e(n)+cne(n−1)+⋯+c1e=0。 (5)
只要慎选c , 可使得式 (5) 的根落在复数平面的左半面, 则可得到稳定的控制系统。然而, 实际上在未知f 和 b 的情况下, 无法获得式 (4) 的控制规律来满足上述要求。而作者提出的可拓控制器可以近似地实现如式 (4) 的最佳控制。
u={uA,σ∈ERuT,σ∉ER‚ (6)
σ=c1e1+c2e2+⋯+cnen。 (7)
ER为合格区, 其范围可由设计者根据要求决定。明显地, 由式 (6) 可知, 根据σ是否属于ΕR而分别地使用不同的控制输入。其中uA称为自适应控制规律, uT称为转换控制规律, 下面将设计这两项控制规律。
《图1》
图1 可拓关联函数
Fig.1 Extension dependent function
K=⎧⎩⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪−1σR(σ−σR)‚ 0≤σ<σR1σR(σ+σR)‚ −σR<σ<0−bσmax−σR(σ−σR)‚ σ≥σRbσmax−σR(σ+σR)‚ σ≤σR。 (8)
图1中, 区域σ∉[-σR, σR]定为可拓区, 而区域σ∈ER=[-σR, σR]为合格区。
根据可拓理论的基本想法, 应找到一种方法使得系统性能规格能处于合格区中的要求。对一个动态系统, 如果σ不在合格区中, 应提供一个控制量, 迫使σ由可拓区转换至合格区。同样地, 应有一个适度的控制量以维持σ停留在合格区内。设计目的是提供上述两个控制量, 并希望式 (5) 得到满足。
增益参数 k 为置入之可调参数, 使得式 (9) 可以最佳地近似u*。
《3 自适应控制uA的推导》
3 自适应控制uA的推导
在未知f 及 b的情况下, 推导得uA中的增益参数k的自适应规律。在式 (1) 两侧同时加减bu*, 并将式 (9) 代入式 (1) , 可得
e(n)=−cTe+b(−uA+u∗)。 (11)
A=⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜00⋮0−c110⋮0−c201⋯0−c3⋯⋮⋱⋯⋯00⋮0−cn−100⋮1−cn⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟‚b=⎛⎝⎜⎜⎜⎜00⋮b⎞⎠⎟⎟⎟⎟, (12)
e˙=Ae+b[−uA+u∗]。 (13)
k∗=argmink∈R[supk∈R|uA(σ|k)−u∗|]‚ (14)
ε=k∗σ−u∗。 (15)
uA(σ|k∗)−uA(σ|k)=k∗σ−kσ。 (16)
通过式 (1) , (4) , (16) , 则式 (13) 改写为
e˙=Ae+b(k∗−k)σ−bε。 (17)
V=12eTPe+b2γ(k∗−k)2, (18)
其中γ为正常数, P为n×n正定对称矩阵且满足李雅普诺夫方程, ATP+PA=-Q, Q 为一n×n 正定矩阵。将式 (18) 对时间微分, 可得
V˙=12e˙TPe+12eTPe˙+bγ(k∗−k)k˙=−12eTQe−eTPbε+bγ(k∗−k)[γeTpσ−k˙]‚ (19)
其中p 为P最后一行向量。针对增益参数k 的自适应规律可选为
k˙=γeTpσ。 (20)
当σ∈[-σR, σR]时, 自适应控制uA=kσ动作, 控制器提供在合格区所需的控制信号。
《4 转换控制uT的推导》
4 转换控制uT的推导
假设受控系统的可能边界为|f|≤fmax, 0<bmin≤ b, 而u=uA+uM, uM为最大值控制, 给定李雅普诺夫函数为
V=12eTPe。 (21)
V˙=−12eTQe+eTPb[u∗−uM−uA]≤ ∣∣eTPb∣∣(|u∗|+|uA|)−eTPbuM。 (22)
uM=sign(eTPb)[b−1min⋅(fmax+∣∣cTe∣∣+∣∣y(n)d∣∣)+|uA|]‚ (23)
可使得式 (22) 小于零, 保证所设计的控制系统的稳定性。值得注意的是, 该控制量是正比于预估的系统可能边界, 以换得该系统要求的稳定度。
《5 仿真结果》
5 仿真结果
将所设计的可拓控制器应用在振荡系统 (duffing forced oscillation system) 的控制上。图2和图3为未施加控制的状态轨迹及输出的响应图, 它基本上是一混沌系统。此处控制设计的目的是, 希望控制该系统的输出能跟踪所要求的正弦波信号sin (t) 。
《图2》
图2 未施加控制的状态轨迹
Fig.2 System trajectory with u=0
《图3》
图3 未施加控制的输出轨迹
Fig.3 Output trajektory with u=0
x˙1=x2, (24)x˙2=−0.1x2−x31+12cos(t)+u。 (25)
可拓控制器的参数为c=[1,2]T, σR=5, σmax=15, b=1, Q=diag (10, 10) , γ=20, 及初始状态x= (2, 2) T。图4至图6为仿真的结果。结果可见, 所提出的可拓控制器可得到不错的跟踪控制性能。
《图4》
图4 施加可拓控制当σR=0.25时跟踪正弦波信号的状态轨迹
Fig.4 Closed-loop system trajectory using extension controller for the σR=0.25 case
《图5》
图5 施加可拓控制当σR=1时跟踪正弦波信号的状态轨迹
Fig.5 Closed-loop system trajectory using extension controller for the σR=1 case
《6 结论》
6 结论
本文将传统的自适应控制设计策略用于可拓控制器设计。根据可拓集概念, 分别设计两项控制规律:a.合格区的自适应控制, b.可拓区的转换控制。在合格区中, 提出增益自适应修正算法, 使得该自适应控制规律近似于假想的最佳控制。在可拓区中, 提出根据未知系统的可能边界值设计出最大值控制规律, 以保证系统的稳定性, 并提供转换控制量, 使状态轨迹由可拓区转换至合格区。仿真结果表明, 所提出的可拓控制器结构在仿真混沌振荡系统的控制上获得可接受的控制效果。
《图6》
图6 施加可拓控制的输出响应轨迹
Fig.6 Output trajectory with the extension controller
……为要求波形 ——为输出波形