富 月 陳 威
跟蹤和鎮(zhèn)定是控制領(lǐng)域的兩個(gè)典型問(wèn)題.一般來(lái)說(shuō),相較于鎮(zhèn)定問(wèn)題,跟蹤更為困難.這是因?yàn)殒?zhèn)定只需要在系統(tǒng)的狀態(tài)或輸出受到干擾而偏離原平衡狀態(tài)時(shí),施加控制作用,使得系統(tǒng)狀態(tài)或輸出恢復(fù)到原平衡狀態(tài)即可,而跟蹤控制問(wèn)題要求系統(tǒng)的狀態(tài)或輸出能夠跟隨任意參考輸入.跟蹤控制不僅是控制理論研究的熱點(diǎn)問(wèn)題,在工程領(lǐng)域也具有很強(qiáng)的應(yīng)用背景,比如機(jī)器人運(yùn)動(dòng)軌跡跟蹤控制[1]、船舶軌跡跟蹤控制[2]和飛行器姿態(tài)控制[3]等.
跟蹤控制器的設(shè)計(jì)方法主要分為兩類,一類是追求跟蹤誤差漸近收斂的常規(guī)跟蹤控制方法,另一類是兼顧跟蹤誤差和整體性能的最優(yōu)跟蹤控制方法.常規(guī)跟蹤控制方法通過(guò)反饋實(shí)現(xiàn)調(diào)節(jié),利用前饋使得系統(tǒng)狀態(tài)跟蹤參考輸入.由于該方法基于零極點(diǎn)對(duì)消原理,如果系統(tǒng)存在不可對(duì)消的不穩(wěn)定零點(diǎn),會(huì)導(dǎo)致閉環(huán)系統(tǒng)輸出產(chǎn)生相移和增益誤差[4].為解決該問(wèn)題,文獻(xiàn)[4-5]提出了一種多速率前饋跟蹤控制方法,使得存在不穩(wěn)定零點(diǎn)的線性系統(tǒng)能夠完全跟蹤參考輸入.20 世紀(jì)90 年代初,隨著自適應(yīng)控制的發(fā)展以及模糊邏輯系統(tǒng)和神經(jīng)網(wǎng)絡(luò)等智能算法的引入,具有不確定性和非線性特性的復(fù)雜系統(tǒng)的跟蹤控制問(wèn)題受到人們的廣泛關(guān)注.文獻(xiàn)[6]針對(duì)一類具有不確定動(dòng)態(tài)的回滯非線性系統(tǒng),提出了一種魯棒自適應(yīng)反步跟蹤控制方法,該方法將整個(gè)非線性系統(tǒng)劃分為多個(gè)子系統(tǒng),對(duì)每個(gè)子系統(tǒng)進(jìn)行設(shè)計(jì),直到倒推至系統(tǒng)輸入.隨著系統(tǒng)階數(shù)的增加,該方法的推導(dǎo)過(guò)程會(huì)變得非常復(fù)雜,容易產(chǎn)生復(fù)雜度爆炸問(wèn)題.文獻(xiàn)[7]針對(duì)一類模型未知的嚴(yán)反饋的單輸入單輸出非線性系統(tǒng),通過(guò)引入動(dòng)態(tài)表面控制技術(shù)和最小學(xué)習(xí)參數(shù)方法來(lái)解決傳統(tǒng)反步法帶來(lái)的復(fù)雜度爆炸的問(wèn)題,提出了一種魯棒自適應(yīng)跟蹤控制方法,使得系統(tǒng)能夠跟蹤任意參考輸入.文獻(xiàn)[8]針對(duì)一類含有外部干擾和建模不確定性的非線性多輸入多輸出系統(tǒng),將模糊控制方法與反步法相結(jié)合,設(shè)計(jì)魯棒自適應(yīng)模糊控制器,保證系統(tǒng)輸出信號(hào)一致有界并能收斂到參考輸入附近.文獻(xiàn)[9]提出一種基于輸出跟蹤誤差的自適應(yīng)模糊控制方法,設(shè)計(jì)帶有模糊觀測(cè)器的模糊控制器,來(lái)減小未知非線性系統(tǒng)的跟蹤誤差.
上述常規(guī)跟蹤控制方法的目標(biāo)是找到一個(gè)穩(wěn)定的控制器,使得系統(tǒng)狀態(tài)或輸出跟蹤參考軌跡.在控制器設(shè)計(jì)中,常常要兼顧到系統(tǒng)的跟蹤誤差和整體性能.最優(yōu)跟蹤控制方法可以通過(guò)最小化二次型性能指標(biāo),一方面使系統(tǒng)跟蹤誤差漸近收斂,另一方面使系統(tǒng)獲得最優(yōu)性能.文獻(xiàn)[10]指出線性二次型最優(yōu)跟蹤(Linear quadratic tracking,LQT)控制器由反饋?lái)?xiàng)和前饋?lái)?xiàng)兩部分組成,其中反饋?lái)?xiàng)使閉環(huán)系統(tǒng)穩(wěn)定,前饋?lái)?xiàng)使閉環(huán)系統(tǒng)輸出跟蹤參考輸入.文獻(xiàn)[11]針對(duì)連續(xù)時(shí)間線性多變量系統(tǒng),將開(kāi)環(huán)解耦控制與LQT 相結(jié)合,提出了一種近似最優(yōu)跟蹤控制方法,實(shí)現(xiàn)了多變量系統(tǒng)的解耦和跟蹤控制.設(shè)計(jì)線性最優(yōu)跟蹤控制器的關(guān)鍵在于求解代數(shù)黎卡提方程,由于該方程中包含著系統(tǒng)模型參數(shù)信息,所以對(duì)于這種傳統(tǒng)的最優(yōu)跟蹤控制方法,當(dāng)系統(tǒng)模型參數(shù)未知時(shí),就無(wú)法得到有效應(yīng)用.為解決這一問(wèn)題,文獻(xiàn)[12]針對(duì)模型參數(shù)部分未知的連續(xù)時(shí)間線性系統(tǒng),提出了一種基于策略迭代的自適應(yīng)動(dòng)態(tài)規(guī)劃方法,通過(guò)計(jì)算代數(shù)黎卡提方程的數(shù)值解,進(jìn)而得到近似最優(yōu)跟蹤控制律.不過(guò)這類方法大多要求系統(tǒng)狀態(tài)完全已知,為了解決這個(gè)問(wèn)題,文獻(xiàn)[13]針對(duì)模型參數(shù)部分未知的離散時(shí)間線性系統(tǒng),僅使用系統(tǒng)輸入輸出數(shù)據(jù),提出了一種基于值迭代和策略迭代的自適應(yīng)動(dòng)態(tài)規(guī)劃方法,設(shè)計(jì)近似最優(yōu)跟蹤控制器,使得系統(tǒng)輸出能夠跟蹤參考輸入.與線性最優(yōu)跟蹤控制器設(shè)計(jì)方法類似,設(shè)計(jì)非線性最優(yōu)跟蹤控制器時(shí)需要求解非線性哈密頓-雅可比-貝爾曼方程.許多專家學(xué)者針對(duì)這一問(wèn)題也展開(kāi)了深入研究.文獻(xiàn)[14]針對(duì)模型參數(shù)部分未知的連續(xù)時(shí)間非線性系統(tǒng),提出了一種基于多層神經(jīng)網(wǎng)絡(luò)的近似最優(yōu)跟蹤控制器設(shè)計(jì)方法,先使用神經(jīng)網(wǎng)絡(luò)辨識(shí)系統(tǒng)模型,再分別設(shè)計(jì)反饋神經(jīng)控制器和前饋神經(jīng)控制器,使得系統(tǒng)可以較好的跟蹤參考輸入,不過(guò)該方法使系統(tǒng)輸出和控制輸入在初始時(shí)刻會(huì)產(chǎn)生較大的震蕩.為了抑制這種震蕩,文獻(xiàn)[15-16]設(shè)計(jì)了一種新型性能指標(biāo),并提出了一種啟發(fā)式動(dòng)態(tài)規(guī)劃方法,不僅減小了系統(tǒng)輸出和控制輸入的波動(dòng),還獲得了更好的跟蹤性能.文獻(xiàn)[17-19]針對(duì)模型參數(shù)未知的連續(xù)時(shí)間非線性系統(tǒng),提出了一種數(shù)據(jù)驅(qū)動(dòng)的自適應(yīng)動(dòng)態(tài)規(guī)劃方法,先利用遞歸神經(jīng)網(wǎng)絡(luò)建立數(shù)據(jù)驅(qū)動(dòng)模型,在該模型的基礎(chǔ)上設(shè)計(jì)了基于自適應(yīng)動(dòng)態(tài)規(guī)劃的近似最優(yōu)跟蹤控制器,使得系統(tǒng)狀態(tài)輸出能夠漸近跟蹤期望軌跡.毫無(wú)疑問(wèn),上述研究工作推動(dòng)了最優(yōu)跟蹤控制方法的進(jìn)一步發(fā)展與應(yīng)用,豐富了跟蹤控制的研究?jī)?nèi)容.
實(shí)際系統(tǒng)往往具有多變量和強(qiáng)耦合特性,上述跟蹤控制方法沒(méi)有考慮到多變量系統(tǒng)中可能存在的強(qiáng)耦合特性,無(wú)法保證系統(tǒng)的整體性能最優(yōu).本文針對(duì)一類具有強(qiáng)耦合特性的離散時(shí)間線性多變量系統(tǒng),提出了一種具有解耦性能的最優(yōu)跟蹤控制方法.首先將耦合項(xiàng)看作可測(cè)干擾,基于零和博弈思想設(shè)計(jì)一個(gè)由系統(tǒng)跟蹤誤差、控制輸入和耦合干擾補(bǔ)償構(gòu)成的性能指標(biāo);然后通過(guò)最小化這個(gè)新的性能指標(biāo),得到最優(yōu)跟蹤控制律,并給出了加權(quán)矩陣的選擇方法,證明了通過(guò)該加權(quán)矩陣的選擇,一方面可以動(dòng)態(tài)解耦閉環(huán)系統(tǒng)并使其穩(wěn)定,另一方面可使閉環(huán)系統(tǒng)的狀態(tài)完全跟蹤參考輸入;最后進(jìn)行了仿真對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明與傳統(tǒng)的LQT 控制器相比,該方法無(wú)論在跟蹤誤差還是在系統(tǒng)的整體性能方面都具有一定的優(yōu)越性.
考慮如下離散時(shí)間線性多變量系統(tǒng):

式中,xk=[x1(k),x2(k),···,xn(k)]T∈Rn是系統(tǒng)的狀態(tài)向量,uk=[u1(k),u2(k),···,un(k)]T∈Rn是系統(tǒng)的控制輸入向量,A∈Rn×n和B∈Rn×n均為常值矩陣,并且B是可逆的.

式中,N為大于1 的正整數(shù),表示終端時(shí)刻,xN為終端時(shí)刻系統(tǒng)狀態(tài),xr,N為終端時(shí)刻參考輸入,ek=xr,k-xk為k時(shí)刻的跟蹤誤差,P和Q為半正定矩陣,R為正定矩陣.易知,最優(yōu)跟蹤控制律為[14]:

式中,Sk和Vk分別根據(jù)下式反向迭代求解:

將式(3)代入式(1),得到閉環(huán)系統(tǒng)方程:

由式(4)~(6)可以看出,即使加權(quán)矩陣P,Q和R都為對(duì)角矩陣,也難以保證從xr,k到xk的傳遞函數(shù)矩陣是對(duì)角的,也就是說(shuō)某一個(gè)參考輸入xri(k),i=1,···,n的變化會(huì)導(dǎo)致其他狀態(tài)xj(k)(j=1,···,n;ij)的變化.造成這種現(xiàn)象的原因是不同控制回路之間存在耦合.如果被控對(duì)象是線性多變量弱耦合系統(tǒng),可以采用分布式控制、模型預(yù)測(cè)控制等方法,然而如果被控對(duì)象是強(qiáng)耦合的,上述方法難以獲得良好的控制效果.
本文的目的是提出一種具有解耦性能的最優(yōu)跟蹤控制方法,針對(duì)已知的離散時(shí)間線性多變量系統(tǒng)(1),通過(guò)預(yù)先給定合適的對(duì)角半正定矩陣P,對(duì)角正定矩陣Λ1和Λ2,得到矩陣序列Sk和Vk以及對(duì)角半正定矩陣Q,設(shè)計(jì)最優(yōu)跟蹤控制器,使得閉環(huán)系統(tǒng)狀態(tài)xk能夠盡可能的跟蹤任意參考輸入xr,k的變化,同時(shí)盡可能減少不同控制回路之間的耦合影響,使閉環(huán)系統(tǒng)達(dá)到最優(yōu)性能.
為了實(shí)現(xiàn)解耦控制,首先令A(yù)1=diag{Aii},B1=diag{Bii},即A1和B1均為對(duì)角矩陣,其對(duì)角線元素分別等于A和B的主對(duì)角元素;令A(yù)2=A-A1,B2=B-B1,即A2和B2均為主對(duì)角元素為零的矩陣,于是如式(7)所示,將系統(tǒng)(1)分成2 個(gè)部分,第1 部分無(wú)耦合特性,第2 部分可視為所有耦合干擾:

受到二人零和博弈問(wèn)題的啟發(fā),將式(7)中的耦合干擾A2xk+B2uk看作可測(cè)干擾,引入如下考慮耦合影響的性能指標(biāo):

式中,zk=Wkxk+Xkuk作為可測(cè)干擾A2xk+B2uk的補(bǔ)償項(xiàng),P為半正定矩陣,Qk為時(shí)變半正定矩陣,Rk和Mk為時(shí)變對(duì)稱矩陣,Wk和Xk為時(shí)變加權(quán)矩陣.為了描述方便,在不引起混淆的情況下,后文將上述時(shí)變矩陣的下角標(biāo)k省略.
定理1.考慮由式(1)以及參考軌跡xr,k構(gòu)成的最優(yōu)跟蹤控制問(wèn)題.對(duì)任意的矩陣X和M,選擇加權(quán)對(duì)稱矩陣R滿足R-XTMX:=>0,則最小化式(8)的最優(yōu)跟蹤控制律為:

式中,Sk∈Rn×n和Vk∈Rn分別根據(jù)下式反向迭代求解:

證明.根據(jù)最小值原理,定義如下哈密頓函數(shù):

式中,λk+1∈Rn是拉格朗日乘子向量函數(shù).根據(jù)極值條件,求Hk對(duì)uk的一階偏導(dǎo)數(shù):

令?Hk/?uk=0,得到最優(yōu)跟蹤控制律:

根據(jù)式(12),得到狀態(tài)方程和協(xié)態(tài)方程分別為:

與文獻(xiàn)[14]類似,假設(shè):

將式(17)代入式(14),可得:


對(duì)式(19)進(jìn)行移項(xiàng)整理后即得到式(9).
將式(1)、式 (14)和式(17)同時(shí)代入式(16),得到:
利用待定系數(shù)法,對(duì)比式(20)與式(17),得到式(10)~(11)反向迭代方程.
在初始狀態(tài)x0已知的情況下,最優(yōu)跟蹤問(wèn)題的邊界條件為:

將式(21)與式(17)進(jìn)行對(duì)比,可得式(10)~(11)中的邊界條件. □
推論1.對(duì)任意對(duì)角正定矩陣Λ1,加權(quán)對(duì)稱矩陣R,以及任意可逆矩陣X,加權(quán)矩陣M和W按照式(22)~(23)選擇:

則對(duì)任意的對(duì)角正定矩陣Λ2,當(dāng)最優(yōu)跟蹤控制律為:

式中,矩陣Sk∈Rn×n滿足:

向量Vk∈Rn滿足:

加權(quán)矩陣P為對(duì)角半正定矩陣,加權(quán)對(duì)角矩陣Q滿足:

不僅能夠?qū)崿F(xiàn)閉環(huán)系統(tǒng)的解耦,而且使跟蹤誤差漸近收斂到零.
證明.觀察式(10),為了實(shí)現(xiàn)解耦控制,首先令:

根據(jù)式(28)和式(29),可得到式(22)和式(23).將式(22)~(23)代入式(10),得到:

令式(30)等號(hào)右邊后3 項(xiàng)之和等于任意的對(duì)角正定矩陣Λ2,即:

由于R為自由選擇參數(shù)矩陣,因此當(dāng)給定對(duì)角正定矩陣Λ1和Λ2以后,對(duì)任意對(duì)角半正定矩陣Q,總可以找到R使上式成立.將式(31)代入式(30)可得式(25),因此對(duì)任意對(duì)角正定矩陣Λ1和Λ2,都能保證Sk是對(duì)角矩陣.將式(22)~(23)分別代入式(9)和式(11),可得式(24)和式(26).
將式(24)代入式(1)中,得到閉環(huán)系統(tǒng)方程:

由于矩陣A1、Λ1、Λ2、Q和Sk都是對(duì)角矩陣,從式(25)~(26)不難發(fā)現(xiàn)閉環(huán)系統(tǒng)式(32)已經(jīng)實(shí)現(xiàn)了解耦.
將選擇對(duì)角半正定矩陣Q,使得系統(tǒng)在穩(wěn)態(tài)時(shí),從xr,k到xk的傳遞函數(shù)矩陣為單位陣,實(shí)現(xiàn)狀態(tài)完全跟蹤參考輸入.
將式(26)進(jìn)行z變換后,通過(guò)移項(xiàng)整理可得:

將式(33)代入式(32)后,再進(jìn)行z變換,移項(xiàng)整理可得:

由極值條件可知,對(duì)于階躍的參考輸入,穩(wěn)態(tài)時(shí)z→1,因此穩(wěn)態(tài)時(shí)要想保證從xr,k到xk的傳遞函數(shù)矩陣為單位陣,那么對(duì)角半正定矩陣Q需要滿足:

進(jìn)一步化簡(jiǎn)整理得到式(27).由式(27)易知,加權(quán)矩陣Q是對(duì)角的.下面證明由式(27)給出的對(duì)角矩陣Q是半正定矩陣.
由于式(27)中涉及到的矩陣Q、Λ1、A1和Sk+1都是對(duì)角矩陣,令Q=diag{Qii},Λ1=,A1=和Sk+1=.
下面針對(duì)2 種情況進(jìn)行討論:


式中,Qii一定大于等于零.若Qii<0,則有:

綜上所述,對(duì)于任意的正定對(duì)角矩陣Λ1和Λ2,由式(27)計(jì)算得到的加權(quán)矩陣Q總是對(duì)角半正定矩陣. □
注1.當(dāng)系統(tǒng)本身是解耦的(或耦合性較弱)時(shí),可以選擇矩陣X或者M(jìn)為零矩陣,此時(shí)具有解耦性能的最優(yōu)跟蹤控制器退化為傳統(tǒng)的LQT 控制器.
注2.本文方法中,矩陣P、Λ1和Λ2的選擇準(zhǔn)則與傳統(tǒng)的LQT 方法中P、R和Q的選擇準(zhǔn)則相同.也就是說(shuō),當(dāng)固定Λ1和Λ2時(shí),P越大系統(tǒng)末態(tài)跟蹤誤差越小;當(dāng)固定P和Λ1時(shí),Λ2越大系統(tǒng)跟蹤誤差越小;當(dāng)固定P和Λ2時(shí),Λ1越大系統(tǒng)控制能量消耗越小.
注3.當(dāng)矩陣B不是方陣時(shí),若對(duì)于離散時(shí)間線性多變量系統(tǒng):

當(dāng)矩陣CCT和CB為可逆矩陣時(shí),則上述系統(tǒng)可以轉(zhuǎn)化為:

此時(shí),該系統(tǒng)與式(1)具有相同的形式,采用本文所提方法,即可實(shí)現(xiàn)輸入到輸出之間的解耦.
注4.本文所研究的對(duì)象是確定的,當(dāng)系統(tǒng)參數(shù)存在匹配和不匹配不確定性時(shí),一方面可以借鑒補(bǔ)償控制的思想,將參數(shù)不確定性造成的影響視為一種干擾,通過(guò)干擾觀測(cè)器,神經(jīng)網(wǎng)絡(luò)或者模糊推理系統(tǒng)等對(duì)其進(jìn)行觀測(cè)或估計(jì),并在控制器中加入補(bǔ)償項(xiàng)予以消除,詳見(jiàn)附錄A;另一方面可以借鑒保性能控制的思想,設(shè)計(jì)具有解耦性能的保性能跟蹤控制器.
算法1.具有解耦性能的最優(yōu)跟蹤控制算法
步驟1.選擇加權(quán)矩陣P和Λi(i=1,2);
步驟2.根據(jù)式(25)計(jì)算得到Sk,將結(jié)果代入(27)式得到對(duì)角加權(quán)矩陣Q;
步驟3.根據(jù)式(26)計(jì)算Vk;
步驟4.將Sk和Vk序列,加權(quán)矩陣P和Λi(i=1,2)代入式(24)和式(32),得到系統(tǒng)的控制輸入和狀態(tài).
為了驗(yàn)證本文方法的有效性和優(yōu)越性,本節(jié)分別采用本文方法和傳統(tǒng)LQT 方法進(jìn)行對(duì)比仿真實(shí)驗(yàn),并對(duì)仿真結(jié)果進(jìn)行了比較和分析.在仿真過(guò)程中,采用相同的評(píng)估函數(shù)來(lái)比較2 種方法的最優(yōu)性能,
考慮如下兩輸入-兩狀態(tài)的離散時(shí)間線性系統(tǒng):

式中,xk=[x1(k),x2(k)]T是系統(tǒng)狀態(tài)向量,uk=[u1(k),u2(k)]T是控制輸入向量,對(duì)應(yīng)的系數(shù)矩陣和控制矩陣分別為:

易知該系統(tǒng)的相對(duì)增益矩陣為:

根據(jù)Bristol-Shinskey 衡量指標(biāo),可以判斷出該系統(tǒng)是一個(gè)強(qiáng)耦合系統(tǒng).
本實(shí)驗(yàn)的目的是針對(duì)離散時(shí)間線性系統(tǒng)(39),設(shè)計(jì)最優(yōu)跟蹤控制器,使得最大跟蹤誤差不超過(guò)參考輸入幅值的10%,其中參考輸入信號(hào)為xr,k=[xr1(k),xr2(k)]T=[2sgn(sink),2sgn(cosk)]T.
為了實(shí)現(xiàn)控制目標(biāo),首先選擇加權(quán)矩陣:

將上述加權(quán)矩陣代入式(25)和式(27),得到各時(shí)刻Sk和Q的值,然后將結(jié)果代入式(26)得到Vk,最后將結(jié)果代入式(24)和式(32),得到如圖1 和圖2 所示的狀態(tài)和控制輸入曲線.從圖1 可以看出,采用本文所提方法后,在實(shí)現(xiàn)了控制目標(biāo)的基礎(chǔ)上,不僅消除了不同控制回路之間的耦合影響,還使得系統(tǒng)在穩(wěn)態(tài)時(shí)能完全跟蹤參考輸入.

圖1 本文所提方法系統(tǒng)狀態(tài)輸出Fig.1 Output curves by using the method proposed in this paper
為了驗(yàn)證本文所提方法的優(yōu)越性,采用傳統(tǒng)LQT 方法,選擇兩組參數(shù)對(duì)式(39)進(jìn)行仿真實(shí)驗(yàn).令加權(quán)矩陣:

當(dāng)加權(quán)矩陣R=時(shí),得到如圖3 和圖4 所示的狀態(tài)和控制輸入曲線.結(jié)合圖1 和圖3可以看出,采用這組參數(shù)下的傳統(tǒng)LQT 方法,雖然實(shí)現(xiàn)了控制目標(biāo),但是當(dāng)某一參考輸入發(fā)生變化時(shí),其他回路狀態(tài)會(huì)受到較大的影響,而且系統(tǒng)達(dá)到穩(wěn)態(tài)后還會(huì)存在一定的跟蹤誤差.由圖2 和圖4 可以看出,傳統(tǒng)LQT 方法與本文所提方法相比,雖然控制輸入變化規(guī)律相同,但是在參考輸入發(fā)生變化時(shí),明顯需要更大的控制輸入.

圖2 本文所提方法控制輸入Fig.2 Input curves by using the method proposed in this paper

圖3 傳統(tǒng)LQT 方法系統(tǒng)狀態(tài)輸出Fig.3 Output curves by using the conventional LQT method
當(dāng)加權(quán)矩陣R=時(shí),得到如圖5 和圖6 所示的狀態(tài)和控制輸入曲線.從圖5 可以看出,采用這組參數(shù)下的傳統(tǒng)LQT 方法實(shí)現(xiàn)了控制目標(biāo),當(dāng)某一參考輸入變化時(shí),其他回路狀態(tài)不再受到影響,但是從圖4 和圖6 可以看出,在這組參數(shù)下的傳統(tǒng)LQT 控制器的控制輸入明顯增大.

圖4 傳統(tǒng)LQT 方法控制輸入Fig.4 Input curves by using the conventional LQT method

圖5 傳統(tǒng)LQT 方法系統(tǒng)狀態(tài)輸出Fig.5 Output curves by using the conventional LQT method

圖6 傳統(tǒng)LQT 方法控制輸入Fig.6 Input curves by using the conventional LQT method
為了比較2 種不同控制策略的最優(yōu)性能,定義如下評(píng)估函數(shù):

式中,σ=1 表示本文所提方法的最優(yōu)性能,σ=2表示傳統(tǒng)LQT 方法的最優(yōu)性能,之后繪制兩種方法的評(píng)估函數(shù)曲線.
當(dāng)采用第1 組參數(shù)下的傳統(tǒng)LQT 方法時(shí),得到如圖7 所示的最優(yōu)性能曲線.從圖7 可以看出,本文所提方法的最優(yōu)性能明顯小于傳統(tǒng)LQT 方法的最優(yōu)性能.由圖1~4 可以看出,對(duì)于傳統(tǒng)LQT方法即使付出了更大的控制輸入,當(dāng)某一參考輸入發(fā)生變化時(shí),其他回路狀態(tài)還是會(huì)受到較大的影響,系統(tǒng)達(dá)到穩(wěn)態(tài)時(shí)也不能實(shí)現(xiàn)完全跟蹤;本文所提方法通過(guò)選擇合適的加權(quán)矩陣,在較小的控制輸入下,不僅消除了系統(tǒng)不同控制回路之間的耦合作用,還使得系統(tǒng)狀態(tài)在穩(wěn)態(tài)時(shí)總能完全跟蹤參考輸入,故具有解耦性能的最優(yōu)跟蹤方法會(huì)得到更小的最優(yōu)性能.

圖7 第1 組參數(shù)下,2 種策略的最優(yōu)性能比較Fig.7 Comparison of the performance under the first set of parameters
當(dāng)采用第2 組參數(shù)下的傳統(tǒng)LQT 方法時(shí),得到如圖8 所示的最優(yōu)性能曲線.從圖8 可以看出,本文方法的最優(yōu)性能仍然小于傳統(tǒng)LQT 方法的最優(yōu)性能.由 圖1 和圖5 可以看出,雖然兩種控制策略的跟蹤效果相同,但由圖2 和圖6 可知,此時(shí)傳統(tǒng)LQT 方法需要更大的控制輸入,導(dǎo)致最優(yōu)性能變得更大.

圖8 第2 組參數(shù)下,2 種策略的最優(yōu)性能比較Fig.8 Comparison of the performance under the second set of parameters
針對(duì)一類具有強(qiáng)耦合特性的離散時(shí)間線性多變量系統(tǒng),本文提出了一種具有解耦性能的最優(yōu)跟蹤控制方法.該方法受到二人零和博弈思想的啟發(fā),設(shè)計(jì)了新的性能指標(biāo),并根據(jù)極小值原理最小化該性能指標(biāo),得到最優(yōu)跟蹤控制律.按照本文給出的加權(quán)矩陣選擇辦法,消除了不同控制回路之間的耦合影響,使得系統(tǒng)的狀態(tài)輸出可以跟蹤任意期望軌跡.仿真實(shí)驗(yàn)表明,當(dāng)離散時(shí)間線性多變量系統(tǒng)具有強(qiáng)耦合特性時(shí),該方法可以獲得更小的控制輸入和更小的最優(yōu)性能,并且系統(tǒng)達(dá)到穩(wěn)態(tài)時(shí),系統(tǒng)輸出總能完全跟蹤參考輸入.在接下來(lái)的研究中,將進(jìn)一步考慮系統(tǒng)模型部分未知的情況,將自適應(yīng)動(dòng)態(tài)規(guī)劃算法與本文解耦控制方法相結(jié)合,設(shè)計(jì)近似最優(yōu)跟蹤控制器,進(jìn)而實(shí)現(xiàn)具有模型不確定性和強(qiáng)耦合特性的線性多變量系統(tǒng)的最優(yōu)跟蹤控制.
附錄A 基于神經(jīng)網(wǎng)絡(luò)補(bǔ)償?shù)牟淮_定系統(tǒng)最優(yōu)跟蹤控制方法簡(jiǎn)述
考慮如下具有匹配和不匹配參數(shù)不確定性的離散時(shí)間非線性系統(tǒng)[20]:

式中,向量xk和uk以及矩陣A和B同式(1)所示;Bdm(xk,k)∈Rn表示系統(tǒng)中滿足匹配條件的不確定性,Cu(xk,k)∈Rn表示不滿足匹配條件的不確定性.
首先,根據(jù)式(A1)的線性標(biāo)稱系統(tǒng)(1)得到具有解耦性能的無(wú)干擾最優(yōu)跟蹤控制器,即式(24),并假設(shè)該控制器能保證與式(A1)組成的閉環(huán)系統(tǒng)的輸入和狀態(tài)信號(hào)有界.令:

則式(24)簡(jiǎn)化為:

其次,將式(A1)中匹配不確定性項(xiàng)和不匹配不確定性項(xiàng)統(tǒng)一看做線性標(biāo)稱系統(tǒng)的不確定性項(xiàng),即令:

則式(A1)簡(jiǎn)化為:

最后,設(shè)計(jì)如下基于神經(jīng)網(wǎng)絡(luò)補(bǔ)償?shù)淖顑?yōu)跟蹤控制器:

為驗(yàn)證所提控制器(A7)的有效性,本文進(jìn)行了仿真實(shí)驗(yàn).考慮如下存在匹配和不匹配參數(shù)不確定性的離散時(shí)間非線性系統(tǒng):

式中,向量xk和uk以及矩陣A和B同式(39)所示;

首先,根據(jù)式(A2)和式(A3)計(jì)算K1和K2,得到具有解耦性能的無(wú)干擾最優(yōu)跟蹤控制器式(A4),將其作用到式(A8),從而得到神經(jīng)網(wǎng)絡(luò)訓(xùn)練所需的輸入數(shù)據(jù)和導(dǎo)師信號(hào).本次仿真實(shí)驗(yàn)中,神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)Xk=[Z1,Z2,···,Z2499],其中Zi=;導(dǎo)師信號(hào)Dk=[E1,E2,···,E2499],其中Ei=xi+1-Axi-Bui,i=1,2,···,2 499.然后,選擇分別具有45 個(gè)和10 個(gè)隱層節(jié)點(diǎn)的雙隱層前饋神經(jīng)網(wǎng)絡(luò)對(duì)不確定項(xiàng)進(jìn)行估計(jì),其中節(jié)點(diǎn)傳遞函數(shù)為雙曲正切函數(shù)tansig,權(quán)值更新算法為Polak-Ribiere 修正算法.圖A1 為采用所提出的基于神經(jīng)網(wǎng)絡(luò)補(bǔ)償?shù)淖顑?yōu)跟蹤控制方法的狀態(tài)跟蹤曲線,由圖A1 可以看出,該方法不僅消除不同控制回路之間的耦合影響,而且消除了不確定項(xiàng)對(duì)閉環(huán)系統(tǒng)的影響,使得閉環(huán)系統(tǒng)的狀態(tài)能夠完全跟蹤參考輸入的變化.

圖A1 基于神經(jīng)網(wǎng)絡(luò)補(bǔ)償?shù)牟淮_定性系統(tǒng)狀態(tài)跟蹤曲線Fig.A1 Tracking curve of uncertain system based on neural network compensation