毛艷嶺 富 月
實際工業過程的被控對象大多是非線性的,比如電镕鎂砂熔煉過程的電極、鋼球磨煤機制粉過程的磨機等等.非線性系統結構復雜,往往難以得到精確的數學模型,其控制問題一直是控制領域相關學者和工程師的研究難點和熱點之一.
經典的非線性控制方法,如反饋線性化方法[1-2],由于需要已知精確的數學模型,無法應用到實際的工業過程中.為了解決這個問題,文獻[3]針對具有全狀態約束的高階非線性隨機系統,利用模糊邏輯系統逼近未知非線性函數,提出了一種新的模糊自適應反步控制方法.文獻[4]在文獻[3]的基礎上,針對具有指數型性能函數的高階非線性隨機系統,提出了基于模糊邏輯系統和反步法的模糊自適應有限時間跟蹤控制方法.當被控對象的非線性較弱或在某一平衡點附近運行時,通常采用近似線性模型進行描述,并針對該模型設計控制器.例如,文獻[5]利用遞歸近似理論,將非線性系統看作線性時變序列系統的極限,針對線性時變序列系統設計線性二次最優序列控制器,從而實現原非線性系統的二次最優控制.文獻[6]利用泰勒公式將非線性系統在某一平衡點附近表示為線性模型與高階非線性項的組合,將開環解耦補償器、非線性神經網絡補償器和一步超前最優加權自適應控制器結合,提出了非線性系統基于神經網絡的自適應動態解耦控制方法.文獻[7]考慮到模型階次的不匹配問題,通過引入降階模型,采用帶死區的歸一化投影算法對線性模型參數進行辨識,利用高階神經網絡估計高階非線性項,將帶有濾波器的極點配置自適應比例積分微分(Proportional integral derivative)控制器與神經網絡補償器相結合,提出了非線性系統基于神經網絡的自適應PID 控制方法.神經網絡收斂速度較慢且容易陷入局部極小點,高階非線性項的估計精確度較低.為了解決這一問題,文獻[8]首次引入了控制器驅動模型和虛擬未建模動態的概念,基于線性控制器驅動模型構造一步超前最優自適應控制器,結合虛擬未建模動態補償器,提出了非線性系統自適應切換控制方法.文獻[9]針對復雜的熱交換過程,設計了具有虛擬未建模動態補償的一步最優比例積分(Proportional integral)控制器,并提出了數據驅動的雙速率控制方法.上述控制方法雖然能夠取得良好的控制效果,但是當系統的非線性較強或平衡點發生變化時,這種只考慮單一平衡點的控制方法往往會使控制性能下降甚至導致整個系統失穩.
很多實際工業過程的平衡點都會隨著工況的不同而發生變化,比如電熔鎂砂熔煉過程的平衡點隨著原料成分和加料階段的不同會發生變化;鋼球磨煤機制粉系統中磨機的平衡點隨著原煤成分和濕度的不同而發生變化.本文針對一類具有M個平衡點的非線性系統,研究基于多模型切換的自適應控制方法.多模型自適應控制方法一般用于改善系統的暫態性能或解決參數跳變系統的控制問題,如文獻[10]針對一類連續時間線性系統,為改善系統的暫態性能,提出了基于直接模型參考自適應控制的多模型切換控制方法.文獻[11]針對一類參數跳變離散時間線性系統,提出了基于間接自校正控制的多模型切換控制方法.文獻[12]針對一類參數跳變離散時間非線性系統,通過引入k-差分算子,分別設計了線性自適應控制器和基于神經網絡的非線性自適應控制器,通過兩個控制器之間的切換,可以提高系統的性能和穩定性.為了避免不良切換行為,文獻[13]采用滯后切換邏輯消除了參數估計器對初始條件的依賴,通過利用魯棒線性時不變工具實現高性能的控制目標,結合控制器混合策略,提出了多模型自適應混合控制方法.針對文獻[13]所提方法需要模型數量大的問題,文獻[14]采用分離處理原則,充分利用所有辨識模型信息,采用二級自適應方法建立自適應控制器.為了消除系統非線性項對控制輸入應嚴格線性的限制,文獻[15]針對離散時間非線性系統,采用極點配置控制方法,提出了由線性間接自校正控制器、基于神經網絡的非線性間接自校正控制器和切換機制組成的多模型自適應控制器.很多研究將多模型自適應控制方法應用到實際系統中,并且取得了較好的控制效果.文獻[16]將多模型自適應切換控制方法應用于電力系統低頻振蕩中,建立了不同工況下的線性小信號模型,采用遞歸貝葉斯方法計算每個模型代表實際電力系統的概率,根據這個概率得到每個控制器輸出的占比權重,最終的控制輸出即為每個控制器輸出的概率加權平均值.文獻[17]針對動態特性隨不同負載狀態而變化的柔性傳送系統,分別在不同負載狀態處建立線性模型,提出了基于閉環輸出誤差最小化的參數估計算法和基于極點配置的多模型自適應切換控制方法.文獻[18]以鋼球磨煤機制粉系統為例,針對一類具有多變量強耦合強非線性且動態特性隨不同運行條件而變化的復雜工業過程,將其在不同平衡點處用不同的線性模型和非線性未建模動態項組成的估計模型來描述,提出了由非線性解耦控制器、線性解耦控制器和多模型切換機制組成的智能解耦控制方法.文獻[19]針對串聯電容補償輸電線路的風力系統次同步諧振問題,采用傳統線性控制方法設計控制器,根據系統條件設計該控制器的監控控制器,該方法之后被拓展到了雙饋異步發電機在串聯補償輸電系統中的次同步振蕩問題[20].上述多模型控制方法中,用于切換的控制器是針對單一時刻的性能指標設計的,具有次優性,無法保證切換序列和控制系統的最優性.
在實際工業生產過程中,保證控制系統性能最優對實現工業過程整體優化控制是至關重要的.本文針對具有未知動態和M個平衡點的連續時間非線性系統,將嵌入轉換法和近似動態規劃技術相結合,提出了一種自適應最優切換控制方法,一方面能夠保證切換序列的最優性,另一方面可以實現控制系統的最優性能,改善控制系統的動態品質.首先在非線性系統的M個平衡點附近采集M組輸入和狀態數據,利用黎卡提方程的迭代求解公式和最小二乘方法得到針對每個線性模型的最優控制器增益的估計,利用極小值原理得到M個近似線性化模型.然后利用嵌入轉換法將M個近似線性化模型嵌入到一個連續時間大系統中,通過二次規劃技術得到非線性系統的線性自適應最優切換控制器和最優切換序列.最后,將線性自適應最優切換控制器和未建模動態補償器相結合,實現了控制目標.仿真實驗驗證了本文所提方法的有效性、優越性和實際可應用性.
本文針對具有未知動態和M個平衡點的連續時間非線性系統,提出了自適應最優切換控制方法.主要創新點如下:
1)提出了由線性最優切換控制器、切換準則和未建模動態補償器組成的控制器結構;
2)模型參數已知時,基于嵌入轉換技術提出了由M個模型、M個最優控制器和切換準則組成的線性最優切換控制器;
3)模型參數未知時,基于嵌入轉換技術和近似動態規劃思想提出了由M個近似線性化模型、M個自適應最優控制器和切換準則組成的線性自適應最優切換控制器.
考慮由如下模型描述的具有M個平衡點的連續時間非線性非仿射系統:
其中x(t)=[x1(t),x2(t),···,xn(t)]T是n維狀態向量,u(t)=[u1(t),u2(t),···,um(t)]T是m維控制輸入向量,f(x(t),u(t))=[f1(·,·),f2(·,·),···,fn(·,·)]T:Rn×Rm →Rn表示連續可微的未知非線性向量函數.
本文的目標是針對具有M個平衡點的未知非線性系統(1),尋找最優切換序列和自適應最優切換控制律u(t),使得閉環系統漸近穩定.
非線性非仿射系統結構復雜,很難直接根據它的模型設計控制器.通常的做法是將非線性系統在某一平衡點附近線性化,針對等價的近似線性模型設計控制器,從而實現對原非線性系統的有效控制,如文獻[4-5]等.為此本文將非線性系統(1)在M個平衡點附近泰勒展開,得到第i∈{1,2,···,M}個平衡點(xi,ui)附近的等價近似線性模型:
其中b是整數,則系統(1)可表示為
其中σ(t)∈{1,2,···,M}表示切換信號.與此同時,本文所提出的控制器結構也包括兩部分,第一部分根據基于線性化模型建立的如下控制器設計模型進行設計:
第二部分根據線性化產生的建模誤差來設計,用于消除未建模動態影響,實現閉環系統漸近穩定.在不引起混淆的情況下,接下來我們將簡化為.
當Ai和Bi(i=1,···,M)已知時,我們提出了如圖1 所示的由線性最優切換控制器、切換準則、未建模動態補償器以及非線性系統組成的控制系統結構,其中線性最優切換控制器和切換準則根據控制器設計模型(4),利用嵌入轉換法[21]、極小值原理和二次規劃方法獲得;未建模動態補償器根據非線性系統狀態和最優模型狀態之間的誤差設計.

圖1 Ai和Bi已知時的控制系統結構Fig.1 Control system structure whenAiandBiare known
首先令δ(σ(t)-i)在區間[0,1]內連續變化,利用嵌入轉換法將式(4)嵌入到一個連續時間大系統中.然后根據該嵌入式連續時間大系統的最優控制問題:
其中δ(σ(t)-i)∈[0,1],Q、R為適當維數的參數矩陣且可觀,采用極小值原理和二次規劃方法得到切換準則函數:
其中Pσ(t)根據如下黎卡提方程求解:
每一時刻,比較Jσ(t),選擇與最小的Jσ(t)對應的線性最優切換控制律:
其中σ(t)為最優切換序列,Kσ(t)表示線性最優切換控制器的增益,通過下式求解:
接下來,為消除未建模動態對控制系統性能的影響,我們設計了如下未建模動態補償器:
其中a1∈Rm×n為可調參數矩陣,a2為可調參數,em=x-x*為建模誤差,x*為最優線性化模型σ(t)的狀態.
綜上,Ai和Bi(i=1,···,M)已知時最優切換控制律為:
注 1.線性最優切換控制律和最優切換序列推導過程見附錄A.
注 2.針對控制器設計模型(4),通過嵌入擴大δ(σ(t)-i)的取值范圍,令δ(σ(t)-i)在區間[0,1]內連續變化,將由多個近似線性模型組成的式(4)嵌入到一個連續時間大系統中;通過轉換將針對控制器設計模型(4)的最優切換控制問題轉化為針對該嵌入式連續時間大系統的最優切換控制問題.
當Ai和Bi(i=1,···,M)未知時,無法通過式(7)得到Pσ(t),無法得到如式(6)所示的切換準則函數和式(8)所示的線性最優切換控制律.為解決這一問題,本文提出了一種自適應最優切換控制方法.首先在非線性系統的M個平衡點附近采集M組輸入、狀態數據,利用黎卡提方程的迭代求解公式和最小二乘算法得到針對線性化模型σ(t)的自適應最優控制器增益以及黎卡提方程近似解,并根據貝爾曼方程得到Pσ(t)Aσ(t)的估計,從而得到M個平衡點附近的M個線性化模型;然后將M個線性化模型嵌入到一個連續時間大系統中,針對該嵌入式連續時間大系統基于極小值原理和二次規劃技術設計線性二次型最優控制律,進而得到最優切換序列和線性自適應最優切換控制律;最后將線性自適應最優切換控制律和未建模動態補償器相結合應用到非線性系統中,實現對未知動態非線性系統的自適應最優切換控制.
針對控制器設計模型(4),當Ai和Bi(i=1,···,M)已知時,根據Kleinman 定理[22],很容易得到如下推論:
推論 1.令Kσ(t),0∈Rm×n為針對線性化模型σ(t)的穩定反饋控制器增益矩陣,Pσ(t),k為下面李雅普諾夫方程的對稱正定解:
其中δ(σ(t)-i)∈{0,1}且,k=1,2,···表示迭代次數,Kσ(t),k滿足
則Kσ(t),k和Pσ(t),k分別收斂于針對線性化模型σ(t)的最優控制器增益Kσ(t)和黎卡提方程解Pσ(t),即
定理 1.針對控制器設計模型(4),當Ai和Bi(i=1,···,M)未知時,使性能指標
最小的切換準則函數為:
其中Θσ(t),和Ξσ(t)的定義見后文,vec(C)是把m×n維矩陣C按列的順序一列接一列地組成的mn維向量,?代表克羅內克積,
線性自適應最優切換控制律為:
其中σ(t)為與最小的Jσ(t)對應的最優切換序列.
證明.首先根據離線采集的M組輸入、狀態數據,計算針對線性化模型σ(t)的自適應最優控制器增益以及黎卡提方程近似解.受文獻[23]啟發,將式(4)等價表示為:
其中Aσ(t),k=Aσ(t)-Bσ(t)Kσ(t),k.根據式(12)和式(13),沿著式(20)的解,可以得到
由克羅內克積的定義,可知
其中,In表示n維單位矩陣.定義如下運算
對于正整數l,定義矩陣
其中0≤t0<t1<···<tl.由式(22)和式(23)可知,式(21)可等價表示為:
當Θσ(t),k為列滿秩矩陣時,
由此,可以得到線性化模型σ(t)第k次迭代的自適應最優控制器增益Kσ(t),k+1.
接下來,針對線性化模型σ(t)求解矩陣Pσ(t)Bσ(t)和Pσ(t)Aσ(t)的估計,從而得到M個平衡點附近的M個線性化模型.當Ai和Bi已知時,易知
因此,Ai和Bi未知時,若記Lσ(t)為Pσ(t)Bσ(t)的估計,則
Pσ(t)Aσ(t)的估計可根據線性化模型σ(t)的貝爾曼方程得到,易知
將式(27)代入上式,利用離線采集的第σ(t)組輸入、狀態數據,通過求取最小二乘解可以得到如式(18)所示的矩陣Pσ(t)Aσ(t)的估計Nσ(t).根據Dσ(t),Nσ(t)以及,可以很容易得到M個平衡點附近的近似控制器設計模型:
最后求取最優切換序列和線性自適應最優切換控制律.針對模型(29),應用嵌入變換法,使δ(σ(t)-i)在[0,1]內連續變化,為此令δ(t)=[δ(σ(t)-1),···,δ(σ(t)-M)]T并記1,δ(σ(t)-i)≥0}.定義哈密頓函數:
易知,針對嵌入式近似控制器設計模型的最優控制律為:
將式(31)代入式(30),化簡可得
下面將δ(σ(t)-i)作為決策變量,通過最小化H(x,δ),可以得到最優切換序列.
實際上,選擇δ(σ(t)-i)使H(x,δ)最小等價為使式(33)最小
這是一個二次規劃問題,由于W是凸集,是凹函數,該問題的全局極小值一定在δ(σ(t)-i)∈{0,1}取得[21],且該全局極小值對應的σ(t)即為最優切換序列.由此可以得到如式(16)的切換準則函數和式(19)的線性自適應最優切換控制律.
注3.由式(27)可知Lσ(t)的估計精度由的估計精度決定.由文獻[23]易知,收斂于參數已知時的最優控制器增益Kσ(t),因此Lσ(t)收斂于Pσ(t)Bσ(t).由式(28)可知Nσ(t)的估計精度由最小二乘估計算法的精度和的估計精度共同決定.
注4.在每個平衡點附近,如果存在正整數l0,使得對于任意l≥l0,都有mn,即矩陣Θσ(t),k是滿秩的,那么序列和分別收斂到黎卡提方程的解Pσ(t)和最優控制器增益Kσ(t)[23].
未建模動態補償器的設計與線性模型參數已知時的情況類似,即
其中a1∈Rm×n為可調參數矩陣,a2為可調參數,為建模誤差,為最優線性化模型σ(t)的狀態.
綜上,Ai和Bi(i=1,···,M)未知時自適應最優切換控制律為:
自適應最優切換控制器設計流程如圖2 所示.

圖2 自適應最優切換控制器設計算法流程Fig.2 Flow chart of adaptive optimal switching control algorithm
為了驗證本文所提方法的有效性,我們分別進行了模型參數已知時最優切換控制和模型參數未知時自適應最優切換控制的數值仿真實驗,并分別與單一的針對一個模型的最優控制器和自適應最優控制器進行了對比.除此之外,為了驗證本文所提方法的實際可應用性,我們進行了模型參數未知時雙容水箱液位系統的自適應最優切換控制仿真實驗.
考慮如下連續時間非線性系統:
其中x=[x1,x2]T∈R2是狀態向量,u=[u1,u2]T∈R2是輸入向量.
我們的目標是針對已知的非線性系統(36),尋找最優切換序列和最優切換控制律,使得閉環系統漸近穩定.為此,首先分別將u=[u1,u2]T=[-3,10]T,[-2,10]T和[-1,10]T施加到非線性系統(36)上,并令得到非線性系統(36)的三個平衡點,即 [ur1,ur2,xr1,xr2]T=[-3,10,-4.4685,0.5592]T,[-2,10,-4.2642,0.7565]T和 [-1,10,-4.0264,1.1119]T.將式(36)分別在上述三個平衡點處泰勒展開,并令δ(σ(t)-i)∈{0,1}且i)=1,可以得到非線性系統(36)在3 個平衡點附近的控制器設計模型:
其中
接下來給定隨機初始狀態x(0)=[x1(0),x2(0)]T=[-4.4685,0.5592]T,并選擇控制器參數矩陣
和未建模動態補償器參數
最后將最優切換控制器(6)~(11)加入到系統(36),得到如圖3 所示的狀態曲線,如圖4 所示的控制輸入曲線和如圖5 所示的最優切換序列.結合圖3和圖4,在t=50 s和t=100 s時,雖然系統的平衡點發生變化,但是采用本文提出的最優切換控制方法仍能夠將狀態很快調節到平衡點附近并保持不變.

圖3 采用最優切換控制器時系統的狀態Fig.3 State curves of the system when using the optimal switching controller

圖4 采用最優切換控制器時系統的控制輸入Fig.4 Input curves of the system when using the optimal switching controller

圖5 采用最優切換控制器時系統的最優切換序列Fig.5 Optimal switching sequence of the system when using the optimal switching controller
為了驗證本文所提最優切換控制方法的優越性,我們與單一的針對一個模型的最優控制方法進行了對比實驗.以針對平衡點[ur1,ur2,xr1,xr2]T=[-1,10,-4.0264,1.1119]T處的線性化模型為例,給定初始狀態x(0)=[x1(0),x2(0)]T=[-4.4685,0.5592]T,選擇控制器參數矩陣如式(38)所示,未建模動態補償器參數如式(39)所示.
圖6和圖7 分別為所得到的狀態曲線和控制輸入曲線.根據圖6 和圖7 可以看出,針對平衡點[ur1,ur2,xr1,xr2]T=[-1,10,-4.0264,1.1119]T處的線性化模型設計的控制器只能將狀態調節到對應的平衡點附近.當平衡點發生變化時,系統的狀態存在穩態誤差.但是由于平衡點的變化引起的建模誤差可近似為常數,因此狀態曲線雖然偏離平衡點但恒定不變.

圖6 采用最優控制器時系統的狀態Fig.6 State curves of the system when using the optimal controller

圖7 采用最優控制器時系統的控制輸入Fig.7 Input curves of the system when using the optimal controller
本節的目標是針對未知非線性系統(36),尋找最優切換序列和自適應最優切換控制律,使得閉環系統漸近穩定.不失一般性,這里我們以兩個平衡點為例進行仿真實驗.結合圖2,首先分別在平衡點[ur1,ur2,xr1,xr2]T=[-2,10,-4.2642,0.7565]T和[ur1,ur2,xr1,xr2]T=[2,10,-2.5517,3.6570]T附近施加激勵輸入信號,即[u1,u2]T=[sin(0.1t),sin(0.5t)]T,從t=0 s到t=2 s,以0.01 s 為采樣周期,分別采集201 組輸入和狀態數據,計算δxx,Ixx,Ixu.選擇控制器參數矩陣
終止循環的條件為||Pσ(t),k-Pσ(t),k-1||≤10-3,其中σ(t)=1,2;k代表迭代次數.根據式(17)分別得到針對兩個模型的,即:
然后利用所采集的輸入和狀態數據求解式(18),分別得到針對兩個模型的Nσ(t),即:
最后,根據式(29)可以得到兩個線性化模型如下式所示:
將兩個線性化模型嵌入到一個連續時間大系統中,結合圖2,給定初始狀態x(0)=[x1(0),x2(0)]T=[-4,0]T和初始時間t0=0 s,設置tmax=100 s,選擇未建模動態補償器參數
將自適應最優切換控制器(35)加入到非線性系統,當滿足t≥tmax時,可以得到如圖8 所示的狀態曲線,如圖9 所示的控制輸入曲線和如圖10 所示的切換序列.在t=50 s,由于平衡點突變,切換序列發生改變,導致系統的狀態震蕩,經過1.8 s 的調節時間,系統的狀態被調節到平衡點附近并保持不變.

圖8 采用自適應最優切換控制器時系統的狀態Fig.8 The state curves of the system when using the adaptive optimal switching controller

圖9 采用自適應最優切換控制器時系統的控制輸入Fig.9 The input curves of the system when using the adaptive optimal switching controller

圖10 采用自適應最優切換控制器時系統的切換序列Fig.10 The switching sequence of the system when using the adaptive optimal switching controller
為了驗證本文所提自適應最優切換控制方法的優越性,我們以平衡點[ur1,ur2,xr1,xr2]T=[-2,10,-4.2642,0.7565]T為例,與單一的針對一個模型的自適應最優控制方法進行了對比實驗.選擇控制器參數矩陣如式(40),根據式(17)和式(18)可以得到和N1分別如式(41)和式(42)所示,根據式(29)可以得到線性化模型如式(43)所示,選擇未建模動態補償器參數如式(44)所示.所得到的狀態曲線和控制輸入曲線如圖11 和圖12 所示.從圖11 和圖12 可以看出,針對平衡點[ur1,ur2,xr1,xr2]T=[-2,10,-4.2642,0.7565]T設計的自適應最優控制器只能將狀態調節到對應的平衡點附近.與模型參數已知時情況相同,當t=50 s時,平衡點發生變化,系統狀態存在穩態誤差.但是由于平衡點的變化引起的建模誤差可近似為常數,因此狀態曲線雖然偏離平衡點但恒定不變.

圖11 采用自適應最優控制器時系統的狀態Fig.11 State curves of the system when using the adaptive optimal controller

圖12 采用自適應最優控制器時系統的控制輸入Fig.12 Input curves of the system when using the adaptive optimal controller
為了進一步驗證所提方法的實際可應用性,接下來針對如圖13 所示的雙容水箱液位系統進行仿真實驗[24].它主要由水池、水泵1、水泵2、水罐1 和水罐2 及兩個液位傳感器組成.水泵1 和水泵2 分別將水池中的水經過橡膠管抽取到水罐1 和水罐2 中,兩個水罐底部存在漏水孔,水罐1 中的水經過漏水孔流入水罐2,水罐2 中的水經過漏水孔流入水池,形成閉環.

圖13 雙容水箱結構Fig.13 Structure of the coupled-tank
根據物料平衡原理,建立雙容水箱液位系統的機理模型:
其中x1和x2分別表示水罐1 和水罐2 的液位,u1和u2分別表示水泵1 和水泵2 的電壓,Kp1、Kp2、Ao1、Ao2、At1、At2和g的含義及取值如表1 所示.

表1 模型中涉及的符號含義及取值Table 1 The symbol meaning and value involved in the model
我們的目標是針對雙容水箱液位系統(45),尋找最優切換序列和自適應最優切換控制律,使系統的液位漸近穩定.為此,首先分別將u=[u1,u2]T=[6.5,4]T和[8,4]T施加到雙容水箱液位系統(45)上,并令得到雙容水箱液位系統(45)的兩個平衡點,即[6.5,4,14.17,25.2]T和[8,4,11.2,21.17]T.結合圖2,分別在兩個平衡點附近施加激勵輸入信號,即[u1,u2]T=[sin(0.1t),sin(0.5t)]T,從t=0 s到t=2 s,以0.01 s 為采樣周期,分別采集201 組輸入和狀態數據,計算δxx,Ixx,Ixu.選擇控制器參數矩陣
終止循環的條件為||Pσ(t),k-Pσ(t),k-1||≤10-3,其中σ(t)=1,2;k代表迭代次數.根據式(17)分別得到針對兩個模型的,即:
然后利用所采集的輸入和狀態數據求解式(18),分別得到針對兩個模型的Nσ(t),即:
最后,根據式(29)可以得到兩個近似線性化模型如下式所示:
將兩個近似線性化模型嵌入到一個連續時間大系統中,結合圖2,給定初始狀態x(0)=[x1(0),x2(0)]T=[0,0]T和初始時間t0=0 s,設置tmax=160 s和輸入電壓限幅為0~22 V,選擇未建模動態補償器參數
當t=80 s時,將自適應最優切換控制器(35)加入到雙容水箱液位系統,當滿足t≥tmax時,可以得到如圖14 所示的液位曲線,如圖15 所示的控制輸入曲線和如圖16 所示的切換序列.在t=120 s,平衡點突變,經過2.1 s 的調節時間,系統的液位被調節到平衡點附近并保持不變.

圖14 采用自適應最優切換控制器時水箱的液位Fig.14 Levels of the coupled-tank when using the adaptive optimal switching controller

圖15 采用自適應最優切換控制器時水箱的控制輸入Fig.15 Input curves of the coupled-tank when using the adaptive optimal switching controller

圖16 采用自適應最優切換控制器時水箱的切換序列Fig.16 Switching sequence of the coupled-tank when using the adaptive optimal switching controller
為了驗證本文所提自適應最優切換控制方法的優越性,我們以平衡點[6.5,4,14.17,25.2]T為例,與單一的針對一個模型的自適應最優控制方法進行了對比實驗.選擇控制器參數矩陣如式(46)所示.根據式(17)和式(18)可以得到和N1分別如式(47)和式(48)所示.根據式(29)可以得到線性化模型如式(49)所示.選擇未建模動態補償器參數如式(50)所示.可以得到如圖17 所示的液位曲線和如圖18 所示的控制輸入曲線.根據圖17 和圖18可以看出,針對平衡點[6.5,4,14.17,25.2]T設計的自適應最優控制器只能將液位調節到對應的平衡點附近.當t=120 s時,平衡點發生變化,系統液位存在穩態誤差.

圖17 采用自適應最優控制器時水箱的液位Fig.17 Levels of the coupled-tank when using the adaptive optimal controller

圖18 采用自適應最優控制器時水箱的控制輸入Fig.18 Input curves of the coupled-tank when using the adaptive optimal controller
針對具有未知動態和M個平衡點的連續時間非線性系統,本文提出了一種自適應最優切換控制方法.該方法首先在非線性系統的M個平衡點附近采集狀態信息和輸入信息,利用最小二乘法和黎卡提方程迭代求解公式得到最優控制器增益的估計,利用極小值原理得到M個平衡點附近的線性化模型.然后將嵌入轉換法和近似動態規劃方法相結合,得到了非線性系統的最優切換序列和線性自適應最優切換控制器.最后,將線性自適應最優切換控制器和未建模動態補償器相結合,實現了對非線性系統的最優控制.仿真實驗表明和單一的最優控制方法相比,本文所提方法能夠實現較好的控制效果且具有實際可應用性.
附錄A 參數已知時的線性最優切換控制律和最優切換序列推導過程
令δ(t)=[δ(σ(t)-1),···,δ(σ(t)-M)]T,并記.針對控制器設計模型(4)的嵌入式模型:
其中δ(σ(t)-i)∈[0,1],定義哈密頓函數:
則協態方程為
把式(A4)代入式(A2)可以得到
接下來,我們將問題轉化為如何選擇δ(σ(t)-i)使H最小.易知,選擇δ(σ(t)-i)使H最小可簡化為使下式最小:
它可看作是一個二次規劃問題:
其中G(t)=λT(t)Bσ(t)R-1BσT(t)λ(t),W={δ∈RM:為凸集.當R為正定矩陣時,-G(t)≤0,因此問題式(A7)可看作凹函數在凸集W上的最小化問題,H0的全局最小值一定在δ(σ(t)-i)∈{0,1}取得[21].根據式(A6),選擇切換準則函數:
其中Pσ(t)為對稱實矩陣.對式(A9)兩邊分別求導并整理得
將式(A3)和式(A10)對比,可以得到
式(A9)分別代入式(A8)和式(A4)可以得到:
由于δ(σ(t)-i)∈{0,1},結合式(A12)和式(A11),可以得到切換準則函數:
其中Pσ(t)根據黎卡提方程求解:
每一時刻,計算并比較Jσ(t),求出最小的Jσ(t)對應的線性最優切換控制律:
其中σ(t)表示最優切換序列,Kσ(t)表示線性最優切換控制器的增益,通過下式求解: