蔣思中, 王改云
(桂林電子科技大學計算機與控制學院,廣西 桂林 541004)
2-D系統理論及分析方法始于20世紀70年代,其中Roesser模型是最常見也最有代表性的模型。迭代學習控制[1-2]包含了兩個獨立的過程,即時間過程和迭代過程。傳統迭代學習控制[3-4]的主要缺點是難以找到一個數學模型同時表達控制系統在時域的動態特性和在空間的迭代學習過程。而在2-D系統中有兩個相互獨立的動態過程,可用其一反映迭代學習控制在時域內系統動態特性,用另一過程反映系統的迭代學習過程,因此2-D系統模型能成為良好的反映迭代學習控制的一種數學模型。國外學者Kurek與Tommy等人[5-6]提出將2-D系統理論用于迭代學習控制,但僅限于對開環迭代學習控制的應用,而迭代學習控制可分為單純的開環﹑閉環[7]及開閉環[8-9]。其中開閉環迭代學習控制能同時利用系統前次運行和當前運行的信息,因而性能優于單純的開環或閉環迭代學習控制。本文利用2-D系統理論,用開閉環迭代學習控制方法討論了線性連續系統的迭代學習控制及其收斂性。
系統的動態過程依賴于兩個獨立的變量則系統稱之為2-D系統,它廣泛用于系統科學及圖像處理等領域。在2-D系統中,若動態過程所依賴的兩個變量一個是連續的,另一個是離散的,則稱之為2-D連續—離散系統?,F在考慮下面的線性連續控制系統:

式中:x(t)∈Rn為狀態向量;u(t)∈Rm為輸入變量;y(t)∈Rp為輸出變量;A,B,C為適當維數的實矩陣;邊界條件為x(0)=x0。
迭代學習控制可以描述如下:對給定的系統(1),并且邊界條件為x(0)=x0,找到一個理想的控制輸入{u(t),0≤t≤T},從而使得系統輸出跟蹤期望輸出yr(t)∈Rp,且滿足

式中:∈為系統允許誤差。
對系統(1)采用如下的開閉環迭代學習控制律

式中:t為連續時間變量;k為迭代次數離散變量;uk+1(t)為本次控制的輸入量;uk(t)為前一次控制的輸入量;Δuk(t)為對前一次控制的修正量;Δuk+1(t)為對本次控制的修正量。迭代學習控制的目的就是在不斷對控制輸入進行修正的情況下,使系統的輸出逐漸接近期望值。
由式(3)可知,線性連續系統(1)的迭代學習控制依賴于兩個獨立的動態過程,一個是連續時間動態過程,一個是迭代學習動態過程,若分別用兩個變量t和k來表示這兩個動態過程,則式(1)和式(3)可表示為

邊界條件為 x(0,k)=x0,k=0,1,2,…,N;u(t,0)=u0(t),0≤t≤T,初始輸入可以任選,通常選擇零初始輸入。經過若干次迭代后,系統(4)應滿足‖e(t,k)‖ < ε,t∈[0,T],e(t,k)=yr(t)- y(t,k),式(4)即為線性連續系統開閉環迭代學習的2-D描述。
對于系統(4),可以推導其學習律,令:

假設yr(t)是可微的,采用如下的D型開閉環迭代學習律:

這里K1,K2待定,還涉及到e(t,k+1)的預測問題。
式(5)~式(8)聯立可得出D型開閉環迭代學習控制的2-D連續—離散Roessor模型為

該模型的邊界條件為 η(0,k)=0,e(0,k)=yr(0)-Cx0=0,其中 k=0,1,2,…,N(如果 e(0,k)≠0,設e′(t)=e(t,k)- yr(0)+Cx0,從而得到類似的結論),另外為了使(I+CBK2)-1(I-CBK1)存在,控制系統必須滿足維數條件p=m。
引理[10]對于2-D線性連續—離散系統,

式中:x(t,k)∈Rn1;y(t,k)∈Rn2;A1∈Rn1×n1;A2∈Rn1×n2;A3∈Rn2×n1;A4∈Rn2×n2。該系統的邊界條件為x(0,k)=0,k=0,1,2,…和 y(t,0)關于時間 t(t>0)的任意變量。如果矩陣A4是漸近穩定的,即矩陣A4的譜半徑ρ(A4)<1,那么對于所有的t≥0,當k→∞時都有
根據以上引理,可得出下面的定理。
定理1 對于線性連續控制系統(4),D型開閉環迭代學習律:

收斂的充分必要條件[11]是矩陣(I+CBK2)-1(ICBK1)漸近穩定即它的譜半徑 ρ[(I+CBK2)-1(ICBK1)]<1。這里給出的收斂條件是以譜半徑的形式給出的,其受到的限制小于以范數形式給出的收斂條件。
對于線性連續系統

系統的期望輸出為yr(t)=t2,系統的初始控制輸入為u0(t)=0,用如下的D型開閉環迭代學習控制算法:
1)當k=0 時,u0(t)=0,x(0)=x0,并取K1=K2=(CB)-1;


對于本文中的仿真實例,取K1=K2=(CB)-1=20,分別用D型開環迭代學習控制律(即令K2=0)和D型開閉環迭代學習控制律進行仿真,得出的結果如圖1﹑圖2所示。
圖1﹑圖2中,橫軸為迭代時間t,縱軸為系統輸出y(t),迭代次數為K,實線代表期望輸出yr(t),另外3條曲線分別代表K=1,K=2,K=3時系統的實際輸出。從兩圖的對比可得出,采用開閉環迭代學習律的控制系統明顯比單純采用開環迭代學習律的控制系統收斂速度更快,跟蹤性能更好。

圖1 D型開環迭代學習律的跟蹤性能Fig.1 Tracking performance using D-type open-loop ILC algorithm

圖2 D型開閉環迭代學習律的跟蹤性能Fig.2 Tracking performance using D-type open-closed-loop ILC algorithm
本文采用D型開閉環迭代學習控制律來控制線性連續系統,并建立了控制系統的2-D連續—離散Roessor模型,分析了系統的收斂性,最后通過仿真實例來證明,采用D型開閉環迭代學習控制律的控制系統在收斂速度上大大優于采用單純D型開環的控制系統,另外本文用譜半徑來給出收斂條件,因此其受到的限制要小于以范數形式給出的收斂條件。
[1]UCHIYAMA M.Formation of high-speed motion pattern of mechanical arm by trial[J].Transactions of the Society of Instrumentation and Control Engineers,1978(19):706-712.
[2]ARIMOTO S,KAWAMURA S,MIYAZAKI F.Bettering operation of robots by learning[J].Journal of Robotic System,1984,1(2):123-140.
[3]MOORE K L.Iterative learning control—an expository overview[J].Applied and Computational Controls,Signal Processing and Circuits,1998,1(1):151-214.
[4]皮道映,孫優賢.非線性時變系統開閉環P型迭代學習控制的收斂性[J].自動化學報,1999,25(3):351-354.
[5]KUREK J E,ZAREMBA M B.Iterative learning control synthesis based on 2-D system theory[J].IEEE Transactions on Automation Control,1993,38(1):121-125.
[6]CHOW T W S,FANG Y.An iterative learning control method for continuous-time systems based on 2-D Systems theory[J].IEEE Trans on Circuits & Systems,1998,45(6):683-689.
[7]DING W D,SUN Z Y,WU J H,et al.D-type closed-loop iterative learning control based on 2-D system theory[J].Journal of System Simulation,2002,14(11):1528-1530.
[8]于少娟,馮冬梅,吳聚華.2-D系統理論在開閉環迭代學習控制中的應用[J].儀器儀表學報,2002,23(3):402-404.
[9]鐘兆偉,郝修清.基于2-D系統理論的變初始條件線性系統的開閉環學習控制[J].控制理論與應用,2007,26(7):16-18.
[10]FANG Y,CHOW T W S.Iterative learning control of linear discrete-time multivariable systems[J].Automatica,1998,34(11):1458-1462.
[11]孫明軒,黃寶健,張學智.非線性系統的PD型迭代學習控制[J].自動化學報,1998,24(5):711-714.