管海娃
1.浙江工業大學 信息工程學院,杭州 310023
2.溫州科技職業學院,浙江 溫州 325006
迭代學習控制技術適用于有限時間區間上重復作業的控制對象。這種控制技術利用前次或前幾次運行結果來修正本次控制輸入,只要足夠多次的運行,可實現在整個作業區間上的完全跟蹤。在實際應用場合,機器人系統經常需要執行重復性工作任務(例如執行搬運、裝配等任務的工業機械臂),鑒于機器人運動的重復性特點和迭代學習控制的特性,自1984年提出以來,迭代學習控制技術已被廣泛應用于機器人運動控制[1-5]。
近年來,類Lyapunov方法下迭代學習控制技術已經成為研究的熱點[6-11]。目前的研究成果主要集中于不確定系統,包括參數化情形和非參數化情形的學習控制,非一致軌跡跟蹤問題以及初值問題。文獻[12]針對具有時變和時不變參數不確定系統,提出一種新的迭代學習控制方法,能有效地跟蹤不同的期望軌跡。文獻[13]提出的魯棒自適應迭代學習控制方法能夠處理離散非線性系統中的參數和非參數不確定。文獻[14]通過迭代學習控制算法,解決了一類多輸入多輸出系統的非參數不確定性。文獻[15]針對在任意初值和可變軌跡下,研究了一類離散不確定系統的自適應迭代學習控制方法。文獻[16]利用障礙Lyapunov函數設計控制器,實現控制過程中的輸出約束。文獻[17]借助文獻[16]的思想,構造二次分式型障礙Lyapunov函數函數,提出實現狀態約束的迭代學習控制算法。文獻[18]通過自適應迭代學習控制,處理高階非線性多智能系統的一致跟蹤問題。
初始定位是應用迭代學習控制技術的一個必要條件,它要求在每次迭代開始時系統的初值要和期望軌跡的初值一致。大量較早的文獻研究機器人系統的迭代學習控制方法,往往假定系統初始誤差為零[19-21]。但由于實際精度的限制,初始定位誤差難以避免,上述假設很難滿足。因此,研究在任意初態下的迭代學習控制算法具有重要的理論與實際意義。針對連續系統的Lyapunov方法,解決初值問題的方案有時變邊界層、誤差跟蹤、有限時間吸引子和初始修正等。文獻[22]基于Lyapunov方法研究了迭代學習控制中的五種不同初始條件。文獻[23]在非零初始誤差條件下,引入時變邊界層,構造模糊自適應迭代學習控制器。文獻[24]借助初始修正吸引子的概念,提出有限時間迭代學習控制方法,實現在預先指定的區間上零誤差跟蹤。文獻[25]研究在任意初始條件下非線性系統的誤差跟蹤學習算法。近年來,人們提出重復學習控制方法處理機器人系統的初值問題,這種控制方法在實施時不需要進行定位操作,而以上一周期終點時刻系統狀態信息作為下一周期系統的初值。文獻[26]針對不確定機器人的軌跡跟蹤問題,提出了一種自適應重復學習控制方法。文獻[27]通過設計重復學習控制方案,處理時變機器人系統的定常和時變參數不確定性。文獻[28]提出一種新的非線性分散重復學習控制,處理非線性機器人系統的軌跡跟蹤問題,實現全局漸近收斂。文獻[29]構造新型Barrier函數,實現機器人系統位置約束的重復學習控制算法。重復學習控制,回避了迭代學習控制的初始定位問題,但要求參考軌跡是光滑閉合的。針對非零初始誤差,文獻[30]通過修正參考軌跡,提出機器人系統變軌跡問題的迭代學習控制算法。這種方法,在每次實現時,需要設計起始段軌跡。本文借助初始吸引子概念。以回避這一問題。它在任意初態條件下,實現機器人系統在有限時間內對期望軌跡的完全跟蹤問題。
本文通過構造一個含有初始修正項的誤差變量,采用Lyapunov-like方法,設計迭代學習控制器處理系統中不確定性,并進行性能分析。所提的方法在任意初始條件下,實現跟蹤誤差在預先指定區間收斂于零。本文分別針對定常/時變機器人系統,采用未含/含限幅學習機制,保證閉環系統各變量的一致有界性。仿真實例中,以三自由度刨床機械臂系統和二自由度的時變機器人系統,來說明方法的有效性。本文主要由以下幾個貢獻點:(1)針對非零初始條件,將初始吸引子方法運用于定常/時變機器人系統,實現跟蹤誤差在預先指定區間收斂于零。(2)本文構造一個修正誤差信號,并給出兩種新的ζ(t)函數的構造方案,改進了現有的同類設計方案。文中所給出的修正誤差構造方案,具有結構簡單和實施便捷的特點。
考慮下述n自由度剛性定常機器人系統:

其中,q,q?,q?∈Rn分別是關節的位置、速度和加速度向量,τ∈Rn是輸入力矩向量,D(q)∈Rn×n是慣性矩陣,C(q,q?)是向心力和哥氏力矩陣,g(q)∈Rn是重力向量。
機器人系統(1)具有如下三個重要的性質:
性質1D(q)是對稱正定的矩陣。
性質 2D?(q)-2C(q,q?)是反對稱矩陣。
性質3動態方程(1)可線性參數化成如下形式:

其中,p 是未知的定常參數向量,φp(q,q?,q?)是相應的回歸矩陣。
在實際情況下,許多機器人系統的載荷會隨時間變化,針對時變不確定性,考慮下述時變機器人系統:

其中,?∈R?是參數向量,D(q,?)∈Rn×n是慣性矩陣,C(q,q?,?)是向心力和哥氏力矩陣,g(q,?)∈Rn是重力向量,F(q,?)是由于引入時變參數?而增加的相關項,其他量的定義同系統(1)。
時變機器人系統(3)同樣具有三個重要的性質:
性質4D(q,?)是對稱正定的矩陣。
性質5D?(q,?)-2C(q,q?,?)-F(q,??)是反對稱矩陣。
性質6動態方程(3)可線性參數化成如下形式:
D(q,?)q?+C(q,q?,?)q?+F(q,??)q?+g(q,?)=

其中,?=[p,θ(t)]T,p是未知的定常參數向量,θ(t)是未知的時變參數向量,φp(q,q?,q?)和 φθ(q,q?,q?)是相應的回歸矩陣。
當系統在區間[ ]0,T 上重復執行任務時,下標k記重復運行次數。給定二階連續可導的期望軌跡qd()t,定義跟蹤誤差ek=qd-qk。
本文的控制任務是,在任意初態的情形下,即ek(0)≠0,分別針對定常/時變機器人系統設計迭代學習控制器τk,使得跟蹤誤差ek能夠在預先設定的區間上實現完全跟蹤(0<Δ 對于微分方程:其中,α>0,其解可表示為: 方程(5)有唯一的吸引子 χ=0。顯然,對于非零χ0,這是無窮時間吸引子,當時間趨于無窮大時,χ收斂于該吸引子,即在迭代學習控制器的設計中,一種更誘人的控制性能是有限時間收斂性。 定義1[24]對于微分方程: 其中,α>0,如果存在初始修正作用r=r(χ0,t),使得對于給定的Δ>0,有: 那么,稱 χ=0為 χ?=-αχ-r的初始修正吸引子。 下面給出一種初始修正作用: 式中,ζ(t)是關于t的函數,滿足: 由于引入初始修正作用(8),微分方程(7)的解為: 由上式可知,方程的解具有有限時間收斂性。對式(10)求導,可得: 由 ζ- 函數的定義可知,ζ(Δ)=0 ,可使得 χ?(Δ)=0 ,因此,χ(t)在Δ時刻可光滑對接。 鑒于上述初始修正吸引子的概念,本文針對非零初始誤差情形,為了實現有限時間完全跟蹤性能,構造修正誤差變量: 其中,c>0是可調整的參數,rk是為處理非零初態條件而引入的修正作用,其可表示為: 其中,ek(0)是初始誤差。為了設計迭代學習控制器,選取的ζ(t)在滿足式(9)的前提下,要使得下式恒成立: 注2本文系統初始誤差ek(0)≠0,不滿足常規迭代學習控制算法的要求。為了解決這個問題,構造修正誤差變量σk(t),并要滿足σk(0)=0。 當e?k(0)=0時,本文給出一種ζ(t)函數的構造方案: 其中,0 當c=3,d=0.2,Δ=0.3,ζ1(t)函數圖像如圖1。 圖1 ζ1(t)函數 ζ(t)函數的構造方案有很多種,類似的,本文給出另一種ζ(t)函數:其中,0 注3現有的幾種ζ(t)函數,在t=0,t=Δ處不連續,或在t=Δ處不可導。本文給出兩種新的ζ(t)函數的構造方案,由式(15)、(16)可以看出,構造的兩種 ζ(t)函數在(0 ,T ]上是連續可微的,相應的,rk在(0 ,T]上是連續可微的。由式(12)可知σk在[0 , T]上也是連續可微的。 若當σk(t)=0,t∈[0 , T ]成立,式(12)可寫成: 由定義1可知,ek(t)=0,t∈[Δ ,T ],并且可得 e?k(t)=0,t∈[Δ ,T]。 由上面的分析可得,設計迭代學習控制器,經過足夠多次迭代后,若能實現在整個作業區間[0 , T]上,σk(t)=0,即可實現在[Δ ,T ],ek(t)=0 和 e?k(t)=0 。這是下一章控制器設計的策略所在。 引入新的變量: 修正誤差變量可轉換為: 建立修正誤差變量的動態方程: 將式(1)代入式(20),并利用性質3可得: 其中,Yp(qk,q?k,q?σ,k,q?σ,k)是相應的相容矩陣,記為Yp,k。 為設計迭代學習控制器,考慮正定函數: 對Vk求導: 通過上面的推導,本文可采取如下控制器: 其中,p?k是對 p的估計,p?k的更新律由下式給出: 其中,Q,Γ是對角正定矩陣。應用力矩輸入式(24),并結合性質2,式(23)可寫成: 為分析閉環系統的收斂性和穩定性,考慮下述Lyapunov-like函數: 容易得到Vk()0=0。Lk在第k次的迭代差分為: 由分部積分,可得: 將式(26)、(29)代入式(28)得: 應用參數更新律(25),式(30)可寫成: 由于: 那么: 由于 p?k(0)=p?k-1(T),再令 t=T ,得到: 依據式(34),容易證明下述定理。 定理1對于在任意初態情形下的機器人系統(1),采用力矩輸入(24),以及參數更新律(25),可以保證: (1)閉環系統中的所有變量在[ ]0,T上一致有界。 (2)當k→∞時,跟蹤誤差在[ ]Δ,T 上一致收斂于零,即: 證明 首先對L0(t)求導: 因此,Lk(t)在上是有界的,由式(27)可知Vk(t),p?k(t)和 σk(t)在上都是有界的。由σk的有界性可得 ek和 e?k在上是有界的。由qd,q?d和rk的有界性,可得上也是有界的。進而,由 式(24),可知 τk(t)在上也是有界的。因此,閉環系統的所有信號都是有界的。 為證明誤差σk(t)一致收斂,對式(34)進行累加: 由Lk(T)≥0和L0(T)的有界性,得到: 同上一章,引入變量 q?σ,k,q?σ,k,利用時變機器人系統的性質6,建立修正誤差變量的動態方程: 給出如下控制器: 其中,p?k和 θ?k分別是對 p 和 θ 的估計,p?k和 θ?k的更新律由如下式子給出: 定理2對于在任意初態情形下的時變機器人系統(3),采用力矩輸入(37)以及參數更新律(38)、(39),可以保證: 其中,Q,Γ1和Γ2是對角正定矩陣。sat為飽和函數,本文sat(?)定義為,對于a∈R: (2)有界性證明。首先對L0(t)求導: 由 θ 和 θˉ-1的有界性可知是有界的,類似于定理1的有界性證明過程,可是有界的,進而可得上是都是有界的。由式(37),可知τk(t)在[ ]0,T上是有界的,因此閉環系統的所有信號都是有界的。進一步可得上一致收斂于零。由前面的分析可知,上一致收斂于零。 例1考慮如下三自由度的機械臂系統[31],其模型為: 其中,D(q)=[Dij],C(q,q?)=[Cij],g(q)=[gi],具體各值具體各值可參考文獻[31],q1,q2,q3分別表示各關節的位置,q?1,q?2,q?3分別表示各關節的速度,l1,l2,l3分別是各關節長度,m1,m2,m3分別是各關節的重量,i1,i2和i3是三個和慣性有關的定常參數,g表示重力加速度。對機械臂系統進行參數化,有p=[m1,m2,m3,i1,i2,i3]T,Yp是相應的相容矩陣,給定如下: 采用式(13)所示的初始修正作用,其中,ζ(t)選取為式(15)的形式,其中參數取值為:T=2 s,Δ=0.3 s,d=0.2 s,t1=1 s,c=2。 采用力矩輸入式(24)以及參數更新律式(25)。參數取值為Q=diag[8 , 6,6],Γ=diag[17]。其他數值取為: 仿真結果由圖2~圖9所示。由圖2~圖5可看出,在非零初始誤差下,引入初始修正作用,設計的迭代學習控制器,經過足夠多次迭代,可實現關節的位置和速度軌跡在時間區間[0 . 3,2]上完全跟蹤上相應的期望軌跡。圖6給出了在k=10時的關節力矩輸入。圖7表示關節1的兩個性能指標隨迭代次數的變化情況,其定義為:分別表示在[Δ ,T ]上關節1的位置和速度誤差絕對值的最大值。圖8表示關節2的兩個性能指標隨迭代次數的變化情況,定義為:分別表示在 [Δ ,T ]上關節2的位置和速度誤差絕對值的最大值。圖9表示關節3的兩個性能指標隨迭代次數的變化情況,定義為分別表示在[Δ ,T]上關節3的位置和速度誤差絕對值的最大值。 例2考慮二自由度的剛性機械臂系統[27],假設機械臂的載荷是時變的,其系統模型為: 圖2 當k=0時,系統位置q和期望軌跡qd 圖3 當k=0時,系統速度q?和期望軌跡q?d 圖4 當k=10時,系統位置q和期望軌跡qd 圖5 當k=10時,系統速度q?和期望軌跡q?d 圖6 當k=10時,力矩輸入τ 圖7 指標Jp1,k和Jv1,k 圖8 指標Jp2,k和Jv2,k 圖9 指標Jp3,k和Jv3,k 期望軌跡設計同例1。采用式(13)所示的初始修正作用,其中,ζ(t)選取為式(15)的形式,其中參數取值為:T=2 s,Δ=0.3 s,d=0.2 s,c=2。采用力矩輸入式(37)和參數更新律式(38)、(39)。參數取值為Q=diag[2 0,10],其他數值取為: 由圖10和圖11分別表示k=0時,機械臂關節1和關節2的位置和速度軌跡。迭代20次后,仿真結果由圖12~16所示。由圖12和圖13可看出,經過足夠多次迭代,關節的位置和速度軌跡在時間區間[ ]0.3,2上完全跟蹤上相應的期望軌跡。關節力矩輸入在第20次迭代期間的取值情況見圖14。圖15表示關節1的兩個性能指標Jp1,k和Jv1,k隨迭代次數的變化情況。圖16表示關節2的兩個性能指標Jp2,k和Jv2,k隨迭代次數的變化情況。指標Jp1,k、Jv1,k、Jp2,k和Jv2,k的定義同例1。 圖10 當k=0時,系統位置q和期望軌跡qd 圖11 當k=0時,系統速度q?和期望軌跡q?d 圖12 當k=20時,系統位置q和期望軌跡qd 圖13 當k=20時,系統速度q?和期望軌跡q?d 圖14 力矩輸入τ 圖15 指標Jp1,k和Jv1,k 圖16 指標Jp2,k和Jv2,k 本文提出定常/時變機器人系統的有限時間迭代學習控制方法,解決在任意初態下的完全跟蹤問題。通過構造修正誤差變量,利用Lyapunov-like方法,分別設計迭代學習控制器處理系統中的不確定性,經過足夠多次迭代后,修正誤差變量在整個作業區間上一致收斂于零。借助初始修正作用,實現跟蹤誤差在預先指定區間上的完全跟蹤。最后的仿真實驗驗證了這種學習控制方法的有效性。3 修正誤差信號的構造
















4 定常機器人系統的控制器設計與性能分析























5 時變機器人系統的控制器設計與性能分析







6 仿真算例























7 結束語