黃小琴, 陳 力
(1.福州大學 機械工程及自動化學院,福州350116;2.福建省高端裝備制造協同創新中心,福州350116)
空間機械臂作為航天領域的關鍵技術之一,能夠協助或代替宇航員完成極端空間環境中的一些艙外活動,如維護和修理故障衛星以及補給航天飛行器的物資等,對航天技術的進步發揮著愈來愈重要的作用,因此其系統動力學與控制問題的研究受到密切關注[1-5]。文獻[6]描述了空間機械臂在時間延遲工況下,笛卡爾空間軌跡跟蹤的控制方法。文獻[7]研究了空間機器人系統捕獲目標衛星時的沖擊影響及隨后的穩定控制問題。
死區、摩擦及飽和等非線性現象存在于空間機械臂執行機構的動力傳遞鏈中,這些現象大部分是未知且時變的,對控制精度造成很大的影響。其中,關節力矩輸出死區作為一種重要的非線性現象,已經成為高精度傳動控制的一個重點研究內容。但以往的研究往往沒有考慮關節力矩輸出死區對空間機械臂系統控制的影響,如果不能消除關節力矩輸出死區的影響,除了會影響跟蹤誤差外,系統還會產生極限環振蕩,導致性能下降或不穩定,從而無法完成空間任務。因此,研究帶有關節力矩輸出死區的空間機械臂具有重要的現實意義。在地面基機器人的控制研究中,已有學者考量了死區的效應[8-11]。文獻[12]采用了基于 RBF的前饋網絡補償系統的非線性耦合控制;文獻[13]設計了一種用于死區參數修正的智能補償滑模控制方法;文獻[14]結合死區觀測器,研究了遞歸小腦網絡控制器。同時,空間機械臂不可避免地會受到運動噪聲、太陽風和宇宙射線等干擾因素的影響。綜上,關節力矩輸出死區與外部干擾都必須在研究中加以考慮。
本文在前述研究的基礎上,針對帶有關節力矩輸出死區及外部干擾的空間機械臂系統建立動力學方程。通過構造關節力矩輸出死區的模型和積分切換函數,借助增廣變量法,提出一種積分滑模神經網絡的控制算法。在死區斜率與邊界參數不確定及最優逼近誤差上確界未知的條件下,利用最優逼近誤差、死區及干擾的補償項來克服各自的影響。穩定性分析和仿真實驗表明本文控制方法有效。
圖1為自由漂浮的雙桿空間機械臂系統,根據第二類拉格朗日方程,可以得到其載體位置和姿態都不受控的動力學方程[6]:

式中 D(q)∈R3×3為對稱正定的質量矩陣,H(q,∈R3為包含科氏力和離心力的列向量,τd∈R3為外部擾動列向量,τ∈R2為機械臂兩關節鉸控制力矩τ1和τ2組成的列向量,q∈R3為載體姿態角α0及關節角θ1和θ2組成的廣義坐標向量。
對于很多物理裝置,在輸入的大小達到某個特定值之前,其輸出為0。這種輸入-輸出關系稱為死區。從反饋控制的觀點出發,死區可認為是信息丟失。空間機械臂系統的關節力矩輸出可能含有死區特性。本文考慮如圖2所示的典型的死區模型[15],死區輸入為ur(t)= [ur1(t),ur2(t)]T,輸出為τ。

式中di-和di+,mli和mri分別為死區的左右斷點與左右斜率,設定mri=mli=mzi。死區參數di-,di+和mzi為有界不確定量,且di+>0,di-<0,mzi>0。
把死區模型改寫為

式中

cri(uri)≤βi,其中βi是有界的。

圖1 漂浮基雙桿空間機械臂系統Fig.1 Free-floating space robot system

圖2 關節力矩輸出死區模型Fig.2 Joint torque output model with the dead-zone
徑向基函數神經網絡是一種三層網絡,通過局部逼近的總和來實現全局逼近[16]。對各類強非線性函數具有良好的逼近能力,能夠以任意精度逼近連續非線性函數,且具有學習速度快和能避免局部極小問題的優點。因此,本文采用此類神經網絡進行控制器設計,其結構示意圖如圖3所示。
用徑向基神經網絡來逼近系統輸出f(x),即

式中 x=[x1,x2,…,xr]T為神經網絡系統的輸入,χ(x)=[χ1,χ2…,χn]T為基函數列向量,UT=[uij](i=1,…,l;j=1,…,n)為網絡權值矩陣,y=[y1,y2…,yl]T為輸出列向量。
采用的基函數為高斯函數,則χ(x)的元素可表示為

式中cj為第j個基函數的中心位置參數,σj為第j個基函數的寬度參數。
設計空間機械臂的控制方案時,對載體的位置和姿態都不施加控制,可減少能源的損耗,延長其工作壽命。
此時,系統控制輸出為qr=[θ1θ2]T,而q∈R3。顯然,該控制輸出向量的維數小于后者,從而難以繼續利用式(1)及其相關性質進行后面相關控制器設計。為此,本文引入增廣變量思想來解決這一難點。
將式(3)代入式(1),將其寫為狀態方程的形式為


圖3 徑向基神經網絡三層結構示意圖Fig.3 Three-layer radial basis function neural network
式中 x1=q,x·1=x2=q·,N=D-1(x1)u(t),g(x1,x2)=-D-1(x1)H(x1,x2)x2為未知的有界連續函數,h(x1,x2,t)=-D-1(x1)[c(u)-τd]為系統的外來干擾和死區特性,c(u)=[0,crT(u)]T為執行機構的死區特性,mz=diag(0,mz1,mz2)為死區斜率矩陣,u=[0,urT]T為增廣關節力矩死區輸入。
設期望輸出為qrd=[θ1d,θ2d]T,則增廣期望輸出為qd=[α0d,]T,那么增廣誤差為

式中er=qr-qrd=[(θ1-θ1d) (θ2-θ2d)]T=[e1e2]T
控制目標是設計關節力矩控制律N,讓兩關節的qr穩定地跟蹤qrd。
定義具有積分的增廣切換函數:

式中

常數kvi>0。
定義光滑函數為Yφ(t)=φT(t)Γφ(t)
式中 Γ=diag[0 1/mz11/mz2]
對Yφ(t)關于時間t求導可得

因為g(x1,x2)和死區斜率未知,則y(z)未知,根據前述神經網絡式(5)來逼近y(z),設y(z U)為y(z)的一個逼近,即

式中 UT=[uij](i=1,…,n;j=1,…,m)為網絡權值矩陣,χ(z)=[χ1,…,χm]T為基函數列向量,m為基函數中心點個數,y=[y1,…,yn]T為輸出列向量。
χ(z)的元素為高斯基函數,可表示為

U*為U的最優值,并滿足

式中 ΩU= {U‖U‖≤MU},設計參數MU為正的有界常數,Ωz= {(xT,ρ)T‖x‖≤Mx},Mx>0。
令

式中ε∈R3為最優逼近誤差,‖εi‖≤εyi,εyi為正常數。
由式(9~12),可得

式中 ‖hi(x1,x2,t)‖≤Ξi,Ξi為已知的正連續函數。
設計如下控制律,

式中 kN∈R3×3為正的設計參數,Γm=diag[0,1/mz1min,1/mz2min],mzimin為死區斜率 mzi的最小值,和分別為U*和εy在t時刻的估計值。
定理 對于式(6)所示的系統,采用式(15)的關節力矩控制規律及如下參數自適應調節率,

將使積分切換函數φ有界,且軌跡跟蹤誤差收斂到0。式中 λr=diag[λr0λr1λr2λr3λr4]和λy=diag[λy0λy1λy2]為正定自適應調節矩陣,Fu和Fε為正常數,abs(φ)為列向量φ中每一項取絕對值。
證明 構造李雅普諾夫函數:

式中

V對時間t求一階導為

將式(13)代入式(18),即

將‖εi‖≤εyi和‖hi(x1,x2,t)‖≤Ξi代入式(19),得


利用不等式

代入不等式(21),得

可得

不等式兩邊同乘ect,并從[0,t]積分可得

式中 b=δ/c+V(0)。
因此,V有界,從而φ也有界。選取合適的數值,將使δ/c充分小。因此,跟蹤誤差收斂到0的某個小鄰域內,定理得證。
為驗證前述所設計控制算法的有效性,采用如圖1所示模型進行驗證。取系統慣性參數l0=1.5 m,l1=l2=1m,m0=40kg,m1=2kg,m2=1kg。中心慣量矩J0=34.17kg·m2,J1=J2=1.5kg·m2。
選取qrd為

系統的外部干擾取為

仿真時,系統參數矩陣選擇如下,

神經網絡徑向基函數的參數取值:基函數的個數j=5,基函數的中心位置參數cj根據神經網絡輸入的范圍取值,其寬度σj設置為5。
死區參數為d1-=d2-=-10,d1+=d2+=10,mz1=mz2=1,mz1min=mz2min=0.85。
仿真初始值q(0)=[3 0.5 1.5]T,(0)取0~0.1的隨機數,(0)=[000]T。
仿真時間取t=10s。圖4和圖5分別為采用積分滑模神經網絡自適應控制算法得到的存在關節力矩輸出死區與外部干擾的空間機械臂兩關節鉸的qr與qrd及其跟蹤誤差的對比情況,其中圖4還顯示了載體姿態的軌跡變化。可以看出,控制算法雖然沒有控制載體姿態,但其姿態變化平穩;兩關節鉸的qr能很好地跟蹤上qrd,在t=4s之后基本消除誤差,具有較高的跟蹤精度。
為對比控制方法的有效性,圖6給出了關閉死區補償控制器后,空間機械臂兩關節鉸的實際運動與期望軌跡變化仿真。可以看出,關閉死區補償,兩關節鉸無法跟蹤qrd。

圖4 開啟死區補償器時的軌跡跟蹤圖Fig.4 Trajectory tracking of the space manipulator

圖5 開啟死區補償器時兩關節鉸的軌跡跟蹤誤差圖Fig.5 Trajectory error tracking of the two joints(open dead-zone compensation)

圖6 關閉死區補償器時兩關節鉸的軌跡跟蹤圖Fig.6 Trajectory tracking of the two arms’joints(closed dead-zone compensation)
本文針對空間機械臂存在關節力矩輸出死區及外部干擾的情況,建立了帶有外部干擾的動力學方程。通過構造關節力矩輸出死區的模型,設計了一種積分滑模神經網絡自適應控制方法。具有積分的切換函數減小了系統穩態誤差;利用神經網絡逼近了動力學方程的未知部分;在死區斜率與邊界參數不確定及最優逼近誤差上確界未知的條件下,利用最優逼近誤差、死區及干擾的補償項來消除各自的影響;構造李雅普諾夫函數并證明了閉環系統是穩定的。