張宇涵,于瀟雁,2,陳力
(1.福州大學機械工程及自動化學院,福建 福州 350108;2.流體動力與電液智能控制福建省高校重點實驗室(福州大學),福建 福州 350108)
空間技術的發展為人類開拓宇宙提供了極大的便利,而太空環境多變,工作風險極高,因此空間機器人代替宇航員進行太空作業是目前的主要手段.目前為止,對高度自主的空間智能機器人的研究還在初步階段,因而遙操作技術依然是人類探索太空的重要手段和主流研究.對于空間機器人遙操作控制系統來說,天地間距離過大,信號在傳輸過程中會產生時間延遲(簡稱時延).如果控制系統對時延影響不予考慮,其控制精度將會大大受到影響甚至導致系統控制失效.目前針對時延環境下空間機器人展開的研究相對較少.張建宇,葉柄能等提出了基于時延估計法的控制力矩設計問題[1-3],但它們均是為解決機器人參數不確定問題而設計的控制手段,而并非解決時延問題,其實際動力學系統中并不存在時延;白碩等展開了網絡環境下工業機器人的時延預測研究,但地面網絡環境并不適用于太空遙操作環境[4-7];Chen等提出使用泰勒級數預測法來得到系統時延項,但他們未在三角函數展開式部分進行化簡,導致系統模型過于繁冗,也未在空間機械臂系統上展開相關工作[8-10];此外,上述研究均未對時延范圍進行有效探討.因此對具有時延的空間機器人系統進行研究,并給予良好的補償控制手段[11-16]是非常有必要的.
針對上述問題與不足之處,本研究利用基于泰勒級數展開的預測手段,對關節空間坐標進行時延項的提取,從而得到改進的空間機器人動力學方程.與傳統動力學方程相比,改進的動力學方程模擬了時延誤差,更加符合客觀實際情況;利用神經網絡控制[14]對非線性函數項的逼近能力,彌補計算力矩法無法解決的時延誤差;在神經網絡控制器的基礎上引入模糊和遞歸控制可有效降低系統的抖振并提升在線學習速度;同時對時延值的有效范圍進行在線評估,在能提供良好品控的基礎之上確定時延范圍.利用本文所提出的控制器方案,可以實現對關節空間預設軌跡的精確跟蹤.數值仿真驗證了所提出方法的有效性.
不失一般性,考慮做平面運動的漂浮基空間機器人(三桿)結構模型如圖1所示.

圖1 自由漂浮三桿空間機器人系統Fig.1 Free-floating space-based robot system
忽略微弱的重力梯度,空間機械臂系統為無外力作用的無根多剛體系統,其重力勢能為0.將總動能T代入第二類拉格朗日方程,可以得到載體位置及姿態均不受控下欠驅動形式的系統動力學方程為

(1)


(2)
將含有時延的關節參數代入到三角函數中,并進行簡化可得

(3)
從上式可以看出,計算誤差來源于對泰勒展開式高階項的省略.


(4)


(5)
將式(5)代入動力學方程式(1),可得到存在時延誤差下的改進動力學方程為

(6)
其中:ΔE為擴展后的剩余項.即系統存在的時延誤差為
研究將用到以下假設.


若不考慮時延誤差,一般情況下對于動力學模型(1),常規的計算力矩法反饋控制器τ可寫為

(8)
其中:Kp、Kv為正定常值矩陣(增益因子).在沒有時延誤差的情況下,常規反饋控制器下的追蹤誤差逐漸收斂為0.若將常規控制器應用于改進的泰勒級數展開下的動力學模型,即將式(8)代入式(6)得

(9)
由于時延誤差的存在,系統無法實現漸進穩定,需要引入補償控制f(·),使得在理想狀況下有

(10)
其中,時延項ΔE為未知的非線性函數.因此,這里引入基于模糊遞歸神經網絡控制算法來補償時延誤差.
神經網絡具有強大的非線性逼近能力及良好的在線學習能力,可以用其對非線性進行補償;在此基礎上引入模糊與歸納推理,將神經網絡與模糊控制結合起來,構成具有推理歸納能力的模糊神經網絡,提升控制品質.其綜合性能更適用于非線性控制系統.所設計的模糊遞歸神經網絡控制算法為三輸入三輸出的層網絡結構,結構如圖2所示.

圖2 模糊遞歸結構Fig.2 Fuzzy recurrent neural structure
每一層的描述規則如下.
第一層接受輸入變量.同時也作為第二層的輸入變量.在姿態關節不受控前提下,設輸入變量為誤差函數s,有

(11)
第二層為隸屬函數值計算階段.采用高斯函數作為隸屬函數,每一個節點都有一個隸屬度函數,即

(12)

第三層為模糊推理層.由第二層得到的輸出量通過規律連乘(模糊過程)得到第三層的輸出量,且第三層上一時刻的輸出量φjp經過bji的加權后反饋到第二層,構成了遞歸結構,即

(13)
第四層為輸出層.其輸出表達式為

(14)
式中:fi為第四層輸出量;wji為模糊推理層與輸出層的連接權值,該值通過在線訓練不斷地調整φj第三層第j個節點的輸出.將所有的輸出結果進行整合,最終得到補償控制的形式為
f(·)=WTΦ
(15)
其中:W為網絡權值矩陣,Φ=[φ1φ2φ3…φn]T為最終的輸出變量.
在一致估計理論和假設1的前提下,對于連續函數f(·),對于任意給定的很小正數ε0,總是存在最優網絡權值W*(f(·)的最佳逼近權值),使得

(16)
因此,定義逼近誤差η=ΔE-f*(s),并存在如下假設.
假設4 逼近誤差η是有界的,即有

(17)

實際應用中理想補償控制效果難以達到,因此設估計的補償控制(實際輸入控制)為

(18)
設理想網絡權值與估計(實際)網絡權值的誤差為

(19)
其網絡權值自適應律在后續的李雅普諾夫證明中可得到.
綜合式(8)、(18),最終的控制器算法可寫為

(20)
其中:δ是為保持等式右端載體姿態角項的輸入控制力矩恒為0所設.

(21)

結合式定義逼近誤差及式(19),可得
因此最終狀態方程可改寫為

(22)
對上述閉環系統,做如下穩定性分析,設計李雅普諾夫函數為

(23)


(25)


(26)
網絡取值誤差自適應律為

(27)
將式(27)代入到式(26),可得

(28)
其中:λmin(Q)和λmax(P)分別為矩陣Q和P的最小特征值和最大特征值.

對圖1所示的空間機器人系統進行數值仿真試驗.設計參數如下:m0=40.00 kg,m1=2.00 kg,m2=1.00 kg,m3=2.50 kg;J0=34.17 kg·m2,J1=1.50 kg·m2,J2=1.50 kg·m2,J3=0.75 kg·m2;L0=1.50 m,L1=3.00 m,L2=3.00 m,L3=3.00 m;d1=1.50 m,d2=1.50 m,d3=1.50 m;隸屬函數單元數為n=25;高斯基函數中心值c按間隔為0.5的均勻分布取值,基帶寬度σ取值為1.2,其余值均為1;Q=diag(60,60,60,60,60,60);Kp=diag(25,25,25);Kv=diag(30,30,30).
利用本文所提出的控制手段進行數值仿真,其軌跡追蹤結果如圖3~5所示.為了突出本文所設計的控制方法(控制方法1)的優越性,將式(8)計算力矩法(控制方法2)和文獻[14]所提出的常規RBF神經網絡控制手段(控制方法3)與其進行比對,其軌跡誤差e變化情況如圖6~8所示.

圖3 關節角1追蹤結果Fig.3 Joint angle 1 tracking results

圖4 關節角2追蹤結果Fig.4 Joint angle 2 tracking results

圖5 關節角3追蹤結果 Fig.5 Joint angle 3 tracking results

圖6 關節角1追蹤誤差對比Fig.6 Comparison of joint angle 1 tracking error

圖7 關節角2追蹤誤差對比 Fig.7 Comparison of joint angle 2 tracking error

圖8 關節角3追蹤誤差對比Fig.8 Comparison of joint angle 3 tracking error
從以上結果可以看到,用控制方法2根本無法保證系統的漸近穩定性;控制方法3可以有效追蹤,但和本文所提出的控制方案1相比,收斂速度相對較慢,而且趨于穩定后會出現抖振.仿真結果說明,融合模糊遞歸的神經網絡控制器既可以有效補償時延誤差,也可以提高收斂速度并減緩抖振現象,擁有更高的控制精度.


圖9 關節角1追蹤誤差Fig.9 Joint angle 1 tracking error

圖10 關節角2追蹤誤差 Fig.10 Joint angle 2 tracking error

圖11 關節角3追蹤誤差Fig.11 Joint angle 3 tracking error
結果顯示,在L∈[0.1,2.6)范圍內,誤差在逐漸遞增,當臨近范圍邊緣,最大誤差波動已經超過了0.01,雖然仍符合軌跡追蹤效果,但是追蹤精度已經不滿足要求,這勢必會影響控制品質,因此本文控制手段從理論上說延遲值在2.6 s以內都可以滿足控制精度要求.
