陶 東,張 強,趙良玉
(1. 北京理工大學宇航學院,北京100081;2. 北京控制工程研究所,北京100094)
通過空間機器人在軌對航天器進行裝配、維修或燃料加注等服務是國內外航天領域研究的熱點之一[1],在軌捕獲是實現上述在軌服務的前提和關鍵環節[2]。目前,國內外對在軌捕獲技術的研究還處于圍繞合作目標開展太空試驗或地面驗證試驗階段,如日本ETS-VII衛星和美國軌道快車任務對空間合作目標的在軌捕獲驗證、加拿大航天局的自主捕獲地面實驗系統、深圳航天技術中心地面實驗系統、美國加州蒙特利海軍研究生院的地面實驗系統等[3-4]。當空間機器人實施在軌捕獲任務時,其機械臂末端執行器和服務對象之間不可避免地發生相遇及碰撞,碰撞產生的接觸力可能會損壞空間機器人及服務對象或將二者彼此推開。因此,在軌捕獲是一項非常危險且具有很大技術挑戰的任務[5-6]。國內外諸多學者研究表明,力位混合控制方法[7-8]和阻抗控制方法[9]可以實現空間機器人與服務對象之間的柔性接觸和柔性抓捕[10]。力位混合控制是將任務空間分解為相互正交的接觸空間和自由運動空間,通過選擇矩陣實現對末端執行器的控制選擇,從而完成機器人末端位置控制和力控制[7]。由于在軌捕獲時,碰撞接觸力會是任意方向,難以實現自由運動空間和接觸空間的解耦,為此,本文選用阻抗控制方法實現空間機器人的在軌捕獲操作。
阻抗控制方法的核心理念是通過位置與環境作用力的動態關系實現機械臂與環境的交互,達到柔性接觸的目的。Moosavian等假設在機器人基座輸入力得到精確控制的情況下,針對多臂空間機器人系統設計了一種阻抗控制律,使整個系統在與服務對象接觸時表現出期望的柔性行為[11]。文獻[12]提出了一種不需要對基座進行精確控制,便可以實現整個服務系統在慣性坐標系下柔性接觸的阻抗控制方法。Abiko等將抓捕時的接觸力作為末端執行器的干擾力進行處理,提出了一種不依賴抓捕目標任何慣性參數的阻抗控制方法[13]。文獻[14]針對非合作目標捕獲問題提出了一種PD控制和阻抗控制相結合的方法,使得在基座無論如何運動的情況下,末端執行器都能夠表現的像一個質量-彈簧-阻尼系統。Uyama等針對服務系統和服務對象碰撞后出現的非期望接觸力及接觸后的相對運動問題,提出了一種參考恢復系數來調整阻抗參數的阻抗控制方法[15]。上述阻抗控制方法針對特定的問題或特定的應用場景均達到了比較好的控制效果,但由于需要在末端執行器安裝測量接觸力的力傳感器,因此增加了系統的復雜度和硬件成本,同時降低了系統的控制帶寬[16]。
為了克服使用力傳感器所帶來的不足,一些學者嘗試使用估計方法來獲取接觸力。Yoshikawa等通過空間機械臂末端執行器與抓捕對象的相對速度及接觸時的沖擊大小關系來估計接觸力[17]。文獻[18]通過自由飛行空間機器人的運動方程來預測接觸力,提出了一種包括多個機械臂、基座和操作對象的多重阻抗控制方法,使包括操作對象在內的整個服務系統表現為柔性行為。Flores-Abad等使用精確逆動力學觀測接觸力,利用PID控制器實現軌跡跟蹤,提出了一種基于干擾觀測器的空間對象阻抗控制方法,實現了捕獲時的柔性接觸[16]。由于上述方法均直接或間接依賴于精確的動力學模型,因此當動力學模型存在不確定時,則可能會出現接觸力估計誤差過大,導致系統穩定性變差甚至失去穩定的情況發生??紤]到空間機器人在太空中工作時,由于燃料消耗、基座和機械臂動力學耦合、關節摩擦力、電機死區、重力梯度等因素的影響[19],進行精確動力學建模幾乎不太可能。因此,在考慮空間機器人動力學模型不確定的情況下進行接觸力估計,并進而開展阻抗控制更有現實意義和應用價值。
針對自由漂浮空間機器人在軌捕獲中與服務對象的碰撞問題,本文提出了一種考慮模型不確定情況下的無力傳感器阻抗控制方法。首先,在建立空間機器人不確定動力學模型基礎上,推導了估計接觸力與不確定部分的關系;其次,將接觸力的估計分為兩部分,一部分通過不確定模型進行估計得到,另一部分利用神經網絡對模型不確定部分進行辨識得到;最后,將后一部分估計得到的接觸力作為前一部分估計所得接觸力的補償,并將補償后的估計接觸力作為空間機器人末端執行器期望位置的反饋,使其表現出類似質量-彈簧-阻尼的特性,最終實現柔性抓捕。
為方便分析且不失一般性,本文基于以下假設建立自由漂浮空間機器人的運動學和動力學模型。
1)空間機器人和服務對象都是剛體,空間機器人的位置和姿態不受控制。
2)忽略重力梯度、太陽風及磁場對空間機器人的影響。
3)已知空間機器人的運動狀態和服務對象的運動狀態。
假設空間機器人由衛星基座和n自由度的串聯機械臂組成,如圖1所示。其中,∑I、∑0、∑c、∑1~∑n和∑T分別為慣性坐標系、基座坐標系、捕捉坐標系、關節1~關節n坐標系和工具坐標系;ri∈R3為連桿i質心的位置矢量;re∈R3為末端執行器的位置矢量;ai∈R3為從關節i指向連桿i質心的位置矢量;bi∈R3為從連桿i質心指向關節i+1的位置矢量;ρi∈R3為關節i的位置矢量;θ∈Rn為關節角向量,即θ=[θ1,…,θn]T,θi為關節i的轉動角度;ωi為連桿i的角速度矢量;v0、ω0分別為基座的線速度和角速度矢量;ve、ωe分別為末端執行器的線速度和角速度矢量;zi∈R3為各連桿旋轉方向的單位矢量。

圖1 空間機器人的多體動力學模型Fig.1 Multi-body dynamics model of space robot
從圖1可知,空間機器人機械臂末端的位置矢量為[20]:
(1)
由式(1)求導可得,空間機器人機械臂末端的線速度可表示為:
(2)
空間機器人機械臂末端的角速度可表示為:
(3)
由式(2)和式(3)整理可得,空間機器人末端執行器的線速度和角速度、基座的線速度和角速度、機械臂關節的角速度的關系為:
(4)

衛星基座受控且機械臂末端受到外力和力矩的空間機器人動力學方程為[8]:
(5)


(6)


(7)

(8)
(9)

在實際工程中,一些為達到控制目的所必需的信息量要么出于技術限制不能直接獲得,要么出于經濟、重量、復雜度和帶寬等考慮無法直接獲得,這就需要通過觀測估計的方法來獲得這些信息量。在本文中,為了實現空間機器人與服務對象接觸時的阻抗控制,需要對空間機械臂抓捕服務對象時的接觸力進行估計。為了在空間機器人動力學模型不確定情況下,能夠較準確的估計末端執行器與服務對象之間的預期接觸力,將接觸力估計分為兩部分,一部分為利用空間機器人的逆動力學關系,通過不確定動力學模型估計得到的接觸力;另一部分為通過神經網絡辨識估計得到的接觸力。
若空間機器人的精確動力學模型已知,由式(6)可得:
(10)

(11)


(12)
將式(12)減去式(11),可得:
(13)

(14)

將式(14)代入動力學方程式(6),可得:
(15)
式(15)等號右邊第一項包括動力學模型的不確定部分,采用高斯徑向基神經網絡對該項進行逼近并整理可得:
(16)

理想網絡權值可表示為:
(17)
至此,動力學方程不確定項可近似表示為:
(18)
將式(18)代入式(13),可得基于神經網絡辨識估計的接觸力為:
(19)
為了使空間機器人的末端執行器與目標接觸時表現為柔性行為,估計接觸力與末端執行器的阻抗關系需滿足[16]:
(20)

(21)

考慮實際工程情況,位置差值的更新率可寫為:
Δ(Δre)≡Δre(t)-Δre(t-T)=
(22)
其中:T為采樣周期。
將式(20)代入式(22),可得:
(23)
因此,空間機器人末端執行器的實際參考位置可寫為:
rea=red-Δre
(24)
基于觀測接觸力實現阻抗控制的原理框圖如圖2所示,觀測器估計的接觸力作為式(23)的輸入,可獲得空間機器人末端執行器期望位置與實際參考位置差值;再利用式(24)可獲得空間機器人末端執行器的實際參考位置。
以一個安裝平面二連桿機械臂的自由漂浮衛星基座為例來驗證本文所提方法的有效性,其構型如圖3(a)所示,其參數如表1所示,其中Ii為連桿i的轉動慣量。為方便計算,假設每個連桿的質心在連桿的中心點;捕捉坐標系和慣性坐標系的原點在空間機器人基座的中心點。空間機器人的初始狀態為:θ0=0,θ1=π/6,θ2=π/6,re=[1.8809, 1.3809]T。

表1 空間機器人參數Table 1 Space robot parameters
用一個如圖3(b)所示的虛擬墻來代替抓捕對象。

圖3 仿真系統Fig.3 Simulation system
為完成仿真,空間機器人的末端執行器與虛擬墻接觸時,虛擬墻對末端執行器產生的接觸力采用Hertz model[16]進行計算:
(25)
其中:kc、cc是和兩個接觸對象的材料屬性相關的參數;ζ是碰撞力的方向向量;δ為末端執行器和服務對象抓捕點的距離。
給定期望軌跡red=[0.02t+1.93, -0.01t+10.4]T,并在x=1.94處,設置一堵虛擬墻,取kc=50000 N/m,cc=1 Ns/m。
其中:P為A和Q的李雅普諾夫方程對稱矩陣,φ為高斯徑向基函數。



圖4 動力學模型精確情況下兩種方法阻抗控制效果Fig.4 The impedance control effect of the two methods with dynamic model accurate

圖兩種方法阻抗控制效果Fig.5 The impedance control effect of the two methods with

圖兩種方法阻抗控制效果Fig.6 The impedance control effect of the two methods with

圖兩種方法阻抗控制效果Fig.7 The impedance control effect of the two methods with

圖兩種方法阻抗控制效果Fig.8 The impedance control effect of the two methods with

圖9 衛星基座姿態角Fig.9 Satellite base attitude angle

圖10 衛星基座位移Fig.10 Displacement of satellite base
由圖9和圖10可知,本文方法和文獻[16]方法的空間機械臂運動對衛星基座均產生了一定的擾動。在空間機器人的末端執行器與虛擬墻接觸之前,兩種方法對衛星基座姿態和位移的影響較為一致;在末端執行器與虛擬墻接觸后,兩種方法對衛星基座姿態和位移的影響均有所增大,但本文方法對基座影響的幅度略小于文獻[16]方法。
采用本文提出的方法,在空間機器人的動力學參數與其真值相對誤差為20%時,末端執行器在x-y平面的軌跡如圖11所示。由該圖可以看出,空間機器人的末端執行器在與虛擬墻發生碰撞的瞬間,先有一個過沖,再慢慢返回到x=1.94附近,實現了末端執行器與虛擬墻的柔性接觸。

圖11 空間機器人末端執行器x-y軌跡Fig.11 The x-y trajectory of the end-effector of the space robot
本文針對空間在軌服務中的柔性抓捕需求,提出了一種在動力學模型不確定情況下使用觀測器估計接觸力并實現阻抗控制的方法。通過將神經網路辨識估計的接觸力作為不確定模型估計的接觸力的補償,實現了空間機器人在動力學模型不確定情況下對接觸力的有效估計,克服了現有方法在動力學模型不確定時接觸力估計誤差偏大及導致控制品質降低甚至發散的問題。仿真結果顯示,在空間機器人與虛擬墻無接觸時,末端執行器能夠正常跟蹤期望軌跡;在與虛擬墻接觸后,末端執行器表現為柔性接觸,驗證了該方法的有效性。由于本文方法考慮了動力學模型不確定情況和關節摩擦力、電機死區等非線性干擾因素,可有效降低對空間機器人動力學建模精度的要求,具有一定的工程應用價值。