霍雨佳,李一平,封錫盛
(1.中國科學(xué)院沈陽自動化研究所機(jī)器人學(xué)國家重點實驗室,遼寧沈陽 110016;2.中國科學(xué)院機(jī)器人與智能制造創(chuàng)新研究院,遼寧沈陽 110169;3.遼寧省水下機(jī)器人重點實驗室,遼寧沈陽 110169;4.中國科學(xué)院大學(xué),北京 100049)
傾轉(zhuǎn)旋翼水空跨域機(jī)器人(以下簡稱跨域機(jī)器人),充分結(jié)合了水下機(jī)器人(AUV)的隱蔽性和無人機(jī)(UAV)的機(jī)動性,具備水空兩棲多種介質(zhì)下的作業(yè)能力,擴(kuò)展了原有機(jī)器人的作業(yè)環(huán)境和應(yīng)用范圍。跨域機(jī)器人應(yīng)分別具備在水中、空氣中兩種介質(zhì)中穩(wěn)定工作,同時具備水空兩種介質(zhì)間多次反復(fù)跨介質(zhì)轉(zhuǎn)換的能力。由于兩種工作介質(zhì)在密度等方面的顯著區(qū)別,跨域機(jī)器人在多種介質(zhì)中穩(wěn)定的作業(yè)需求對機(jī)器人的運動控制器提出了艱巨的挑戰(zhàn)。因此,針對跨域機(jī)器人,建立可靠的動力學(xué)模型是設(shè)計機(jī)器人運動控制器的關(guān)鍵。
模型辨識方法在水下機(jī)器人和無人機(jī)上都有廣泛應(yīng)用,辨識數(shù)據(jù)來源于機(jī)器人傳感器的數(shù)據(jù)采集,將所獲的動力學(xué)模型用于機(jī)器人運動控制仿真平臺搭建和控制策略設(shè)計。最小二乘法、極大似然等參數(shù)化建模方法,需要一定的先驗知識,如機(jī)器人的動力學(xué)模型結(jié)構(gòu),可由流體力學(xué)、慣性和結(jié)構(gòu)布局等分析得到。所獲得的高精度模型常限制在一個小范圍內(nèi),通常通過增加建模的復(fù)雜性提高模型的范圍。利用神經(jīng)網(wǎng)絡(luò)、示教學(xué)習(xí)等非參數(shù)化建模也可獲得一定的效果,但所構(gòu)建的模型被限制在受過訓(xùn)練的集合內(nèi),難以應(yīng)對模型的不確定性。
高斯過程回歸(Gaussian Processes Regression,GPR)是基于貝葉斯理論和統(tǒng)計學(xué)習(xí)理論的一種機(jī)器學(xué)習(xí)方法,適于處理小樣本、非線性等復(fù)雜問題,被廣泛應(yīng)用于機(jī)器人等領(lǐng)域。該方法提供了一種簡單有效的方式表示數(shù)據(jù)的先驗分布,可使用較少的參數(shù)得到準(zhǔn)確的模型。GPR屬于非參數(shù)模型,只需假設(shè)它服從指定均值函數(shù)和協(xié)方差函數(shù)的高斯過程。相較于其他常用的參數(shù)模型,如神經(jīng)網(wǎng)絡(luò)、支持向量回歸、多項式回歸等,GPR具有易訓(xùn)練、超參數(shù)自適應(yīng)獲取以及預(yù)測結(jié)果具有概率意義等特點。KO等利用高斯過程(Gaussian Processes,GP)模型和強化學(xué)習(xí)實現(xiàn)對飛艇的模型辨識和運動控制。FU等利用高斯過程實現(xiàn)對船舶模型的辨識。HEMAKUMARA和SUKKARIEH利用GP模型對固定翼UAV的模型進(jìn)行辨識,獲得了固定翼機(jī)翼模型。CAO等利用GP模型和MPC控制器實現(xiàn)四旋翼無人機(jī)的運動控制仿真。
本文作者利用高斯過程對跨域機(jī)器人的動力學(xué)模型進(jìn)行辨識。通過采集遙控飛行過程中機(jī)器人的狀態(tài)數(shù)據(jù),獲得機(jī)器人的動力學(xué)模型。這種非參數(shù)化建模方法可利用機(jī)器人運行過程中的反饋數(shù)據(jù)較大范圍地獲取機(jī)器人的動態(tài)特性,而不需要對機(jī)器人的模型結(jié)構(gòu)具備先驗知識,可以在控制器設(shè)計環(huán)節(jié)節(jié)省大量試驗成本。
為實現(xiàn)對跨域機(jī)器人的動力學(xué)模型進(jìn)行辨識,應(yīng)對機(jī)器人進(jìn)行模型分析。本文作者采用一種新型跨域機(jī)器人,具有4臺水空兩棲涵道推進(jìn)器,如圖1所示。如圖1(b)所示,4臺推進(jìn)器可以旋轉(zhuǎn)的最大角度為π/2,可實現(xiàn)推進(jìn)器推力由向下到向后的切換。
該跨域機(jī)器人具備水下航行、水面滑行起飛、水面(陸地)垂直起飛懸停和空中平飛等工作模式。其中,在垂直起飛懸停模式下,推進(jìn)器推力向下,機(jī)器人以旋翼飛行器模式工作;在空中平飛狀態(tài)下,機(jī)器人以固定翼飛機(jī)模式工作,通過升力體機(jī)翼提供機(jī)器人升力,通過控制涵道推進(jìn)器傾轉(zhuǎn)角度和螺旋槳轉(zhuǎn)速控制機(jī)器人的俯仰。
機(jī)器人載體坐標(biāo)系選擇重心為原點,遵循右手系,指向前方并與機(jī)器人縱向?qū)ΨQ軸重合;位于機(jī)器人水線面,與垂直并指向右舷;位于機(jī)器人縱中剖面,與垂直并指向下,如圖1(a)所示。

圖1 傾轉(zhuǎn)四旋翼跨域機(jī)器人
本文作者主要考慮機(jī)器人以傾轉(zhuǎn)旋翼模式在空中飛行時的運動控制問題。機(jī)器人在飛行中受力主要分為涵道推進(jìn)器推力、機(jī)翼升力與阻力、重力和機(jī)身阻力。上述力會同時對機(jī)器人產(chǎn)生相應(yīng)的力矩,同時涵道推進(jìn)器槳葉的旋轉(zhuǎn)也會產(chǎn)生相應(yīng)的力矩。
由文獻(xiàn)[16-17]可知,令=[,,]表示載體坐標(biāo)系下機(jī)器人在橫滾、俯仰和偏航方向的角速度,=[,,]表示機(jī)器人姿態(tài)角,=[,,]表示載體坐標(biāo)下機(jī)器人各方向線速度,=[,,]表示世界坐標(biāo)系下機(jī)器人位置,則跨域機(jī)器人的動力學(xué)模型可描述為

(1)
其中:=[,,}為載體坐標(biāo)系下機(jī)器人各方向分力;=[,,]為載體坐標(biāo)系下機(jī)器人繞各軸力矩;為載體坐標(biāo)系到世界坐標(biāo)系的旋轉(zhuǎn)矩陣;為載體角速度到姿態(tài)角速率的旋轉(zhuǎn)矩陣。則世界坐標(biāo)系下,機(jī)器人的受力可描述為

(2)
跨域機(jī)器人的4個涵道風(fēng)扇推進(jìn)器產(chǎn)生的合外力為

(3)
其中:T,、T,和T,分別表示合力在載體坐標(biāo)系下、和軸上的分量,有:


同時,推進(jìn)器推力產(chǎn)生的力矩為
T,=T,
(4)
式中:表示第個推旋翼進(jìn)器中心距離重心的距離,表達(dá)式為

(5)
其中:,為第個傾轉(zhuǎn)旋翼推進(jìn)器軸中心到機(jī)體坐標(biāo)系下平面的距離;,為傾轉(zhuǎn)旋翼推進(jìn)器軸中心到機(jī)體坐標(biāo)系平面的距離;為推進(jìn)器旋翼中心到傾轉(zhuǎn)軸的距離。


(6)


(7)
其中:(,)為通過所有數(shù)據(jù)集輸入計算得到的協(xié)方差矩陣;為單位矩陣。輸出數(shù)據(jù)集和對問詢點的預(yù)測輸出()的聯(lián)合分布為

(8)
其中:()的條件分布服從一個新的正態(tài)分布:
(|,)~[(),()]
(9)
則()的均值和方差的表達(dá)式為

(10)
()=(,)-(,)((,)+

(11)

因此,計算預(yù)測點的預(yù)測值可得:
=(,)
(12)
同時,采用平方指數(shù)協(xié)方差函數(shù)作為GPR的內(nèi)核函數(shù)(,):

(13)



(14)



(15)
則GPR模型的優(yōu)化目標(biāo)為
=argmin()
(16)
對超參數(shù)進(jìn)行迭代更新以最小化()。最后將優(yōu)化后的超參數(shù)代入式(10)和式(11)得到測試樣本最終的預(yù)測值和方差()。
由于高斯過程回歸在輸入訓(xùn)練集較大時計算緩慢,為降低其模型回歸過程中的計算復(fù)雜度,提出采用局部高斯過程回歸方法。該方法通過引入多個局部模型,將訓(xùn)練集分配到多個局部模型中進(jìn)行單獨訓(xùn)練,由此減少每個局部模型的數(shù)據(jù)量和總體的計算復(fù)雜度。因此,該方法可以保證模型的快速更新。
通過計算新的訓(xùn)練數(shù)據(jù)與模型中心的距離,對數(shù)據(jù)進(jìn)行分配,該距離可描述為

(17)
同時,設(shè)置閾值,判斷它是否屬于已有的局部模型。當(dāng)數(shù)據(jù)不屬于已有的任一局部模型時,則以此數(shù)據(jù)建立新的局部模型。局部高斯過程回歸流程如圖 2所示。

圖2 局部高斯過程回歸流程


(18)
基于新型水空跨域機(jī)器人,考慮當(dāng)前機(jī)器人以傾轉(zhuǎn)旋翼無人機(jī)模式進(jìn)行飛行(空中懸停)的情況,通過遙控器控制機(jī)器人的飛行。機(jī)器人的輸入為其8個執(zhí)行機(jī)構(gòu)的動作量,包括4臺涵道螺旋槳的轉(zhuǎn)速(=1,2,3,4)和4臺傾轉(zhuǎn)舵機(jī)的傾轉(zhuǎn)角度(=1,2,3,4)。機(jī)器人的傳感器如IMU和GPS獲得機(jī)器人的運動狀態(tài)包括位置信息、姿態(tài)信息、速度和角速度信息等。
如圖 3所示,機(jī)器人控制模塊主要由PX-4控制板構(gòu)成,PX-4主要承擔(dān)通信、數(shù)據(jù)記錄功能,與無線遙控器實現(xiàn)通信并下發(fā)指令。同時,利用它自帶的簡單的傾轉(zhuǎn)旋翼機(jī)器人控制算法,實現(xiàn)簡單的機(jī)器人飛行控制試驗,以獲取機(jī)器人的運動狀態(tài)數(shù)據(jù)。機(jī)器人通過外接的60 V直流電源通電。

圖3 試驗平臺構(gòu)成
對于時刻,基于高斯過程的機(jī)器人動力學(xué)模型辨識有:

(19)

(20)

機(jī)器人的輸入包括執(zhí)行機(jī)構(gòu)控制量和機(jī)器人的速度和姿態(tài)等信息。同樣的,在相同的執(zhí)行機(jī)構(gòu)中控制輸入,利用第2.2節(jié)方法,獲得機(jī)器人的動力學(xué)模型。并對比相同控制輸入下的模型預(yù)測值和實際測量值。


圖4 模型預(yù)測與實際測量值對比
定義平均絕對值誤差(Mean Absolute Error,MAE)評價模型預(yù)測精度,如式(21)所示。同時,對比全局GPR和LGPR的更新時間和預(yù)測時間,評價兩種方法在計算復(fù)雜度上的區(qū)別,結(jié)果如表1所示。

表1 全局GPR和LGPR性能評價

(21)

本文作者提出了一種基于高斯過程的辨識方法,采用該方法實現(xiàn)對新型跨域機(jī)器人在空中以傾轉(zhuǎn)旋翼無人機(jī)模式下飛行的動力學(xué)模型辨識。通過試驗,對比了測量值和模型預(yù)測值,證明了該方法的有效性。該模型為跨域機(jī)器人仿真平臺及其運動控制器設(shè)計提供了參考,同時后續(xù)應(yīng)完善機(jī)器人的功能(如空中平飛和水下航行等),實現(xiàn)對機(jī)器人更多模式下的動力學(xué)模型辨識。