Alδ+=Alδ-cosβ+Qsinβ
(8)
φ+=δ+(1-cosβ)
(9)
2 雙足移動機器人越障步態控制
2.1 姿態信息獲取
為提升雙足移動機器人智能化程度,在越障步態控制中引入姿態信息,更準確地掌握機器人的運行姿態,完成精準越障。將雙足移動機器人分成軀體、頭部、左上肢、右上肢、左下肢和右下肢6部分。創建機器人部件檢測器,其目標是利用該檢測器,在圖片中找出機器人對應部件方位[8]。以軀體部分為例,依照如下過程創建機器人部件檢測器。
a.在已拍攝完畢的訓練圖片中裁剪軀體部位,將其旋轉到豎直狀態,采集一些機器人軀體的圖片作為負例樣本。
b.計算各樣本圖片的方向梯度直方圖特征,取得1個矢量Z,矢量Z加上正例或負例標簽,就表示相對的樣本圖片。
c.把獲得的矢量引入AdaBoost算法內訓練獲得強分類器,記為
(10)
式中:S(·)為sigmoid函數;hi(·)為第i個矩形框長度計算函數。
關聯性是獲得機器人姿態信息的關鍵指標,以左上肢和軀體之間的距離關系為例,設定軀體方位是已知的[9],僅需計算左上肢當前處在何種方位即可。設定左上肢和軀干相連的邊是g,二者在軀體的頂點k處相互連接,則邊g的中心點和軀體頂點k之間的距離為
(11)
式中:xg、yg為邊g的橫縱坐標;xk、yk為頂點k的橫縱坐標。
關聯性評價指標最終表達式為
od=p(-1×(d-n))/(N-n)
(12)
式中:p為關聯常數;n為全部候選區域內的最小d值;N為全部候選區域內的最大d值。
可以看出,d值越小,關聯度od的值越大,機器人姿態信息的關聯程度越高。
骨骼密度能展現機器人每個部位的位置與走向,在人機交互中為一個核心識別特征[10]。通過獲取骨骼數據系統評估機器人姿態,將候選區域的骨骼密度計算公式描述為
qj=r1q1+r2q2
(13)
式中:q1為骨骼點數量;q2為骨骼點居中水平;r1、r2均為計算權重,二者相加之和等于1。
2.2 越障步態控制
得到足夠的姿態信息后,為進一步優化越障步態控制精度,實現期望越障成效,設計一種基于神經網絡前饋補償[11]的機器人越障步態控制策略,神經網絡訓練數據為機器人姿態信息與障礙物圖像信息。
利用攝像頭獲取障礙物圖像信息[12],圖像信息使用坐標系描述,將障礙物投影方位表示為
(14)
式中:u、w為橫向與縱向參照點方位。
雙足移動機器人越障時,使用具備前饋補償性能的神經網絡進行步態控制,針對機器人導線彎曲引發的不良影響創建前饋控制模型,在偏差與控制量之間組建補償模型[13]。
神經網絡前饋補償控制器和神經網絡分辨器的網絡架構完全相等,都涵蓋輸入層、隱含層與輸出層,不同之處是輸入、輸出2個層級的引入參數。以神經網絡分辨器為例,詳細分析雙足移動機器人越障步態控制全過程。
設定I(1)、O(1)分別是神經網絡第1層輸入值與輸出值,在輸入層中,把機器人加速度傳感器測量信號f與感知的姿態信息擬作輸入量,并代入網絡控制器輸入端,同時將其輸出值fi傳遞至網絡的下一層,此時存在如下對應關系,即
O(1)=I(1)=f
(15)
在隱含層內部,使用sigmoid函數[14]獲得各節點輸入的激勵函數為
(16)
式中:si為第i個節點下的函數權重值。
輸出層中,線性化計算隱含層獲得的信息,把計算結果擬作權重,得到
(17)
式中:R為訓練總次數。
梯度下降算法計算簡便、及時性強[15],在神經網絡參數學習中使用梯度下降完成運算任務。首先設置目標函數F(x)的值域,記作
(18)
式中:z為控制系統輸出控制量;zn為神經網絡分辨器補償量。
神經網絡學習的根本目的是讓目標函數值為最小[16],設定控制周期的補償量為tc,越障步態控制器的輸出為to??刂葡到y的當前控制量t(j)為上述二者的總和,求出總和值即可完成神經網絡訓練,完成機器人智能化越障步態控制任務。
控制輸出總和計算公式為
t(j)=tc(j)+to(j)
(19)
式中:j為當前控制所需時間。
3 實驗分析
為驗證本文所提方法能否完成精準的越障步態控制,對其進行實驗分析,并把文獻[4]深度強化學習法與文獻[5]變質心高度策略法擬作對比組,實驗軟件為MATLAB。以某型號雙足移動機器人為例,設置障礙物數量為5個,起點坐標是(0,0),目標點所處坐標是(8,8)。3種方法越障步態控制結果如圖1所示,圖中圓形為出發點,三角形為目標點,實心方塊是障礙物,虛線部分為障礙物影響范圍。

圖1 3種方法越障步態控制結果對比
由圖1可知,本文方法的越障路徑較為平滑,能以最快速度完成越障,越障路徑最為合理,有效改進了機器人在障礙物停滯不前的現象,越障性能顯著優于其他2種方法。
通過越障步態控制偏差、質心高度和SI指數來驗證方法穩定性。越障步態控制偏差實驗中,設定實驗時間為5 min,越障路徑總長為2 000 m,且有500 m路徑處于崎嶇地段,障礙物影響范圍較大,分析3種方法下機器人在二維平面垂直和水平方向上的越障姿態偏差,結果如圖2所示。

圖2 不同軸位的越障步態控制偏差對比
由圖2可知,越障控制下0~80 s與130~300 s時,機器人控制偏差浮動較小,偏差控制狀態較好,而在90~120 s時發生較大浮動。這是由于機器人經過了崎嶇地段,越障時會產生一定擺動。但和其他2種方法相比,本文方法利用姿態信息感知功能,快速調整了機器人重心,增強機器人在垂直及水平方向的越障水準,證明了本文方法在極端情況下也能進行更細微的行走操作,實現可靠的越障任務。
雙足移動機器人的初始質心高度采用傾斜平臺法測得,以初始質心高度為中心零點,當雙足移動機器人跨越障礙運動時,其質心的高度會發生變化,當運動質心高于初始質心則為正數;當運動質心低于初始質心則為負數。假設機器人在平地運動,路面上安置一個高度為7 m的障礙物,觀察雙足機器人越障時的質心波動,結果如圖3所示。由圖3可知,面對7 m高的障礙物,本文方法下機器人成功越障后,質心高度波動情況明顯小于深度強化學習法和變質心高度策略法,證明了本文方法可以花費較小的動力就能越過障礙,垂直方向能量耗損有較大改善,完成了越障步態控制的預期目標。

圖3 機器人越障質心浮動對比
采用穩定性指數(stability index,SI)衡量機器人越障步態控制水準,該指標計算公式為

(20)
式中:λt為實測零力矩點;λs為預期零力矩點;λmax、λmin分別為零力矩點的最大值與最小值。
設定越障路徑總長為100 m,在行走第9 s引入一定外力擾動,SI指數變化趨勢如圖4所示。

圖4 SI指數變化趨勢
由圖4可知,本文方法雙足機器人行走受到擾動時,步態控制的SI指數波動較小,具備更好的抗干擾性能,動態穩定性也隨之提高,綜合性能優于其他2種方法,在真實場景應用中可獲得更優的實踐結果。
4 結束語
為有效處理雙足移動機器人越障波動性大、穩定性不高的實際問題,結合人機交互概念,本文提出一種基于姿態信息的雙足移動機器人越障步態控制方法。分析機器人動力學特征并劃分姿態規律,使用擁有前饋補償性質的神經網絡進行越障步態控制訓練。實驗過程中,利用不同指標和傳統算法進行對比,充分驗證了所提方法在越障步態控制方面的實用性與可靠性,為提升機器人整體越障性能打下堅實基礎。