吳 波,閆紅雨,孫霄偉,胡益菲
(1.北京國電富通科技發展有限責任公司,北京 100070;2.國網電力科學研究院有限公司,江蘇 南京 211106;3.國網天津市電力公司,天津 300010)
近年來,供電企業為改善國內營商環境、提高經濟效益,不斷加強電網作業能力。但人工作業強度大、風險系數高,有可能對工作人員的安全造成威脅,另外受天氣影響較大,作業效率有待提高。自倡導發展智能電網以來,全國范圍內掀起智能化技術研究,配網機器人作為智能化技術的代表,能夠配合工作人員完成檢修工作,取代操作人員在危險的環境中工作,降低了人力的勞動強度,提高了工作效率。但配網作業現場線路和設備眾多,不僅要求機器人在固定空間內高效到達指定位置,還必須靈活躲避周圍障礙物。因此,對于機器人來講,路徑規劃問題決定了作業效果,該問題已經成為廣大學者研究的熱點。
文獻[1]利用預測與模糊控制算法規劃機器人路徑,針對避障行為設置模糊控制器,確定內部規則,達到行為交替目的;對于避障死鎖問題,利用累加轉角判定法避免機器人進入死鎖狀態,引入陷阱預測機制,克服傳感器測量的局限性,減少路徑冗余。文獻[2]通過Bezier曲線解決機器人路徑規劃問題,構建機器人運動模型,利用Bezier曲線表示路徑狀態,將路徑規劃變換為方位優化問題;使用遺傳算法將二維路徑編碼轉換成一維編碼,確定路徑約束,保證機器人擺脫局部最小解,順利繞過障礙物到達目標點。
上述方法在作業環境簡單或障礙物固定的情況下都表現出良好的避障路徑規劃能力。但當障礙物是動態時,這些方法的避障能力下降。針對這一問題,本文提出基于動態窗口法(DWA)的配網作業機器人避障路徑規劃方法。
基于動態窗口法(DWA)根據傳感器獲取的環境數據,將機器人位置約束變換為速度約束,具有較強的避障性能,在動態環境下同樣適用[3]。該方法綜合考慮機器人自身運動特點和環境產生的約束,根據這些因素建立動態窗口,獲取速度信息,按照采樣速度形成多個待評價的軌跡,通過建立評價函數得出不同軌跡的評分,將評分最高的作為最終規劃結果。
假設機器人的總體質量為m,車輪半徑為r,2輪之間的距離為2R,利用v和ω描述前向與轉向角速度,q=[x,y,θ]代表機器人坐標。由于DWA算法屬于一種采樣方法,在構建運動學模型[4]時,必須注意位姿的實時變化情況,這與機器人的速度、角速度相關[5]。
設置現階段機器人位姿為qt=[xt,yt,θt],其中,xt、yt分別為t時刻機器人在x軸和y軸上的坐標,θt為機器人與x軸形成的夾角。此外,t時刻機器人速度與角速度分別表示為vt和wt,則t+1時刻的位姿情況描述為qt+1=[xt+1,yt+1,θt+1]。如果t時刻機器人做弧形運動,軌跡半徑表達式為
(1)
如果角速度wt不等于0,則t+1時刻機器人位姿為:
(2)
(3)
θt+1=θt+ωt
(4)
1.2.1 機器人運動范圍確定
在路徑規劃過程中,建立作業環境模型是非常關鍵的步驟,其主要作用是分析傳感器采集到的環境信息,將作業環境中機器人、障礙物、起點和終點的位置數據映射在抽象的空間中[6],方便計算機分析處理。一個良好的環境模型能夠減少路徑規劃的時間。
如果利用(x,y)表示空間內某一坐標點,xmax與ymax分別描述該空間內橫、縱坐標的極大值。則利用下述公式描述空間內所有可規劃的范圍,即
{x,y}|0≤x≤xmax,0≤y≤ymax
(5)
式(5)確定了所有能夠規劃的范圍,確保機器人軌跡不會偏離作業環境[7]。
1.2.2 局部地圖建立
確定機器人的活動范圍后,建立局部地圖。已知機器人起點PS和目標點PG,獲取2點間的所有障礙物,分別在距離障礙物l1與l2的距離下各設置1對頂點,表示為(r1,r2)、(r3,r4)。
根據下述規則將2個頂點連接:
規則1:每個頂點間的連線均為單向,且由PS到PG方向連接。
規則2:PS和PG之間的連線構成的夾角余弦值要比0大,且比1小,可表示為
(6)
上述即為機器人作業環境模型,能夠對機器人的運動范圍起到約束作用。
DWA算法就是利用約束速度與速度變化性能,對機器人速度進行多采樣,并在采集的多組速度下模擬出不同軌跡,通過評價函數選出得分最高的路徑,完成避障路徑規劃。在此過程中,DWA算法發揮的最關鍵作用就是根據機器人的運動學模型,在搜索空間中設定一個滑動窗口[8],通過該窗口將避障問題變換為速度約束問題。
利用圖1描述DWA算法的速度向量空間,其中,ω和V分別為角速度與線速度,ωmin與ωmax為最小、最大角速度,Vmin和Vmax為最小、最大線速度。整體區域表示為Us,無色空間Ua是機器人安全活動范圍,Ud是限速區域,Ur是所有空間的交集,即搜索空間。

圖1 速度向量空間描述
結合速度約束情況,將Us作為線速度和角速度集合,該集合就是DWA算法求解的范圍,符合
Us={(V,ω)|Vmin≤V≤Vmax,ωmin≤ω≤ωmax}
(7)
將機器人的路徑分為直線和圓弧運動,為確保機器人始終在安全范圍內活動,則碰撞可行范圍內Ua滿足
(8)

在電機轉矩約束作用下,采樣周期Δt內存在V和ω的最大與最小范圍,因此,還需縮小動態窗口的區間。在已知現階段Vc和ωc情況下,限速區域Ud需符合
(9)

最終確定的速度區間是式(6)~式(8)的合集,則Ur滿足
Ur=Us∩Ua∩Ud
(10)
在搜索空間Ur內,結合線速度和角速度的采樣情況,對Ur做離散化處理,獲得離散采樣點(V,ω)。針對這些采樣點,根據機器人運動學模型即可生成多條路徑。
針對在空間Ur中的速度采集結果,有一部分路徑方案是可行的。為選出最佳路徑,需通過評價函數判斷每條路徑的優劣,進而確保機器人不僅成功躲避障礙物,還能縮小起點與終點的距離。
典型的DWA算法評價函數為
G(V,ω)=κ(α·h(V,ω)+β·d(V,ω))+
γ·v(V,ω)+κ(V,ω)
(11)
式中:α、β和γ為方向、障礙物間隙和速度評價函數的權值;κ為平滑系數;h(V,ω)、d(V,ω)和v(V,ω)分別為方向、障礙物距離和速度的評價函數。
將得分最高的組合作為機器人速度控制指令,即
Vc=argmax{G(V,ω)}
(12)
動態窗口評價函數的加權項如下所述。
好在奮力拼搏自強不息的中年人是社會主流。他們在前邊打基礎,趟路子,積人脈,付學費,中年后開始見成效,收果子,打江山,坐天下。如果按40歲算進入中年,這個歲數的劉邦剛揭竿而起,劉備才請到軍師諸葛亮,曹雪芹剛開始動筆寫《紅樓夢》,愛因斯坦剛提出相對論,毛澤東剛帶領隊伍來到延安,錢學森剛從美國學成歸來,袁隆平的雜交水稻研究剛起步……即便生活困頓,衣食不周,篳路藍縷,但其精氣神十足,心氣很大。因為后邊的路還長著呢,他們還要大展宏圖,大有可為,事業還輝煌得很。今日而言,馬云、馬化騰、劉強東、施一公、饒毅、李彥宏、俞敏洪、馬偉明等風云人物,個個都是中年精英,雄姿英發,個個都獨掌一面,名聞天下。
a.方向評價函數。
函數h(V,ω)就是在已知采樣速度的情況下,模擬前向路徑,計算路徑末端切線和目標點的連線距離[9],表達式為
(13)
式中:φ為機器人實際路徑和理想路徑之間的角度差。
φ值越小,函數h(V,ω)的得分越高。因預估位置取決于速度,所以h(V,ω)也與速度有關。
b.障礙物距離評價函數。
函數d(V,ω)描述運動路徑和障礙物的間距。該值越小,機器人就越容易與障礙物發生碰撞;反之,間距越大,d(V,ω)評分越高,機器人路徑也就越安全。若通過某閾值判斷該函數評分,則
(14)
式中:D為路徑某點和障礙物的間距;L為設定的閾值。
c.速度評價函數。
函數v(V,ω)能夠減少機器人到達終點的時間,具體表達式為
v(V,ω)=|Vg|
(15)
式中:Vg為前向線速度。
在評價函數G(V,ω)中,上述3個子函數是不可缺少的,共同約束機器人朝目標點前進。機器人只有在這些約束條件下行駛,才能躲避障礙物,到達終點。
由于不同評價函數的單位不同,需要歸一化各分量[10]。將所有子函數的區間設置為[0,1],歸一化過程為:
(16)
(17)
(18)
式中:n為全部采樣路徑;i為某條待評價路徑。
對3個子函數分別歸一化處理后,獲得最優避障路徑。
選擇DL-RH型巡檢機器人作為實驗機器人。該機器人包括硬件與軟件2個子系統,主要技術參數為:工作范圍0~1 300 mm、重復定位精度±0.03 mm、6個旋轉關節、設計壽命周期36 000 h,UR10的特性滿足了配網檢修作業中的持重、距離、精度、自由度和服務時長等要求。
人工作業時需要對作業環境進行觀察,并準確定位作業點。該機器人以攝像機及激光雷達作為視覺設備,激光雷達采用了市場上成熟的激光雷達sick 581,其主要特性為:紅外線(850 nm)光源、角度分辨率0.33°,幾乎可以識別任何形狀,sick 581的特性克服了配網檢修環境中強光、沙霧和高識別精度等難題。配網作業機器人運行現場如圖2所示。

圖2 配網作業機器人運行現場
設置配網作業的范圍為19 m×19 m,實驗開始前,設置柵格地圖,分別在障礙物較少、障礙物較多和動態障礙物環境下測試本文方法、預測與模糊控制方法、Bezier曲線法的避障路徑規劃性能。
此環境下,障礙物數量少且分散,得到的測試結果如圖3所示。

圖3 簡單環境下不同算法的避障路徑模擬
由圖3可以看出,當作業環境中障礙物數量較少時,3種算法都能準確躲避障礙物,并且從起點到終點的路徑都較短,路徑中拐點數量少,提高行進效率。
在較為復雜的環境下,障礙物數量和類型增多,加大了避障路徑規劃難度。3種算法的路徑規劃結果如圖4所示。

圖4 不同方法在復雜環境下的路徑規劃模擬
分析圖4可知,當作業環境相對復雜時,本文方法逐漸顯示出優勢,依然能夠保持起點與終點之間的路徑最短,且沒有與障礙物發生碰撞。其他2種方法雖然有效避開障礙物,但會以犧牲距離為代價,增加路徑總長度。本文方法之所以能在簡單和復雜環境下都能取得最好的規劃結果,是因為DWA算法可以通過動態窗口對機器人速度進行采樣,增強自適應調整能力,同時合理地評價函數,有助于選出最佳路徑。
在上述復雜環境下,添加2個隨機障礙物,分析3種方法的路徑規劃能力,測試結果如圖5所示。

圖5 動態環境下不同方法路徑規劃模擬
由圖5可知,作業環境下出現隨機障礙物時,本文方法能夠有效辨識障礙物并避障,但其他方法均與障礙物發生碰撞。實驗結果表明,本文方法全局規劃能力較強,可以根據環境中的信息更改路徑,實時性較強。
為提高配網機器人作業效率,進一步保證配網安全運行,利用DWA算法完成機器人避障路徑規劃。利用滑動窗口采集機器人的速度信息,根據機器人運動模型,生成多條避障路徑,通過設定合理的評價函數確定最佳規劃路徑,實現避障路徑規劃。實驗結果表明,本文方法能夠準確規避障礙物,軌跡規劃效率較高。DWA方法不僅充分考慮障礙物,還能確保路徑規劃的實時性,滿足配網機器人作業需求。