白巖峰
(天津渤海職業技術學院,天津300400)
腦機接口(英文簡稱BCI)是一種綜合多學科、多領域的人機接口方式,其內容涉及計算機科學、神經科學、控制及信息科學和醫學等。BCI系統主要通過采集和提取腦電信號來識別人的思想,進而將該腦電信號翻譯成控制信號,完成大腦與被控對象之間的信息傳遞及控制任務,促使人腦與外部設備之間的信息交互,在醫學上,可用于增強或恢復人類身心健康,如感覺功能修復、人體生理機能增強、抑郁癥預測及治療等諸多應用。
隨著國內外科技界對BCI研究的不斷深入,BCI不僅在神經科學、臨床醫學方面展現出極高的應用價值,而且在工業、軍事、生活娛樂等多個領域具有廣闊的應用遠景。與此同時,作為BCI應用的重要載體—智能機器人,同樣在工業等領域發揮重要作用。以化工行業為例,智能機器人已在化工園區公共管廊安全[1]、化工產品及物料的輸送搬運、化工廠環境的值班巡檢、化工企業工作人員的人機交互及人像識別等方面廣泛應用,而以上功能的實現則往往建立在機器人工作時能有效躲避障礙物的前提下,避障算法的研究至關重要。以此為背景,本文主要針對智能移動機器人運行避障的腦機控制方法展開研究。
國內外已對腦控機器人有了一定的研究基礎。早在2008年,國外研究人員提出一種智能輪椅的BCI控制方案,將基于思維任務EEG的自主BCI所產生的指令與環境約束概率(即相乘)結合起來,實現輪椅的共享控制[2];國內某實驗室,將腦-機接口技術與機器人技術相結合,通過對受訓者腦電Alpha波阻斷現象進行特征識別和提取,實現了對服務機器人的控制[3]。近些年,隨著技術的發展和成熟,機器人腦機控制方法呈現多樣性,市場上也出現多家腦控機器人產品。但是,由于缺乏可靠、易用、便捷的采集系統,智能機器人缺乏魯棒性和日常生活中的半自主性,機器人運動過程中BCI系統的信息傳輸率和準確率較低,使得人機交互的流暢性較差,從而導致腦控機器人的運動控制容易出現穩定性較差、運動卡頓甚至失控的問題。此外,當前市場上的腦控機器人系統多采用少量干電極進行控制,這些新系統雖比傳統濕電極EEG系統更方便操作,但不能保證采集到真正的EEG信號,去噪效果也較差。
本文將腦電信號作為生物信息的反饋信號,通過監測受訓者腦電的alpha波和beta波,進行生物反饋,采用當前技術先進的醫用腦電信號采集系統,信號采集更加精準,受訓者經訓練,可輸出相對穩定、準確的腦控指令。在智能機器人控制方面,將動態速度窗口法應用于腦控機器人的運動控制,使得機器人運動平滑性和穩定性得到很大改善,在一定程度上實現人機互補,提升人機交互的流暢性。
動態窗口法又稱DWA(Dynamic Window Approach)算法,是一種機器人局部路徑規劃的算法。智能機器人在行進過程中,其位置變換和方向變化是通過其當前的運動速度及角速度(轉向速度)來實現的,而窗口是限定當前機器人最大速度、最小速度及角速度的一個范圍(由機器人當前狀態和運動模型獲得),在該范圍內,可計算機器人不同速度及角速度下所能到達的位置,通過對不同位置的評測(包括機器人與障礙物的距離及朝向終點的角度等),獲取機器人當前最佳位置,并由該位置繼續重復上述過程建立新的窗口,這樣便形成了動態窗口,根據評價指標對各軌跡進行評估,選取最優軌跡和最優速度[4]。
3.2.1 選擇機器人運動模型
在動態窗口算法中,要生成機器人的軌跡,首先要確定機器人的運動模型,本文以差分驅動運動模型為例,假設機器人只完成前進和旋轉,且機器人旋轉角速度和平移速度可獨立控制[5]。
在t時刻,用x(t)和y(t)表示機器人位置坐標,用θ(t)表示機器人運動方向與水平方向的夾角,則可用[x(t),y(t),θ(t)]來描述機器人當前的運動學模型。假設機器人在前進和旋轉運動中,初始位置為(x0,y0),在不發生碰撞的前提下,經過n個時間間隔到達目標位置,每個時間間隔的速度為(vt,ωt),間隔時間內的加速度為零,由此可獲得t時刻到t+1時刻,機器人坐標位移與角度間的關系,進而描述機器人運行軌跡,見公式(1)~(3)。

3.2.2 機器人速度采樣
在確定了運動模型的基礎上,通過機器人左右輪的速度可獲得機器人的運行軌跡。考慮到機器人自身最大速度、最小速度、最大加減速和電機力矩等因素的影響,對速度(v,ω)的二維采樣空間進行限制,得到一個動態窗口,機器人在該窗口內的速度與其實際能夠達到的速度相匹配。
3.2.3 評價函數
根據采樣速度可生成許多條軌跡,為選出一條最優軌跡,現定義如下評價函數,見公式(4)。

其中:heading(v,ω)為方位角評價函數,用于衡量機器人在當前速度條件下,到達預期軌跡末端時頭部朝向與目標位置間的角度的偏差,該值越小,評價得分越高。
dist(v,ω)為間隙評價函數,表征機器人在當前軌跡與最近的障礙物之間的距離,該值越大越好,如果軌跡與障礙物發生了碰撞,則把這條估計排除掉。
velocity(v,ω)為速度評價函數,評估機器人當前軌跡的速度大小。通常,機器人速度在不超過最大值的前提下,該值越大越好。確定了評價函數之后,通過對采樣速度生成的軌跡進行評估,進而可選擇出最優軌跡和最優速度。
以上三部分計算出來的數據進行分別進行歸一化平滑處理,再相加。所謂歸一化,就是將以上各項除以各自項的總和,由以上三部分構成的評價函數可使機器人在局部導航過程中,避開障礙物,以較快速度朝目標行駛。
3.2.4 軌跡生成
在生成軌跡之前,設置機器人的最大速度、最小速度、最大加速度、最小加速度、速度分辨率、采樣時間,機器人自身半徑(用于碰撞檢查)以及評價函數所用到的權重值。根據3.2.1中的差分驅動運動學模型,以及初始位姿和速度來即可生成軌跡。
在智能移動機器人兩輪差分驅動和動態窗口控制算法的基礎上,將腦機接口技術與機器人控制進行結合,利用基于EEG的BCI系統來控制移動機器人。設計采用臨床中使用的濕電極和導電膏,準確獲取腦電alpha波和beta波,采用模式識別的方法對腦電信號進行分類提取特征信息,估計大腦意圖,從而獲得控制指令,即前進、左轉、右轉。根據當前機器人運動狀態(位姿、速度)和腦機指令,將當前機器人的運動速度窗口,分為直線區域、左轉區域和右轉區域。
智能機器人在運行過程中將結合當前外部障礙和腦機控制指令來決策速度。當指令為直線速度時,直接使用左右輪速度相同或者近似相等的速度組合(如紅色標記);否則,在左轉區或者右轉區域中選擇最優的左右輪速度;當根據指令選擇的最優速度與外部障礙物存在碰撞可能時,則機器人自動停止運動,并等待下一次的控制指令。
本研究對機器人動態速度窗口算法做了大量仿真實驗,仿真結果顯示,在障礙物排列較松散時,該算法能夠使機器人以較快速度到達目標點,且運行軌跡相對平滑;若障礙物排列較緊密,機器人需在障礙物間隔中連續轉彎通過時,機器人速度遲緩,甚至出現碰撞(例如圖1,A點)或進入死角的情況。將腦機控制應用到機器人避障運行過程后,當機器人運行方向有誤或速度明顯降低的情況下,通過腦控指令影響機器人左右輪運動速度的選擇,調整機器人運行方向(例如圖1,B點),可優化機器人運行的速度和軌跡,減小碰撞幾率。

圖1 MATLAB仿真效果對照圖
機器人動態速度窗口法在腦機控制中的應用是研究的初步嘗試,當采樣時間間隔較短且腦機指令間隔較短時,因為動態窗口存在的糾偏能力,可能導致指令和窗口規劃在小范圍的速度抖動,快速腦機指令下的運動平滑將是后續的研究方向。隨著研究的不斷深入,基于動態窗口法的機器人腦機控制方法有望應用于化工車間移動巡檢機器人,為機器人有效避障控制方案的設計提供借鑒。