馬麗英,張洪杰,羅天洪,鄭訊佳
(1.重慶交通大學機電與車輛工程學院,重慶 400074;2.重慶文理學院智能制造工程學院,重慶 402160)
腦-機接口(Brain-Computer Interface,BCI)技術能夠將人的意圖轉換為腦電信號(Electroencephalogram,EEG),不依賴肌肉和外周神經,在外部設備與人腦之間建立起通道,直接進行信息交流[1-3]。BCI技術使得人們可以通過大腦直接控制智能假肢、智能輪椅、康復外骨骼機器人等設備。因此,BCI技術在醫療康復等領域得到了廣泛的應用,而在自動化駕駛以及通信娛樂等方面也具有廣闊的應用前景[4-8]。
EEG信號具有非平穩性、信噪比低等特性,傳統的信號分析方法不能夠對其進行完全有效的處理[9-11]。如何有效的提取出EEG信號的特征以及提高腦電信號的分類準確率是當下BCI技術的核心難題[12-15]。目前,國內外研究者提出了各種EEG信號特征提取方法以及分類方法。Kwon-Woo Ha等[16]提出了一種基于膠囊網絡(CapsNet)的EEG信號分類方法,首先通過短時傅里葉變換算法將EEG信號轉換成2D圖像,然后在使用膠囊網絡進行識別分類,但該方法的分類準確率較低。孫會文等[17]提出了一種基于希爾伯特黃變換(Hilbert-Huang Transform,HHT)的EEG信號識別方法,提取腦電信號前三階本征模態函數的平均瞬時能量以及前6階AR模型的系數作為特征,將其輸入到支持向量機進行分類識別,但該方法側重于提取EEG信號中具有分類特征信息的瞬時幅值而忽略其他特征。Park Y等[18]提出了一種基于局部區域共空間模式(Local Region CSP,LRCSP)的EEG信號分類方法。劉寶等[19]提出了一種基于PS0-CSP-SVM的EEG信號分類方法,利用粒子群優化算法得到EEG信號的最佳時段,并采用CSP對最佳時段進行特征提取,最后通過支持向量機對提取的特征進行分類。汲繼躍等[20]提出了一種基于最優區域共空間模式(Optimal Region CSP,ORCSP)的EEG信號分類識別方法,該方法通過計算方差比來選取通道附近的最優區域進行特征提取,并通過支持向量機進行分類識別。徐建等[21]提出了一種基于人工蜂群(Artificial Bee Colony,ABC)算法和反向傳播(Back Propagation,BP)神經網絡的EEG信號分類方法,通過引入交叉運算增強ABC算法的全局搜索能力,并通過該算法進一步優化BP神經網絡,從而提高對EEG信號的分類識別。谷學靜等[22]提出了一種將CSP和卷積神經網絡(Convolutional Neural Network,CNN)相結合的EEG信號分類方法,通過CSP提取到EEG信號的空域特征,并將其輸入到CNN網絡進行分類識別。
綜上所述,針對腦電信號因為具有非平穩性、時變性以及非線性等特性而導致分類準確率低的問題,本文提出一種基于LMD-CSP和隨機森林的EEG信號分類方法。LMD是一種具有很強自適應性的非線性分析方法,能夠將非平穩、非線性的EEG信號分解為多個更平穩的PF分量,而對于EEG信號的時變性,利用CSP分別對PF分量進行空域特征的提取,將EEG信號的特征進行差異最大化,最后利用隨機森林算法對CSP特征進行分類識別,獲得更高的分類準確率。
現代神經電生理學研究表明:當人進行單側肢體運動想象時,大腦對側運動感覺區域中EEG信號相應頻段的幅值降低,頻帶能量也降低;相反,大腦同側的運動感覺區域中EEG信號相應頻段的幅值增大,頻帶能量升高,這種現象分別稱為事件相關去同步(Event Related Desynchronization,ERD)和事件相關同步(Event Related Synchronization,ERS)[23]。例如進行右手運動想象時,大腦右半球區域產生的腦電波幅值降低,出現ERD現象;同時,大腦左半球區域產生的腦電波幅值增加,出現ERS現象。此外,ERD/ERS現象還具有頻段特性。EEG信號按頻率的不同分為四個波段,分別為8 Hz~13 Hz的α波、13 Hz~30 Hz的β波、4 Hz~8 Hz的θ波以及0.5 Hz~4 Hz的δ波,而在進行肢體運動想象時,ERD/ERS現象主要出現在頻率范圍為8 Hz~30 Hz[24-27]。因此,ERD/ERS現象的空間特性和頻段特性為運動想象的分類提供了理論依據。利用LMD分解能夠獲取EEG信號和個體的運動想象最想關的頻段,再利用CSP能夠提取最佳頻段EEG信號的空間特征,最后將CSP空間特征輸入到隨機森林分類器中獲得分類準確率。
為提高EEG信號分類準確率,本文提出一種基于LMD-CSP和隨機森林的分類方法。首先對原始腦電信號進行濾波、陷波等預處理,為了獲取EEG信號的最佳頻段,利用LMD將EEG信號分解為多個PF分量,并通過每個PF分量頻譜圖選取出符合EEG信號最佳頻段的PF分量。共空間模式能夠通過構建空間濾波器將兩類數據的特征差異最大化,有效進行分類,通過共空間模式對選取的PF分量進行特征提取,得到具有較大區別度的空間特征,然后將得到的CSP特征輸入到隨機森林分類器中,經過分類識別后得到最終分類結果,算法的流程圖如圖1所示。

圖1 算法流程圖
針對腦電信號,LMD能夠進行自適應分解,并且產生PF分量,PF分量具有真實物理意義,同時反映出腦電信號能量在空間尺度上的時頻發布。相對于經驗模態分解,更具有端點效應小、迭代次數少等特點。首先采用LMD對EEG信號進行處理,其過程如下。
①求取輸入EEG信號x(t)的全部局部極值點ni,并求取相鄰極值點ni和ni+1的均值mi,以及包絡估計值ai,即:

②將得到的全部均值mi和包絡估計值ai分別用直線進行連接,然后進行平滑處理,分別得到局部均值函數m11(t)和包絡估計函數a11(t),并將局部均值函數從EEG信號剔除,即:

③用h11(t)除以包絡估計函數a11(t),得到調制信號s11(t),即:

④計算s11(t)的包絡估計函數a12(t),如果a12(t)≠1,則s11(t)不是純調頻信號,重復上述步驟,直到得到純調頻信號s1n(t),即:

式中,

⑤求得純調頻信號s1n(t)相應的包絡信號a1(t),并與之相乘得到第一個乘積函數PF1(t),即:

⑥將PF1(t)從EEG信號x(t)中剔除,得到新的信號u1(t),再將u1(t)作為原始信號重復上述步驟k次,直至uk(t)為一個常數或單調函數為止,即:

原始EEG信號x(t)可表示為乘積函數PFk(t)與殘余分量uk(t)之和,即:

對腦電信號進行LMD后,再利用CSP算法分別對最具判別性的PF分量進行特征提取。CSP算法主要針對EEG信號的空域特性,能有效提取出EEG信號的空域特征[28]。具體過程如下。
①將各個PF分量分為左手運動想象數據X1以及右手運動想象數據X2,并求取對應的協方差矩陣R1和R2,并求取兩類數據的混合空間協方差矩陣R,即:

式中,i=1,2,表示矩陣的轉置,trace()為矩陣的跡。
②對混合空間協方差矩陣R進行奇異值分解,并求取白化特征矩陣P,即:

式中,U為特征向量矩陣,λ為對應特征值的對角矩陣,且特征值為降序排列。
③對協方差矩陣R1和R2,進行以下變換:

④S1、S2具有公共特征向量,且存在兩個對角矩陣λ1、λ2和相同的特征向量矩陣B,對S1、S2進行主分量分解,可得:

式中,I為單位矩陣。
⑤計算投影矩陣W,即:

⑥求取左手運動想象數據X1以及右手運動想象數據X2的特征矩陣以及特征向量,即:

式中,i=1,2,Zi為對應的特征矩陣,fi為對應特征向量。
原始EEG信號經過LMD-CSP算法后,將獲得一組CSP特征,然后將CSP特征輸入到隨機森林分類器中進行分類識別。
隨機森林算法是對多個決策樹分類器的集成,決策樹得出結果后,通過對不同結果實行簡單投票法來獲得最終結果。隨機森林具有泛化能力強、訓練速度快等特點,同時隨機森林還具有樣本隨機性以及特征選取隨機性,降低了每一棵決策樹的相關性,保證隨機森林的分類能力。其算法結構如圖2所示。

圖2 隨機森林算法結構圖
其算法流程如下:①首先對給定的訓練特征集F進行有放回的隨機抽樣,形成子訓練集,即θ;②子訓練集θ一共有M個屬性特征,在決策樹的每個節點需要分裂時,從中任意選出m個特征做為候選的分裂屬性特征;③計算所選m個特征的信息增益,并將其中增益最大作為分裂特征屬性;④每個節點都按照上面步驟進行分裂,直到生成的決策樹可以準確地將訓練特征集F中的樣本進行分類,或者用完所有屬性特征;⑤重復上述步驟,建立大量決策樹并組成隨機森林模型。
將提取到的CSP特征作輸入到隨機森林分類器中,得到最后的分類結果。
本文實驗數據來源于奧地利Graz University of Technology提供的BCI Competition 2008 data sets 2b數據集,該實驗中共有9個受試者(編號為B01~B09),每個受試者視力都正常。經過實驗最終獲得9個受試者的左右手運動想象腦電數據。
實驗過程如圖3所示,實驗一共持續8 s~9 s,前兩秒,屏幕上出現一個“+”,該時間段內受試者放空大腦,不進行任何想象。第二秒時,出現一個持續時間為70 ms的蜂鳴聲。從第三秒開始,屏幕上出現一個持續時間為1.25 s的提示箭頭,受試者根據箭頭指示,進行持續時間為3 s的運動想象。最后受試者休息1.5 s,為下一次測試做準備。每個受試者進行三組測試,前兩組測試均進行60次左手運動想象以及60次右手運動想象,第三組測試進行80次運動想象,每個受試者總計進行200次左手及右手運動想象。

圖3 實驗過程
該次實驗只記錄了C3、C4以及CZ三個電極產生的EEG信號以及三個眼電通道所記錄的眼電信號,其中采樣頻率為250 Hz,并對EEG信號進行了50 Hz的陷波處理以及0.5 Hz~100 Hz的帶通濾波處理,電極分布為國際10-20系統,如圖4所示。

圖4 電極分布圖
當受試者進行實驗時,運動想象所產生的EEG信號頻段主要集中在8 Hz~30 Hz,因此采用FIR帶通濾波器對EEG信號進行8 Hz~30 Hz的帶通濾波處理。由實驗過程可知,前幾秒數據與運動想象無關且考慮到受試者需要反應時間,本文選取每次實驗中的4 s~7 s的數據進行分析,因此對濾波后的EEG信號進行事件分段以及偽跡去除。
通過LMD將EEG信號分解為多個PF分量以及一個殘余分量,并對最具判別性的PF分量進行后續分析。其中以C3通道一次運動想象為例,利用LMD對腦電信號進行分解,結果如圖5、圖6所示。

圖5 左手運動想象PF分量波形及頻譜圖
從圖5、圖6均可以看出,PF3以及PF4分量的頻率都在5 Hz以下,而EEG信號對應的頻段為8 Hz~30 Hz。因此根據運動想象腦電信號的頻帶范圍,選取PF1和PF2分量作為后續分析對象。將所有選取出來的左右手運動想象的PF分量矩陣分別作為CSP的輸入進行特征提取,最后可以得到200組左手及200組右手CSP特征向量,共400組特征向量。

圖6 右手運動想象PF分量波形及頻譜圖
為了保證分類結果的準確性以及有效性,將得到的400組CSP特征向量隨機選取百分之七十作為訓練集,百分之三十作為測試集,并輸入到隨機森林分類器中。而隨機森林分類器最終的分類結果與隨機森林中決策樹的個數有關,為了保證最終分類準確率達到最高,因此選取不同數目的決策樹,看其與分類準確率的關系,其結果如圖7所示。

圖7 決策樹對分類準確率影響圖
由圖6可以看出,決策樹大約在達到40棵及以后時,腦電信號的分類準確率達到最高,考慮到算法響應時間等因素,決策樹選取為40棵。將其中一位受試者的測試集數據輸入到隨機森林分類器中,得到結果如圖8所示。

圖8 分類結果圖
上圖中類別1代表左手運動想象,類別2代表右手運動想象。當“o”與“*”重合時,說明分類結果的類別與實際類別一樣,從圖中可以看出左右手運動想象的分類結果大多與實際類別相同,其中右手分類準確率達到92.4%,左手分類準確率達到98.1%,具有較高的分類準確率。為保證實驗結果的可靠性以及普遍性,對每位受試者進行了50次實驗,得到其每次實驗的分類準確率,并最終取50次實驗的分類準確率的平均值為最后的分類準確率,其結果如表1所示。

表1 所有受試者分類準確率
從表中可以看出,受試者B09的分類準確率最低時,只有81.5%,而受試者B04的分類準確率最高時,達到了99.1%。同時9位受試者中的平均分類準確率都達到了90%以上,說明LMD-CSP+RF方法運用在EEG信號特征提取以及分類識別上是有效可行的。
為更好的驗證LMD-CSP+RF方法的可行性,將9位受試者的分類準確率的平均值作為該方法的最終分類準確率,并將LMD-CSP+RF方法與其他方法得到的結果進行對比分析,其結果如表2所示。

表2 本文方法與其他方法分類準確率比較
由表2可以看出采用LMD-CSP+RF方法對EEG信號進行分類識別得到的分類準確率遠高于其他文獻方法,相比于其他文獻采用的CapsNet方法、HHT+SVM方法、LRCSP+SVM方法、PS0-CSP+SVM方法、ORCSP+SVM方法對EEG信號進行分類識別,分類準確率分別提高了13.74%、11.1%、10.06%、4.53%、2.4%,進行一步證明了本文方法對腦電信號特征提取以及分類識別的有效性。
針對EEG信號具有非平穩性、非線性等特性而導致特征提取困難、分類準確率低的問題,本文提出一種基于LMD-CSP和隨機森林的運動想象腦電信號分類方法。利用LMD對BCI Competition 2008 data sets 2b數據集中腦電信號進行分解,選取最具判別性的PF分量并通過CSP進行特征提取,之后將CSP特征輸入到隨機森林分類器,最終分類準確率達到了92.18%。為了進行一步驗證本文方法的有效性以及可行性,對比了本文方法與其他文獻方法的EEG信號分類準確率,結果表明:相比于其他算法,本文方法的分類準確率有了明顯的提升,為基于運動想象EEG信號的BCI技術提供一種新方法與思路。