王雪嬌陽, 王連明
(1.東北師范大學物理學院,長春 130024;2.海南熱帶海洋學院海洋科學與技術學院,三亞 572022)
腦電圖(electroencephalogram,EEG)是一種利用電極記錄下來的、可以反映腦功能與人的意識行態的生物電信號,由于其具有無創、便捷性強、時間分辨率高的特點,常被應用于腦機接口(brain computer interface, BCI)[1]?;谀X電圖的BCI系統主要的研究方向有:基于運動想象的BCI系統;基于穩態試聽誘發電位的BCI系統、基于P300的BCI系統、其中左右手運動想象分類是目前的研究熱點之一[2]。
研究發現運動想象時產生的EEG信號同自發運動狀態下的EEG信號相似,當人們想象一側身體運動時,對側大腦皮層運動區的腦電mu節律(8~13 Hz)和beta節律(13~30 Hz)的幅值降低,該現象稱作事件相關去同步(event-related desynchronization, ERD),而同側大腦運動區的mu節律和beta節律幅值升高出現事件相關同步(event-related synchronization, ERS)現象[3-5]。這種反應差異是BCI系統進行運動想象識別的重要特征和依據。
2003年BCI競賽數據集Ⅲ和2005年BCI競賽數據集Ⅲa是近年來常被用作研究左右手運動想象識別的兩個公共數據集。對于數據集2003 Ⅲ,當針對C3、C4通道進行時頻變換提取能量譜和邊際譜特征,分時段和分頻段輸入給集成分類器進行分類時,得到識別率最高,可達95.57%[6],其他基于ERD/ERS現象進行特征提取并識別的方法得到的識別率普遍在90%以上[2,7-11]。而對于數據集2005 Ⅲa,對11個通道(包含C3、C4)的EEG進行Stockwell變換,并運用與共空間模式(common spatial pattern, CSP)相結合的方法得到各頻帶特征向量,使用LS-SVM(least square-support vector machine)進行分類,得到最終準確率達92.43%[12],在現有研究內,其他研究方法得到的識別率平均在80%左右[13-17]。
對前人研究結果分析發現,在基于ERD/ERS現象的特征提取及分類方法下,利用C3、C4通道的腦電信號,得到數據集2003 Ⅲ對運動想象的識別率普遍高于數據集2005 Ⅲa,為了探究識別率差異原因,進一步提高識別率提供思路,從噪聲含量、受試者對于運動想象任務的反應程度以及C3、C4兩通道能量差異三個方面,對影響運動想象識別率的因素進行分析與驗證。
2003年BCI競賽數據集Ⅲ是有關左右手運動想象任務的腦電數據集。實驗中有一名受試者,實驗任務分類兩類,左手運動想象和右手運動想象,每類任務各進行280次試驗。每次試驗采集時長為9 s,實驗過程如圖1(a)所示,前2 s受試者處于放松狀態;第3 s系統會有聲音提示表明試驗開始;第4 s開始電腦屏幕上會隨機出現一個箭頭(指向左或者右),受試者需要根據箭頭的指示想象左手或右手運動。腦電數據的采集通過三對差分電極獲得,電極的放置遵循國際標準10~20導聯系統中C3、Cz、C4三個通道的位置,如圖1(b)所示。數據的采樣頻率為128 Hz,并經過0.5~30 Hz的濾波。

圖1 數據集2003 Ⅲ實驗范式
2005年BCI競賽數據集Ⅲa是四類(左手、右手、腳和舌頭)運動想象腦電數據集。該實驗共有三名受試者,分別被標記為k3b、k6b、l1b,其中k3b受試者每類進行90次試驗;k6b和l1b受試者每類進行60次試驗。每次試驗采集的時長為7 s,實驗過程如圖2(a)所示,前2 s受試者處于靜息狀態,第3 s系統發出蜂鳴提示受試者準備,第4 s電腦屏幕上隨機顯示指向上、下、左、右的箭頭,受試者開始根據箭頭提示進行想象舌頭、腳、左手或者右手運動持續4 s,每次試驗之間休息3.24 s。該數據集的腦電數據由60個通道組成,電極位置如圖2(b)所示。數據的采樣頻率為250 Hz,并經過1~50 Hz濾波。

圖2 數據集2005 Ⅲa實驗范式
由于需要對兩個數據集的數據進行對比評估,因此對2005 Ⅲa數據集只選取左右手(類別1和類別2)運動想象的數據。
腦電信號是一種信噪比較低的微弱生物電信號,其包含的噪聲來源分為非神經源噪聲和神經源噪聲。其中非神經源噪聲有眼動偽跡、肌電干擾、工頻噪聲等,此外,參考兩個數據集的采集過程,傳感器的電極接觸不良產生的偽跡也是一種必須考慮的噪聲來源;而神經源噪聲包括自發的與意念無關的信號或者與感興趣特征腦電無關的其他特征信號,大腦在處于靜息狀態時,內部的神經元族也保持著放電過程,故在進行運動想象任務時,對于誘發腦電來說,自發腦電就是一種必須考慮的干擾。所以腦電信號噪聲的多少被認為是影響識別率的一個因素。對腦電信號進行8~30 Hz的濾波,因此高頻的肌電信號與低頻的眼電信號偽跡不作為噪聲考慮[18-19]。
采集設備與人的大腦直接接觸的部分一般為Ag/AgCl電極,但由于電極與頭皮之間存在傳導阻抗,并且兩數據集中包含多位受試者的數據,每位受試者的頭皮狀態不同,阻抗大小也因此不同,而阻抗的存在會導致信號采集的靈敏度降低,進而削弱信號中隱含的特征[20]。另外,在運動想象BCI系統中,存在盲BCI現象,即由于被試腦機制的差異,被試在采用現有的運動想象模式時,無法誘發出較強的ERD/ERS等特征信號[21-22]。因此,將受試者對任務反應程度考慮為影響運動想象識別的因素之一。
ERD/ERS現象不僅具有時間特異性和頻帶特異性,還具有空間特異性,即與大腦皮層的運動區相關[5]。根據國際標準10-20導聯系統,C3、C4通道分別處于大腦運動感覺皮層的左腦中心位置和右腦中心位置,為最能體現運動想象腦電信號變化的兩個通道。通過對2003、2005年兩個數據集特征提取及識別方法的統計發現,能量譜特征和邊際譜特征多被作為特征向量進行左右手運動想象任務的分類[6,10-11,13-15]。因此C3、C4通道信號的能量差異也可能是影響運動想象識別的因素。
故針對數據集2003 Ⅲ和數據集2005 Ⅲa分類識別率相差較大的問題,從噪聲含量、運動想象開始后受試者反應程度、C3和C4通道信號能量差三方面對運動想象識別影響因素進行分析,并分別對這三個因素進行驗證。
兩個數據集中的腦電信號在時域內是隨機非平穩的,如圖3所示。因此基于運動想象腦電信號的特點,即ERD/ERS現象,通過Stockwell變換(簡稱S變換)將時域信號轉換到時頻域內,得到信號在不同頻率下的分量[12]。圖4為圖3中腦電信號經過S變換在時頻域下的可視化特征圖,圖4中顏色亮的位置表示相應時間和頻率的腦電信號的能量高,即ERS現象,反之,暗的地方能量低,即ERD現象[13]。由此,可以從時頻圖上直觀地看到每次試驗腦電信號對任務的反應程度。

圖3 時域的運動想象腦電信號

圖4 時頻域的運動想象腦電信號
噪聲信號是一種隨機非平穩信號,由于它的幅值和頻率呈現隨機性,在時頻圖中體現為雜亂、無規則的絮狀亮網[23]。圖4中運動想象任務誘發的EEG特征體現在底部的較明亮條帶,而整個時頻圖中布滿絮狀亮網絡,因此認為誘發腦電信號中的噪聲在時頻圖中對應為絮狀亮網。為了體現數據集2003 Ⅲ與數據集2005 Ⅲa的差別,對兩個數據集中所有試驗的時頻圖進行像素直方圖統計,如圖5~圖8所示。圖5為數據集2003 Ⅲ兩類運動想象EEG的時頻圖的像素直方圖平均曲線;圖6~圖8為數據集2005 Ⅲa三名受試者兩類運動想象EEG的時頻圖的像素直方圖平均曲線。橫坐標為像素,縱坐標為各像素值的個數占總像素數的百分比。圖中紅色豎線對應的像素k0為占比最大的像素,k0越低、對應的百分比越大,表示時頻圖中暗的部分越多,即絮狀亮網絡越少,噪聲含量越少。根據曲線整體趨勢以及像素k0可以看出數據集2003 Ⅲ的信號噪聲少于數據集2005 Ⅲa。

圖5 數據集2003Ⅲ像素直方圓平均進線

圖6 數據集2003Ⅲa(k3b)像素直方圓平均曲線

圖7 數據集2005Ⅲa(k6b)像素直方圓平均曲線

圖8 數據集2005Ⅲa(11b)像素直方圖平均曲線
兩個數據集的實驗范式都要求受試者第3 s開始進行運動想象,對比兩個數據集左手運動想象的時頻特征,如圖9、圖10所示。由圖9、圖10可知,第3 s后與第3 s前相比,數據集2003 Ⅲ的腦電信號出現較明顯的能量變化,即ERD/ERS現象,而數據集2005 Ⅲa反應微弱,無明顯變化。

圖9 數據集2003Ⅲ左手運動想象EEG時頻圖

圖10 數據集2005Ⅲa(k3b)左手運動想象EEG時頻圖
利用對比信號在時頻域下第3 s前后的平均累積能量(mean cumulative energy,MCE)來判斷每次試驗是否為有效試驗,得到每個數據集的有效試驗次數比例,以此作為分析識別率存在差異的依據。選取8~30 Hz頻段的MCE表達式如式(1)所示:
(1)
式(1)中:ef(t)為在時刻t頻率f下的信號能量;H和W分別為EEG在8~30 Hz頻段的時頻特征矩陣的行數和列數。
對于左手運動想象任務,反應特征為左側腦運動區能量升高,右側腦運動區能量降低,若C3通道第3 s后的MCE大于第3 s前的MCE,或C4通道第3 s后的MCE小于第3 s前的MCE,則認為該次試驗為合格。對于右手運動想象任務來說,ERD/ERS現象應體現為右側腦運動區能量升高,左側腦運動區能量降低,若C4通道第3 s后的MCE大于第3 s前的MCE,或C3通道第3 s后的MCE小于第3 s前的MCE,則認為該次試驗為有效試驗。兩個數據集的統計結果如表1、表2所示。

表1 數據集2003 Ⅲ的任務反應程度分析有效試驗次數比例

表2 數據集2005 Ⅲa的任務反應程度分析有效試驗次數比例
對比表1、表2可知,數據集2003 Ⅲ中有效試驗次數占比為92.5%,高出2005年數據集達5.4%,說明了數據集2003 Ⅲ的受試者對運動想象任務的反應明顯于2005年數據集的受試者。
為了抑制左右腦信號的噪聲干擾,增強左右感覺運動區域的信號差異,將C3、C4通道的時頻特征按照采樣點做差,累積腦電信號在f1-f2頻段內的能量差值,并將同一受試者所有次試驗的能量差值曲線疊加平均,得到每位受試者對應的能量差值曲線Df1f2(t),表達式為
(2)

左手運動想象開始之后,EEG的mu節律和beta節律的能量發生變化,且在C3通道中能量增加,同時在C4通道中能量降低;右手運動想象則相反。因此C3、C4通道能量差值曲線在左手運動想象任務下應呈正趨勢,而在右手運動想象任務下呈負趨勢[24]。兩個數據集中各受試者的C3、C4通道在 8~30 Hz頻段內的能量差值曲線如圖11~圖14 所示,為了使曲線的趨勢更加明顯,圖中用紅色虛曲線表示能量差值經過20階多項式擬合后的結果。

圖11 數據集2003 Ⅲ C3、C4通道能量差值曲線

圖12 數據集2005 Ⅲa(k3b)C3、C4通道能量差值曲線
由圖11~圖14可知,第3 s運動想象開始后,2003年數據集受試者與2005年數據集中k3b受試者的能量差值曲線,在左手任務下呈正趨勢,右手任務下呈負趨勢;k6b受試者的左右手任務下的曲線趨勢近似一致;l1b受試者的曲線在左手任務下呈負趨勢,右手任務下呈正趨勢。

圖14 數據集2005 Ⅲa(11b)C3、C4通道能量差值曲線
由于腦電信號的信噪比較低,對左右手想象的分類不穩定,因此采用時間序列投票的方法對不同時間段的預測結果進行匯總,可以緩解這種影響。首先,考慮到相鄰段之間的差異相對較小,對運動想象后的時段每隔0.1 s計算一次C3、C4通道能量差的累積值,若此值為正,則預測該0.1 s對應左手運動想象;若此值為負,則預測為右手運動想象。然后,每次試驗的所有片段預測都參與投票來決定最終的預測,贏得更多選票的任務類別(左手或右手)將是這次試驗的最終預測[24]。最后,若此預測結果與數據集中所提供的正確類標簽一致,認為此次試驗為有效試驗;反之,為無效試驗。經統計,兩個數據集在各腦電節律delta(1~4 Hz)、theta(5~8 Hz)、alpha(9~12 Hz)、beta(13~30 Hz)、gamma(30~60 Hz)以及8~30 Hz頻段下的有效試驗情況如圖15所示。

圖15 各頻段C3、C4通道能量差分析有效試驗次數比例
由圖15可以看出,數據集2003 Ⅲ的有效試驗次數比例明顯高于數據集2005 Ⅲa中k6b和l1b兩位受試者的有效試驗次數比例;數據集2005 Ⅲa中k3b受試者的試驗有效性最高,l1b受試者的試驗有效性最低,此結果與C3、C4通道能量差值曲線所體現的結果一致。由于數據集2003 Ⅲ和數據集2005 Ⅲa中k3b受試者的結果在各頻段下普遍較好,因此將其作為參考,對比不同頻段的有效試驗次數比例發現,mu節律和beta節律所在頻段8~30 Hz下的有效試驗次數比例最高,且在該頻段數據集2003 Ⅲ的有效試驗比例高出數據集2005 Ⅲa三位受試者的平均比例達29.78%。該結果說明了數據集2003 Ⅲ的C3、C4能量差異趨勢在運動想象腦電信號有效頻段內比數據集2005 Ⅲa更標準。
經統計現有研究發現兩個BCI競賽運動想象數據集2003 Ⅲ和2005 Ⅲa的識別率普遍存在差異。針對該問題,從信號噪聲含量、受試者反應程度和C3、C4通道能量差異三個方面對運動想象識別影響因素進行了理論分析,進而利用腦電信號的可視化時頻特征結合相關能量參數的方法對比兩個數據集。結果表明數據集2003 Ⅲ與數據集2005 Ⅲa相比,數據噪聲含量更少,受試者反應程度明顯的試驗次數占比高出5.4%,且C3、C4通道能量差異趨勢標準的試驗次數占比高出29.78%,該結果解釋了兩個數據集以ERD/ERS現象為特征基礎的分類識別方法所得到的識別率存在差異的現象。通過研究影響運動想象識別的因素,為運動想象腦電數據有效性分析、以及提高基于腦電的運動想象識別率提供了新的思路。