田曉彬,鄧趙紅,王士同
江南大學(xué)數(shù)字媒體學(xué)院,江蘇無錫 214122
全球大約有1%~2%的人患有癲癇。盡管大多數(shù)患有癲癇的人在癲癇未發(fā)作期間和正常人無異,但癲癇突然發(fā)生時的不可預(yù)測性是其導(dǎo)致病人殘疾甚至死亡的主要原因,這種發(fā)作的不確定性嚴(yán)重影響病人的生活。EEG信號是一種記錄大腦神經(jīng)元活動的重要信號,它通過使用電生理指標(biāo)來記錄大腦活動時產(chǎn)生的大腦皮層的電波變化,是大腦神經(jīng)元活動在大腦皮層的總體反映。在生物醫(yī)學(xué)研究方向的電信號研究中,癲癇發(fā)作時,由于大腦神經(jīng)元的異常放電,導(dǎo)致此時的EEG信號和正常狀態(tài)下的EEG信號是不相同的,因此通過識別EEG信號來檢測癲癇是否發(fā)作是一種有效的癲癇檢測方法。
隨著機器學(xué)習(xí)的發(fā)展,越來越多的智能算法被運用到EEG信號的癲癇檢測,例如支持向量[1-2]、樸素貝葉斯[3]、神經(jīng)網(wǎng)絡(luò)[4]和模糊邏輯系統(tǒng)[5-6]等分類方法,以及主成分分析(principal component analysis,PCA)[7]、小波包分解(wavelet packet decomposition,WPD)[1,8]、高階交叉(higher order crossings,HOC)[9]等特征提取方法。這些方法首先對原始特征進行特征提取,使用獲得的新特征訓(xùn)練出一個分類模型,然后使用訓(xùn)練好的模型進行預(yù)測,從而達到癲癇檢測的功能。雖然已有很多的特征提取和分類方法運用于EEG癲癇檢測中,但如何提取有效的含有豐富鑒別信息的特征用于后續(xù)的有效檢驗依然是一個重要的挑戰(zhàn)。
近年來,深度學(xué)習(xí)作為一種機器學(xué)習(xí)方法,在特征學(xué)習(xí)等方面受到了廣泛關(guān)注。深度學(xué)習(xí)通過期望的輸出來學(xué)習(xí)到每一層的權(quán)重,層次結(jié)構(gòu)的每一層都對特征進行調(diào)整來獲得更可能得到期望輸出的特征,即每一層都對輸入特征進行了優(yōu)化學(xué)習(xí),從而獲得越來越有鑒別性的特征。近些年來,深度學(xué)習(xí)技術(shù)在EEG信號處理方面已得到有效應(yīng)用,有研究[10-12]使用不同的特征提取方法得到EEG信號的特征,然后利用卷積神經(jīng)網(wǎng)絡(luò)來對得到的特征進行癲癇檢測。
多視角學(xué)習(xí)技術(shù)是通過考慮不同視角之間的多樣性來從多視角數(shù)據(jù)中學(xué)習(xí)的方法[13-14],根據(jù)多視角學(xué)習(xí)技術(shù)之間的相似點和不同點,多視圖學(xué)習(xí)算法可以被分為三種:(1)協(xié)同訓(xùn)練;(2)多核學(xué)習(xí);(3)子空間學(xué)習(xí)。雖然三種方法存在顯著差異,但它們主要利用共識原則或互補原則來確保多視角學(xué)習(xí)的成功。多視角學(xué)習(xí)技術(shù)也被廣泛地應(yīng)用到EEG信號的癲癇檢測中,通過多種特征提取方法獲得EEG信號的多視角數(shù)據(jù),然后使用多視角學(xué)習(xí)技術(shù)來進行癲癇檢測[6,15]。
為了使用EEG信號構(gòu)建出有效的特征用于癲癇檢測,本文利用深度學(xué)習(xí)和多視角學(xué)習(xí)技術(shù),提出了融合深度和淺層特征的多視角分類算法。由于EEG信號具有多種不同的淺層特征,如頻域特征、時頻域特征、非線性特征等,因此對多個不同的淺層特征進行深度特征提取得到深度特征,并將深度特征和淺層特征一起構(gòu)造出多視角數(shù)據(jù)集。進一步,使用多視角學(xué)習(xí)技術(shù)對多視角特征集進行分類,從而實現(xiàn)癲癇檢測的功能。
本文提出的算法可概括為如下三部分:
(1)EEG信號淺層特征的獲取:EEG信號有很多構(gòu)建淺層特征的方法,用不同方式構(gòu)造出的淺層特征都具有一定的效果,也各有優(yōu)缺點。為了將不同方法構(gòu)造的淺層特征的優(yōu)勢結(jié)合起來,獲取多個不同的淺層特征來進行癲癇的檢測。本文使用的淺層特征包括使用快速傅里葉變換(fast Fourier transform,F(xiàn)FT)和WPD獲取EEG信號的頻域淺層特征、時頻域淺層特征。
(2)EEG信號深度特征的獲取:為了提高EEG信號淺層特征的有效性并且獲得更具有泛化能力的特征,本文使用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)對EEG信號的淺層特征進行深度特征學(xué)習(xí)來構(gòu)造出深度特征。相對于淺層特征,EEG信號的深度特征具有更小的數(shù)據(jù)維度和更高的分類效果。
(3)分類器的構(gòu)建和分類的決策:將EEG信號的淺層特征和深度特征看作一個多視角特征集。構(gòu)造出多視角分類器,基于多視角分類器的輸出結(jié)果來進行是否發(fā)作癲癇的決策。
融合深度和淺層特征的多視角分類算法集合淺層特征和利用深度學(xué)習(xí)技術(shù)獲得的深度特征,再利用多視角學(xué)習(xí)技術(shù)進行決策。深度學(xué)習(xí)的深層次結(jié)構(gòu)優(yōu)化特征表示;淺層特征保留EEG信號的原始信息,減少信息損失;多視角技術(shù)有效地利用每個視角特征的獨立性和視角特征之間的相關(guān)性。將淺層特征、深度特征和多視角學(xué)習(xí)技術(shù)有效結(jié)合可以充分提取EEG信號中的有效信息,提高分類器的泛化能力。
本章將對本文所提方法的相關(guān)工作進行簡要介紹,包括使用EEG信號進行癲癇檢測的意義,以及將機器學(xué)習(xí)技術(shù)、深度學(xué)習(xí)技術(shù)以及多視角學(xué)習(xí)技術(shù)應(yīng)用在EEG癲癇檢測方面的進展。
生物信息學(xué)、醫(yī)學(xué)圖像處理和生物信號處理等都是智能技術(shù)在生物醫(yī)學(xué)上面的應(yīng)用。生物信息學(xué)研究蛋白質(zhì)和基因信息;醫(yī)學(xué)圖像處理主要包括分析CT、NMR等;生物信號處理就是對EEG、ECG等電信號的研究。EEG信號是人體腦部神經(jīng)元活動的表現(xiàn),包含著很多人體生理活動的信息,EEG信號已被廣泛地應(yīng)用于癲癇檢測領(lǐng)域。癲癇檢測通常表示使用自動算法對病人的生物信號進行分析來判斷癲癇病人是否正在發(fā)作癲癇或者已經(jīng)發(fā)作癲癇。癲癇檢測的重要目標(biāo)是如何盡可能快速地有效地執(zhí)行此轉(zhuǎn)換。近年來,多種用于癲癇檢測的算法[5,16]已被提出,并達到了一定的效果。
近些年來有很多機器學(xué)習(xí)技術(shù)被用到EEG信號的自動癲癇檢測中。Wang等人[17]使用隨機森林(random forest,RF)、C4.5、支持向量機(support vector machine,SVM)+RF、SVM+C4.5四種方法進行EEG癲癇檢測,發(fā)現(xiàn)RF具有最好分類效果。Zhang等人[18]采用小波包分解提取的近似熵和樣本熵作為特征,然后利用支持向量機和極限學(xué)習(xí)機作為分類器進行EEG癲癇檢測。Yang等人[19]使用WPD和KPCA(kernel principal component analysis)進行特征降維,進一步使用TSK模糊邏輯系統(tǒng)作為分類器進行癲癇檢測。這些算法都在癲癇檢測方面取得了一定的效果。
隨著深度學(xué)習(xí)的發(fā)展,堆疊自動編碼器[20-22]、深度信念網(wǎng)絡(luò)[23-25]、卷積神經(jīng)網(wǎng)絡(luò)[26-28]、循環(huán)神經(jīng)網(wǎng)絡(luò)[29-32]等經(jīng)典深度學(xué)習(xí)算法都被有效地運用到生物醫(yī)學(xué)中。近年來,已有一些工作嘗試使用卷積神經(jīng)網(wǎng)絡(luò)來處理EEG信號,并且取得了不錯的效果。Antoniades等人[10]通過卷積神經(jīng)網(wǎng)絡(luò)對原始EEG信號進行一維卷積來預(yù)測癲癇發(fā)作;Cecotti等人[11]通過對原始信號進行傅里葉變換來將EEG信號轉(zhuǎn)換到頻域,然后使用卷積神經(jīng)網(wǎng)絡(luò)進行分類;Mirowski等人[12]使用特征處理將原始EEG信號編碼為像素顏色以形成二維模式,然后將編碼后的數(shù)據(jù)應(yīng)用于癲癇預(yù)測。
多視角學(xué)習(xí)算法是針對擁有不同視角特征的數(shù)據(jù)集發(fā)展起來的機器學(xué)習(xí)算法。由于引入的多視角協(xié)作學(xué)習(xí)機制可以有效地利用每個視角的視角獨立性和學(xué)習(xí)過程中不同視角之間的相關(guān)性,因此可以獲得比原始單視角數(shù)據(jù)更好的建模效果。典型相關(guān)性分析(canonical correlation analysis,CCA)[33-34]、協(xié)同訓(xùn)練co-training[35-36]、稀疏多視角SVM[37]等是常用的多視角算法,并且在不同多視角數(shù)據(jù)應(yīng)用場景已取得了較單視角方法更好的效果。近些年來的一些工作將多視角技術(shù)應(yīng)用在EEG信號的癲癇檢測中。Spyrou等人[15]通過對EEG多視角特征使用張量分解來得到新的特征進行癲癇檢測,相關(guān)研究結(jié)果表明提取得到的新的特征具有更好的分類效果;Jiang等人[6]提出了基于多視角學(xué)習(xí)框架和模糊系統(tǒng)結(jié)合的多視角EEG信號癲癇檢測的方法。
定義TSK模糊系統(tǒng)的模糊推理規(guī)則如下:


其中,xg是通過模糊規(guī)則將原始輸入x映射到新的特征空間的向量,pg為TSK模糊系統(tǒng)中的規(guī)則構(gòu)建出來的模糊規(guī)則的后件參數(shù)。許多算法都可以用于求解TSK模糊系統(tǒng)的后件參數(shù),Deng等人[1]使用了一種有效的優(yōu)化算法。在這個算法中,TSK模糊系統(tǒng)的目標(biāo)函數(shù)定義如下:

其中,第一項期望學(xué)習(xí)到最優(yōu)的pg,j來對訓(xùn)練樣本進行分類;第二項為正則化項,給TSK模糊系統(tǒng)進行一定的懲罰,提高TSK模糊系統(tǒng)的泛化能力,即在未知的測試集上也能達到很好的效果。λ為正則化參數(shù),用來權(quán)衡正則化項懲罰的大小。
計算?(JMV_TSK_FS)/?(wk)=0時的解,來獲得最優(yōu)的后件參數(shù)pg。pg的最優(yōu)值可以通過以下公式計算得到:

本文通過對原始EEG信號使用FFT和PWD來獲取頻域淺層特征和時頻域淺層特征,然后對淺層特征進行深度特征提取,得到頻域深度特征和時頻域深度特征,最后對深度和淺層特征進行多視角模型學(xué)習(xí)。
本文提出的方法包含三個核心的部分:EEG信號淺層特征的獲取;EEG信號深度特征的獲取;多視角分類器的學(xué)習(xí)。圖1詳細描述了本文方法的基本框架。

Fig.1 Framework of proposed method圖1 本文方法框架
原始EEG信號為時序信號,由不同頻率的信號累加而成。雖然具有很好的時間特性,但是并不能很好地表現(xiàn)出信號的基本頻率特征。為了獲得信號的頻率特征,使用傅里葉變換將信號從時域轉(zhuǎn)換到頻率域。根據(jù)傅里葉變換可知,任何連續(xù)的周期信號都可以轉(zhuǎn)換到頻域,但傅里葉變換的基礎(chǔ)是信號為周期信號,EEG信號越長周期性就越小,得到的頻域特征越不準(zhǔn)確。小波變換可以將信號轉(zhuǎn)換到時頻域中進行分析,獲得各個時間點的瞬時頻率,由此既保留信號的時間順序,又因為計算瞬時頻率時信號長度很短所以得到的頻率更為準(zhǔn)確。基于上述分析,本文從原始EEG信號中抽取出頻域和時頻域兩個視角的淺層特征。
3.2.1 頻域淺層特征構(gòu)建
EEG信號具有很大的復(fù)雜性,被看成是不同頻率信號疊加形成的。根據(jù)研究發(fā)現(xiàn),EEG信號的頻率主要處于0 Hz到60 Hz之間,主要分為6個頻率區(qū)間:Delta-1(0~2 Hz)、Delta-2(2~4 Hz)、Theta(4~8 Hz)、Alpha(8~15 Hz)、Beta(15~30 Hz)、Gamma(30~60 Hz)。
為了在減少頻域淺層特征的維度的同時又可以較好地保留原始EEG信號的信息,本文設(shè)置離散傅里葉變換后的頻率采樣間隔為1 Hz,選取4 Hz到30 Hz之間的頻率來構(gòu)建頻域淺層特征[38-39]。圖2即為原始EEG信號轉(zhuǎn)化得到的頻域淺層特征,其中橫軸代表頻率,縱軸代表振幅。

Fig.2 Frequency domain shallow features of EEG signals圖2 EEG信號的頻域淺層特征
3.2.2 時頻域淺層特征構(gòu)建
信號的時頻特征能描述信號在各個時間點下的瞬時頻率,即在保留信號的時間特征之外有效計算出信號的頻域特征。小波分解是一種常用的將信號轉(zhuǎn)換到時頻域的方法。小波變換將傅里葉變換的三角函數(shù)基轉(zhuǎn)換成小波函數(shù)基,小波函數(shù)中有兩個變量:尺度a和平移量τ。尺度控制小波變換的伸縮即頻率,平移量控制小波變換的平移即時間。由這兩個變量控制的小波變換可以對信號逐步進行多尺度的細化,從而達到自適應(yīng)時-頻信號分析的要求。
WPD是小波變換的一種常用方法[18,40]。本文使用WPD來獲得EEG信號的時頻域淺層特征,采用的小波基函數(shù)為Daubechies(dbN)。dbN小波具有較好的正則性,隨著階次的升高消失矩階數(shù)增大,光滑性就變得越好,頻域的局部化能力越強,頻帶的劃分效果就越好。但過大的消失矩階數(shù)會使得時域的支撐性減弱,計算量增大,即實時性變差。本文設(shè)置小波函數(shù)的階數(shù)N為4,同時因為轉(zhuǎn)換到時頻域的信號是三維的數(shù)據(jù)(通道×頻率×?xí)r間),為了減少轉(zhuǎn)換后特征的數(shù)量,減少計算時間,設(shè)置和頻域不同的采樣間隔2 Hz。設(shè)置小波變換的分解層數(shù)為6層。和頻域一樣,本文只考慮頻率范圍4 Hz到30 Hz之間的時頻特征。圖3為原始EEG信號轉(zhuǎn)化得到的時頻域淺層特征,其中橫軸代表時間,縱軸代表頻率,圖中不同的顏色表示在相應(yīng)的時間和頻率下的能量的不同。能量的對照值在圖右方的彩色條中表明。

Fig.3 Time-frequency domain shallow features of EEG signals圖3 EEG信號的時頻域淺層特征
本文使用卷積神經(jīng)網(wǎng)絡(luò)對EEG信號的頻域和時頻域淺層特征進行自動提取。針對兩個域的淺層特征,分別構(gòu)建兩個不同的卷積神經(jīng)網(wǎng)絡(luò)來對淺層特征進行深度自動提取,獲得相應(yīng)的深度特征。
CNN網(wǎng)絡(luò)在訓(xùn)練時采用最后一層輸出層的結(jié)果計算誤差并進行反向傳播,由此來進行網(wǎng)絡(luò)的學(xué)習(xí)。因為倒數(shù)第二層計算得到的特征向量到輸出層只經(jīng)過一個全連接層,可以認為根據(jù)網(wǎng)絡(luò)輸出層訓(xùn)練優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)的同時,對倒數(shù)第二層輸出特征向量的表達也進行了優(yōu)化,即網(wǎng)絡(luò)在訓(xùn)練的同時也學(xué)習(xí)到了更好的特征表達,因此選擇網(wǎng)絡(luò)倒數(shù)第二層的輸出作為網(wǎng)絡(luò)學(xué)習(xí)到的特征。通過卷積神經(jīng)網(wǎng)絡(luò)的自動學(xué)習(xí)獲得的特征,具有比原始特征更小的維度,并且得到的特征是經(jīng)過非線性組合的具有更好劃分能力的特征,可以使后續(xù)的分類模型具有更好的泛化效果。
圖4、圖5為頻域和時頻域深度特征提取所使用的CNN網(wǎng)絡(luò)架構(gòu)圖。用k@m×n表示網(wǎng)絡(luò)各個層的特征圖,k表示該層特征圖的個數(shù),m×n表示特征圖的大小。網(wǎng)絡(luò)的二維卷積核用k×m×n表示,k是卷積核的個數(shù),m×n為卷積核的大小;三維卷積核用k×m×n×l表示,k是卷積核的個數(shù),m×n×l為卷積核的大小。卷積核的步長默認為1。網(wǎng)絡(luò)的輸入為各個視角特征,輸出為一個向量,向量長度等于2(癲癇和非癲癇)。若樣本是癲癇樣本,則第一維等于0,第二維等于1;若樣本是非癲癇樣本,則第一維等于1,第二維等于0。

Fig.4 Deep feature extraction network with frequency domain圖4 頻域的深度特征提取網(wǎng)絡(luò)
3.3.1 頻域深度特征提取網(wǎng)絡(luò)
圖4為頻域深度特征提取使用的CNN網(wǎng)絡(luò)架構(gòu)圖,總共包括2個卷積層和3個全連接層。多通道的EEG頻域視角特征是一個通道數(shù)×頻率的二維矩陣,因此網(wǎng)絡(luò)的輸入為23×27的二維矩陣。網(wǎng)絡(luò)第一層卷積層為20個4×4的卷積核,步長為1,得到20個20×24的特征圖;第二層卷積層是10個8×8的卷積核,步長為1,得到10個13×17的特征圖。網(wǎng)絡(luò)接下來有3個全連接層,這3個全連接層首先將特征圖轉(zhuǎn)換成1×512的特征向量,再轉(zhuǎn)換成1×100的特征向量,最后得到一個二分類的結(jié)果。
3.3.2 時頻域深度特征提取網(wǎng)絡(luò)
圖5為時頻域深度特征提取使用的CNN網(wǎng)絡(luò)架構(gòu)圖,總共包括4個三維卷積層和3個全連接層。多通道的EEG時頻域特征是一個時間×通道數(shù)×頻率的三維矩陣,因此網(wǎng)絡(luò)的輸入為128×23×14的三維矩陣。網(wǎng)絡(luò)各個層的詳細操作和頻域深度特征提取網(wǎng)絡(luò)相同。因為輸入為三維矩陣,卷積核采用三維卷積核,三維卷積操作是二維卷積操作在三維空間的擴展,基本原理和二維卷積操作相同。
兩個網(wǎng)絡(luò)統(tǒng)一選取tanh函數(shù)作為激活函數(shù)來引入非線性變換,因為tanh(x)∈[-1,1],且tanh函數(shù)的均值為0,所以在實際應(yīng)用中具有比sigmoid更好的效果。tanh函數(shù)的表達如下:

網(wǎng)絡(luò)采用softmax交叉熵損失函數(shù),該函數(shù)的定義如下:


Fig.5 Deep feature extraction network with time-frequency domain圖5 時頻域的深度特征提取網(wǎng)絡(luò)
softmax函數(shù)計算第j個樣本屬于第i類的概率aji,zji為第j個樣本在第i個輸出節(jié)點的輸出。yj={yji|i=1,2,…,C}為第j個樣本的真實標(biāo)簽,C是總的類別數(shù),N是樣本的總個數(shù),L為N個樣本的總平均交叉熵損失。
使用淺層特征和深度特征構(gòu)建成的多視角特征具有很好的表達能力和較少的信息損失,但如何高效地將這些特征用于癲癇檢測是很重要的。近些年來的研究中,許多基于多視角學(xué)習(xí)的智能模型[15,36-37]已被用于癲癇EEG識別,但它們中的大多數(shù)缺乏在疾病診斷等現(xiàn)實應(yīng)用中至關(guān)重要的可解釋性。因此,在基于多視角學(xué)習(xí)的癲癇EEG檢測技術(shù)的發(fā)展過程中,需要具有更高可解釋性的模型。
TSK模糊系統(tǒng)是基于規(guī)則系統(tǒng)的智能模型,具有很高的可解釋性。本文以TSK模糊系統(tǒng)為基礎(chǔ),構(gòu)建出具有可解釋性的多視角分類器用于EEG信號的癲癇檢測。
3.4.1 多視角TSK模糊系統(tǒng)的加權(quán)機制

通過最小化式(8),可以獲得每個視角的權(quán)重值wk。通過計算每個視角的權(quán)重,可以了解不同視角的重要程度,進而權(quán)衡不同視角之間的關(guān)系。
3.4.2 多視角TSK模糊系統(tǒng)的多視角協(xié)同學(xué)習(xí)機制
給定一個多視角癲癇數(shù)據(jù)集,多視角TSK模糊系統(tǒng)的多視角協(xié)同學(xué)習(xí)機制可以被定義為如下形式:

3.4.3 多視角TSK模糊系統(tǒng)的目標(biāo)函數(shù)
基于多視角模糊系統(tǒng)的加權(quán)機制和多視角協(xié)同學(xué)習(xí)機制,構(gòu)建出多視角TSK模糊系統(tǒng)的目標(biāo)函數(shù)如下所示:

該目標(biāo)函數(shù)共有3項組成,第一項為改進過后的多視角加權(quán)機制,wk為第k個視角的權(quán)重,m表示權(quán)重wk的模糊指數(shù)。通過引入視角權(quán)重的指數(shù),可以在優(yōu)化多視角模型中研究權(quán)重的更新規(guī)則,該模糊指數(shù)已經(jīng)被深入研究并在許多機器學(xué)習(xí)算法中達到了很好的效果,例如著名的模糊C均值聚類(fuzzy C-means,F(xiàn)CM)等[41-42]。第二項為正則化項,對不同視角的后件參數(shù)進行約束,防止多視角的模型產(chǎn)生過擬合現(xiàn)象。λ1為正則化項的系數(shù),用來改變正則化項對模型的懲罰大小。第三項為多視角協(xié)同學(xué)習(xí)項,該項期望各個視角獲得相同的決策值。限制條件控制各個視角的權(quán)重和為1。
3.4.4 目標(biāo)函數(shù)的求解
方程(10)是一個不能直接解決的非凸優(yōu)化問題。為了去求解這個優(yōu)化問題,本文采用一種交叉迭代的方法,這個方法還用于模糊C均值(FCM)算法中。這個迭代過程主要分為兩步,更新各個視角的后件參數(shù)和各個視角的權(quán)重wk。

本文提出的多視角TSK模糊系統(tǒng)的具體細節(jié)在下面的算法流程中給出。
算法1基于視角加權(quán)的多視角TSK模糊系統(tǒng)
初始化:設(shè)置模糊規(guī)則數(shù)K,正則化參數(shù)λ1和λ2,算法收斂閾值ε以及最大的迭代次數(shù)T。每個視角的初始化權(quán)重wk設(shè)為,迭代次數(shù)l=1。
步驟1使用模糊聚類算法FCM或者其他聚類算法獲得訓(xùn)練集中每個視角的前件參數(shù)。
步驟2使用式(4a)~式(4c)將訓(xùn)練集和測試集每個視角的特征映射到模糊空間,獲得新特征集。
步驟3使用式(6)得到每個視角的先驗后件參數(shù)。
步驟4使用式(11)更新每個視角的后件參數(shù)
步驟5使用式(12)更新每個視角的權(quán)重
步驟6如果|Jl+1-Jl|>ε或者l<T時,l=l+1并且返回步驟4;否則進入步驟7。
步驟7使用式(13)做出用于癲癇檢測的多視角TSK模糊系統(tǒng)決策。
本文采用CHB_MIT數(shù)據(jù)集進行實驗研究。該數(shù)據(jù)集采集了波士頓兒童醫(yī)院23個患者的EEG信號,這些來自23位患者的記錄被分成24個組(其中第21組為第1個病人在幾年后重新采樣后添加進去的數(shù)據(jù)),每一組都包含一個患者的連續(xù)十幾個小時的EEG信號記錄。這些連續(xù)的信號通過256 Hz的頻率采樣,即一秒的信號有256的采樣點。每個患者的EEG信號通過對18個點進行采集構(gòu)成單通道數(shù)據(jù)集,后續(xù)處理成為23個通道的多通道數(shù)據(jù)。圖6是一段時間的CHB_MIT數(shù)據(jù)集的原始數(shù)據(jù),總共包含23個連續(xù)多通道信號。
由于數(shù)據(jù)高度不平衡,即癲癇樣本數(shù)量與非癲癇樣本數(shù)量之比為1∶100,如果直接使用所有數(shù)據(jù),算法的效果會面臨嚴(yán)重的過擬合問題。針對這個問題,本文舍棄了一部分未發(fā)作癲癇的EEG信號數(shù)據(jù),并且對發(fā)作癲癇的EEG信號數(shù)據(jù)應(yīng)用了過采樣技術(shù)。使用滑動窗口將連續(xù)的EEG信號分成多個長度為一秒的信號段(根據(jù)采樣頻率可知1 s信號有256個采樣點),通過允許兩個窗口之間存在重疊的方法對發(fā)作癲癇的EEG信號進行過采樣。
k折交叉驗證在確保一致的數(shù)據(jù)分布的基礎(chǔ)上將數(shù)據(jù)劃分為相同大小的k個子集。每次將其中一個子集作為測試集,其他子集用作訓(xùn)練集。獲得k個測試結(jié)果的平均值作為最終結(jié)果。這種驗證方法有效地避免了實驗樣品的取樣偏差,從而獲得了更有說服力的實驗結(jié)果。為了驗證本文提出的癲癇診斷算法,將每一個患者的EEG信號數(shù)據(jù)都進行5折交叉驗證。
為了進行有效的評估,采用如下3個廣泛應(yīng)用的評價標(biāo)準(zhǔn)來進行實驗分析[43-44],Accuracy、Sensitivity和Specificity定義如下:


Fig.6 Original multi-channel EEG signals圖6 原始多通道EEG信號
式中,TP是將癲癇片段正確預(yù)測的個數(shù);FN是將癲癇片段預(yù)測為非癲癇片段的個數(shù);FP是將非癲癇片段預(yù)測為癲癇的個數(shù);TN是將非癲癇片段預(yù)測為非癲癇的個數(shù)。Accuracy表示分類器正確分類的比例,越高代表分類器的分類效果越好;Sensitivity表示將所有的癲癇片段正確分類的比例,越高代表分類器對于癲癇片段的預(yù)測準(zhǔn)確率越高;Specificity表示將所有非癲癇片段正確分類的比例,越高代表分類器對非癲癇片段的預(yù)測準(zhǔn)確率越高。
本文方法得到的平均效果在表1中列出,由表可以看出所有組的平均Accuracy、Sensitivity和Specificity分別為99.08%、98.59%和99.32%。可以看出算法在準(zhǔn)確度、敏感性和特異性上均取得較好的結(jié)果。
為了進一步分析本文提出的方法,將最近使用CHB-MIT數(shù)據(jù)集進行癲癇檢測的方法[45-52]與本文提出的方法進行比較。表1列出了特征提取方法、實驗設(shè)置和實驗效果(NR代表文中并未提及該效果)。值得注意的是,Rafiuddin等人[45-47]并未采用交叉驗證,這無法有力地證明在癲癇檢測方面的性能。未采用交叉驗證的原因可能是因為數(shù)據(jù)集的癲癇樣本較少,采用交叉驗證會使得驗證集中癲癇樣本過少,導(dǎo)致得到的效果和真實效果差距過大,Kiranyaz等人[47-49]為了避免驗證集癲癇樣本過少只采用25%的樣本用于訓(xùn)練。在Yao等人[50-52]的研究中,使用了不同的過采樣的方法來增加癲癇樣本的數(shù)量。由于數(shù)據(jù)不平衡,大多數(shù)算法的準(zhǔn)確度和敏感性都比較低,但是本文提出的方法在保持相同特異性的情況下,表現(xiàn)出了更好的準(zhǔn)確度和敏感性,如表1所示。

Table 1 Performance of different methods on CHB-MIT dataset表1 不同方法在CHB_MIT數(shù)據(jù)集上的效果
為了確定各個視角的貢獻度,本文在實驗中統(tǒng)計了各個視角的權(quán)重。以第一個患者數(shù)據(jù)為例,4個深度和淺層特征的權(quán)重分別為0.072、0.075、0.760和0.092。其他所有患者數(shù)據(jù)的視角權(quán)重也都類似,并未出現(xiàn)某一視角權(quán)重過小,貢獻度過小的情況。
為了驗證本文所提方法的深度特征和淺層特征的有效性,采用不同的特征提取方法獲得不同的特征,然后使用SVM、KNN、NB、DT和TSK-FLS進行建模,最后計算出各種特征的效果,繪制成表2~表4。頻域和時頻域的深度特征在各個分類器上的平均Accuracy、Sensitivity和Specificity效果均達到了最好;頻域和時頻域的淺層特征在各個分類器的平均Accuracy、Sensitivity和Specificity效果也僅次于深度特征。可以看出對原始頻域和時頻特征使用深度特征自動提取方法達到的深度特征都得到了較好的特征表達,獲得了較好的分類效果。
表5比較了4個視角的特征分別使用不同的單視角分類器和本文提出的多視角TSK模糊系統(tǒng)的效果,發(fā)現(xiàn)本文提出的算法在Accuracy、Sensitivity和Specificity都取得了最好的效果。
為了驗證多視角TSK模糊系統(tǒng)的有效性,本文使用SVM、KNN、NB和DT算法構(gòu)造基于視角加權(quán)的多視角分類器,得到實驗效果如表6所示。
由以上結(jié)果可以看出,本文提出的基于TSK模糊系統(tǒng)的多視角分類器在癲癇檢測中達到了較好的效果。
本文對2個用于提取深度特征的CNN網(wǎng)絡(luò)進行訓(xùn)練,為了確定網(wǎng)絡(luò)的效果,遞增地設(shè)置網(wǎng)絡(luò)的迭代次數(shù),發(fā)現(xiàn)2個CNN網(wǎng)絡(luò)的效果均在一定迭代次數(shù)后達到穩(wěn)定狀態(tài)。將網(wǎng)絡(luò)達到穩(wěn)定狀態(tài)時的迭代次數(shù)設(shè)置為最終的迭代次數(shù),由此即可以在較少的訓(xùn)練時間里得到較好的分類效果。圖7、圖8僅僅展示第一個患者數(shù)據(jù)的網(wǎng)絡(luò)迭代次數(shù)和最終效果的關(guān)系,其他各組和第一組大致相同。

Table 3 Sensitivity of different feature extraction methods表3 不同特征提取方法的Sensitivity效果比較 %

Table 4 Specificity of different feature extraction methods表4 不同特征提取方法的Specificity效果比較 %

Table 5 Effect of combined features on classifiers表5 融合特征在分類器上的效果 %

Table 6 Effect on multi-view classifiers表6 不同多視角分類器的效果 %

Fig.7 Performance of frequency domain network圖7 頻域網(wǎng)絡(luò)的效果

Fig.8 Performance of time-frequency domain network圖8 時頻域網(wǎng)絡(luò)的效果
根據(jù)實驗發(fā)現(xiàn)頻域特征在訓(xùn)練2 000次后趨于穩(wěn)定,因此設(shè)定頻域網(wǎng)絡(luò)的訓(xùn)練次數(shù)為2 000。而時頻域特征雖然效果隨著訓(xùn)練的次數(shù)在上升,但是有較大的波動,考慮特征的效果和波動,將時頻域特征提取網(wǎng)絡(luò)的訓(xùn)練次數(shù)設(shè)置為5 000次。
多視角TSK模糊系統(tǒng)的診斷為各個視角TSK模糊系統(tǒng)的加權(quán)組合,模糊規(guī)則的利用方面和TSK模糊系統(tǒng)完全相同,因此可以通過分析簡單的TSK模糊系統(tǒng)的可解釋性,來理解多視角TSK模糊系統(tǒng)的可解釋性。為了驗證本文提出的基于視角加權(quán)的多視角TSK模糊系統(tǒng)的可解釋性,本節(jié)對第一個患者的頻域深度特征構(gòu)建的TSK模糊系統(tǒng)進行分析,并將具體數(shù)據(jù)展示在表7中。為了分析方便,只列出規(guī)則數(shù)為5時前6維特征的數(shù)據(jù)。
通過表7的數(shù)據(jù),可以確定每一條規(guī)則的模糊語言描述,例如:“EEG信號某一維特征的值為低、中、高”。以第一維特征為例,不同規(guī)則的前件參數(shù)分別為(0.447,0.117),(0.452,0.175),(0.545,0.181),(0.548,0.277),(0.459,0.205)。可以確定規(guī)則數(shù)對應(yīng)的模糊語言描述分別為低、較低、較高、高和中。上述的模糊語言描述只是模糊規(guī)則的If部分的可能解釋,因為不同的專家可能對同一規(guī)則使用不同的語言描述。為了進一步解釋模糊規(guī)則的用法和重要性,圖9列出一個例子的描述,該例子為一名患者的頻域深度特征使用TSK模糊系統(tǒng)進行診斷。

Table 7 Description of fuzzy rules表7 模糊規(guī)則描述

Fig.9 Use of fuzzy rules圖9 模糊規(guī)則的使用
上述分析表明,多視角TSK模糊系統(tǒng)是使用生成的模糊規(guī)則識別癲癇患者的可解釋模型。
本研究提出融合深度和淺層特征的多視角分類算法來對癲癇EEG信號進行檢測,通過實驗數(shù)據(jù)可以發(fā)現(xiàn),本研究提出的融合特征比傳統(tǒng)的特征提取方法獲得了更好的效果,并且使用基于TSK模糊系統(tǒng)的多視角分類器對融合特征進行學(xué)習(xí),進一步提高了算法的效果。可以發(fā)現(xiàn)深度和淺層特征的提取方法以及多視角TSK模糊系統(tǒng)的引入對癲癇EEG信號的檢測很有價值。
雖然研究的效果得到了提升,但是該研究還有一些不足和值得進一步深入研究的地方。比如引入的淺層特征是分布在頻域和時頻域的,但是EEG信號還有很多有用的特征比如統(tǒng)計學(xué)特征和非線性特征,如何有效利用這些特征很有意義;在多視角算法方面,多視角TSK模糊系統(tǒng)雖然達到了比單視角更好的效果,但是還有改進的空間。將來的工作中將對上述方向進行深入研究。