程偉,龍佳偉,鄭威
(江蘇科技大學(xué)電子信息學(xué)院,鎮(zhèn)江 212000)
癲癇(Epilepsy)是人類(lèi)最易發(fā)的神經(jīng)科疾病之一,近年來(lái)越來(lái)越被重視。其病理為在大腦神經(jīng)元中時(shí)常突發(fā)性不常規(guī)放電,從而導(dǎo)致大腦功能受阻。其特征為反復(fù)性、突發(fā)性的發(fā)作,且發(fā)病范圍廣[1]。
腦電圖(electroencephalogram,EEG)是有效判斷癲癇發(fā)病的臨床醫(yī)學(xué)依據(jù)[2]。使用腦電圖可以更方便地對(duì)大腦神經(jīng)元異常放電進(jìn)行監(jiān)測(cè)和記錄[3]。癲癇腦電信號(hào)一般指尖波、棘波等突發(fā)性的非常規(guī)放電[4],臨床上它們是醫(yī)生診斷癲癇信號(hào)的重要依據(jù)。
迄今為止,有很多方法被用于腦電癲癇信號(hào)識(shí)別[5]。1970年,Viglione等[6]利用對(duì)癲癇發(fā)病患者的長(zhǎng)期腦電檢測(cè),發(fā)現(xiàn)在臨床癲癇發(fā)作之前患者的腦電圖會(huì)發(fā)生棘波、尖波、慢波等癲癇樣放電。Majundar等[7]通過(guò)微分方差等簡(jiǎn)單的時(shí)域分析對(duì)癲癇腦電圖進(jìn)行特征提取。Khan[8]等通過(guò)頻域方法離散小波變換分析腦電信號(hào)的時(shí)頻特征,并在小波變換的基礎(chǔ)上,進(jìn)一步提取頻譜特征。Daniel等[9]利用信號(hào)的復(fù)雜度和近似熵等非線(xiàn)性動(dòng)力學(xué)特征應(yīng)用于癲癇預(yù)警。劉偉楠[10]等使用功率譜對(duì)睡眠中的癲癇發(fā)作作出預(yù)測(cè)。
針對(duì)癲癇放電模式的多樣化,將不同患者各自的癲癇腦電特點(diǎn),通過(guò)機(jī)器學(xué)習(xí)[11]自動(dòng)學(xué)習(xí)到最合適的特征才是理想的解決方案[12]。陳姍姍[13]結(jié)合小波變化和稀疏表示的方法對(duì)癲癇腦電信號(hào)進(jìn)行特征分類(lèi)。戴若夢(mèng)[14]利用CNN卷積神經(jīng)網(wǎng)絡(luò)對(duì)運(yùn)動(dòng)想象腦電進(jìn)行分類(lèi)。呂健[15]利用小波變換和SVM支持向量機(jī)算法對(duì)癲癇腦電信號(hào)進(jìn)行檢測(cè),最終預(yù)測(cè)癲癇腦電樣本中癲癇信號(hào)的正確分類(lèi)率為91.667%。潘媛媛等[16]使用基于GM-SVM,即遺傳算法和支持向量機(jī)相結(jié)合的分類(lèi)模型。宋玉龍等[17]使用經(jīng)驗(yàn)?zāi)B(tài)分解和極限學(xué)習(xí)機(jī),實(shí)現(xiàn)了對(duì)癲癇的分類(lèi)研究。沈雷等[18]利用遷移學(xué)習(xí)和空洞卷積對(duì)癲癇腦電信號(hào)進(jìn)行自動(dòng)檢測(cè)研究。
上述研究成果,為癲癇腦電信號(hào)識(shí)別提供了較為明確、清晰的思路,但仍存在一些不足:通常網(wǎng)絡(luò)層數(shù)較淺,不能很好地學(xué)習(xí)到癲癇樣放電的特征;對(duì)于數(shù)據(jù)集最后的驗(yàn)證未使用合理科學(xué)的K折驗(yàn)證;分類(lèi)時(shí)參數(shù)過(guò)多,分類(lèi)性能較差。
本研究引入了Densenet密集卷積網(wǎng)絡(luò)對(duì)癲癇腦電信號(hào)進(jìn)行識(shí)別。通過(guò)使用Densenet加深了網(wǎng)絡(luò)結(jié)構(gòu),提取了更多特征。由于網(wǎng)絡(luò)密集機(jī)制的使用,可以避免隨著網(wǎng)絡(luò)層數(shù)加深產(chǎn)生的過(guò)擬合以及退化現(xiàn)象。使用K折交叉驗(yàn)證對(duì)腦電癲癇信號(hào)提前進(jìn)行分類(lèi),再互相比較,為實(shí)驗(yàn)驗(yàn)證增加了更多合理性。
ResNet[19]這種將前層與后層相連接的網(wǎng)絡(luò)結(jié)構(gòu),由于其非常像電路中的短路結(jié)構(gòu),被統(tǒng)稱(chēng)為“短路連接”(shortcuts,skip connection),對(duì)梯度的反向傳播比較有利。而DensNet[20]在繼承了此網(wǎng)絡(luò)結(jié)構(gòu)之外,增加了與前層所有層之間的連接結(jié)構(gòu)。
由于DenseNet所有的層均被連接,每一層都會(huì)獲取之前的所有層作為該層額外的輸入,對(duì)于一個(gè)L層的網(wǎng)絡(luò)來(lái)說(shuō),DenseNet一共包括了L(L+1)/2個(gè)連接。同時(shí)借助該密集連接(見(jiàn)圖1),DenseNet可獲取來(lái)自不同層的特征圖,以達(dá)到特征重用的目的,進(jìn)一步提升了效率。

圖1 密集連接
傳統(tǒng)的L層網(wǎng)絡(luò)的輸出,見(jiàn)式(1):
xl=Hl(xl-1)
(1)
而在DenseNet中,連接了前面所有層的輸入,見(jiàn)式(2):
xl=Hl([x0,x1,...,xl-1])
(2)
式中Hl(.)代表非線(xiàn)性轉(zhuǎn)化函數(shù),為一個(gè)卷積神經(jīng)網(wǎng)絡(luò)中[21]常用的操作,包含Conv,BN(Batch Normalization),ReLU激活函數(shù)及池化等步驟。
在DenseNet中獨(dú)有Dense block密集塊(見(jiàn)圖2),在Dense block中,每一層特征圖的大小一致,可以在通道上連接。Dense block的非線(xiàn)性轉(zhuǎn)化函數(shù)一般采用BN+ReLU+3×3Conv的結(jié)構(gòu)。由圖3可知,Dense block中,各個(gè)層卷積后都輸出k個(gè)特征圖,即采用k個(gè)卷積核。卷積核的個(gè)數(shù)k在DenseNet中被稱(chēng)為growth rate。

圖2 DenseNet網(wǎng)絡(luò)結(jié)構(gòu)
在密集塊后,由于密集連接的特性,為確保各層特征圖輸入的維度一致,通常會(huì)添加一個(gè)過(guò)渡層。本研究的過(guò)渡層使用BN+Conv+池化操作,在連接兩個(gè)密集塊的同時(shí),降低前一層特征圖的大小。此外,過(guò)渡層還起到壓縮模型的作用,引入壓縮系數(shù)m,通過(guò)此過(guò)渡層后,特征數(shù)量會(huì)乘以0~1之間的一個(gè)m壓縮系數(shù)。
在密集塊中,使用BN+Relu+Conv的結(jié)構(gòu)。Relu為常見(jiàn)的激活函數(shù):

(3)
一般神經(jīng)網(wǎng)絡(luò)選擇的激活函數(shù)有:Sigmoid,Tanh,Relu,Elu,除Relu外其余定義見(jiàn)式(4)—(6),對(duì)比見(jiàn)圖4。Relu為非線(xiàn)性激活函數(shù),本研究采用該函數(shù),在深層的神經(jīng)網(wǎng)絡(luò)中可以更好地避免過(guò)擬合的發(fā)生[23]。

圖4 四種激活函數(shù)對(duì)比圖
(4)

表1 網(wǎng)絡(luò)結(jié)構(gòu)
(5)
(6)
本研究所使用的數(shù)據(jù)集為德國(guó)伯恩大學(xué)癲癇數(shù)據(jù)集的預(yù)處理版本。實(shí)驗(yàn)所使用的環(huán)境以及庫(kù)版本,見(jiàn)表2。

表2 實(shí)驗(yàn)環(huán)境
原始數(shù)據(jù)集包含五個(gè)不同患者的腦電采樣,每個(gè)文件記錄了23.6 s的大腦活動(dòng),采樣頻率為173.61 Hz。相應(yīng)的時(shí)間序列被采樣到4 097個(gè)數(shù)據(jù)點(diǎn)中,每個(gè)數(shù)據(jù)點(diǎn)都記錄了不同時(shí)間點(diǎn)的EEG值。其中,樣本A記錄了癲癇發(fā)作活動(dòng),樣本B和C為正常無(wú)癲癇疾病的正常人,樣本D和E分別取自癲癇發(fā)作期間患者閉上眼睛和睜開(kāi)眼睛時(shí)的EEG信號(hào)。
首先將原始腦電數(shù)據(jù)進(jìn)行預(yù)處理和重構(gòu)。數(shù)據(jù)集預(yù)處理由德國(guó)伯恩大學(xué)作出的成果完成[24],即使用0.53~40 Hz的帶通濾波器對(duì)其進(jìn)行濾波操作,并使用視覺(jué)檢測(cè)技術(shù)去除偽跡干擾。數(shù)據(jù)重構(gòu)[25]將原始數(shù)據(jù)集的4 097個(gè)數(shù)據(jù)點(diǎn)分為23個(gè)數(shù)據(jù)塊,按照隨機(jī)排列,每個(gè)數(shù)據(jù)塊包含178個(gè)數(shù)據(jù)點(diǎn),持續(xù)1 s,每個(gè)數(shù)據(jù)點(diǎn)是在不同時(shí)間點(diǎn)的EEG記錄值。因此,數(shù)據(jù)集被拆分為23×500=11 500條數(shù)據(jù),每個(gè)數(shù)據(jù)包含1 s的178個(gè)數(shù)據(jù)點(diǎn),數(shù)據(jù)標(biāo)簽為{A,B,C,D,E}。
數(shù)據(jù)集取樣見(jiàn)圖5、圖6。圖5為數(shù)據(jù)集中癲癇樣1 s腦電圖取樣,即從數(shù)據(jù)標(biāo)簽為A的數(shù)據(jù)集中選取的第一組數(shù)據(jù)塊。圖6為非癲癇樣1 s腦電圖取樣,即從數(shù)據(jù)標(biāo)簽為B的數(shù)據(jù)集中選取的第一組數(shù)據(jù)塊。

圖5 癲癇樣1 s腦電圖取樣

圖6 非癲癇樣1 s腦電圖取樣
本研究使用最常用的卷積神經(jīng)網(wǎng)絡(luò)框架AlexNet[26]和LeNet[27]作為實(shí)驗(yàn)對(duì)照組。實(shí)驗(yàn)的評(píng)價(jià)指標(biāo)使用準(zhǔn)確率 (accuracy,ACC)、精確度(precision, PPV)、靈敏度 (sensitivity,TPR)、特異度(specificity, TNR)和F1分?jǐn)?shù) (F1 score, F1)。這里引入受試者工作特性曲線(xiàn)(receiver operating characteristic-area under curve, ROC-AUC)。ROC曲線(xiàn)中的x軸為誤診率(false positive rate, FPR),y軸的縱坐標(biāo)為靈敏度 TPR,ROC曲線(xiàn)相對(duì)于x軸的面積為AUC(Area under curve)。其作用是給出反應(yīng)敏感度和特異度連續(xù)變量的綜合指標(biāo),并且通過(guò)統(tǒng)計(jì)數(shù)據(jù),確定疾病的最佳診斷點(diǎn)。上述指標(biāo)定義見(jiàn)式(7)—式(11),其中 FN為假陰性,F(xiàn)P為假陽(yáng)性,TN為真陰性,TP為真陽(yáng)性。
(7)
(8)
(9)
(10)
(11)
為了保證實(shí)驗(yàn)的可靠性以及避免數(shù)據(jù)集的隨機(jī)性導(dǎo)致的實(shí)驗(yàn)誤差,這里引入K折交叉驗(yàn)證法[28],見(jiàn)圖7。五折交叉驗(yàn)證,即將數(shù)據(jù)集隨機(jī)拆分為5堆,將其中的一堆作為測(cè)試集,其余作為驗(yàn)證集所用,并且保證每次取得的測(cè)試集不重復(fù)。即第i次實(shí)驗(yàn)時(shí),只用原數(shù)據(jù)集的第i個(gè)子集作為測(cè)試集,數(shù)據(jù)集中的其他數(shù)據(jù)作為訓(xùn)練集;通過(guò)五次實(shí)驗(yàn)計(jì)算,以五個(gè)實(shí)驗(yàn)的平均值作為結(jié)果,從而達(dá)到將測(cè)試誤差估計(jì)平均測(cè)試誤差的效果。本次實(shí)驗(yàn)中,未對(duì)數(shù)據(jù)集添加一些數(shù)據(jù)增強(qiáng)等手法,增強(qiáng)了模型的可靠性和耦合性。

圖7 五折交叉驗(yàn)證
實(shí)驗(yàn)結(jié)果顯示,本研究模型的ACC為96.94%,PPV為97.46%,TPR為87.18%,TNR為99.42%、F1分?jǐn)?shù)為92.03%。由表3可知,針對(duì)同一數(shù)據(jù)集下,使用基于卷積神經(jīng)網(wǎng)絡(luò)不同模型的神經(jīng)網(wǎng)絡(luò)相比DenseNet的表現(xiàn)比較優(yōu)異,對(duì)EEG癲癇腦電信號(hào)識(shí)別的精準(zhǔn)度提升較大。在指標(biāo)中,ACC、PPV、TPR、TNR和F1分?jǐn)?shù)較其他模型均有提升,說(shuō)明DenseNet模型的效果遠(yuǎn)高于AlexNet 和 LeNet。幾種常用的卷積神經(jīng)網(wǎng)絡(luò)中,Densenet模型對(duì)EEG腦電癲癇信號(hào)的識(shí)別效果最好,而AlexNet模型識(shí)別效果最差。

表3 實(shí)驗(yàn)對(duì)照組評(píng)價(jià)參數(shù)對(duì)比
ROC曲線(xiàn)顯示Densenet模型的AUC達(dá)到了0.99,見(jiàn)圖8。說(shuō)明該模型對(duì)EEG癲癇腦電信號(hào)的識(shí)別效果較好。此外,本研究還引入混淆矩陣來(lái)評(píng)價(jià)模型對(duì)癲癇和非癲癇腦電信號(hào)的分類(lèi)能力,混淆矩陣中顏色越深表示概率越大,見(jiàn)圖9。由圖可知,本研究模型在EEG腦電癲癇信號(hào)識(shí)別分類(lèi)中取得了良好的識(shí)別效果,模型具有較強(qiáng)的有效性和泛化能力。

圖8 ROC曲線(xiàn)圖

圖9 DensNet模型混淆矩陣
使用德國(guó)波恩大學(xué)的相同數(shù)據(jù)集,將本研究取得的各項(xiàng)指標(biāo)與目前已發(fā)表的文獻(xiàn)做對(duì)比,結(jié)果見(jiàn)表4。由表3和表4可知,本研究模型對(duì)比以前的文獻(xiàn)結(jié)果,各項(xiàng)指標(biāo)都非常均衡,說(shuō)明Densenet在EEG腦電癲癇信號(hào)識(shí)別領(lǐng)域取得良好的表現(xiàn)和穩(wěn)定性。主要有如下3個(gè)原因:優(yōu)秀的數(shù)據(jù)集預(yù)處理和重構(gòu)算法增加了模型的通用性和兼容性;密集連接的優(yōu)勢(shì),在獲取多層特征的同時(shí),減少了參數(shù)的設(shè)置;通過(guò)加深網(wǎng)絡(luò)深度,獲取更多特征,通過(guò)Densenet模型避免退化問(wèn)題的發(fā)生。

表4 與已經(jīng)發(fā)表的文獻(xiàn)結(jié)果對(duì)比
本研究使用Densenet密集卷積網(wǎng)絡(luò)對(duì)癲癇腦電信號(hào)進(jìn)行識(shí)別。密集卷積在同一數(shù)據(jù)集下可以擁有更少的參數(shù)數(shù)量,在提升自動(dòng)化的同時(shí),取得了96.94%的識(shí)別率,為癲癇發(fā)病檢測(cè)臨床應(yīng)用技術(shù)的發(fā)展提供了新的可行性方案。
在后續(xù)研究中,便攜性以及實(shí)時(shí)性將成為重要方向。目前隨著基于移動(dòng)手機(jī)芯片的深度學(xué)習(xí)架構(gòu)的發(fā)展,結(jié)合手機(jī)成熟的用戶(hù)界面,后續(xù)可考慮將該模型應(yīng)用于專(zhuān)業(yè)的醫(yī)療移動(dòng)設(shè)備。