999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

檢測腦電癲癇的多頭自注意力機制神經網絡

2023-02-18 07:16:54江永全
計算機與生活 2023年2期
關鍵詞:癲癇特征模型

仝 航,楊 燕,江永全

西南交通大學 計算機與人工智能學院,成都611756

癲癇是第四大最常見的神經疾病,具有慢性、復發性、非感染性等特點,全世界有超過5 000 萬的癲癇患者,其中25%的患者沒有得到有效的手術或藥物控制。由于癲癇發作的時間不可預測,癲癇對患者的生活質量造成了很大的影響。大腦活動異常即大腦神經細胞突然過度放電導致癲癇發作,致使患者出現不正常的行為或感覺,有時甚至失去意識,進而導致其他健康問題,甚至死亡。

腦電圖(electroencephalogram,EEG)是一種記錄大腦活動的有效工具,已被廣泛用于分析和診斷癲癇、阿爾茨海默癥、注意力缺陷多動障礙等疾病。作為監測、檢測和診斷癲癇發作的常用方法之一,腦電圖通過放置在大腦不同位置的多個電極來測量腦電活動,記錄的信號通常包含多個通道。根據以往的工作,腦電圖信號的采集通常是將電極置于頭皮表面或短期植入顱內,分別稱為頭皮腦電圖和顱內腦電圖。雖然顱內腦電圖記錄提供了更好的信噪比,更好地定位于致癇區域,但是,顱內電極的覆蓋范圍有限,可能會漏過覆蓋范圍以外的癇樣放電,對手術者要求較高。頭皮腦電圖是一個非侵入性的無創技術,對于每天的患者監測和發作警報生成,頭皮腦電圖記錄具有更高的適用性和易用性,因此,目前對癲癇發作檢測的研究大多傾向于利用頭皮腦電圖。

在癲癇發作檢測任務中,需要對腦電圖信號進行徹底的分析,以判斷癲癇是否發作,這是一項依賴大量臨床經驗且耗時的工作。由于癲癇發作的頻率相對較低,面對長期的腦電圖記錄,人類專家或專業醫生通過視覺閱讀多通道腦電圖信號識別癲癇發作的特征模式耗時嚴重且效率低下。腦電圖癲癇發作的自動檢測深受神經信息學研究者和醫學界的關注,因此,迫切需要基于計算機的癲癇自動檢測技術,這也是節省時間和精力的關鍵方法。

近年來,癲癇發作自動檢測方面存在著大量的研究。一般來說,癲癇檢測過程分為特征提取和分類兩個階段。特征提取至關重要,因為提取的腦電特征模式將影響著分類器的性能。基于人工特征和機器學習分類器的技術研究很多。常見的人工特征提取方法有時頻分析[1]、非線性動力學[2]、累積能量增量[3]、統計特征[4]等。這些人工特征提取的設計方法雖然各不相同,但通常涉及大量的專家知識,以便從數據中獲得可解釋的表示。常見的機器學習分類器有決策樹、貝葉斯網絡、高斯混合模型、傳統神經網絡和支持向量機等。然而,特征提取依賴于有限的和預先細化的手工工程操作集。此外,不同患者的癲癇發作特征不同且可能隨著時間的推移而有所改變,提取這些特征所需的計算時間取決于過程的復雜性,因此,自動從腦電數據中提取和學習特征信息是非常有必要的。

隨著深度學習在圖像分類、自然語言處理、時間序列預測等領域的廣泛應用和深入推廣,越來越多的深度學習模型被提出。尤其是深度學習算法擁有可以從自然信號中學習高級表示的能力[5],因此,它在醫學領域和信號處理領域取得了較為突出的結果。在腦電圖癲癇檢測中,像卷積神經網絡(convolutional neural network,CNN)和堆疊自編碼器(stacked autoencoder,SAE)等深度學習模型可以直接從腦電數據中學習特征表示,進而代替手工設計的特征提取方法,已被證明提取的特征更健壯,可以實現更好的性能檢測[6-7]。因此,本文將基于深度學習的癲癇發作檢測作為研究的主要任務。

EEG 信號本質上是多維度、高度動態、非線性的時間序列數據,BiLSTM(bi-directional long short-term memory)網絡在提取不同狀態下大腦活動的時間特征方面比CNN 有設計上的優勢,如在情緒識別[8]、運動想象分類[9]和睡眠分期[10]等方面。但由于信息在深層神經網絡結構中經過許多層后會衰減,當長短時記憶網絡(long short-term memory,LSTM)面對超長序列時,反向傳播也會導致梯度消失問題,會削弱模型的可靠性。而CNN 可以從輸入序列中提取位移不變的局部模式作為分類模型的特征,尤其是學習多元時間序列數據的特征,例如,用于動作或活動識別[11],可捕獲醫療保健數據的多元時間序列的隱藏模式[12],提取周期信息進行多元時間序列預測[13]。

由于深度學習算法需要大量的腦電圖記錄數據,缺乏開放的含標記的腦電圖數據是一個限制因素。公開的波士頓兒童醫院收集的頭皮腦電圖數據庫CHB-MIT 是一個包含連續長期頭皮腦電圖記錄的開放數據庫,且由專家對癲癇發作期做了標記,可用于癲癇檢測。在實踐中,不平衡的數據問題可能會破壞深度學習方法的有效性,因為癲癇發作事件的數量是有限的。另外,因為癲癇發作的腦電圖特征在不同患者之間可能存在顯著差異,雖然大部分針對特定患者的分類器可以具有良好的性能,卻不能對其他新患者起作用。由于癲癇發作和癲癇不發作活動因患者不同而具有特異性,跨多患者非特異性分類器的研究更有實際意義。文獻[14]提出了一種基于堆疊稀疏去噪自編碼器(stacked sparse denoising autoencoder,SSDA)的腦電通道選擇方法,考慮了多種信息共同確定關鍵信道特征。由于不相關的通道被過濾掉,這些方法顯著地減輕了噪聲影響。雖然他們的選擇策略取得了很好的效果,但實際上,不相關的通道會因設備不同、患者不同而有所改變。大多研究是利用領域知識從多通道腦電信號中選擇特定的通道進行分析,而對多通道癲癇腦電信號的數據驅動分析還沒有深入研究。此外,由于癲癇發作與一系列的腦電圖信號有關,而不是與某一時刻的值有關,大多數方法將每個時間戳隨機反饋給分類器,忽略了腦電數據之間的動態相關性,這導致無法更好地識別時間信號模式,因此時間分析對于癲癇發作的檢測是關鍵且有必要的。

為了解決上述挑戰,本文提出了一種廣義的癲癇預測方法,此方法將特征提取和分類階段結合到一個單獨的自動化框架中,能夠直接處理原始腦電圖數據。本文的主要貢獻包括三方面:

(1)利用滑動窗口將CHB-MIT 多通道腦電信號分割成固定時間長度的片段,確保癲癇發作和非發作數據的平衡,以便進一步研究和分析。

(2)提出了CABLNet(convolutional attention bidirectional long short-term memory network)深度學習網絡模型,使用CNN 提取腦電時間序列數據的時間短期模式和多通道之間的局部依賴關系,利用多頭自注意力機制捕獲特征表示的時間動態相關性,使用雙向LSTM 充分利用上下文向量前后時刻信息,可在不依賴任何醫學專家知識的情況下,從多通道腦電信號中準確檢測癲癇發作。

(3)在CHB-MIT 有噪聲腦電數據上的實驗結果表明,本文提出的模型在捕獲癲癇發作模式上具有很好的魯棒性和穩定性,能較好地克服不同患者癲癇發作的變化,用于跨多患者癲癇檢測。

1 相關工作

癲癇自動檢獲的研究已經進行了幾十年,提出的許多方法都取得了良好的性能。這些方法可以分為兩類:基于特征的方法和深度學習方法。

大多數基于特征的方法將專家手工制作的特征與分類器相結合,比較注重從背景模式中提取手工制作的特征,常見的特征包括時域方法[15]、頻域方法[16]、時頻域方法[17]和非線性方法[18]。分類器常使用傳統的機器學習方法,更注重研究開發患者特異性癲癇檢測方法。例如,文獻[19]提取了頻譜、空間、時間三類特征,提出了一種混合數據采樣和增強技術的算法,這種學習框架可以緩解類別不平衡問題,在魯棒性和泛化方面具有強大能力,對CHB-MIT 數據集進行患者特異性實驗,檢出準確率達97%,每小時誤檢率為0.08,可以有效地用于自動癲癇發作檢測問題。文獻[17]提出了一種基于離散小波變換(discrete wavelet transform,DWT)的新型計算效率特征Sigmoid熵的癲癇自動檢測模型。根據每個子帶的小波系數估計出Sigmoid 熵,并使用非線性支持向量機分類器進行交叉驗證,在UBonn 和CHB-MIT 兩個數據集的靈敏度分別達到100.00%和94.21%。文獻[20]認為將部分定向相干性(partial directed coherence,PDC)分析作為特征提取機制應用于癲癇發作檢測的頭皮腦電圖記錄,可以反映癲癇發作前后大腦活動的生理變化。于是,利用PDC 分析方法提取腦電通道相關信息流的方向和強度等特征,將特征輸入到支持向量機分類器,用于區分癲癇間期和發作期。這些方法試圖通過整合圖像特征和信號相關特征來捕捉腦電信號的非平穩行為,雖然在特征提取方面有所不同,但通常需要大量的領域知識。

然而,在許多領域,通過深度學習方法提取的特征比手工制作的特征更健壯。隨著深度學習技術的興起,許多深度學習方法被開發出來用于癲癇檢測。卷積神經網絡引起了人們對癲癇發作檢測的極大興趣,文獻[21]利用短時傅里葉變換(short time Fourier transform,STFT)提取腦電信號的時域和頻域信息,使用由3 個block 組成的CNN 架構(每個block包括一個歸一化層、一個卷積層和一個最大池化層)進行特征提取和分類。在CHB-MIT 數據集上,平均癲癇檢測靈敏度達81.2%,誤檢率為每小時0.16。文獻[22]并不對腦電信號進行特征提取,而是直接使用金字塔型一維深度卷積神經網絡對單通道腦電信號進行癲癇檢測,實驗結果表明,CNN 比人工工程技術的學習效果好。

另外,循環神經網絡也被用于從頭皮腦電圖記錄中自動檢測癲癇發作。文獻[23]提出了一種基于頭皮腦電圖的特殊癲癇發作檢測的深度循環結構(deep recurrent neural network,DRNN)和一種癲癇腦電信號映射方法,使所提出的深度結構能夠同時分別學習原始腦電信號的時間特征和空間特征。文獻[24]提取Hurst 和自回歸滑動平均(auto-regressive moving average,ARMA)特征,為腦電信號建立一個20 維的通道特征,標準化處理之后送入LSTM,實驗結果表明,雙層LSTM 方法比之前使用的支持向量機分類器獲得了更高的精度。文獻[25]對原始腦電信號進行局部均值分解,使用最大值、最小值、中位數、均值、標準差、方差、均值絕對偏差、均方根、偏度、峰度10 個統計參數作為特征,將這些特征送入到雙向LSTM。在CHB-MIT 頭皮腦電圖數據庫中,平均靈敏度為93.61%,平均特異度為91.85%,該模型考慮了當前分析時刻前后的信息,并共同確定了決策結果。文獻[26]首先在腦電通道中引入注意機制,不同的權重會自動分配給大腦不同區域的信號通道,之后采用BiLSTM 提取腦電圖信號的前向和后向的時間特征,使用時間分布全連接層是在每個時間步上進一步提取特征,平均池化操作后提取每個樣本的全局特征,大量的實驗結果表明,提出的新方法的性能更加穩定。這些研究都取得了良好的成果,深度學習技術在腦電分析中仍有很大的潛力。

手工提取特征需要大量的領域知識,只選擇部分腦電通道會丟失部分有用信息。雖然腦電圖信號通常是動態的和非線性的,但在足夠小的時間段內,信號可以被認為是平穩的。不同的大腦區域可能對癲癇有不同的影響,不同腦區癲癇的腦電圖數據特征不同,不同的通道之間可能存在著局部依賴性。腦電圖信號在一個時間點的特征與過去時間點的數據和未來時間點的數據有著不同程度的關聯。而在自然語言處理領域,自注意力機制往往用于捕獲上下文關系。例如,文獻[27]提出了一種具有自注意力機制和多通道特性的BiLSTM 模型,結合多種特征向量和BiLSTM 模型的隱式輸出,利用自注意力機制對不同的詞給出不同的情感權重,能有效提高情感極性詞的重要性,充分挖掘文本中的情感信息。文獻[28]提出了一種基于多尺度局部上下文特征和自注意力機制的中文命名實體識別模型。通過融合不同核大小的卷積神經網絡(CNN)提取多尺度局部上下文特征,改進了原有的雙向長短期記憶和條件隨機場模型(bidirectional long short-term memory and conditional random field,BiLSTM-CRF),利用多頭自注意機制打破了BiLSTM-CRF 在捕獲遠程依賴關系方面的局限性,進一步提高了模型的性能。

基于上述觀點,本文提出了基于多頭自注意力機制神經網絡的癲癇腦電檢測方法。該方法不提取手工特征,直接處理原始腦電信號,提取信號的時間短期模式和多通道之間的局部依賴關系,引入多頭自注意力機制進一步捕獲短期時間模式之間的上下文聯系。在本文構造的數據集上進行跨多患者實驗,與其他方法進行對比,結果表明,提出的新方法的性能有了很大提升,具有高穩定性。

2 CABLNet模型

本章主要介紹所提出的CABLNet(即卷積-多頭自注意力機制-雙向長短時記憶網絡)模型,模型結構如圖1 所示。該模型包括卷積層、多頭自注意力層、雙向長短時記憶層和融合輸出層。本文將腦電信號切割為長為4 s 的樣本(詳見3.2 節),對切割得到的全部數據進行標準化,每個樣本可以表示為一組時間序列信號X={x1,x2,…,xn}∈RT×n,其中,xi∈RT,n表示腦電信號通道數,T表示每個樣本記錄的時間數。

圖1 模型架構圖Fig.1 Model architecture diagram

2.1 卷積層

CABLNet 網絡模型的第一層是一個沒有池化層的卷積層,其目的是為了提取腦電信號的短期時間模式和各個腦電通道間的局部依賴關系。同時,對時間步進行位移不變的壓縮,防止超長時間序列導致的梯度消失問題,方便后續雙向長短時記憶層捕獲信息。卷積層由多個濾波器組成,濾波器高度為h,濾波器寬度為n(寬度設置與腦電信號通道數相同),步長為s。第k個濾波器掃過腦電時間序列信號X得到輸出,計算過程如式(1)所示。

其中,*表示卷積操作,hk表示此濾波器對應的輸出向量,bk表示偏置項,函數f是非線性激活函數,這里使用ReLU,如式(2)所示。

另外,為了減少神經網絡訓練中的內部協變量偏移,降低過擬合的風險,同時增加收斂速度,本文在卷積之后以及使用非線性激活函數之前加入批處理歸一化(batch normalization,BN)操作。在非線性激活函數之后,增加dropout操作,用于減少神經元之間復雜的協同適應,迫使每個神經元學習更加魯棒的特征,避免過擬合。最終得到特征表示C∈Rt×m,其中m是濾波器的個數,t(t

2.2 多頭自注意力層

自注意力機制是注意力機制的一個特例,已經成功應用于自然語言處理(natural language processing,NLP)和問答系統(question answering system,QA)等多個領域。自注意力機制可以用于捕獲輸入輸出之間的全局依賴關系和序列本身的長距離依賴。針對本文,卷積得到的特征表示在時間維度上具有位移不變性,不同時間步的特征向量之間依然存在著長距離依賴關系和時間動態相關性。采用多頭自注意力機制[29]可以在不同表示子空間學習到相關的信息,進一步提高全局上下文特征的提取能力。

自注意力機制主要采用縮放點積注意力,注意力模塊的輸入由查詢(queries)、鍵(keys)、值(values)矩陣三部分組成,輸出是基于查詢和鍵的相似度與值的加權和。縮放點積注意力計算公式如下:

其中,Q、K、V分別表示查詢、鍵、值矩陣,dk表示鍵的維數。自注意力機制是一種與單個序列的不同位置相關的注意力機制,用于計算序列的表示。本文使用d表示自注意力機制的輸出維度,用Wq,Wk,Wv∈Rm×d表示可訓練的參數矩陣,則根據如下計算過程可得到上下文表示:

圖2 自注意力機制的計算過程Fig.2 Computational process of self-attention mechanism

與CNN 中的過濾器類似,一次自注意力關注不足以學習多個特征的權值。為了讓模型從不同的表示子空間學習信息,通過多個平行頭重復多次Attention運算,每個頭處理不同的信息,這樣可以處理特征表示的不同部分,提取出更豐富的時間序列長距離依賴關系。多頭自注意力機制的模型圖如圖3 所示,其中,h表示頭數。用Qi、Ki、Vi表示第i個子空間的查詢、鍵、值矩陣,則第i頭的自注意力結果表示如式(5)所示,將各個頭的自注意力結果拼接,使用矩陣Wdr進行多空間融合,最終得到多頭自注意力的最終結果,具體如式(6)所示。

圖3 多頭自注意力機制模型圖Fig.3 Model of multi-head self-attention mechanism

最后,使用層規范化(layer normalization)得到最終的上下文表示矩陣M∈Rt×d。多頭自注意力機制為不同時間步的特征向量分配不同的權重,即大的權重分配給少數關鍵特征向量,小的權重分配給大多數不相關的特征向量,從而有效地解決了各時間步特征向量的平等貢獻問題,捕獲了各時間步特征向量的長距離依賴關系和時間動態相關性。

2.3 雙向長短時記憶層

循環神經網絡(recurrent neural network,RNN)比人工神經網絡(artificial neural network,ANN)更適合于具有短期依賴性的序列學習問題。然而,RNN并不能有效地處理長期依賴的問題,因為長期的訓練過程可能因訓練權重突然變化導致網絡不穩定(即梯度爆炸)。

長短時記憶網絡[30]是一種特殊的遞歸神經網絡,它使用記憶單元(memory cell)的概念來處理長期依賴關系,克服了傳統RNN 模型的梯度消失和爆炸問題,可以有選擇地保存上下文信息。如圖4 所示,用mt表示第t時間步的輸入向量,用b表示偏置項,用ft、it、ot分別表示遺忘門、輸入門、輸出門的激活值向量,用ct、表示細胞狀態和候選值向量,用ht表示輸出向量,用W表示權重矩陣。在時間步t更新LSTM 記憶單元的計算操作如下:

圖4 LSTM 網絡結構圖Fig.4 LSTM network structure diagram

其中,函數σ表示Sigmoid 非線性激活函數,⊙表示元素的乘積。

然而,LSTM 只考慮過去的信息,只能按順序處理來自過去的信息,忽略了未來的信息。針對腦電癲癇檢測問題,需要有效地使用上下文信息,因此,采用雙向長短時記憶網絡(Bi-LSTM)。將上下文表示矩陣送入Bi-LSTM,分別由前向LSTM 和后向LSTM 通過計算前向隱藏序列和后向隱藏序列得到兩個單獨的隱藏狀態,然后將這兩個隱藏狀態拼接起來形成最終提取到的上下文特征:

ht+1∈R2h_d,h_d表示隱狀態的特征維度。

2.4 融合輸出層

含有長距離依賴關系的上下文表示,經過雙向長短時記憶網絡的信息提取,得到最終的上下文特征表示,將其輸入到全連接層進行融合,經logsoftmax函數計算得到最后的分類結果,如式(13)所示。其中,Wp、bp分別表示權重矩陣和偏置項。

3 實驗與結果

3.1 評價指標

本文使用靈敏度(Sen)、特異性(Spe)、G-均值(G-mean)、準確率(Acc)、F1-score(F1)作為模型分類的評價指標[25-26]。如果用TP 表示預測類別和真實類別都為癲癇發作期的樣本數,FN 表示預測類別為癲癇間期而真實類別為癲癇發作期的樣本數,FP表示預測類別為癲癇發作期而真實類別為癲癇間期的樣本數,TN 表示預測類別和真實類別都為癲癇間期的樣本數,那么所用評價指標公式表示如下:

用Pre表示精確率,其公式如式(18)所示,則可根據Pre和Sen得到F1,如式(19)所示。

3.2 實驗數據及預處理

本文使用波士頓兒童醫院收集的頭皮腦電圖數據庫(CHB-MIT),此數據庫包含連續長期頭皮腦電圖記錄。該數據庫共包含23 名患者24 個病例記錄(每個文件包含9 至42 個連續的.edf 格式的腦電數據文件),其中第1 個和第21 個病例記錄來自同一名患者。這些記錄采用國際10-20 EEG 電極位置和命名系統,所有信號采樣頻率為256 Hz,16 位分辨率。大多數病例記錄的腦電圖信號是23 通道的,為便于統一研究,本文只保留這23 個通道:FP1-F7、F7-T7、T7-P7、P7-O1、FP1-F3、F3-C3、C3-P3、P3-O1、FP2-F4、F4-C4、C4-P4、P4-O2、FP2-F8、F8-T8、T8-P8、P8-O2、FZCZ、CZ-PZ、P7-T7、T7-FT9、FT9-FT10、FT10-T8、T8-P8。通道數小于23 的記錄將被舍棄。

因為每個病例記錄文件所包含的每條記錄長度都不同,大部分記錄沒有發作,而發作的記錄也可能是多次發作,為保證樣本數據維度統一,需對數據做預處理工作。為便于理解數據預處理過程,圖5 展示了對只含有癲癇間期的記錄和同時含癲癇發作期的記錄的處理過程,上方的記錄只含有癲癇間期的記錄,下方的記錄表示含癲癇發作期的記錄,灰色部分表示癲癇發作期,陰影部分表示癲癇發作間期,小矩形表示4 s 的無重疊滑動窗口,將截取的長為4 s 的癲癇發作期數據、癲癇發作間期數據分別看作正、負樣本,對包含發作期的記錄進行兩次發作期采樣(第一次從發作開始,第二次從發作后3 s 開始),每段發作最后不足4 s 的部分將被舍棄,可得到5 236 條正樣本。每個不含發作期的記錄從第10 min 開始采樣12個無重疊的負樣本,為保證樣本數據的平衡性,從采樣得到的負樣本中隨機選擇5 236 條。按照60%∶20%∶20%的比例分別將正負樣本數據集劃分,最終得到訓練集數據6 284 條、驗證集數據2 094 條、測試集數據2 094 條。

圖5 腦電數據預處理過程圖Fig.5 Preprocessing process chart of EEG data

3.3 實驗環境

本文的實驗環境為:Ubuntu 16.04 操作系統,cudnn7,編程語言采用的是Python 3.6.8,深度學習框架為Pytorch(其版本為1.1)。另外使用了CUDA 9 用于GPU 加 速,GPU 為TIAN X,內 存16 GB,顯 存12 GB。

3.4 實驗參數

本實驗在模型訓練過程中訓練200 個輪次(Epoch),數據批處理大小設置為20。使用負對數似然損失函數NLLLoss 作為損失函數,使用Adam 優化器進行優化,學習率為0.000 1。根據以上參數設置,按照3.2 節的預處理方法,對數據進行分割,每個EEG 片段的大小為(1 024,23),可表示成通道數為1的張量(1,1 024,23),則卷積層輸入一個批次的張量大小為(20,1,1 024,23),卷積核尺寸設置為(26,23),卷積產生的通道數為26,步長設置為4,dropout為0.5,最終卷積層輸出張量大小為(20,26,250,1)。可訓練矩陣Wq、Wk、Wv的大小都為(26,64),多頭自注意力層的輸入Q、K、V的張量大小都為(250,20,64)。雙向長短時記憶層的隱藏狀態數為12,前后兩個方向最后時間步的隱藏狀態拼接后的上下文特征矩陣大小為(20,24)。最終經過融合輸出層得到輸出矩陣大小(20,2)。

3.5 實驗結果分析

在本節中,通過在CHB-MIT 有噪聲的頭皮腦電圖數據集上進行跨多患者實驗來評估CABLNet模型的性能,并針對不同病例的測試集進行分析,對比幾種不同方法的敏感性、特異性、G-均值、準確率、F1-score。

子空間數量(即頭數)意味著多頭自注意力層的多個子表示層的學習能力,頭數過少會導致提取的特征數量不足,頭數過多會導致過度表示,并不能從中提取更多有用的信息,反而增加了模型的復雜度。因此,就多頭注意力機制的頭數對實現性能的影響進行對比實驗。實驗結果如圖6 所示,分析可得,8 頭對應的G-均值、準確率、F1-score 均取得較高值,因此,本文將注意力子空間數量的最優值設置為8。

圖6 不同頭數的實驗結果對比Fig.6 Comparison of experimental results with different number of heads

使用8 頭注意力機制,模型在大約175 個輪次之后趨于收斂。如圖7 所示,(a)圖展示了在訓練集和驗證集上準確率隨輪次的變化情況,(b)圖展示了訓練損失和驗證損失隨輪次的變化情況。

圖7 準確率和損失值隨輪次的變化情況Fig.7 Variation of accuracy and loss with epoch

雖然是針對同一腦電數據集CHB-MIT,但不同的文獻對數據切割所得到的樣本時長(1~30 s)不盡相同。為了使實驗結果具有可對比性,本文對比了兩個基線實驗CNN+LSTM 和CNN+BiLSTM,同時復現了文獻[26]、文獻[31]、文獻[32]、文獻[33]所提出的方法,在本文預處理得到的數據集上進行了對比實驗,實驗結果如表1 所示。

表1 中,模型7 是本文提出的模型,模型1、模型2是兩個基線模型,隱藏狀態數為12,卷積層的相關設置以及其他實驗參數和本文模型相同。模型3、模型4、模型5 和模型6 是對比實驗模型,它們的相關參數設置與對應原文獻一致。

表1 不同模型在CHB-MIT 數據集上的實驗結果對比Table 1 Comparison of experimental results of different models on CHB-MIT dataset

與模型1 相比,除特異性外,模型2 在靈敏度、G-均值、準確率、F1-score 上有了大幅度提升,由此可見,雙向LSTM 比單方向的LSTM 具有更好的性能,對癲癇檢測問題融合前后信息至關重要。與模型2相比,本文提出的模型在各個評價指標上均有所提高,捕獲短期時間模式特征間的相關性有利于更好地進行特征提取。對比模型3、模型4、模型5 和模型6,靈敏度方面,模型5 最高,可達到91.60%,而本文提出的模型為96.18%,高出其4.58 個百分點;特異性方面,模型4 和模型5 比較高,分別為96.94%和96.75%,而本文模型為97.04%,與這些模型不相上下;G-均值方面,模型3、模型4 和模型6 較低,模型5 較高,為94.14%,本文模型為96.61%,高出其2.47 個百分點;準確率和F1-score 方面,模型3、模型4 和模型6 較低,模型5 最高,分別為94.17%和94.02%,本文模型為96.61%和96.59%,均高出其2 個百分點。整體看來,本文提出的模型在各項指標上均比對比的算法高,具有良好的性能。

癲癇發作和癲癇不發作活動因患者不同而具有特異性,為了比較訓練的模型在不同的病例上的表現能力,將原來的測試集數據按病例劃分為24 個測試集,實驗結果如表2 所示。本文提出的CABLNet模型,病例chb07、chb11、chb21 的準確率最高,為100.00%,病例chb14、chb24 的準確率較低,分別為84.78%、86.44%,靈敏度分別為73.68%、82.93%。病例ch13的特異性最差,為75.00%,敏感性為100.00%。經過對比,模型4 在病例chb01、chb10、chb22、chb23上準確率最高,模型5 在病例chb3、chb18、chb20 上準確率最高,而在其他病例上,本文提出的模型準確率均最高。模型3 準確率低于85.00%的病例分別為chb08、chb13、chb14、chb16 和chb24,模型4 準確率低于85.00%的病例分別為chb12、chb14、chb20、chb21和chb24,模型5 準確率低于85.00%的病例分別為chb12、chb14 和chb24,模型6 準確率低于85.00%的病例分別為chb5、chb14 和chb24,而本文提出的模型僅在病例chb14 上低于85.00%。更進一步,模型3 在13 個病例上準確率低于90.00%,模型4 在9 個病例上準確率低于90.00%,模型5 在4 個病例上準確率低于90.00%,模型6 在7 個病例上準確率低于90.00%,而本文提出的模型準確率低于90.00%的病例僅有2個。實驗結果表明,CABLNet 模型具有較好的魯棒性,能有效檢測不同患者的癲癇發作情況。

表2 不同模型在不同病例數據上的表現Table 2 Performance of different models on different case data

4 結束語

本文提出了一種基于多頭自注意力機制神經網絡的癲癇腦電檢測方法,該模型主要由卷積層、多頭自注意力層、雙向長短時記憶層構成,因此,命名為CABLNet(C 代表卷積,A 代表注意力機制,BL 代表雙向LSTM)模型。首先,對多位患者的數據進行采樣,確保得到不同類別均衡的樣本數據。其次,將原始腦電時序數據送入到卷積層,提取短期時間模式和通道之間的關系,將特征表示送入多頭自注意力機制捕獲短期時間模式的時間動態相關性,進而得到上下文表示,利用雙向LSTM 充分提取前后兩個方向的信息。最后,進行融合分類。實驗結果表明,該方法在捕獲癲癇發作模式上具有魯棒性和穩定性,提高了泛化性能,能夠有效地實現對多通道腦電信號的跨多患者癲癇檢測。該工作可以減輕臨床醫生的工作量,對輔助診斷有重要意義。

在未來的研究工作中,一方面,擴大癲癇數據的規模,使用更多患者的EEG 數據,繼續優化模型,提升算法性能;另一方面,結合實際情況,考慮EEG 記錄過程中部分電極脫落的情況,針對通道缺失問題做進一步研究。

猜你喜歡
癲癇特征模型
一半模型
癲癇中醫辨證存在的問題及對策
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
玩電腦游戲易引發癲癇嗎?
飲食科學(2017年5期)2017-05-20 17:11:53
3D打印中的模型分割與打包
左氧氟沙星致癲癇持續狀態1例
西南軍醫(2015年4期)2015-01-23 01:19:30
主站蜘蛛池模板: 国产无码高清视频不卡| 青青网在线国产| 成人欧美日韩| 再看日本中文字幕在线观看| 永久免费AⅤ无码网站在线观看| 试看120秒男女啪啪免费| 亚洲色图狠狠干| 中文字幕亚洲电影| 九九香蕉视频| 黄色国产在线| 在线精品亚洲国产| 丁香婷婷激情网| 色噜噜在线观看| 一级香蕉视频在线观看| 激情综合网址| 国产精品一区二区国产主播| 日本精品影院| 国产啪在线91| 国产18在线播放| 中文字幕亚洲第一| 国产午夜无码片在线观看网站| 亚洲一级毛片免费看| 波多野结衣中文字幕久久| 亚洲精品在线91| 免费看a级毛片| 日韩福利视频导航| 亚洲swag精品自拍一区| 婷婷六月激情综合一区| 韩国福利一区| 午夜在线不卡| 国产亚洲精品在天天在线麻豆| 毛片在线播放网址| 日韩高清一区 | 日本a级免费| 亚洲,国产,日韩,综合一区 | 国产精品手机在线播放| 国产福利微拍精品一区二区| 亚洲无码高清免费视频亚洲| 老司机久久99久久精品播放| 亚洲国产成人综合精品2020| 91色综合综合热五月激情| 亚洲综合极品香蕉久久网| www.精品国产| 日本不卡视频在线| 国产免费羞羞视频| 四虎影视库国产精品一区| 欧美一区二区三区国产精品| 蜜臀AV在线播放| 啊嗯不日本网站| 国产免费自拍视频| 亚洲综合在线网| 国产自产视频一区二区三区| 99久久国产精品无码| 无码精品国产dvd在线观看9久| 欧美一级一级做性视频| 67194亚洲无码| 一区二区三区精品视频在线观看| 扒开粉嫩的小缝隙喷白浆视频| 国产青榴视频| 欧美日韩久久综合| 日韩欧美国产综合| 成人免费午夜视频| 网久久综合| 在线色国产| 欧美日韩第三页| 国产成人无码AV在线播放动漫 | 国产91在线免费视频| 九九视频免费看| 亚洲成人福利网站| 午夜欧美理论2019理论| 国产精品视频第一专区| 制服丝袜无码每日更新| 999精品视频在线| 欧美黄网在线| 欧美精品色视频| 国产地址二永久伊甸园| 免费日韩在线视频| 国产福利影院在线观看| 国产视频一区二区在线观看 | 高清欧美性猛交XXXX黑人猛交| 国产精品一区二区不卡的视频| 在线中文字幕网|