曾昊辰,胡 濱,關治洪
1.華中科技大學 人工智能與自動化學院,武漢 430074
2.華南理工大學 未來技術學院,廣州 510641
3.人工智能與數字經濟廣東省實驗室(廣州),廣州 510335
抑郁癥是一種全球性精神障礙疾病,其終生患病率相對較高,從2%到15%不等,并且與顯著的發病率有關[1]。世界衛生組織的數據顯示,全球估計有3.8%的人口受到影響。不同于通常的情緒波動和短暫情緒反應,當抑郁癥反復發病并達到中度或重度時,可能引發嚴重的健康疾患,甚至導致自殺傾向。然而,抑郁癥發病機制尚不完全清楚,目前普遍認為是生物、心理、社會、季節等多因素綜合干預下的產物。抑郁癥本質上是異質的,不同抑郁癥患者的癥狀與嚴重程度也可能是不一樣的,不同亞型的抑郁癥的癥狀也不同且亞組在不斷變化。輕度抑郁癥如果不及時發現并治療,極有可能發展成中度甚至是重度抑郁癥。因此,實現準確的抑郁癥診斷是兼具實際意義和挑戰性的課題。
目前,抑郁癥診斷依賴臨床癥狀,暫無任何無創或定量檢測方法。主要基于癥狀學,根據是否出現抑郁癥狀來進行診斷。面對抑郁人群逐漸增多并且癥狀多樣的診斷背景,傳統診斷方法缺乏生物診斷根據、存在主觀因素影響且量表無法有效進行抑郁癥亞型與嚴重程度的判斷,15 個國家或地區醫生對抑郁癥識別率僅有55.6%,而中國上海僅為21%,存在很大的誤診風險。深度學習(deep learning,DL)輔助診斷有望改善上述問題。深度學習是機器學習領域的一大分支,通過樣本數據提取其特征并分析內在的規律。深度神經網絡在圖像、視頻等任務上表現良好。在抑郁癥診斷中,深度學習方法相比于傳統的量表等檢測手段,優勢主要在于將復雜的抑郁癥診斷問題轉換成建模計算的量化問題,排除了主觀因素影響準確性更高,同時從患者的磁共振、腦電等生理信號提取抑郁癥特征,具有一定的生理依據。
王鳳琴等[2]通過卷積神經網絡(convolutional neural network,CNN)為核心的在線腦電分類系統能實現抑郁癥與健康個體分類的準確率、敏感度和特異度達到99.08%、98.77%和99.42%。IBM 團隊[3]通過CNN 提取患者的語言方式進行分類,最終達到了83%的精確度。Achary 等[4]提出基于腦電圖EEG 的卷積網絡對15 名正常和15 名患者的腦電圖進行測試,分別在左半球和右半球的EEG 信號上獲得了93.5%和96.0%的準確度,并發現右半球的信號比左半球的信號更活躍。Uddin等[5]通過循環神經網絡(recurrent neural networks,RNN)與長短期記憶(long short-term memory,LSTM)相結合研究患者的癥狀信息,精確度達到98%。Shah等[6]提出基于脈沖網絡的NeuCube模型通過抑郁與健康EEG信號計算的神經回路連接進行分類,準確率分別為68.18%(EC)和72.13%(EO)。Uyulan 等[7]提出的基于EEG 信號的MobileNet架構產生了89.33%和92.66%的準確率,其中delta頻段的效果最好。Mumtaz等[8]提出自動診斷架構,對抑郁癥EEG信號分類準確度超過98.32%。
值得指出的是,基于深度學習的輔助診斷方法存在局限性,如模型大多難以訓練,因為抑郁癥特征難以有效提取導致數據中存在較多的無關噪聲;模型的性能不足,因為醫學隱私保護問題,數據集不夠大,不足以支撐巨大的參數量,使得模型在泛化性、穩定性、魯棒性上有很大不足,臨床大規模應用能力有待提高;模型的生物可解釋性不足,反映抑郁癥生理學障礙機制的能力有限,訓練過程產生的大量能耗與復雜度問題[9]也限制了進一步的臨床應用。類腦學習方法有望克服上述局限性,提升臨床輔助診斷效率[10]。
類腦學習是延伸機器學習的基本方法,新興的具有生物可解釋性的腦啟發算法。類腦學習本質是通過計算與建模的手段,在軟硬件協同下實現對大腦神經傳導與認知機制的模擬,達到擁有人類智能水平的人工智能方法[11]。類腦智能系統的目標是具有信息處理機制上類腦、認知行為表現上類人、智能水平上達到或超越人等優勢。類腦學習可分為三個層次:結構層次、器件層次與功能層次。處于類腦學習核心的脈沖神經網絡,擁有更好的生物可解釋性,并且能處理時間維度的信息;脈沖網絡的連接具有稀疏性,并且是通過離散的脈沖信號傳輸信息。因此,構建基于脈沖神經網絡的類腦學習方法,有望克服傳統深度學習因高能耗難以應用于邊緣設備的缺陷。
針對抑郁癥臨床診斷的需求及現有深度學習方法的局限,本文提出了一種用于抑郁癥EEG 診斷的類腦學習模型,主要創新點如下:
(1)在功能層面,構建稀疏脈沖神經網絡,對抑郁癥EEG 信號實現高精度分類,并通過稀疏連接,降低分類任務的能耗,同時所建脈沖網絡在樣本較少情況下能夠保證性能。
(2)功能層次的簡單分類并不能直觀地反映生理學障礙機制,進一步在結構層面,對患者的腦功能連接關系通過復雜網絡分析建立腦連接空間拓撲,為抑郁癥腦功能連接異常提供生理學線索。
數據來源基于蘭州大學MODMA 數據集[12]記錄的測試者5 min閉眼狀態腦電圖。參與者被要求保持清醒狀態,并且保持沒有任何身體運動,包括頭部和腿部,以及任何不必要的眼球運動、掃視和眨眼。選取健康個體、輕度抑郁癥患者各20 人的數據進行實驗。數據預處理的方法如下:將初始128 通道信號濾波后去除干擾,包括肌肉收縮和運動偽影、眼球運動等導致的干擾,隨后對去除的壞導進行重新插值,接下來進行電極重參考并對子空間重構去除高能成分。隨后,將完成預處理之后的EEG 數據進行不同波段的濾出,包括δ(delta,1~4 Hz),θ(theta,4~8 Hz),α(alpha,8~12 Hz),β(beta,13~30 Hz),γ(gamma,30~40 Hz),全波段(1~40 Hz)。分別對不同波段的濾出EEG信號進行分析。
腦是一個龐大的神經元網絡,不同區域神經元的同步活動可以提供有關神經活動的有用信息,這被稱為腦連通性。本文選擇鎖相值[13](phase-locking value,PLV)量化連通性。通過計算不同電極之間的鎖相值,可以反映電極之間的相位同步性,從而衡量不同大腦區域之間的協調激活。鎖相值的公式如下:
其中,N是窗口的數量,Δ?n表示第n個窗口的相位差。PLV值越接近1,表示兩區域之間的同步性越強,連接性也就越強,反之,越接近于0,則兩區域之間的相互獨立性越強,連接性越弱。
實驗采用128通道電極記錄測試者的EEG信號,計算得到的腦鄰接矩陣為128×128,假定連接性是無向的,為了減少輸入參數量,對128×128 的矩陣取上半部分得到8 128維數據,去掉28個由參考或無關電極計算的元素得到90×90 的矩陣并轉換為單通道圖像作為神經網絡的輸入。
模型從兩個層次出發:在功能層次通過類腦計算學習抑郁癥特征并進行準確的診斷,在結構層次對腦功能連接通過復雜網絡分析找出EEG信號的相位同步性所反映的腦網絡連接特性,找出生理學異常并進行潛在病因分析。
1.3.1 抑郁癥的脈沖神經網絡分類器
脈沖神經網絡分類器由CNN通過FS(few-spikes)[14]編碼轉換而來,這種編碼方式被證明能改善目前脈沖神經網絡基于速率[15]及時間[15-16]的編碼方式在能耗上及神經形態硬件應用的缺點,同時提升網絡的延遲與吞吐量。CNN 已被證明在處理二維輸入數據具有顯著優勢,首先在CNN上對EEG數據集進行訓練,保存訓練權重,再通過FS 轉換保留原連接權重的情況下將卷積網絡轉換為脈沖網絡。
CNN分類器結構如圖1,卷積層卷積核均為3×3,過濾器的數量分別為32、64、128。選擇ReLU函數作為激活函數。前兩個卷積層后分別連接步長為1 的最大池化層,池化窗口為2×2,將最后一個卷積層展平(flatten)之后連接設置p為0.2的Dropout層。Dropout層連接著包含個46 208個隱藏節點的全連接層,全連接層的輸出為2個節點。使用Adam算法進行訓練。固定學習率為0.000 1,權值衰減系數為0.001,使用Xavier進行權重初始化,批量為128。

圖1 卷積神經網絡結構Fig.1 CNN structure
1.3.2 抑郁癥的復雜網絡分析模型
將初始的腦鄰接矩陣轉換為基于閾值的無向圖應用復雜網絡分析:在復雜網絡分析中,平均路徑長度L和聚類系數C分別對應于大腦功能組織的兩個基本原則,功能整合和隔離[17]。功能整合反映了大腦組織與組合不同區域信息的能力,通過計算所有節點對之間的平均最短路徑長度得到的特征路徑長度L可以很好地衡量這一特性;功能分離反映了以特殊方式處理信息的能力,聚類系數C可以衡量節點的鄰居之間存在連接的比例,不同腦分區節點聚類平均的結果可以反映分區的分離特性。
從平均路徑長度與聚類系數出發,分別從小世界屬性和平均聚類進行分析:
(1)小世界特性:小世界網絡是一類特殊的復雜網絡結構,對小世界特征的研究,通過計算與原始網絡具有相同節點與連接性的隨機網絡的平均路徑長度Lr與聚類系數Cr,并與原始網絡的L值與C值對比,當C/Cr顯著大于1,L/Lr接近于1 時,小世界網絡特征是明顯的。文獻[18]定義了單一的標量小世界指數S量化小世界特征(當S值大于1時,網絡表現小世界屬性):
(2)電極平均聚類:對每個電極做平均聚類分析,通過電極采樣的部位將不同腦區對應的一定數量電極的聚類系數平均得到不同腦區的平均聚類系數,比較患者與健康個體不同腦區聚類系數的差別,可以分析不同腦區的腦連接強弱與腦活躍程度。
本文所建脈沖神經網絡分類器的性能如表1、表2,表1中,記錄了FS編碼前的分類精度,以及編碼后的脈沖神經網絡分類精度。表1、2 中每個波段實驗的數據量均為400,神經元的個數均為136 384。

表1 脈沖神經網絡分類器精度Table 1 Classifier accuracy of spiking neural network 單位:%

表2 脈沖神經網絡分類器能耗Table 2 Classifier energy consumption of spiking neural network
神經網絡通常需要足夠的數據輸入以提高性能,但在實際應用中必須考慮到醫學數據隱私等導致的樣本不足的問題,因此訓練集大小為1 600,測試集與驗證集均為200。表1、表2 的結果顯示,較少的數據輸入情況下網絡的分類精度較高、能耗較低。
為了找出在分類任務中提取的抑郁患者與健康個體的分類特征,將每個batch 輸入數據量設置為1,并且比較網絡輸出的最后一層特征圖之間的差異:將患者與健康個體的特征圖取任意10 張,計算二者之間平均結構相似指數SSIM 值(structural similarity index measure,SSIM),如表3。SSIM 通過提取圖像的亮度、對比與結構特征比較圖像之間的相似程度。取值范圍在[?1,1]。

表3 分類器特征圖結構相似指數Table 3 Structural similarity index of classification feature map
表3結果顯示,除了δ波段的特征圖差異不夠顯著,其余波段與全波段二者的結構相似指數都比較低,差異明顯,將特征圖差異可視化并標記差異位點。如圖2所示,各個波段下提取的患者與健康個體的特征圖差異比較明顯,換言之通過隨機樣本提取的患者差異于健康個體的特征比較多,患者的腦活動異常較明顯。如果將特征圖差異區域映射到對應腦區,可以得到相關腦區的異常情況。但是神經網絡信息傳輸存在失真,在卷積層、池化層不斷地提取特征時數據會受到一定程度的損失,特征圖特征是缺失的,這不利于映射到相關腦區的生理學分析,因為存在部分腦區電極的像素點在傳播過程中被裁剪的問題。因此對于更深層次生理學機制的分析,神經網絡的特征圖并不能準確地、無失真地分析出患者與健康的腦功能連接差異性,因此,對腦連接作進一步的復雜網絡分析是必要的。

圖2 各波段輸出層抑郁與健康特征圖差異可視化Fig.2 Visualization of difference between depression and health feature maps in output layer of each band
將腦功能連接矩陣基于連接閾值轉換為無向圖,如圖3,節點表示位于不同腦區的電極,不同顏色表示不同腦區;節點之間的連線表示不同腦區之間的功能連接,連線的稀疏性表示腦區的活躍程度。對比患者與健康結果,以額中線及左前額線為例,靜息狀態下,患者與健康個體相比在此腦區活動減弱;在右額葉區患者的腦活動增強。構建與原始無向圖具有相同連接矩陣的隨機圖,分別比較二者的圖特征,如表4~表6。

表4 聚類系數比值(C/Cr)Table 4 Ratio of clustering coefficients(C/Cr)

表5 平均路徑長度比值(L/Lr)Table 5 Ratio of average path length(L/Lr)

表6 平均小世界指數STable 6 Mean small world index S

圖3 將腦鄰接矩陣轉換為基于閾值的無向圖Fig.3 Converting brain adjacency matrix to threshold-based undirected graph
為了建立相關腦區與實驗電極之間的有效映射,劃分出不同腦區的電極編號,如圖4。腦區編號如下:MpF前額中線、LpF左前額葉、RpF右前額葉、LF左額葉、RF右額葉、MF額中線、LT左顳、RT右顳、MC中線中央、LP左頂葉、RP 右頂葉、MP 中線頂葉、LO 左枕骨、RO 右枕骨、MO枕中線。

圖4 實驗用到的128電極空間拓撲Fig.4 Spatial topology of 128 electrodes used in experiment
對不同腦區內所有電極作平均聚類分析,如圖5,橫軸為腦區編號,縱軸為患者該腦區平均聚類系數與健康個體的差值,縱軸的正半軸以上曲線表示患者該腦區集聚特征增強,縱軸的負半軸以下曲線表示患者該腦區集聚特性減弱,虛線表示二者差的閾值(0.02),超過這一閾值說明在相關部位的平均聚類系數出現異常。

圖5 分波段不同腦區平均聚類系數差Fig.5 Differences in average clustering coefficients of different brain regions in sub-bands
本文提出的脈沖神經網絡,能實現抑郁癥EEG 信號的分類,具有高精度、低能耗及良好的泛化性能。為進一步測試模型的性能,在同一數據集δ 波段下,選擇文獻[19]提到的五類深度神經網絡模型,包括LeNet、VGG11、VGG16、GoogLeNet、ResNet18,對比測試模型的準確率與參數量。在功耗方面,將上述五類網絡基于頻率編碼轉換為權重不變的脈沖神經網絡模型,分別計算轉化模型的準確率與脈沖數,對比結果如表7,括號內精度為對應的脈沖網絡精度。對比顯示,本模型使用了最少的參數量使得對抑郁癥的識別精度達到了97.5%,精度高于LeNet、VGG11、GoogLeNet。對比VGG16、ResNet18 的性能,盡管精度略低,但是相比使用的參數量要少得多,收斂速度也更快,訓練成本更低。盡管發放脈沖數多于LeNet,但是相較LeNet,模型的精度有了較大的提升,同時對比其他方法轉換的脈沖神經網絡,在高精度識別的前提下,模型發放脈沖的數量最少,能耗最低,實現了高精度少參數與低功耗的效果,有較好的實用性。

表7 相關方法性能對比Table 7 Performance comparison of related methods
同時對腦功能連接作復雜網絡分析:在α、β、θ 波段,健康個體與患者差距較大。α波段患者聚類系數較高,在此波段有較高的腦活動水平,而α 波與潛意識的活動密不可分[20],高水平的此活動可能會導致無法集中注意力;在β波段結果則相反,β波在認知推理等有意識的思考活動方面有積極的影響[21],低水平的β 波會導致抑郁癥、認知與注意力等能力差;在θ 波段患者表現出較強腦活動,這種頻率較低的波與人們對原始情緒的感受與體驗有關[22],過多的θ 活動可能會使人們出現抑郁癥等癥狀。在β、δ、γ、θ波段患者表現出增加的平均最短路徑長度,短路徑長度確保大腦網絡中有效的區域間完整性或及時信息傳輸,是認知過程的基礎。疾病相關的路徑長度的增加可能與用于信息傳輸的纖維束退化有關[23]。最后,在δ、θ、β波段的平均小世界指數顯示,患者的大腦網絡一定程度上偏離了小世界網絡,這與神經影像學圖形分析研究結果一致[24]。
患者與健康個體的腦網絡均表現小世界特征,集聚系數較高而平均路徑長度較低,很小的平均路徑長度可以保證信息傳導的及時性,信息傳導完成的回路上激活的神經元較少,產生電脈沖信號因此較少;從另一個角度看,一個神經元被激活之后,由于神經回路上神經元數量很少,只會激活很少的突觸后神經元,發出較少的脈沖數量,一定程度上這也可以說明腦網絡的連接具有稀疏性。
對不同腦區的電極作平均聚類分析,可視化并驗證計算結果,使用Matlab EEGlab工具箱對腦連接設定閾值之后進行可視化,以圖6 為例:圖5 中數據顯示,左前額葉LpF 區beta 波段下,抑郁患者的集聚特性減弱,通過設定閾值可視化之后如圖6(a)與圖6(b),紅圈內連線的稀疏性可以反映集聚特性。

圖6 左前額葉LpF區beta波段對比Fig.6 Comparison of beta bands in LpF region of left prefrontal lobe
抑郁患者的腦功能連接性往往發生改變。在右顳區域的β 與θ 波段聚類系數較低,意味著這一區域的患者腦連接減少,這可能是抑郁癥右后島葉和一系列感覺皮層之間的功能連接性顯著降低導致的[25],也可能是[26]顳上回的連接性下降,但在左顳區域出現反常,患者在γ與α 波段展現了較強大腦活動。在左前額葉皮層,β 波段聚類系數較低,此區域患者腦功能連接減少,這與患者背外側前額葉皮層大腦活動減少[27]的結論一致。在頂葉區域,γ 波段的頂葉中線與右頂葉表現出很強的連接性,在左頂葉區域,α 波段表現出高連接性,這與文獻[27]提到的楔前葉和后扣帶回活動減弱似乎矛盾,同時[28]患者楔前葉和額顳葉區域與健康個體有巨大差異。在額葉區域,左右額葉的表現完全相反,在右額葉區,波段均表現出低聚類特性,意味著這一區域連接性下降[29];在左額葉區γ波段表現出高聚類特性,這有可能是膝下扣帶回-丘腦連接上升[27]產生的逆轉。在左右枕骨區,右枕骨在γ、α、β 波段都展現了較高的聚類特性,這預示著抑郁癥患者的右枕骨區連接增強;在左枕骨區只在β波段連接性較強。
患者在γ波段多個腦區均展現出高水平腦活動,而γ 波健康認知、精神障礙有關[30]。右半球的患者與健康個體差異明顯,在右前額葉、右額葉皮層、右顳皮層、右頂葉皮層、右枕骨區域都展現了集聚系數反映的連接性差異。
本文的創新點如下:針對醫學背景下隱私數據少引起的低性能問題,通過簡化輸入、減少參數量并且設置Dropout層,使得在樣本量減少的情況下,精度仍然能達到高水平,并且有良好的泛化性、穩定性與魯棒性;針對高能耗問題,構建了基于脈沖網絡的抑郁癥EEG 分類器,顯著降低了分類任務的能耗;針對診斷中缺乏生理依據的問題,結合復雜網絡分析為抑郁癥腦活動異常提供定量分析的支持。此外,本文研究的不足之處包括:模型的功能整合性不強,需要結合脈沖網絡分類器與復雜網絡分析從兩個層次進行分析,模型的即時性與效率不夠;數據處理相對繁瑣,而實用場景下的輔助診斷需要快速、精確地進行;采用單模態,抑郁癥是一種異質性疾病,只采用EEG 信號作為單一模態在應對實際復雜診斷環境時并不完全適用,結合多模態的數據對抑郁癥及嚴重程度進行量化評估將是未來改進工作的主要方向。
本文提出了一種基于類腦學習的抑郁癥EEG診斷及分析模型,分別從功能與結構兩個層面對抑郁癥個體的功能腦網絡特性進行分析。首先,通過提取抑郁癥患者EEG信號的特征,量化分析電生理的腦連接信息,提取抑郁癥與健康個體的差異特征;其次,構建具有較高精確度與類腦性能的脈沖網絡分類器,并結合復雜網絡,建立腦連接的空間拓撲分析潛在的病因,從平均聚類與特征路徑長度出發,分析功能腦網絡的小世界特性與平均集聚特性,為抑郁癥的病理障礙溯源提供可能線索。