許飛飛,應俊,張立寧,宋亞男,謝惠敏,陳廣飛
解放軍總醫院 a. 生物醫學工程研究室;b. 醫療大數據中心;c. 康復科,北京 100853
精神分裂癥是一種嚴重的精神疾患,其特點是思維、觀點、情緒、語言、自我意識和行為出現扭曲,常見的癥狀包括幻聽和妄想。世界人口中約0.3%~0.7%(約2100萬人)患有精神分裂癥,男女發病比例無明顯差異[1]。精神分裂癥患者平均預期壽命比平均值少10~25年,其背后的原因是患者較差的身體狀態和較高的自殺率(約5%)[2-3]。臨床上主要依靠于精神疾病診斷與統計手冊(DSM-5)或國際疾病分類手冊(ICD-10)中的標準并結合患者的實際癥狀做出相應診斷,但此時患者一般已經患病較長時間。精神分裂癥病程多遷延并呈進行性發展,如果能夠在患病早期準確診斷,并給予合理治療,多數患者的病情是可以得到控制的,然而該疾病并沒有任何客觀的測試供作診斷[4]。
聽覺穩態響應(Auditory Steady State Responses,ASSR)是由周期性刺激聲音誘發,與刺激頻率具有鎖相性的腦電反應[5]。Kwon等[6]是最早研究精神分裂癥患者40 Hz聽覺穩態反應的,發現與正常對照者相比,精神分裂癥患者在γ(30~200 Hz)頻段內頻譜能量顯著減少,同時在刺激頻率處的相位存在延遲和同步性減弱。Kirihara等[7]對188名正常人和234名精神分裂癥患者的40 Hz聽覺穩態反應分析,發現與正常人相比,精神分裂癥患者在θ(4~8 Hz)頻段內能量有所增加,在γ頻段內能量較少。Thunel等[8]的一項關于精神分裂癥患者40 Hz聽覺穩態反應的meta分析指出40 Hz的聽覺穩態反應可以作為精神分裂癥的一個潛在生物標記物。
以往在精神分裂癥方面的研究,主要采用傳統的淺層機器學習算法進行研究。如李鋼等[9]提取精神分裂癥患者和健康對照者靜息態腦電信號16導聯上的6個頻段的能量作為特征,采用多項式和徑向核函數兩種核函數的支持向量機對其進行分類。Santos-Mayo等[10]使用支持向量機和多層感知機對提取到的17個導聯上20個特征(16個時域特征,4個頻域特征)進行識別和分析。上述介紹的研究都是采用淺層機器學習算法,很難在有限的樣本和計算單元來實現對復雜函數的逼近,泛化能力受到限制。
深度學習作為機器學習中一個嶄新的分支,相比于傳統淺層機器學習的方法,其優點在于它是基于多層特征學習的結構,可以從數據中自動學習輸入數據從底層到高層的不同表示,對復雜分類問題具有較好的泛化能力。除了在圖像和語音領域取得的顯著成果,近年來,深度學習也被成功應用于生理信號的分析中,比如肌電、腦電和心電[11]。An等[12]針對基于運動想象的腦電數據分類,在所有被試的數據上,深度信念網絡(Deep Belief Network,DBN)的分類準確率均要優于支持向量機(Support Vector Machines,SVM),表明深度信念網絡是研究腦機接口的一個強有力的工具。尹虹毅[13]使用棧式自編碼網絡分析靜息態下精神分裂癥患者與正常對照者的腦電數據,提取五個不同頻段的頻譜能量作為特征,其模型最優分類準確率為74.57%。
綜上所述,本文對精神分裂癥患者與正常對照者40 Hz聽覺穩態誘發數據采用DBN的算法建立分類模型,并且與傳統的機器學習算法SVM的分類結果進行比較。在預測樣本中利用準確率、靈敏度、特異度、ROC曲線評價模型的性能。
本文所用數據均為醫院采集的真實數據,共29名受試者,14名精神分裂癥患者和15名正常對照者。14名精神分裂癥患者包括7名男性和7名女性,均為右利手,年齡在21~40歲之間,平均年齡30.2歲。15名正常對照者包括11名男性和4名女性,均為右利手,年齡在22~36歲之間,平均年齡28.6歲,認知功能正常,聽力正常,無已知神經學疾病。實驗在隔聲屏蔽室中完成,背景噪聲強度小于15 dB(A),受試者被要求坐在舒適的椅子上,同時保持直立姿勢,雙耳給予聲壓強度為60 dB的40 Hz chrip刺激音。實驗數據均采用清華神經工程實驗室研發的Mipower腦電采集系統記錄,采樣頻率為1000 Hz。以鼻尖為參考,所采集的樣本數據都包括9個導聯(F3、FZ、F4、C3、CZ、C4、P3、PZ、P4)上4~5 min的時域數據,導聯位置按照國際慣例10~20系統。
1.2.1 能量與相位
對信號采用快速傅里葉變換獲取其幅度譜和相位譜,根據幅度譜提取其在α波段(8~13 Hz)、β波段(14~30 Hz)和γ波段(31~50 Hz)3個頻帶的能量,根據相位譜提取其在刺激頻率處(40 Hz)的相位,最終得到9個導聯上27個能量特征和9個相位特征。
1.2.2 信噪比
SNR計算是通過檢測信噪比計算相應頻率處的信號功率譜Ps與周邊頻率處的平均功率譜Pn獲得,見公式(1)。

其中,xs表示時域信號FFT后,在響應頻率處頻譜的實部,ys表示頻譜的虛部,xj表示在響應頻率處周邊的N點頻譜的實部,yj表示在響應頻率周邊N點頻譜的虛部,最終得到9個導聯上9個SNR特征。
1.2.3 微分熵(Differential Entropy,DE)
DE擴展了香濃熵的概念并用于測量連續隨機變量的復雜性。已經證明,對于一個固定長度的EEG信號,DE值等于某個頻段內能量譜的對數值[14]。因為EEG數據低頻能量高于高頻能量,DE值具有在低頻和高頻能量之間鑒別腦電圖模式的平衡能力,最終得到9個導聯上27個DE特征。
由于深度學習網絡模型訓練需要大量樣本,因此將每個受試者時域數據截取成多個時間樣本,每個時域樣本截取成長度為2 s的多個片段樣本,處理后最終得到1025個精神分裂癥患者的時間片段和1750個健康對照者的時間片段,最終每個片段共提取到72個特征(27+9+9+27=72)作為模型的輸入模型的。
DBNs是由多個受限玻爾茲曼機組成的[15]。一個受限玻爾茲曼機由一個可訓練權值的馬爾可夫隨機場建立,其中所有節點被分為可見層和隱藏層。在玻爾茲曼機中,可見層表示模型的輸入,而隱藏層表示從輸入中提取得到的特征。
在受限玻爾茲曼機中,p(v,h;θ)是可見節點v與隱藏節點間h的聯合分布。給定模型參數θ,p(v,h;θ)根據能量函數 E(v,h;θ)的定義如式 (2):

對于一個標準二值類型的玻爾茲曼機(伯努利-伯努利),能量函數定義如式(3):

Z定義為歸一化因子,計算公式為式(4):

wij是可見單元vi與隱藏單元hj間的權重,V和H是對應可見單元與隱藏單元的數量,bi和aj均為偏倚權重。根據對數似然函數logp(v,h;θ)的梯度,訓練迭代的權重wij更新公式如式(5):


k表示分類的類別數,l=k表示輸入向量的分類結果為k類,wik表示的是最后一層隱藏單元hi與第k類標簽之間的權值。DBNs采用對比散度算法(Contrastive Divergence,CD)逐層訓練每層RBM權值,CD算法核心思想是使用估計的概率分布與真實的概率分布之間的相對熵(Relative Entropy)的差異作為度量準則,在近似的概率分布差異度量函數上求解最小化作為訓練參數的標準[16]。
本研究構建了一個包含兩層隱藏單元的三層DBNs,見圖1。其中,w0、w1、w2表示各層權值,先訓練好第一個RBM1,然后將訓練好的節點作為第二個RBM2的輸入,訓練第二個RBM2在兩層RBM層訓練完成之后,再使用反向傳播算法對網絡進行微調。

圖1 DBNs訓練流程圖
支持向量機是根據統計學理論提出的一種機器學習方法,它集成了最大間隔超平面、Mercer核、凸二次規劃和松弛變量等多項技術[17-19]。支持向量機是解決非線性分類、函數估計和密度估計等問題的一種有效方法,廣泛應用于圖像解釋、數據挖掘、生物認證、生物技術調查和臨床診斷等領域。關于支持向量機理論的具體解釋,可以參考文獻[18]。本研究使用支持向量機中最常用的三種核,分別是線性(linear)核、徑向基函數(Radial Basis Function,RBF)核和sigmoid核。
本研究設計了一個含有兩個隱藏層的三層深度信念網絡模型,隱藏層的節點數量決定了深度信念網絡模型的結構,因此隱藏層結構的選擇對模型性能至關重要。本文研究了三種隱藏層結構在不同迭代次數下模型分類的準確率(圖2)。從圖2中可以觀察到,無論哪種結構的隱藏層,其分類準確率總體都是隨著迭代次數的增加而提高,當迭代次數過了200之后,準確率提高變得緩慢,當迭代次數到了300左右時,三種隱藏層結構模型的準確率基本不再提高了。比較三種隱藏層結構,可以明顯看出隱藏層節點數為64-64時,無論迭代次數是多少,這個結構的深度信念網絡模型的準確率都是最高的。迭代次數越大,深度信念網絡模型的訓練就越耗時,因此綜合考慮時間成本,本研究最終選擇了迭代次數為300,隱藏層節點數為64-64的深度信念網絡模型。

圖2 不同迭代次數和隱藏層節點下的精神分裂癥和正常對照DBNs模型分類準確率
支持向量機有兩個十分關鍵的參數C和γ。C為懲罰系數,表示的是模型對誤差的寬容度,C越大表示模型越不能容忍出現誤差,容易出現過擬合現象,相反C越小模型容易出現欠擬合。因此懲罰系數C過大或者過小會導致模型的泛化能力變差。γ是選擇RBF作為核函數后自帶的一個參數,γ的取值會影響RBF核函數里α的取值,α和γ的懸系如式(7)所示:

若γ取值過大,σ會很小,使得高斯分布又高又瘦,這樣只會作用在支持向量附近,對于未知樣本分類效果很差。對于SVM如何選擇最優參數的問題,國際上并沒有公認的統一的最好的方法,本研究選擇最常用的網格搜索法(Grid Search)來確定模型的參數。
線性核函數、徑向核函數和Sigmoid核函數建立的支持向量機模型的最優參數如表1所示,C取值為(2-5, 2-4, 2-3…24, 25),γ取值為(2-5, 2-4, 2-3… 24, 25)。

表1 SVM核函數的最優參數
本研究建立了SVM-linear、SVM-RBF、SVM-sigmoid和DBNs模型對精神分裂癥患者和正常對照進行識別和分類,采用十折交叉驗證的方式劃分訓練集與測試集,根據分類準確率、靈敏度、特異度和ROC這些指標對上述四個模型的分類結果進行評價和討論。
表2給出了三種支持向量機算法和深度信念網絡模型四項評價指標的結果,從表中看出DBNs模型在準確率、靈敏度和AUC三個指標上都高于三種支持向量機模型,而徑向核函數支持向量機模型和線性核支持向量機模型靈敏度很高,但是它們的特異度均低于60%,說明模型存在過擬合,泛化能力不足。四種模型的ROC曲線如圖3所示。不同于三種支持向量機模型,深度信念網絡的靈敏度和特異度比較均衡,這證明DBNs更能學習到數據的本質特征,因此模型的泛化能力要遠好于支持向量機。

表2 SVM和DBNs模型的分類準確率、靈敏度、特異度和AUC值

圖3 SVM-linear、SVM-RBF、SVM-sigmoid和DBNs模型的ROC曲線
SVM-linear、SVM-RBF、SVM-sigmoid三種支持向量機模型的分類準確率均未超過80%,且遠低于深度信念網絡模型的分類準確率,說明對于這個數據集,支持向量機算法建立的三種模型特征學習能力不如深度信念網絡算法。三種支持向量機模型的靈敏度均較高,SVM-RBF甚至超過了深度信念網絡模型,但是從模型特異度來看,SVM-linear、SVM-RBF、SVM-sigmoid三種模型的特度均未超過60%,這說明模型假陽性率較高,即很多正常對照者被誤診斷為患有精神分裂癥。反觀深度信念網絡,其特異度為75.50%,遠高于三種支持向量機模型,這說明所建立的深度信念網絡模型具有較強的泛化能力,具備一定的鑒別診斷能力。
本研究基于機器學習算法基于腦電數據建立了精神分裂癥患者與正常人的診斷模型。精神分裂癥是一種十分嚴重的精神疾患,目前臨床上是通過相應診斷量表以及醫生的經驗對其進行診斷,主要也是根據疾病的進展來對其進行診斷。本研究通過使用客觀的腦電數據,使用深度學習算法建立數學模型對該疾病進行鑒別診斷,取得了較好的結果,可以為臨床診斷提供一個參考,提高臨床醫生對精神分裂癥的診斷能力以達到及時發現病情,給予及時的治療。
本研究建立的四種精神分裂癥模型均取得了不錯的效果,但是還是存在一定的問題。三種支持向量機模型準確率均為70%多,也具備較高的靈敏度,但是其特異度均未超過60%,SVM-linear甚至只有30%多的特異度,這說明模型的假陽性率過高,容易把正常人誤診為精神分裂癥患者,這樣會消耗不必要的醫療資源,增加人們的醫療負擔。相比于這三種支持向量機模型,DBNs模型的各項評價指標均很優秀,說明完全具備能力來對精神分裂癥進行鑒別診斷。同時也說明DBNs這種深度學習算法能夠學習到數據中蘊含的最本質的特征,證明DBNs比支持向量機具有更好的二分類能力。
雖然本文使用機器學習領域的算法對精神分裂癥患者與正常人的腦電數據進行建模分析,從結果上來看確實取得了不錯的成績。然而機器學習是一種數據驅動的算法,樣本量越大,所建立的模型才能更加接近真實世界。下一步工作可以盡可能多的采集數據,這樣建立的模型才能有更好的泛化能力,來有效協助臨床醫生進行疾病的診斷。