張銳 王茹 黃俊 曾鑫
摘 要:傳統的心電信號識別算法依靠心電專家參與特征識別,費時費力,診斷成本高,心電信號形態復雜多樣導致識別準確率低、適應性差。為解決上述問題,將棧式稀疏自編碼器(SSAE,Stacked Sparse Autoencoder ),與Softmax分類器相結合形成深度堆棧網絡(DSN, Deep Stacked Network)完成對心電信號的自動識別。通過3個稀疏自編碼器堆疊的方式完成心電信號特征提取,逐層刻畫心電信號的高維特征,由Softmax分類器完成心電信號識別。詳細評估了深度堆棧網絡的模型特性,確定了該網絡模型的超參數,訓練集樣本和測試集樣本源于MIT-BIH數據庫。實驗結果表明采用本文所提方法對心電信號進行識別,總識別率達到99.69%,驗證了所提方法的有效性。
關鍵詞:
棧式稀疏自編碼器;特征提取;心電信號識別;稀疏參數
DOI:10.15938/j.jhust.2021.03.016
中圖分類號: TP183
文獻標志碼: A
文章編號: 1007-2683(2021)03-0108-07
ECG Signal Recognition Based on Deep Stacked Network
ZHANG Riu1, WANG Ru1, HUANG Jun2, ZENG Xin1
(1.School of Automation,Harbin University of Science and Technology,Harbin 150080,China; 2.Chengdu East Road Traffic Technology Co., Ltd, Chengdu 610037, China)
Abstract:The traditional electrocardiogram (ECG) signal recognition algorithms rely on ECG experts to participate in feature recognition, which is time-consuming and laborious with high diagnostic cost. Complex and diverse ECG signal patterns result in low recognition accuracy and poor adaptability. To solve the above problems, the stack Sparse Autoencoder was combined with the Softmax classifier to form a Deep stack Network to realize automatic recognition of ECG signals. The feature extraction of ECG signals was completed by stacking three sparse autoencoders, and the high-dimensional features of ECG signals were depicted layer by layer, and the ECG signals were identified by Softmax classifier. Detailed assessment of the model characteristic of Deep stacked Network, determine the super parameter of the network model, sample training set and test set samples from MIT/BIH database. The experimental results show that the total recognition rate of the proposed method is 99.69%, which verifies the effectiveness of the proposed method.
Keywords:stacked sparse auto-encoder; feature extraction;? ECG signal recognition; sparse parameter
0 引 言
心血管疾病仍然是全球死亡的主要原因。心電圖能提供心臟活動的信息,對各種心律失常的分析診斷具有極為重要的意義。心電信息是患者重要的臨床資料,臨床診斷需要醫生具備高度的信息綜合處理能力。但是心電特征具有一過性,所以臨床上多用心電圖儀對患者進行24 h甚至48 h的連續監控。傳統的人工診斷面對龐大的數據困難極大,針對心電信號自動分類的智能算法變得尤為重要。
心電信號的自動分類過程通常包括心電信號采集、心電信號的預處理、心電信號的特征提取和分類。臨床采集的心電信號是非常珍貴的,所以現在大多數心電信號的研究者研究所用的心電信號來源于4個國際權威的心電數據庫,本次實驗采用的是其中之一的MIT-BIH心律失常數據庫。信號特征提取是整個過程的核心環節,病理信息體現在信號特征上,心電信號的特征提取也是過去幾十年心電信號分類研究的關鍵,其中最重要的特征是R波、P波、T波的形態、位置和幅度,心電主要波形的檢測是心電特征提取和分類的基礎,為此小波變換[1]、小波變換與數學形態學相結合[2]、R波檢測和心電數據壓縮相結合[3]等算法不斷被提出。以上文獻在特定的數據集下雖都能取得較高的準確率,但是仍存在需要人工設計特征,構建模板甚至需要心臟專家的參與等諸多問題,這些問題導致時間、金錢成本的增加,還具有低適應性的缺陷。針對以上問題,隨著深度學習技術的深入研究,無監督特征提取技術逐漸受到關注。
自編碼器是深度學習的重要組成部分,深度學習也稱為特征學習[4],是從輸入數據中自動學習一個好的特征表示的算法,典型的深度學習架構包括深信念網絡,堆疊自動編碼器,卷積神經網絡[5,9],與傳統淺層構架相比,深度學習在許多方面表現的更出色,如圖像分類[10],對象識別[11],人臉識別[12],醫學圖像分析[13]等。Hassan等[14]采用深度信念網絡從電皮活動,光體積描記圖和Z肌肌電圖傳感器信號的融合觀測中提取深度級別特征,結合支持向量機分類五種基本情緒。Yu Dong等[15]使用13層的卷積神經網絡提取水果圖像的特征,以高準確率實現水果的分類。Rahhal等[16]使用堆疊的去噪自編碼器學習特征并在迭代時結合人工專家標記最相關和不確定的心電信號節拍實現心電信號的主動分類。劉勝輝等[17]使用小波包分析方法對原始數據進行數據降噪,實現特征提取,將得到監控數據的熵值化結果作為預測模型的輸入,訓練和測試深度神經網絡,完成刀具剩余壽命的預測。
本文主要針對心電信號的分類問題提出一種基于深度堆棧網絡完成心電信號的識別方法,該方法堆疊三個稀疏自編碼器的中間層利用無監督訓練提取心電信號深層特征,然后根據所提取信號特征通過Softmax分類器進行有監督訓練,最后以判別心電類型的估計概率值的方式完成心電信號類型的識別。通過實驗分析得到深度堆棧網絡算法能提高心電信號識別的準確率。
1 心電信號識別流程
本文基于深度堆棧網絡的心電信號分類流程如圖1所示。
首先輸入含噪聲的原始信號,然后進行心電信號預處理,對心電信號進行降噪,并檢測QRS波進行心拍截取,完成數據的預處理,最后基于處理后的心電數據建立深度堆棧神經網絡進行訓練,獲得心電信號的特征與Softmax分類器結合,最終完成心電信號的分類。
2 心電信號預處理
受到外部環境以及人體自身活動的影響,采集到的心電信號包含大量的噪聲,需要去除的主要噪聲分別為機體活動產生的肌電干擾、心電信號采集設備的電極與體表接觸不良致使的基線漂移及該設備受附近電網影響形成的工頻干擾三種噪聲。傳統的去噪方法主要包括中值濾波法、數字濾波器技術、自適應濾波法、小波變換以及現在的高斯濾波法。數字濾波具有簡單、系統可靠性強等優點,在心電信號預處理階段應用廣泛。
按照文[18]的降噪處理方法,先對原始信號進行200 ms中值濾波處理,去除QRS波和P波,再用600 ms的中值濾波去除T波,然后用原始信號減去以上兩個濾波后的信號就可得到消除掉基線漂移的心電信號,最后使用12-tap、3 dB點的截止頻率為35 Hz的低通濾波器去除基線校正后的工頻噪聲和肌電噪聲,濾波后的心電信號可用于所有后續處理。
對去噪后的心電信號進行帶通濾波,通帶為15~25 Hz,此頻率區間主要為QRS波頻段,主要目的是消除噪聲,削弱P波和T波。然后按照Wang Y等[19]提出的雙斜率處理方法,主要思想是在某個點左右兩側的設定區間0.015~0.060 s內分別尋找其最大平均斜率和最小平均斜率,再分別求右側最大斜率和左側最小斜率的差以及左側最大斜率和右側最小斜率的差,然后利用它們中的最大值進行截止頻率為5 Hz的低通濾波,利用滑動窗口積分增大幅值,進一步平滑波形,至此心電信號的波形模式變得單一,方便后續波形檢測。
為了對心電信號進行心拍截取,采用雙閾值算法進行R峰確定,根據信號特點設定兩個不同的閾值,若當前檢測峰值高于所設定低閾值,可判斷此檢測波形為R峰。
3 心電信號心拍截取
本文選取4種形態的心電信號,然而同種形態的心電信號之間也具有一定的差異,因為本文所用的自編碼器算法魯棒性較強,所以無需對心電信號精確截取。自編碼器的輸入層為固定數目節點,心拍截取方式是以檢測到的R峰為基準,左右兩側分別取100個點和150個點,最終得到的單個心拍時長為0.7 s左右。
4 心電信號的特征學習與識別
棧式自編碼器是由輸入層、輸出層和多個中間層組成,其特征在于能夠挖掘出數據淺層特征中存在的深層特征,從而得到心電信號的本質信息。本文所構建的心電信號識別模型結構如圖2所示。
DSN模型主要分為特征提取和識別兩個階段。特征提取階段堆棧多個稀疏自編碼器搭建成SSAE網絡挖掘心電信號中的深層特征,計算得出特征矩陣,信號識別階段則將該特征矩陣輸入softmax分類器完成判別。
4.1 心電信號特征學習模型
深層特征提取的過程主要分為編碼和解碼兩個階段,由編碼過程完成數據從SSAD網絡的輸入層到中間層的非線性映射計算,解碼過程則完成特征從中間層到輸出層的非線性映射計算,具體如式(1)所示:
Xc=σac(Wac·Xc-1+bac)
Xc=σsc(Wsc·Xc-1+bsc)
X0=x(1)
其中:中間層序號為c,c∈{1,2,…,C};激活函數為σac(·),為分析階段第c中間層映射計算的激活函數;σsc(·)表示合成階段第c中間層映射計算的激活函數;Wac,bac分別為第c中間層分析階段的網絡參數;Wsc,bsc分別為第c中間層合成階段的網絡參數;第c中間層的輸出值Xc為該層輸入Xc的預測估計值;深層特征提取階段的激活函數選擇Sigmiod函數,其表達式為
σ(α)=11+e-α(2)
4.2 心電信號識別模型
將特征學習模型計算得到的心電信號深層特征輸入Softmax分類器網絡進行心電信號形態判別。對整個深度堆棧網絡進行有監督微調,迭代計算使得網絡輸出值和真值之間的損失近似于零。該階段網絡以心電信號形態的概率估計值為輸出,表達為:
y=Softmax(s,θ)=[y1,y2,…,yk,…yK]
yk=P(z=k|s,θk)=e(s·θk)∑Kj=1e(s·θk)(3)
式中:yk為第k種心電信號形態的預測概率;k為心電信號類別數量;θk為Softmax分類器的第k個輸出矩陣的權重向量;s為中間層輸出的特征矩陣向量,輸入Softmax分類器進行下一步計算,中間層輸出的單個樣本的特征經過網絡的參數向量θ計算得到k個值,最后輸出k個心電信號類別估計概率,通過最小化對應標簽的損失值進行迭代訓練。
4.3 深度堆棧網絡學習算法
深度堆棧網絡訓練分為參數初始化過程和精調過程,參數初始化過程的核心是采用無監督訓練方式對心電信號進行深層特征學習,即在未分類的心電信號數據集上獲得優化目標函數。先訓練第1個自編碼器,然后舍棄解碼部分,保留編碼部分,以中間層作為第2個自編碼器的輸入進行訓練,以此類推,進行迭代訓練。精調過程,以參數初始化過程得到的網絡參數作為該過程初始值,依據softmax分類器的損失,以有監督訓練方式結合反向傳播算法在有標簽訓練集上更新整個深度堆棧網絡(包括SSAE和Softmax分類器)的參數(W,b,θ),訓練完成后的概率估計值作為深度堆棧網絡的輸出,實現心電信號的判別。
依據能量損失準則給出深度堆棧網絡參數初始化階段的優化目標函數:
J(W,b)=1N∑Ni=112‖xi-xi‖2+
β∑pj=1KLρc‖X-jc(4)
其中:xi為輸入xi的估計值;KL(ρc‖X-jc)稱為相對熵,利用相對熵引入稀疏性約束,構造的稀疏正則項為
KL(ρc‖G-jc)=ρclog(ρcG-jc)+(1-ρc)log(1-ρc1-G-jc)(5)
G-jc=1N∑Nn=1σac(Wac,jxn+bac,j)(6)
其中:G-jc為第c層第j個節點的的平均激活度;ρc為平均激活度的目標值;KL(ρc‖G-jc)表示了通過更新參數(Wa,ba)獲得的G-jc與ρc之間的差異。
利用多目標優化原則構造深度堆棧網絡精調階段的優化目標函數:
minJ(R)=-1λ∑λi=1loss(y(i),y(i))+ξ2∑λi=1∑μj=1θ2ij(7)
loss(y,y)=-∑μl=1δ(yl-1)·logesiθl∑μl=1esiθl(8)
其中:第l類心電信號目標向量為l=[0,…,1,…,0],yl=1;λ為中間層輸出樣本數;μ為心電信號類別數;ξ為權重衰減系數;ξ2∑λi=1∑μj=1θ2ij為引入的懲罰項,旨在防止梯度消失,可以快速找到全局最優解。
4.4 性能指標
為驗證模型的可靠性,以總體準確率(total classification accuracy,TCA)和陽性預測值(positive predictive value,PPV)為評價指標對深度堆棧網絡進行性能評估,指標的具體表達為:
TCA=TP+TNTP+FP+FN+TN(9)
PPV=TPFP+TP(10)
其中:TP為表示為被準確識別出該類型的心拍數;TN為準確識別出的不屬于該類型的心拍數;FP為錯誤的識別為該類型的心拍數;FN為沒有識別出該類型的心拍數。
5 實驗結果分析
5.1 實驗數據
實驗數據選擇MIT-BIH心律失常數據庫數據,該數據庫每條心電信號記錄的采集時長約為30min,采樣頻率為360Hz。實驗選取4種形態目標,分別為“左束支阻滯(LBBB)”形態、“右束支阻滯(RBBB)”形態、 “正常(NORM)”形態、“室性早搏(PVC)”形態, 其形態如圖3所示。在保證心電信號形態完整的情況下,統一輸入為250個采樣點。不同類型的訓練集和測試集如表1所示。
5.2 SSAE參數對分類效果的影響
SSAE模型中稀疏參數的選則極大程度上影響了識別準確率,當前研究階段棧式自編碼器的稀疏參數一般通過人工經驗選取,為分析心電信號識別中稀疏參數ρ和β對深度堆棧網絡判別準確率的影響,分別改變稀疏參數ρ和β進行心電信號識別實驗,以模型準確率為評價標準驗證SSAE的稀疏參數對識別正確率的影響。實驗設置棧式稀疏自編碼器中間層數為3,各中間層的節點數依次設為150節點,50節點和10節點,輸入層節點設置為單個心拍長度即250節點,輸出層對應四種形態心拍設定節點數為4節點。實驗結果如表2、表3所示。
由表2所示,心電信號識別準確率隨稀疏參數β的增大呈現先升高后降低的趨勢,當參數β過小時,深度堆棧網絡提取到的特征纏繞在一起,準確率較低,參數β過大時,深度堆棧網絡得到的特征則過于稀疏,實驗證明,針對本文構建的深度堆棧網絡的稀疏參數β選為3時準確率最高,結果最優,β過大或過小,深度堆棧網絡均不能實現最優結構;
由表3所示,心電信號識別準確率隨稀疏參數ρ的增大呈現先升高后穩步降低趨勢,本次實驗中,設定稀疏參數ρ過小時,會弱化心電信號中的部分關鍵特征,進而導致特征提取能力下降,識別準確率較低。稀疏參數ρ選取0.01時深度堆棧網絡的識別準確率最高,從而實現最優網絡結構。
5.3 棧式稀疏自編碼器結構分析
5.3.1 網絡中間層數對分類效果的影響
棧式稀疏自編碼器模型的中間層數直接影響特征挖掘能力,分別構建含有1~6層中間層的棧式稀疏自編碼器,頂層疊加Softmax分類器的深度堆棧網絡,每個中間層統一設定為200個節點,從單中間層結構開始依次增加中間層數搭建深度堆棧網絡,為降低實驗偶然性,每個層級進行10次重復實驗,以訓練集和測試集識別準確率為標準。本次實驗結果如圖4所示。
由圖4曲線看出:深度堆棧網絡在訓練集和測試集的識別準確率均呈現先快速增大后逐漸減小的趨勢。單中間層使得網絡結構過于簡單,特征提取能力不強,中間層數過多則造成網絡結構冗余,同時增加訓練復雜度,針對心電信號識別搭建的深度堆棧網絡,中間層數選為3時識別準確率最高,模型最佳。
5.3.2 中間層節點數對分類效果的影響
設定自動編碼器的中間層節點數小于輸入層從而稀疏高維的特征,特征映射后的特征表達與中間層節點數高度相關,構建含有1個中間層的棧式稀疏自編碼器模型,改變中間層節點數,從50個節點數開始逐漸增加,分別在訓練集和測試集上重復進行10次實驗,以Softmax分類器的準確率為標準,得到的結果如圖5所示。
由圖5可得結論:在節點數為150時,分類效果最佳。中間層節點數過多造成心電信號的特征冗余,無法提取心電信號中的本質特征,從而使深度堆棧網絡的識別準確率下降;中間層節點數太少則會致使特征過于稀疏,損失部分重要特征,降低心電信號的識別準確率。
確定中間層節點數的基本原則是在滿足精度的前提下,取盡可能緊湊的結構,即取盡可能少的中間層節點數。根據此原則,最終深度堆棧網絡各中間層節點數以不超過前一層節點數為基礎,多次試驗,選取最佳網絡結構。
5.4 深度棧式網絡性能分析
深度棧式網絡由棧式稀疏自編碼器和Softmax分類器構成。棧式稀疏自編碼器的各層單元數結構為{250-150-50-10-4},輸入為第一層250個節點,第5層4個節點為輸出層對應心電信號形態類別,訓練次數為50,批次大小為200。稀疏參數ρ為0.01,稀疏權重β為3,分類器的衰減系數ξ為0.0001。將構建的深度棧式網絡與多層感知器模型(multilayer perceptron,MLP),棧式自編碼器模型(stack automatic encoder,SAE),主成分分析算法(principal component analysis,PCA)的特征提取能力通過實驗進行對比分析。
基于棧式稀疏自編碼器的識別總準確率為99.69%。其中LBBB、RBBB、NORM、PVC的陽性預測值分別為98.87%、98.40%、99.78%、98.38%。結果如圖6所示,表明本文方法在心電信號自動診斷方面適應性強。
根據Softmax分類器分類原則,深度堆棧網絡模型在4種測試數據集上隨機選擇樣本的識別結果如表4所示。Softmax分類器的輸出為歸一化的每個心電類型的概率,從表4可以明顯看出每類心電信號的概率值,故樣本1、樣本2、樣本3、樣本4分別對應的心電類型是LBBB、RBBB、NORM、PVC。
本次實驗在表1的測試集上對所有模型進行對比實驗,以總體分類精度為評價標準,各模型的總體分類精度如表5所示。
從表中可以看出,DSN較MLP、SAE和PCA,表現出較高的識別準確率。SAE模型的分類準確率也達到了97.63%,證明稀疏自編碼器在特征選擇上比MLP和PCA要準確。棧式稀疏自編碼器能夠自動提取心電信號的高維有效特征,并將此特征作為Softmax分類器的輸入,模型的準確率明顯提高。深度堆棧網絡結構相對于其他實驗模型更加復雜,但通過多層次地學習獲得了更有利的分類特征,且總體的運算時間控制在合理范圍內。證明了所提方法對心電信號診斷的準確率更高,適用性更強。
6 結 語
針對大量數據的診斷難問題,本文將棧式稀疏自編碼器與Softmax分類器結合構建了深度堆棧網絡用于心電信號識別。利用了稀疏自編碼器的稀疏性,集中了信號特征的表達,在提高網絡學習能力的同時也提高了網絡泛化能力,多個中間層的堆疊實現了對信號特征從低維到高維的深度挖掘。討論了深度堆棧網絡的結構及影響稀疏性的重要參數,并給出了相應的結論。與多層感知器模型、棧式自編碼器模型、主成分分析算法相比大大提高了心電信號識別的準確率,證明了本文所提算法的有效性。
參 考 文 獻:
[1] 張金玲,崔彤,劉為斌.基于自適應時間窗函數優化的心電特征波形識別[J].北京郵電大學學報,2019,42(4):82.
ZHANG Jinling, CUI Tong, LIU Weibin. Feature Waveform Recognition of ECG Based on Adaptive Time Window Function Optimization[J]. Journal of Beijing University of Posts and Telecommunications, 2019,42(4):82.
[2] 劉少穎, 盧繼來, 郝麗, 等. 基于數學形態學和小波分解的QRS波群檢測算法[J]. 清華大學學報(自然科學版), 2004,44(6):852.
LIU Shaoying, LU Jilai, HAO Li, et al. QRS Complex Detection Algorithm Based on Mathematical Morphology and Wavelet Decomposition[J]. Journal of Tsinghua University(Science and Technology), 2004, 44(6): 852.
[3] DEEPU C J, LIAN Y. A Joint QRS Detection and Data Compression Scheme for Wearable Sensors[J]. IEEE Transactions on Biomedical Engineering, 2014, 62(1): 165.
[4] HINTON G E, SALAKHUTDINOV R R. Reducing the Dimensionality of Data with Neural Networks[J]. Science, 2006, 313(5786): 504.
[5] 王萬良,楊小涵,趙燕偉,等.采用卷積自編碼器網絡的圖像增強算法[J].浙江大學學報(工學版), 2019,53(9):1728.
WANG Wanliang, YANG Xiaohan, ZHAO Yanwei, et al. Image Enhancement Algorithm Using Convolutional Autoencoder Network[J]. Journal of Zhejiang University (Engineering Edition), 2019,53(9):1728.
[6] WANG S, CHEN H, WU L, et al. A Novel Smart Meter Data Compression Method Via Stacked Convolutional Sparse Auto-encoder[J]. International Journal of Electrical Power & Energy Systems, 2020, 118: 105761.
[7] ZHOU P, HAN J, CHENG G, et al. Learning Compact and Discriminative Stacked Autoencoder for Hyperspectral Image Classification[J]. IEEE Transactions on Geoscience and Remote Sensing, 2019, 57(7): 4823.
[8] LI J C, NG W W Y, YEUNG D S, et al. Bi-firing Deep Neural Networks[J]. International Journal of Machine Learning and Cybernetics, 2014, 5(1): 73.
[9] ZHANG J, DING S, ZHANG N, et al. Incremental Extreme Learning Machine Based on Deep Feature Embedded[J]. International Journal of Machine Learning and Cybernetics, 2016, 7(1): 111.
[10]HAYAT M, BENNAMOUN M, AN S. Deep Reconstruction Models for Image Set Classification[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2014, 37(4): 713.
[11]BAI J, WU Y, ZHANG J, et al. Subset Based Deep Learning for RGB-D Object Recognition[J]. Neurocomputing, 2015, 165: 280.
[12]HUANG Z, WANG R, SHAN S, et al. Face Recognition on Large-scale Video in the Wild with Hybrid Euclidean-and-Riemannian Metric Learning[J]. Pattern Recognition, 2015, 48(10): 3113.
[13]BROSCH T, TAM R. Efficient training of Convolutional Deep Belief Networks in the Frequency Domain for Application to High-resolution 2D and 3D Images[J]. Neural Computation, 2015, 27(1): 211.
[14]HASSAN M M, ALAM M G R, UDDIN M Z, et al. Human Emotion Recognition Using Deep Belief Network Architecture[J]. Information Fusion, 2019, 51: 10.
[15]ZHANG Y D, DONG Z, CHEN X, et al. Image Based Fruit Category Classification by 13-layer Deep Convolutional Neural Network and Data Augmentation[J]. Multimedia Tools and Applications, 2019, 78(3): 3613.
[16]Al Rahhal M M, BAZI Y, AlHICHRI H, et al. Deep Learning Approach for Active Classification of Electrocardiogram Signals[J]. Information Sciences, 2016, 345: 340.
[17]劉勝輝,張人敬,張淑麗,等.基于深度神經網絡的切削刀具剩余壽命預測[J].哈爾濱理工大學學報,2019,24(3):1.
LIU Shenghui, ZHANG Renjing, ZHANG Shuli, et al. Prediction of Cutting Tool Remaining Life Based on Deep Neural Network[J]. Journal of Harbin University of Science and Technology,2019,24(3):1.
[18]DE Chazal P, O′DWYER M, REILLY R B. Automatic Classification of Heartbeats Using ECG Morphology and Heartbeat Interval Features[J]. IEEE Transactions Onbiomedical Engineering, 2004,51(7):1196.
[19]WANG Y, DEEPU C J, LIAN Y. A Computationally Efficient QRS Detection Algorithm for Wearable ECG Sensors[C]//2011 Annual International Conference of the IEEE Engineering in Medicine and Biology Society. IEEE, 2011: 5641.
(編輯:王 萍)