吳義滿 徐瑤瑞
1(江蘇醫藥職業學院醫學影像學院 江蘇 鹽城 224000)2(鹽城市第一人民醫院設備科 江蘇 鹽城 224000)
室性早搏是一種心律失?,F象,是由心室中的異位起搏點過早發出電沖動引起的,危害性較大。因此,及時準確地診斷室性早搏對于臨床治療具有重要意義。傳統的室性早搏識別主要是通過特征分析與分類器進行識別,即人為地設計并提取QRS波寬、波峰間隔和心電周期等諸多參數,僅為室性早搏的信號外部形態特征,特征分析易產生較大偏差而導致分類失敗[1]。
近年來,深度學習理論深入發展,為信號處理領域的特征分析提供了有效的理論和方法。深度神經網絡的自適應特征提取能力受到了廣泛的關注與研究,在很多信號處理任務中取得了優良的效果,遠遠超過了人工特征處理方法[2]。卷積神經網絡是一種被廣泛應用的深度神經網絡,通常用于圖像處理任務,且所挖掘的特征對圖像平移、旋轉和縮放等操作具有魯棒性[3]。Kiranyaz等通過采用卷積神經網絡方法來構建特征心電分類,在MIT-BIH心電數據庫的室上性異位與室性異位心拍心拍識別中取得了良好的識別率[4]。文獻[5]首先通過多層一維卷積神經網絡來提取心電信號特征,然后采用SoftMax分類器進行分類,使MIT-BIH心電數據庫的心拍分類性能得到了提高,但識別率與靈敏度不夠理想。文獻[6]提出了一種并行多通道的卷積神經網絡分類結構,在BIDMC數據集上的檢測準確率達到94.65%。上述研究將一維心電時域數據進行處理,由于卷積神經網絡的全鏈接層要求在訓練時輸入的心電數據為固定長度,病理特征在時域上往往隨機出現,截取的數據經常發生有效信息丟失。而且由于心電信號極其微弱,在采集過程中容易受到干擾,造成特征信息發生變形,一維時域序列的直接輸入處理使CNN魯棒性較差[7]。此外,深度學習算法對訓練樣本數據量要求比較高,一般數十萬級別的樣本量才能使深度學習模型獲得良好的性能。實際中的室性早搏檢測,其訓練數據往往較少,卷積神經網絡在訓練時往往過擬合造成性能急劇下降,即泛化能力差[8]。
本文提出了一種改進的卷積神經網絡室性早搏檢測算法。該算法模型首先通過經驗小波變換實現了心電信號的自適應分解進而得到時頻二維數據,分析了室性早搏與正常心電信號的差異性,并以此取代傳統一維數據作為網絡訓練輸入,避免了心電信號的信息損失問題。然后利用二維卷積神經網絡進行心電信號的特征自適應提取,且在網絡代價函數中引入布雷格曼散度以解決傳統交叉熵代價函數在小樣本訓練時的性能下降問題。最后該算法在心電數據庫MIT-BIH上進行了訓練,并對該算法進行了性能評估。
經驗小波變換的優勢在于:解決了傳統模態分解存在的模態混疊問題,以達到信號分解過程更具魯棒性。理論基礎是自適應模態分解與小波分析理論[9]。經驗小波變換表達式表示為:
(1)
式中:固有模態函數為調幅調頻信號,即為:
fk(t)=Fk(t)cos(φk(t))
(2)
式中:Fk(t)>0,φk(t)>0。該變換實質上是自適應地把信號分解成多個本征模態函數的組合和形式。
從MIT-BIH心電數據庫中的選取部分室性早搏心拍數據去除基線漂移和高頻噪聲等簡單預處理得到室性早搏心拍時域波形,如圖1所示。心電周期中的波形狀態和間期時間表征著心臟的各種生理狀況,若心臟發生病變或受到某些刺激都會使心電信號發生相應的變化[10]。典型的室性早搏心電特征有:① QRS波群提前出現,導致波形形態變化;② QRS波群間期T常大于0.12 s[11]。

圖1 室性早搏心拍時域波形
對室性早搏心拍時域數據進行EWT分解,可得到一系列子分量信號如圖2所示,依次從低頻向高頻的順序顯示。

圖2 室性早搏心拍EWT分解結果
對運用經驗小波變換方法分解得到的心拍子分量信號進行Hilbert變換,可以得到子分量Hilbert譜數據:瞬時頻率和幅度函數。對所有心拍子分量信號的Hilbert譜數據進行相加,就得到通過經驗小波變換得到的時頻譜數據。圖3和圖4分別為室性早搏心拍與正常心拍EWT時頻譜,時頻譜中表達了豐富的時頻特征變化信息。心拍信號的瞬時頻率實質上是由心室原始振動頻率決定[12]。因此,若將EWT時頻二維數據作為卷積神經網絡的輸入,可以進一步自適應地挖掘出心臟的振動特征變化參數。而且,二維數據類似于圖像,可在不丟失時頻信息的情況下對其進行縮放以滿足卷積神經網絡的輸入大小,避免了一維數據截取時的信息損失問題。

圖3 室性早搏心拍通過EWT變換后的時頻譜

圖4 正常心拍通過EWT變換后時頻譜
卷積神經網絡的由三個部分構成:輸入層、中間層及輸出層。其中,中間層由卷積層、池化層、全連接層構成。卷積層通過卷積運算得到輸入數據的不同特征。在一定范圍內,卷積層數越多,則能夠獲得更為抽象的深度特征表達。但過度增加卷積層數也會降低網絡準確性,造成特征表達性能飽和甚至下降[13]。
池化層主要實現特征降維,減小過擬合,同時提高模型的容錯性。池化操作是神經元針對局部接受域進行的,常用的池化方法有均值池化、最大池化、隨機池化等[14]。
卷積層與池化層的運算過程如圖5所示。卷積層首先對輸入數據進行卷積運算,再經過加入偏置部分得到輸出。池化層的采樣過程: ① 使用對應區域位置內數據的最大值或平均值等降采樣得到對應的數據。② 通過加權,再加上偏置部分。③ 利用激活函數得到降采樣后的數據特征。而取樣層類似于二次特征提取,去除特征冗余維度的同時增加了特征魯棒性。
卷積神經網絡所提取的特征數據經全連接層后,一般是利用Softmax函數結合交叉熵代價函數進行有監督分類識別。在這個過程中涉及到:① 訓練的方法:反向傳播算法。② 調整的對象:訓練過程中不斷的調整優化網絡權重參數。調整參數的依據為每次迭代訓練更新權值時,調整網絡各層的參數使訓練輸出值和輸入標簽誤差盡量小。③ 訓練的目的:減小類內距離并盡可能地增加類間距離,使模型能夠有效獲取區別能力更強地特征量,較好地實現后期樣本的分類識別。

圖5 卷積與取樣過程示意圖
設卷積神經網絡的心電信號樣本集為:
{(x1,y1),(x2,y2),…,(xm,ym)}
其類別為正常心電信號和室性早搏心電信號。其中,y表示樣本信號,x表示類別標簽,則其基本代價函數為:
(3)
式中:W為卷積神經網絡的各層權值參量,b為網絡偏置項,hW,b(xi)為卷積神經網絡的輸出預測值。網絡的訓練過程即利用隨機梯度下降等方法,最小化J(W,b),進而得到最優的網絡權值與偏置項。因此,網絡代價函數直接決定了最終的網絡優化結果,亦直接影響了最終的模型分類能力。在小樣本情況下,傳統的交叉熵代價函數往往會造成網絡過擬合等造成性能下降嚴重,因此有必要尋找性能更優的代價函數形式。
布雷格曼散度是一種距離失真函數。設樣本p與類別q,利用布雷格曼散度便可以有效度量令p屬于類別q而導致的距離失真,因此布雷格曼散度可以用作卷積神經網絡的代價函數。
定義函數F:Ω→R。其中,Ω為凸集,F為嚴格凸二次可微函數。則布雷格曼散度可表示如下:
d(p,q)=F(p)-F(q)-<▽F(q),(p-q)>
(4)
式中:▽F(q)表示函數F在q處的梯度,(p-q)表示兩個向量的差,<▽F(q),(p-q)>表示▽F(q)與(p-q)的向量內積結果。
布雷格曼散度是F函數與該函數的線性近似(一階泰勒展開式)之差。若令F(p)=‖p‖2,則布雷格曼散度即為歐氏距離函數:
d(p,q)=‖p-q‖2
(5)
假設卷積神經網絡所輸入的樣本數據y∈RD,輸出的特征為Γ∈RM,可利用Γ=fγ(y)表示由輸入樣本至輸出特征的映射函數,其中γ表示待優化的網絡參數。文獻[15]的研究表明,在數據分類過程中,使用布雷格曼散度可使樣本至類別均值中心的損失到達最小,即利用布雷格曼散度作為代價函數可以獲得最優的類別表達,使樣本分類能力達到最佳化。
如圖6所示,令Ck,k=1,2表示類別均值中心向量,即:
(6)
式中:n表示第k個類別所屬樣本的數量。如果能夠得到最佳化的類別中心Ck,則對于新輸入的樣本數據p,通過計算其與類別中心Ck的布雷格曼散度即能實現有效分類。

圖6 基于布雷格曼散度的特征優化學習示意圖
在卷積神經網絡的訓練過程中,考慮到Softmax函數則有:
(7)
式中:Sγ(k|y)表示輸入樣本y屬于第k個類別的概率。因此,在樣本集的特征訓練過程可以看作對于已知類別的樣本y,最小化網絡代價函數J(γ)=-log(Sγ(k|y))的過程。則相應的網絡代價函數為:

(8)
訓練過程中使用隨機梯度下降法,基本迭代過程可表示如下:
(9)
式中:α為卷積神經網絡的學習速率。
訓練過程中先進行前向傳播,由輸入數據得到網絡輸出值,并計算網絡代價函數,然后由誤差進行反向傳播,調整權值參量,最終達到網絡優化,使卷積神經網絡的輸出特征具有較好的分類能力。
為驗證上述算法檢測性能,實驗數據來源選取MIT-BIH心電數據庫部分心電數據。訓練樣本包括標注室性早搏心拍、正常心拍數據。性能評估樣本選取除訓練數據外的第116、201、205、221、223號共五組病人的心電數據。如圖7所示,卷積神經網絡的輸入為經驗小波變換后的時頻二維數據(大小為256×256),包含兩個卷積層與兩個池化層,卷積核大小為128×128與48×48,池化層選用最大池化方法,初始網絡學習速率取0.06。

圖7 卷積神經網絡結構圖
分別采用傳統交叉熵代價函數與布雷格曼散度代價函數且利用隨機梯度下降法進行訓練評估,其中,布雷格曼散度選取歐氏距離函數。性能評估采用文獻[5]中的敏感度與陽性檢測率參數。性能評估結果如表1所示。

表1 實驗性能評估結果
其中,TP為正確檢測的心拍數量,FP為錯誤檢測的心拍數量,FN為漏檢的心拍數量,CE為傳統交叉熵函數,BD為布雷格曼散度代價函數。
評估結果表明,本文代價函數情況下的總體敏感度與總體陽性檢測率分別為96.39%、97.25%,均優于傳統交叉熵代價函數,因此基于布雷格曼散度的代價函數在訓練樣本有限的情況下具有更好的識別性能,即使用改進后的代價函數能夠計算得到更強的信號表征信息。此外,二者的性能均優于文獻[5]的識別結果,顯示出基于經驗小波變換的二維時頻數據輸入較之一維數據保存了更完整的特征信息,因此訓練后的網絡模型具有更佳的特征識別能力。特別地,二維數據的輸入避免了一維數據的QRS波群檢測過程,因此不會因誤檢而影響特征提取,故在干擾較多的第221號病人數據上仍有良好的檢測率。
通常情況下,當待識別的病人心拍數量增大時,FP與FN容易增加。整體來看,本文算法在五組病人的數據中的檢測性能浮動較小,特征提取與識別性能較為穩定,具有良好的魯棒性,對于臨床檢測具有一定意義。
心電信號中包含了諸多心臟生理病變的信息,通過經驗小波變換將心拍信號的自適應分解以獲得二維訓練數據,并利用布雷格曼散度作為卷積神經網絡的代價函數進行訓練優化,在有限樣本的情況下具有優良的室性早搏心拍識別性能。未來將繼續針對其他類型的病變心拍數據進行數據采集、特征分析與檢測研究。