王佳琪, 袁永峰
(1 東北林業(yè)大學(xué) 信息與計算機工程學(xué)院, 哈爾濱150040; 2 哈爾濱工業(yè)大學(xué) 計算機科學(xué)與技術(shù)學(xué)院, 哈爾濱150001)
隨著社會的不斷發(fā)展,人口老齡化及城鎮(zhèn)化進程加速,我國心腦血管疾病率及死亡率加速增長,心腦血管病現(xiàn)患病人數(shù)2.9 億,2016 年心腦血管死亡率仍居首位,高于腫瘤及其他疾病,因此心電檢測尤為重要。 現(xiàn)代檢測心電的手段通常采用12 導(dǎo)聯(lián)技術(shù),12 導(dǎo)聯(lián)的電極位置分布在四肢、前胸和腋下周圍,幫助診斷心臟周圍異常部位。 同時由于12 導(dǎo)聯(lián)技術(shù)的發(fā)展,心電圖可視化技術(shù)也隨之出現(xiàn),傳統(tǒng)的可視化技術(shù)是采用面繪制的方法對體表電位進行可視 化, Liberos A 等[4]通 過 體 表 電 位 仿 真 技 術(shù)(BSPM)研究房性心律失常的信號傳播活動,同時也出現(xiàn)了針對心臟三維建模的可視化技術(shù),Ramanathan 等[5]通過ECGI 對正常成人的心臟進行了電生理研究,利用ECGI 技術(shù)對健康成年人心臟心外膜電位、電圖及等時線進行無創(chuàng)重建,可顯示正常心室激動特征,尤其可以反應(yīng)心臟整體的復(fù)級特點,更加直觀的觀察心臟的電活動。 近年的心電散點圖、瀑布圖技術(shù)可以直觀的反映心臟的節(jié)律變化及心電特征的改變[6-7],從而快速識別早搏、房顫、冠心病、心絞痛等。
而本文直接對不同疾病的心電特征進行可視化研究。 首先選擇PhysioBank 開源生理數(shù)據(jù)庫中5種疾病類型的數(shù)據(jù),其次將心電特征從GQRS-極值法處理后的心電信號提取出來,分析不同疾病的特征值分布,最后,通過信息增益的方法比較不同疾病下的特征差異程度,如圖1 所示。 心電特征的差異反映了心臟不同位置的病理,當(dāng)出現(xiàn)異常疾病類型時,本文的可視化研究可以快速診斷心臟部位的病變。
為研究12 導(dǎo)聯(lián)心電圖的特征,從PhysioBank數(shù)據(jù)庫中選擇了共289 440 個樣本。 其中,所有數(shù)據(jù)庫的數(shù)據(jù)采集均為2 min,室上性心律失常(SA)和正常竇性心律(normal)數(shù)據(jù)庫采樣頻率(fs)為128 Hz,各30 720 個樣本。 惡性室性心律失常(MVE)、BIDMIC 充血性心力衰竭(BIDMIC)和房顫(AF)數(shù)據(jù)庫采樣頻率為250 Hz,各為60 000 個樣本,部分癲癇發(fā)作后心率震蕩(PIHRO)數(shù)據(jù)庫采樣頻率為200 Hz、共48 000 個樣本。 所有這些數(shù)據(jù)都是從波士頓貝思醫(yī)院收集的,該醫(yī)院是心電圖信號的最大數(shù)據(jù)收集之一,并為人類受益人的工作進行記錄[9]。

圖1 心電特征可視化研究Fig. 1 Visualization study of ECG characteristics
在得到不受任何干擾的心電信號、提取到大量準確的特征信息,首先對原始心電信號進行預(yù)處理。原始的ECG 信號通常含有基線漂移、肌電、工頻干擾的噪聲信息,因此利用離散小波變換方法對心電信號進行去噪處理,小波變換分為小波分解和重構(gòu),離散小波分解是將噪聲的信號進行多尺度的分解,選擇小波函數(shù)的低通濾波和高通濾波將信號分解為低頻和高頻部分,小波重構(gòu)是小波分解的逆過程,將細節(jié)信號和過濾后的最終逼近信號進行重組。 本實驗根據(jù)心電信號的特點,采用db5 小波基函數(shù),分解層數(shù)為5 層,最終得到去噪后的心電信號。
在一個正常的心動周期中,竇房結(jié)形成起搏后,迅速將沖動通過傳導(dǎo)系統(tǒng)傳至心臟各部形成心肌整體的電活動,心肌進而形成機械性收縮,心肌激動的電流傳導(dǎo)至體表,從而出現(xiàn)心電圖中的各個特征波形。 一個典型竇性心律正常的ECG 波形(圖2)包括以下特征波:一個P 波,一個QRS 波群(Q 波,R波,S 波),一個T 波,以及在50%~75%的ECG 中可能見到的U 波。

圖2 心電信號波形圖Fig. 2 ECG signal waveform
因此,想要得到心電特征,需要進一步識別心電信號的各個波峰,采用GQRS-極值法。 由于QRS波群具有明顯的特征,通常先提取ECG 信號中的R波作為波形的劃分依據(jù),因此采用GQRS 算法識別,GQRS 算法為PhysioBank 提供的WFDB(波形數(shù)據(jù)庫)軟件包中檢測R 波的算法,對信號進一步去噪并進行低通濾波,之后用濾波信號卷積QRS 匹配濾波器,使用計算出的信號長度運行學(xué)習(xí)階段,學(xué)習(xí)檢測QRS 和與主檢測階段相同的非QRS 峰,不保存QRS 位置,并記錄QRS 閾值,運行檢測時比較RR間隔與QRS 間隔從而判斷R 峰位置,Q 峰的位置在R 峰前三分之一周期(fs)樣本內(nèi)的第一個極值拐點,對應(yīng)的S 峰位置在R 峰后三分之一周期內(nèi)的第一個極值拐點,T 峰在該周期與下一周期的RR 間隔內(nèi)前三分之二的樣本內(nèi)檢測,位置在該周期S 峰位置后的第一個極值拐點。 同時,判斷是否出現(xiàn)倒置情況,因此在識別時分別求出極大值和極小值,判斷極大值與極小值距離基準電壓0 V 的幅值大小篩選T 波是否倒置,確定T 波位置。
確定心電圖的波峰位置后,選擇RR 間期(RR_time)、Q-T 間隔(QT_time)、Q-T 幅值(QT_value)、S-T 間隔(ST_time)、S-T 幅值(ST_value)、R-T 幅值(RT_value)、T-T 間隔(TT_time)、QRS 間期(QRS_time)、心率(Heart_rate),這些心電特征有利于患者的臨床診斷、可以大幅度檢測出不同疾病下的差異,其中的心率為脈搏或心臟聽診1min 心跳的次數(shù),計算方法為:

最后將以上得到的9 個特征對應(yīng)的數(shù)據(jù)值進行統(tǒng)計,如圖3 所示。

圖3 各特征值分布Fig. 3 Distribution of eigenvalues
根據(jù)不同特征值的分布特點,可以計算出不同疾病針對同一特征的差異程度。 在此之前,傳統(tǒng)的差異性分析方法為相關(guān)系數(shù)、協(xié)方差矩陣、回歸分析法等, Mingjing Y[17]也運用相關(guān)熵判斷R 峰與RR區(qū)間的相關(guān)性。 熵表示信息在動態(tài)系統(tǒng)中的混亂程度,當(dāng)各特征之間不能通過單純的數(shù)字進行差異性比較時,則需要利用信息增益的方法。 信息增益即為在一定條件下,信息不確定性減少的程度。 本研究采用信息增益的方法判斷各特征之間的差異性,比較各特征的差異性大小。 收集的Physionet 生理數(shù)據(jù)庫中各類型不同特征組成的特征向量為:

式中,type 為疾病類型,xi為該類型第i 個特征值組成的特征值向量。
首先將每個特征值向量進行線性歸一化處理:

其中, x′ 為特征值向量中歸一化處理后的值,歸一化后的特征值向量均為標量形式。 類型值type的熵定義式為:

其中,pi為第i 種疾病類別在特征向量中對應(yīng)的概率。 得到的熵值越大,隨機變量type 的不確定性越大。 信息增益表示得知特征Xi的信息使得類別Y的信息不確定性減少程度,信息增益為數(shù)據(jù)集合Dk的經(jīng)驗熵與特征xi給定條件下Dk的條件熵之差:

其中,|Dk|為第k 個疾病特征向量與正常竇性心律(normal) 特征向量組成的特征向量矩陣。 特征xi對數(shù)據(jù)集的條件熵為:
其中,|Di|為樣本容量,根據(jù)心電特征xi的取值將Dk劃分為c 個子集,記子集Dt中屬于第u 類別的樣本集合為Dtu。 將各疾病類型的所有特征進行信息增益計算,得到的可視化可以比較不同疾病特征差異(圖4)。 同時在單一疾病條件下,各特征差異程度不同,對疾病的影響程度也不同(圖5)。

圖5 不同疾病下各差異值分布Fig. 5 Distribution of differences in different diseases
特征提取的前提是對波峰的正確檢測,波峰識別算法準確率的高低直接影響特征值提取的正確性。 判斷波峰的準確性通常檢測靈敏度和準確率指標。 表1 中定義的參數(shù)如下。
?真陽性(TP):正確檢測到的正確信號數(shù);
?假陰性(FN):沒有檢測到的信號數(shù);
?假陽性(FP):誤報信號數(shù);
?真陰性(TN):正確檢測到錯誤的信號數(shù);
?靈敏度:Sensitivity =TP/(TP + FN) ;
?準確率:Accuracy =(TP + TN)/(TP + TN +FP + FN)。

表1 各算法指標比較Tab. 1 Comparison of various algorithm indicators %
由表1 可看出,本文采用的GQRS 算法靈敏度比Linear prediction 算法高,準確率在96%以上,識別到的心電波峰準確率較高,為特征可視化奠定了基礎(chǔ)。
本文針對不同疾病的12 導(dǎo)聯(lián)心電圖進行心電特征的可視化分析。 提取到的心電特征可視化統(tǒng)計圖2.2,可以清楚的看到不同疾病下各特征的分布特點,特征數(shù)值在某一區(qū)間內(nèi)越集中,特征值波形越高聳,不同疾病下特征值的區(qū)間存在差異。 之后通過信息增益的方法進一步分析各特征之間的差異程度,雷達可視化分析圖2.4 可以看出室上性心律失常的心電特征較其他疾病類型不明顯,TT 段與ST段與其他特征相比差異較大;部分癲癇發(fā)作后心率震蕩的差異程度最高,其中QT 段、ST 段、RT 段的幅值與QRS 波群差異最大,異常情況較其他疾病更為明顯,ST 段的差異可以證明該疾病大幅導(dǎo)致心肌梗死,QT 波的差異證明心率的波動對該疾病有很大影響,更加直觀的觀察到不同特征對哪種疾病的影響最大,同時統(tǒng)計圖2.5 對比了同一疾病不同特征對疾病的影響程度。 對于異常心臟疾病類型情況,本文的心電特征可視化分析可以直觀快速地觀察到不同心電特征的影響,進而根據(jù)特征差異判斷出心臟不同部位的病變程度。