孫 括, 王云峰, 徐靜波, 張海英
基于自組織神經網絡的QRS波聚類方法
孫 括1,2, 王云峰2, 徐靜波2, 張海英2
(1.中國科學院大學 電子電氣與通信工程學院,北京 101407;2.中國科學院 微電子研究所 新一代通信射頻芯片技術北京市重點實驗室,北京 100029)
為提高查看大量數據動態心電(ECG)圖時的效率,將波形聚類,采用埃爾米特函數和自組織神經網絡,實現了室性早搏占比高情況下的心電波形聚類算法。使用MIT—BIH心率失常數據庫,利用埃爾米特函數分解QRS波形為QRS向量,將所有QRS向量輸入自組織神經網絡進行分類。使用特征向量元素分析聚類結果,用陽性率指標對結果進行統計,平均真陽性率為91.2 %,假陽性率為1.03 %,驗證了基于自組織神經網絡的心電聚類算法的有效性。達到了將正常心搏和室性早搏心搏聚類的目標。
QRS; 聚類; 埃爾米特函數; 自組織神經網絡; 陽性率
近年來,心臟疾病越來越受到人們關注。為全面了解心臟狀態,動態心電圖使用廣泛。動態心電圖對心臟進行24h或48h監測,產生大量心電數據[1]。人工查看心電波形工作量大,易出錯。計算機自動識別歸類技術可以大大提高醫護人員的工作效率[2]。
為實現將心電波形聚類目標,本文使用埃爾米特函數提取心電波形特征,自組織神經網絡對心電特征聚類[3],利用特征向量不同元素的貢獻度對自組織神經網絡的輸出進行分析,并用陽性率指標對聚類結果進行統計。使用MIT—BIH心率失常數據庫,聚類結果真陽性率為91.2 %,假陽性率為1.03 %,實驗結果說明基于自組織神經網絡的聚類算法適用于室性早搏心搏占比高的動態心電圖,基于自組織神經網絡的心電波形聚類算法有效,完成了將心電波形聚類的目標。
1.1 埃爾米特函數
埃爾米特多項式是經典的正交多項式序列。埃爾米特多項式Hn定義如下
(1)
式中n為階數。埃爾米特函數定義如下
(2)
埃爾米特函數具有正交性[4]
(3)
ψn(x)構成正交基空間,不同階的埃爾米特函數的組合可以表示QRS波形。
1.2 自組織神經網絡
自組織映射 (self-organizing map,SOM) 模型是一種無監督的自組織神經網絡,它自動尋找數據中的規律,并改變網絡參數[5]。SOM由輸入層和輸出層組成,可以將高維度向量分類,分類結果是一個二維平面結構,二維平面上存在神經元。SOM使輸入數據從高維數據空間映射到二維空間[6]。
SOM使用了競爭性學習方法,對于一個有權重向量Wv(s)的神經元v,更新準則為[7]
Wv(s+1)=Wv(s)+f(u,v,s)α(s)(D(t)-Wv(s))
(4)
式中s為迭代次數,t為輸入向量的下標,u為神經元,α為學習速率,D(t)為輸入向量,f(u,v,s)為計算神經元之間距離的函數。f(u,v,s)與兩個神經元的距離直接相關。
1)提取心電數據庫心電數據,將心電數據用埃爾米特函數重構,將每一個心電波形表示為四維標準QRS向量。
2)將標準QRS向量輸入SOM,找到獲勝向量,調整獲勝向量和鄰近向量的權重。
3)所有標準QRS向量進行步驟(2),并調整學習速率參數,重復200次。
4)將分類結果輸出,統計每一類的心電類型和數量,得到陽性率指標。
使用MIT—BIH心率失常106#心電數據,106#心電數據正常心搏(數據庫中標記為1)1 507次,室性早搏心搏(數據庫標記為5)520次,將正常心搏和室性早搏心搏數據混合。
實驗對正常心搏和室性早搏心搏分類,自組織神經網絡使用4個輸出。神經元按照從左到右,從下到上編號1#,2#,3#,4#。
數據分類之后,神經元之間的距離如圖1。神經元的距離是相應權重向量的歐氏距離,神經元之間的顏色代表相鄰神經元之間的距離。顏色越深,距離越大,顏色越亮,距離越小。1#和2#神經元距離最近,3#和4#神經元距離最遠。

圖1 權重向量距離
聚類結果輸出如圖2。每一個神經元內部的數字表示該分類結果中包含的心電波形總數量。1#神經元對應967個心搏,2#神經元對應619個心搏,3#神經元對應228個心搏,4#神經元對應213個心搏。將這些數據分類結果進行統計,見表1。

圖2 聚類結果

分類正常心搏室性早搏1944232562573122740213
根據SOM的篩檢結果表2,得到真陽性率為84.2 %,假陽性率接近0 %。
表2 陽性率統計數據表

項目 金標準陽性陰性合計自組織神經網絡篩檢結果陽性陰性440 80 11506 4411586合計52015072027
圖3為權重向量位置圖,由圖可見輸入的標準心電向量集中在上部,上部的兩個神經元是1#和2#神經元,處于下部的兩個神經元是3#和4#神經元。

圖3 權重向量位置
實驗中,輸入SOM的是四維向量,輸出二維平面空間,輸入向量的每個元素對神經元都有權重貢獻。輸入向量每個元素對輸出神經元的貢獻度統計如表3。
表3中可以得到結論:輸入向量的第一元素對2#神經元貢獻最大,對4#神經元貢獻最小。輸入向量的第二元素對3#神經元貢獻最大,對4#神經元貢獻最小。輸入向量第三元素對4#神經元貢獻最大,對1#神經元貢獻最小。輸入向量第四元素對3#神經元貢獻最大,對4#神經元貢獻最小。
表3 元素貢獻度統計

輸入向量維度序數每個元素對神經元貢獻度從高到低排序一2134二3214三4231四3124
至此,使用SOM完成了106#心電數據波形聚類過程,真陽性率為84.2 %,假陽性率接近0 %。使用此算法對MIT—BIH的所有包含心率失常和正常心搏的數據文件進行聚類統計,得到表4。
表4 所有心電文件陽性率統計

文件號正常心搏個數室性早搏個數真陽性率/%假陽性率/%100223910010299475.0010416320010525264100106150752084.201081739170011418204397.70116230210997.21.41191543444100012118611001231515300200174382690.30.2201162519899.00.320220611900203252944485.11.920525717197.20208158699298.32.12092621100210242319479.40213264122093.60215319516489.0021724416287.71.221920816400221203139696.70223202947371.59.5228168836295.02.8230225510023131421000233223083196.20.22342700300
表4中的真陽性率統計數據變化非常大,分布在兩個極端,一部分接近100 %,一部分接近0 %,假陽性率所有統計接近0 %。真陽性率和假陽性率均為0的原因是室性早搏心搏數量過少,室性早搏心搏數目與正常心搏數量比例過低。SOM在數據分類過程中,神經元的權重向量要依據輸入向量調整,心搏數據過少會使室性早搏類型神經元學習受阻,整個數據訓練學習過程權重向量調整有限,并且容易受到正常心搏向量的影響,使權重向量偏向正常心搏向量。在結果中沒有分出室性早搏類型,從而出現真陽性率和假陽性率均為0的情況?;赟OM的心電聚類算法適用于室性早搏數量較多的情況。
為進一步統計結果,舍去表4中真假陽性率均為0的情況,對其他心電數據文件的真假陽性率取均值,得到真陽性率均值為91.2 %,假陽性率均值為1.03 %。在室性早搏心搏占比高的心電數據中,基于SOM的聚類算法可以有效對室性早搏心搏和正常心搏分類。
本文使用埃爾米特函數和SOM實現聚類算法,用輸入向量的不同元素分量對聚類結果進行貢獻度分析,完成心電波形聚類統計。聚類結果平均真陽性率為91.2 %,平均假陽性率為1.03 %。在室性早搏占比高的動態心電圖中,算法有效,達到了將心電波形聚類的目標。
[1] 李 婧,劉知貴,彭桂力,等.心電檢測技術及其在遠程醫療中的應用[J].傳感器與微系統,2008,27(1):1-3.
[2] 朱 非.室性早搏的檢測與心電分類技術的研究[D].天津:天津大學,2005.
[3] 徐 毓,李 鋒,金以慧.基于聚類融合的多目標跟蹤算法[J].傳感器技術,2002,21(7):31-34.
[4] Laguna P,Jane R,Olmos S,et al.Adaptive estimation of QRS complex wave features of ECG signal by the Hermite model[J].Medical & Biological Engineering & Computing,1996,34(1):58-68.
[5] Philip de Chazal,Maria O’Dwyer,Richard B Reilly.Automatic classification of heartbeats using ECG morphology and heartbeat interval features[J].IEEE Transactions on Biomedical Enginee-ring,2004,1(7):1196-1206.
[6] Linh T H,Osowski S,Stodolski M.On-line heart beat recognition using Hermite polynomials and neuro-fuzzy network[J].IEEE Transactions on Instrumentation & Measurement,2003,52(4):1224-1231.
[7] Martin Lagerholm,Carsten Peterson,Guido Braccini,et al.Clustering ECG complexes using hermite functions and self-organizing maps[J].IEEE Transactions on Biomedical Engineering,2000,47(7):838-848.
Method for QRS wave clustering using self-organizing neural network
SUN Kuo1,2, WANG Yun-feng2, XU Jing-bo2, ZHANG Hai-ying2
(1.School of Electronic,Electrical and Communication Engineering,University of Chinese Academy of Sciences,Beijing 101407,China; 2.Beijing Key Laboratory for Next Generation RF Communication Chip Technology,Institute of Microelectronics of Chinese Academy of Sciences,Beijing 100029,China)
To improve the efficiency when checking the morphology of the large dataset of a dynamic ECG and cluster QRS complexes,a method for QRS clustering is realized using Hermite functions and self-organizing neural network with premature ventricular contraction in high proportion. Using MIT-BIH arrhythmia database,a QRS complex is decomposed into a QRS vector by Hermit functions.All the vectors are input into self-organizing neural network for clustering.Elements of the vectors are used to analyze the clustering result. Positive rate is used to give a statistics result.Method achieves an average true positive rate of 91.2 % and an average false positive rate of 1.03 %.The method is effective in clustering using self-organizing neural network.The aim of clustering normal beats and premature ventricular contraction beats is attained.
QRS; clustering; Hermite functions; self-organizing neural network; positive rate
10.13873/J.1000—9787(2017)02—0061—03
2016—04—01
R 318; TP 183
A
1000—9787(2017)02—0061—03
孫 括(1988-),男,碩士研究生,研究方向為生物醫學傳感器、新型醫療電子設備以及信號處理。