曹書豪 許成哲
摘 要:本文針對基于分類器組合的ECG信號進行了身份識別算法的研究,通過無基準點的方法來提取QRS波形,HOAC、DWT、PCA特征提取和分類器組合算法相結合的方法,該算法對身份識別的準確率進行提高。通過對比實驗得出,在組合規則中,中值規則和乘法組合形式的分類器的效果最好,相比通過單一特征提取的分類效果更好,分類的錯誤率也較比同類論文有了一定程度上的降低。實驗驗證,本文研究的的號身份識別算法分類識別精度高,而且實現更加容易,為今后基于ECG身份識別的研究提供了良好的支持。
關鍵詞:心電信號;身份識別;分類器組合算法;高階自相關
0 引言
身份識別技術這個研究課題已經被提出許久,市面上常見的身份識別還有虹膜識別等,該類產品大多數應用于身份驗證、視頻監控等領域。特別是在人口流量管理方面有著較為廣泛的應用。2001年由Biel首先提出心電信號身份識別的概念并且完全實現后[1],數以百計的研究人員不斷對此技術進行革新,身份識別的流程可以概括為三步,首先對基礎數據進行預處理,再通過選取特征輸入到分類器中,進行最后的分類來完成身份的識別。
2010年,文獻[2]提出基于ECG信號的身份識別算法,在預處理階段通過小波變換的方式進行去噪處理,選取R峰值點作為特征,最后通過遺傳算法、DNA算法以及優化過后的BP神經網絡分類器三種分類方法進行分類識別,取得了較好的準確率。Plataniotis[3]是最早的將基于ECG信號波形提取的特征提出來,采用的是自相關變換加離散余弦變換,對原始信號經過進行濾波處理,選用4階巴特沃斯濾波器,第二步在保證時間窗不重疊的情況下進行窗口分割,最后計算每個小窗口的AC值。
針對現有方法的不足,本文提出了一種基于分類器組合的心電信號身份識別算法,分選選取HOAC、DWT、PCA三種方式提取特征,通過離散余弦變換對HOAC提取的特征做降維處理,另外詳盡的介紹了K近鄰分類方法,通過使用不同的5種分類器組合規則,在MIT-BIH和PTB數據庫中進行仿真,驗證了本算法的有效性。
1 ECG信號的預處理及QRS波形的提取
針對ECG信號的噪聲干擾及其特點,本文選擇4階巴特沃斯帶通濾波器,該濾波器的頻率范圍是在1~40Hz之間,巴特沃斯濾波器的特點就是它的通頻帶對應的頻率響應曲線是最為平滑的。該巴特沃斯低通濾波器平方函數如公式(1-1)所示:
預處理之后的ECG信號我們利用文獻[7]的方法來進行QRSnorm波形提取,使用HOAC算法可以減少受特征點不準確性的干擾,更為準確的獲取到ECG信號波形特征信息。本文對每個ECG信號都將其用同等窗口長度的ECG信號進行劃分,通過設置相同時間窗口長度的方法,來提取心電信號中的重要信息,原則上QRS復合波的波形長度應與時間窗口長度的設定相同。通過這樣的方式在一定程度上可以減少心率變化對信號的干擾,也降低了算法本身的復雜程度。通過公式(1-2)可以確定HOAC系數,得出QRSnorm。
2 基于分類器組合的ECG信號身份識別算法
2.1 基于ECG信號多種特征提取結合的過程分析
本算法為了提高身份識別識別精度,并更好的將其特征應用在分類器組合規則,利用高階自相關提取QRSnorm波形。HOAC特征中時間窗口長度為4s,重疊時間窗口長度為1s。在特征選擇上,第一個特征為7階HOAC系數進行DCT變換后的前20個系數;第二個特征為QRSnorm波形進行PCA之后的前10個系數;最后一個特征為進行3層DWT變換之后QRSnorm波形的17個低頻成分系數,DWT中選取‘db1母小波。將上述三個特征輸入到K值為1的K-NN分類器中,選擇乘法、最大、最小、中值、大多數投票等5種分類器組合規則。本文的整個分類過程流程如圖1所示:
2.2 基于分類器組合的心電信號身份識別算法介紹
將提取到的特征作為輸入值進入到K近鄰分類器之后,本文創新性通過不同組合規則對所提取特征特征進行組合,從而實現提高基于ECG信號的身份識別率,其中包括乘法規則、最小規則、最大規則、中值規則及大多數投票規則等5種組合規則,組合規則均為并行結構。分類器的組合方式規則可以表示為:
乘法規則:模式Z包含了m個可能的出現的類別,表示為w1,...,wm,如果使用分類的的數量為R,那么在給定的類別中,任何一個分類器都會賦予一個不相同的測量xi , i從1到R,等式兩側按貝葉斯理論與全概率定理,表示如(2-1):
若測試向量均為彼此獨立的話,類條件概率密度公式可表示為:
將此公式代入到公式(2-1)可以得出乘法規則:
本算法中3個特征是相互獨立的,用乘法規則進行分類器組合是最優的。乘法規則也可以表示為:
通過下式衍生出了最大值、最小值和中值規則:
最大值規則:是通過求和規則逼近最大的后驗概率推導后可表示為:
最小值規則是通過對乘法規則逼近后驗概率的邊界范圍,經推導后得出以下公式:
中值規則是在相等的先驗假設,求和規則可視為計算平均最大的后驗概率。公式如下:
該公式表示最大的后驗概率是中值規則分配給該類的機率。一旦有分類器輸出的后驗概率為異常結果,平均值結果會因此受到影響,進而導致分類出現錯誤。我們規定,穩健估計的均值為中值。因此基于分類器組合的后驗概率中值規則表示為(2-10):
大多數投票規則可表示為:
上式右邊的表示為從個體分類器接收到類wk的選票個數之和。哪一個類別的累加之和最大,意味著得到最多的投票,進而表示為第wj類,第wj類是由獲得最多投票來確定的。最后使用K近鄰分類器對心電信號進行分類識別,利用上述5中不同的組合規則進行組合,驗證本文提出算法的可行性以及實際性能。
3 仿真結果與分析
仿真實驗的過程中分別對PTB數據庫與MIT-BIH數據庫中的數據進行對比實驗,在原始數據庫當中隨機選取訓練集與測試集,實驗共進行1000次,從而得出STD與平均錯誤率,最后利用本文算法的實驗結果與同類別論文進行數據對比。3種不同特征以及5種不同分類器組合規則在兩個數據庫中進行對比,實驗結果如表1所示。從實驗的結果我們不難看出,乘法規則與中值規則的組合方式在心電信號身份識別的識別精度上要優于只利用單一特征的分類精度,分類的錯誤率也更低。
通過本文得出的實驗數據,與其他研究人員提出的算法,文獻[4-7],在PTB和MIT-BIH數據庫進行實驗結果比較,實驗結果如表2所示:
4 結論
通過對比實驗,共得到以下結論:
(1)本文利用HOAC手段對QRS復合波形進行特征提取后進行分類識別,通過對比錯誤率和使用分類器組合規則的平均錯誤率進行了比較,驗證了該算法的優越性,同時對設置不同的時間窗重疊長度,對分類器組合的算法起到了優化的作用。
(2)通過本文提出的分類器組合算法,在兩個數據庫當中進行驗證對比試驗,實驗得出,乘法和中值規則組合的方式令分類器的分類能力有了極大的加強,較比只利用單一特征而言,識別率得到了顯著的提升,同時分類錯誤率也有了極大地下降。通過對比本文提出的算法與現有的心電信號識別算法進行試驗數據對比,本文的身份識別精度更高。
參考文獻:
[1]Biel L,Pettersson O,Philipson L,et al.ECG analysis: a new approach in human identification[J].Instrumentation and measurement,IEEE Transactions on,2001,50(03):808-812.
[2]朱民杰.基于神經網絡的心電圖身份識別研究[D].鄭州大學,2010.
[3]K.N.Plataniotis,D.Hatzinakos,J.K.M.Lee.ECG Biometric Recognition Without Fiducially Detection[C].Baltimore:2006 Biometric Symposium;Special Session on Research at the Biometric Consortium,2006:1-6.
[4]S.C.Fang,H.L.Chan.Human Identification by Quantifying Similarityand Dissimilarity in Electrocardiogram Phase Space. Pattern Recognition,2009(42):1824-1831.
[5]Wang Y J,Agrafioti F,Hatzinakos D,el al Analysis of human electrocardiogram for biometric recognition [J].EUR ASIP Journal on Advances in Signal Processing,2008.
[6]C.C.Chiu,C.M.Chuang,C.Y.Hsu.A Novel Personal Identity Verification Approach Using a Discrete Wavelet. In: Proceedings of the 2008 International Conference on Multimedia and Ubiquitous Engineering.Washington,DC,2008: 201-206.
[7]Chengzhe Xu,Yonggao Jin.Human Identification using one lead ECG signal.Advanced Material Research,2013:671-672.