趙治棟,楊 雷,陳甸甸
(1.杭州電子科技大學電子信息學院,杭州310018;2.杭州電子科技大學通信工程學院,杭州310018)
與傳統的基于密碼或ID卡的認證方式相比,生物識別技術(Biometrics)具有更高的安全度與可靠度,已逐漸成為國際研究的熱點,并逐漸在不同的領域發揮著舉足輕重的作用。生物識別的優勢在于更高的安全性和便利,但在實際應用中也面臨許多挑戰,其中比較突出的是安全問題[1]。有人成功利用明膠制成的假手指騙過了指紋識別系統[2];利用打印下的虹膜圖片或者在隱形眼鏡上蝕刻出的虛假虹膜,可以讓虹膜識別系統真假難辨[3]。生物特征識別應用過程中所潛藏的安全問題引起了國內外研究者的格外重視,新的生物特征識別技術不斷涌現[4-5]。
近年來出借助于人體內蘊的心電信號ECG(E-lectrocardiogram)進行身份識別的方法廣受關注。相比傳統的生物識別技術,心電識別技術具有獨特的優勢:首先,心電來自于人的心臟,不易被輕易仿制,與指紋和人臉等比,具備高安全性;其次,任何人都有心電,具備普適性;第三,心電信號因人而異,不同的心臟位置、尺寸、解剖結構和胸腔結構等造成了心電信號的差異;第四,心電信號是一維信號,處理簡單,數據量小,節省存儲空間;第五,心電信號可以通過手指電極方便的數字化采集;最后,心電信號具有較長期的穩定性。國內外對心電身份識別做了初步的探索研究。從研究方法上分,目前ECG身份識別算法大致分為三種:基于多基點檢測的特征提取方法、基于單基點的特征提取方法和非基點檢測的特征提取方法。本文重點研究非基點檢測的身份識別算法。Biel早期詳細研究了利用ECG信號作為身份識別的可行性[6]。Wang從心電信號中提取了解析特征和外觀特征相融合的特征,并利用PCA對13個心電信號進行分析,獲得100%的個體識別率和98.9%的心跳識別率[7]。Ming Li提出了一個融合時域和復倒譜信息的識別方法,識別率可達98.3%[8]。楊向林等人根據R波位置以固定長度提取單個心跳周期的心電信號,并對其進行小波分解提取小波參數,最后選用相關系數閾值法實現身份識別;基于波形特征、小波特征和融合特征的識別率分別達到82.5%、87.5%和 95%[9]。Platanioatis提出了自相關系數(AC)結合離散余弦變換(DCT)的非基點檢測識別方法,采用高斯似然距離獲得100%的識別率,采用歐式距離獲得92.8%的識別率[10]。
本文研究了基于快速傅里葉FFT(Fast Fourier Transform)的匹配追蹤MP(Matching Pursuit)心電身份識別算法。通過心電信號的預處理:消噪和標準化,提高了心電信號消噪比,消除了心率變異;通過分析MP過完備原子庫的結構特性和心電信號的特征,提取前三個原子的時頻參數和投影值作為特征參數,然后構建支持向量機SVM(Support Vector Machine)進行分類匹配,完成識別;最后通過MIT-BIH心電數據庫驗證了算法性能,取得了較高的識別率。

表1 各種典型心電身份識別技術的比較
MP算法是常用的信號稀疏分解方法之一,通過不斷的迭代來求取待分析信號的稀疏表示,是一種貪婪算法。
用于MP稀疏分解的過完備原子庫可表示為D={gγ}γ∈Γ,gγ表示過完備庫中的原子,它的長度與待分析信號長度相等,它由時頻參數γ確定,庫內原子都作了歸一化處理,即‖gγ‖=1。假設H表示Hilbert空間,原始的待分析信號f∈H,則MP算法的基本流程如下所述[11]:
初始化:使得R0=f。首先從過完備原子庫中找出滿足式(1),最能匹配待分析信號結構特征的原子 gγ0。

然后將待分析信號分解為如下形式:

式中〈f,gγ0〉gγ0表示待分析信號 f在原子 gγ0上的投影,R1f為待分析信號在原子gγ0上投影后的剩余分量。待分析信號經過一次分解后,得到在最佳原子gγ0上的投影和及其剩余分量R1f兩部分。顯然,R1f與原子gγ0是正交的。

為了使剩余分量的能量‖R1f‖2最小化,必須選擇合適的原子 gγ0最大化 |〈f,gγ0〉|2。但是由于計算量等因素的限制,原子的選擇受到一定的限制,因此只能選取滿足下列條件的最佳逼近原子gγ0。

式中α表示最優因子,通常α=1。MP是一個不斷迭代的過程,通過重復上面同樣的分解過程,將信號剩余分量Rkf在其最佳匹配原子gγk上投影得到下一階的剩余分量,從而不斷地對其進行分解。當‖Rkf‖足夠小時,上述分解過程即停止。信號被分解為:

其能量表示形式如下:

式中Rnf表示待分析信號經過n次分解以后得到的剩余分量。已經證明在信號長度有限的條件下,隨著n的增大剩余分量的能量‖Rnf‖逐步衰減為零[11]。用較少的原子可以表示原始信號的主要成分,從而待分析信號可以近似地表示為:

其中n?N,N表示待分析信號的長度。
根據心電信號的時頻結構,本文中選擇由Gabor原子來形成過完備原子庫。一個Gabor原子可由一個經過調制的高斯窗函數組成[12]:

其中g(t)=e-πt2表示一個高斯窗函數,時頻參數γ可表示為 γ=(s,u,v,w),s為尺度因子,u 為位移因子,v為頻率因子,w為相位因子。由過完備原子庫的結構特性可知時頻參數γ=(s,u,v,w)可決定一個原子。當參數s,v,w相同而只有參數u不同時,原子的形狀是相同的,只有中心位置不同。本文預處理后得到的心電模板各段的位置基本保持穩定,因此可省略這些原子從而減小原子庫中原子的數目。根據上面的分析,可使參數u的值保持不變,其他參數s,v,w按照原來的方法進行選取,過完備原子庫中的原子數目將大大減小,有效提高算法的計算速度。可將N次內積運算轉換為一次Rkf和gγ的互相關運算,以提高計算效率。
FFT可快速實現互相關運算,在每次分解過程中找到與心電信號或心電信號剩余分量匹配性最好的原子,大大地提高了MP稀疏分解的運算速度,且不會影響心電信號的稀疏表示。
該算法主要包括3個部分:預處理、特征提取和分類。首先對心電信號做消噪和標準化等預處理,然后將得到的心電模板進行FFT-MP分解得到原子的時頻參數和投影值,將其作為特征參數輸入到SVM分類器中進行訓練,最后利用ECG數據進行性能測試。算法的主要流程圖如圖1所示。
實際采集到的心電信號會受到外界噪聲等因素的干擾,污染了心電信號的波形,嚴重影響了身份識別的準確度。本文提出了心電信號預處理算法,算法的具體流程如圖2所示。

圖1 FFT-MP心電特征提取算法流程圖

圖2 預處理過程的流程圖
(1)心電信號消噪:首先采用平滑先驗法對心電信號進行處理,消除心電信號中基線漂移等低頻噪聲,然后采用基于小波閾值的去噪方法消除心電信號濾除中高頻噪聲。平滑先驗法可有效濾除基線漂移和其他低頻噪聲,可以通過參數λ來調節該濾波器的截止頻率[13]。經過平滑處理后的心電信號通過Sym4小波對其進行三層小波分解,然后對分解得到的小波系數采用極大極小閾值和軟閾值函數進行去噪處理[14]。經過心電消噪處理前后的心電信號如圖3所示。
(2)心電信號標準化:在每次心電信號采集過程中,受測者的心率一般會隨著受測者的情緒、壓力狀態等而改變,心率的改變對心電身份識別造成一定的影響。本文提出了心電信號標準化方法以消除此影響,流程圖如圖4所示。
為了得到標準化的心電信號,首先從輸入的心電信號S中提取出每個心跳周期的心電信號M(i)。本文采用基于雙正交樣條小波的QRS波檢測方法來檢測心電信號的R波[15],R波的位置可以表示為p(i),i=1,2,3,…,m。

圖3 去噪前后心電信號

圖4 心電信號標準化流程圖
在確定心電信號R波的位置后,根據波形的特點,將單個心跳周期的心電信號劃分成4個部分:PQ間期、QRS復合波、S-T間期和T波,如圖5所示。

圖5 典型的心電信號波形
QRS復合波在心率改變的情況下基本保持穩定,因此取 R 波前(0.06×fs)個采樣點,R 波后(0.1×fs)個采樣點作為單個心跳周期心電信號的QRS復合波,表達式如下:

其中fs表示心電信號的采樣頻率。
P-Q間期波形會隨著心率的改變而輕微的發生變化,它的標準化可通過下式獲得。

其中dt是一個閾值變量,由心率決定,它可以表示為:

T波波形隨著心率的改變變化比較顯著[17],因此把T波分成兩段,一段從 S波結束點 s(i)=S[p(i)+0.1fs]開始到 T波開始點稱為 S-T間期,另一段從T波開始點到結束點,稱之為T波。這兩段間期可以表示成:

在單個心跳周期的心電信號中P-Q間期,S-T間期和T波會隨著心率的改變而改變,根據式(9)、式(10)、式(12)和式(13)可以得到相對應的P-Q間期,S-T間期和T波,然后分別將P-Q間期重采樣至216ms,S-T間期重采樣至100 ms,T波重采樣至320 ms,這些間期都是心率為75 bpm時的長度。在重采樣之后,將這四個間期重新組合起來,組成一個完整心跳周期的心電信號波形,時間長度為800 ms。在心電信號采集過程中心電信號的幅度也會受到受測者心理狀態、周圍環境等因素的影響,因此需要對心電信號的幅度進行相應的歸一化處理。

根據式(14)可以得到零均值單位方差的歸一化信號。標準化后的心電信號如圖6所示,有效的去除了心率變異性的影響。

圖6 標準化后的心電信號
(3)心電信號質量檢測:心電信號在經過消噪和標準化后,需要判斷心電信號是否滿足識別所需的質量要求。根據心電信號的準周期特性及周期變換的特點[18],提出了基于周期變換的檢測方法來判斷心電信號的質量。
將經過心電信號標準化的單個心跳周期的心電信號Si重新拼接起來組成一個合成信號,可以表示成 F=[S1,S2,…,Sn]。因為合成信號可作為一個準周期信號,噪聲會造成信號波形的改變從而影響信號的周期性。可通過周期變換將合成信號投影成一系列的周期序列,檢查合成信號的周期性。經過周期變換后,根據式(15)來估計質量評價參數Qi,Qi表示合成信號的周期性,即合成信號受到噪聲或其他因素影響的程度。

x是原始序列,xp是投影到周期子空間p的周期序列。Qi計算原始序列與投影后的周期序列之間的相對能量,表示原始序列與周期序列之間周期的接近程度。Qi越大表示合成信號受到噪聲和心率變化影響較小,反之說明受到干擾較大。經過大量實驗,設定閾值為0.8,當合成信號的Qi大于0.8時,則表示心電信號質量滿足識別要求;當Qi小于0.8時,則提示重新輸入另一段新的心電信號。
由于同一個人的心電模板信號有著相似的波形,因此同一個人的心電模板信號經過MP稀疏分解后得到的原子的時頻參數有著最大的相似度。原子是由時頻參數 γ=(s,u,v,w)決定的,同一個人的時頻參數有著最大的相似度,因此稀疏分解得到的時頻參數可以作為心電信號的特征參數。
此外,待分析的心電模板信號或剩余分量與最佳原子的匹配度可用其在最佳原子上的投影值大小來表示,投影值越大,表示該原子在原始心電模板信號或其殘余分量中所占的比例越大。原子的投影值也可以作為特征參數。同時最先分解得到的原子投影值較大,在選取特征參數時可以僅選取前幾個原子的時頻參數和其投影值。圖7是采用FFT-MP稀疏分解算法得到的心電模板信號的時頻分布圖,其中圖中央是心電模板信號的時頻分布,底部是信號的時域分布,右側是信號的功率譜,從圖中可知通過原子重建得到的時頻分布圖較好反映了原始信號的時頻特性。
圖8為同一個人不同時間段的心電模板信號稀疏分解后的時頻分布圖,圖9為四個人的心電模板信號稀疏分解后的時頻分布圖。從圖8、圖9中可以看到同一個人的原子的時頻圖有著相似的時頻分布,而不同人的原子的時頻圖各不相同,因此可知原子的時頻參數具有較好的區分特征和穩定性。

圖7 FFT-MP稀疏分解算法得到的心電模板信號的時頻分布

圖8 同一個人不同時間段的心電模板信號稀疏分解后的時頻分布

圖9 四個人的心電模板信號稀疏分解后的時頻分布
支持向量機是建立在Vapnik和Chervonenkis(VC)理論和結構風險最小原理的基礎上,在線性可分的情況下求最優超平面,最優超平面不僅能將兩個類別的樣本正確分開,使得經驗風險最小,而且兩類樣本之間的距離最大,非常適用于小樣本情況下的分類和識別[19]。支持向量機示意圖如圖 10所示。

圖10 支持向量機示意圖
將前n個原子的時頻參數和投影值作為心電模板的特征參數輸入到SVM分類器中進行身份識別。軟件采用LIBSVM。
在本節中討論參數選取對識別率的影響。訓練選取20 s的心電數據,測試選取10 s的心電數據,最后的識別效果通過單個心跳周期的心跳識別率和10 s測試數據中提取的前三個心電模板的判別結果通過多數投票準則得到的識別率來進行衡量。
在訓練過程中,選取心率范圍在50 bpm~80 bpm的20 s心電信號,對其預處理,提取出單個心跳周期的心電模板,進行質量檢測,若檢測出的Qi不滿足閾值條件,則重新輸入心電信號,直到Qi滿足要求為止。對心電模板進行FFT-MP稀疏分解,將得到的前三個原子中的時頻參數以及投影值作為特征參數,即每個心電模板可獲得一個1×12的特征矢量。最后將提取出的特征參數保存到模板庫中,采用交叉驗證法訓練模板庫,得到SVM的最優參數,構建SVM分類器。
在測試過程中,首先對輸入10 s的測試心電信號進行預處理,采用FFT-MP提取特征參數,最后輸入到SVM分類器中與訓練模板庫中的特征進行匹配分類,根據多數投票準則得到判別結果,最后根據心跳識別率和識別率來評價算法性能。
選取MIT-BIH的3個心電數據庫:ST change數據庫,Long Term ST數據庫和QT數據庫中的心電作為實驗數據[20]。ST change和Long-Term ST數據庫選取的同一個人心電數據中存在心率變異,如圖11所示。

圖11 從MIT-BIH ST change和Long-Term ST數據庫中選取同一人心電信號的心率變化
為了探討算法中原子個數對系統性能的影響,首先對輸入的心電模板信號進行FFT-MP稀疏分解得到10個原子的時頻參數和其投影值。一般先分解得到的原子的投影值大,取前 n(n=2,3,4,5,6)原子的時頻參數γ=(s,u,v,w)和其投影值作為單個心跳周期心電信號的特征參數,實驗結果如圖12所示。

圖12 不同原子個數對系統識別率的影響
從圖12中可以觀察到取前3個原子的時頻參數和投影值可以獲得最好的識別效果,心跳識別率和系統識別率最高,隨著原子數目的增加,系統識別性能逐漸降低。
一個原子的波形是由其時頻參數 γ=(s,u,v,w)決定的,這4個參數對原子的波形的貢獻各不相同。原子的投影值反映了該原子在原始信號或者剩余分量所占的比例,對系統識別率也有一定的影響。下面實驗討論了原子不同參數對識別性能的影響,實驗中取前3個原子的特征參數,實驗結果如圖13所示。可以看到相位因子w對系統的影響不大,且表現出較大的隨機性,因此選取前三個原子時頻參數中的s,u,v以及投影值p作為單個心跳周期心電模板的特征參數。
SVM的核函數主要有線性核函數、Polynomial核函數、RBF核函數和sigmoid核函數。核函數的參數選取選用交叉驗證法進行自適應最優選取,實驗結果如圖14所示。

圖13 原子的不同參數選取對系統識別的影響

圖14 SVM核函數對系統識別的影響
從圖14可以觀察到,當選取線性核函數時識別效果最好,因此選取線性核函數作為SVM的核函數,并采用交叉驗證法對相關參數進行自適應最優選取。通過實驗本算法中參數設定為:選取前三個原子時頻參數中的s,u,v以及投影值p作為單個心跳周期的特征參數,SVM核函數選取線性核函數,算法在3個心電數據庫中測試性能如表2所示。

表2 FFT-MP心電特征提取算法在3個數據庫中的識別性能
心電信號與其他生物特征相比有著更高的安全性,不易偽造,有著較大的發展潛力。本文提出了基于FFT-MP的心電特征提取算法,主要包含預處理、特征提取和分類三部分。預處理消除噪聲和心率變異性的影響,并對提取的心電模板進行質量評估;選取單周期的心電信號經過FFT-MP稀疏分解后的前三個原子的時頻參數和投影值作為特征參數,構建SVM分類器完成身份識別。采用MIT-BIH心電數據庫對該算法進行驗證,獲得了較好的識別效果。
[1]Xiao Qinghan.Biometrics-Technology,Application,Challenge,and Computational Intelligence Solutions[J].IEEE Computational Intelligence Magazine,2007,2(2):5-25.
[2]Tsutomu Matsumoto,Hiroyuki Matsumoto,Koji Yamada,et al.Impact of Artificial“Gummy”Fingers on Fingerprint Systems[J].Proceedings of SPIE,2002,275-289.
[3]Nixon K,Aimale V,Rowe R.Handbook of Biometrics:Spoof Detection Schemes[M].Springer,2008,403-423.
[4]Kenneth R,MagalhaesD,TenreiroS.CognitiveBiometrics:Challenges for the future[C]//Braga:ICGS3 2010’6,2010:79-86.
[5]Kenneth R,Farzin D,Konstantinos S.Biosignals for User Authentication-Towards Cognitive Biometrics?[C]//Canterbury:2010 International Conference on Emerging Security Technologies,EST 2010,2010:71-76.
[6]Biel L,Pettersson O,Philipson L,et al.ECG Analysis:A New Approach in Human Identification[C]//Venice:IEEE Instrumentation and Measurement Technology Conference,2001:808-812.
[7]Wang Y,Plataniotis K N,Hatzinakos D.Integrating Analytic and Appearance Attributes for Human Identification from ECG Signal[C]//Baltimore:Biometrics Symposiums(BSYM),2006:1-6.
[8]Li Ming,Narayanan S.Robust ECG Biometrics by Fusing Temporal and Cepstral Information[C]//Istanbul:International Conference on Pattern Recognition ICPR’20,2010:1326-1329.
[9]楊向林,嚴洪,李延軍,等.基于小波分解和數據融合方法的ECG身份識別[J].航天醫學與醫學工程,2009,22(4):296-301.
[10]Platanioatis K,Hatzinaos D,Lee J.ECG Biometric Recognition without Fiducial Detection[C]//Baltimore:Biometrics Symposium BCC’06,2006:19-21.
[11]Mallat S,Zhang Z.Matching Pursuit with Time-Frequency Dictionaries[J].IEEE Trans on Signal Proeessing,1993,41(12):3397-3415.
[12]Arthur P L,Philipos C L.Voiced/Unvoiced Speech Discrimination in Noise Using Gabor Atomic Decomposition[C]//HongKong:Proc of IEEE ICASSP,2003:820-828.
[13]TarvainenM,Ranta-Aho P,Karjalainen P.An Advanced Detrending Method with Application to HRV Analysis[J].IEEE Trans Biomed Eng,2002,49(2):172-175.
[14]趙治棟,陳裕泉.廣義小波收縮消噪閾值選擇及應用研究[J].傳感技術學報,2007,20(3):601-605.
[15]紀震,鄭秀玉,羅軍,等.基于雙正交樣條小波的QRS波檢測[J].深圳大學學報理工版,2008,25(2):167-172.
[16]王立傳,陳裕泉.基于小波變換的QT檢測[J].傳感技術學報,2006,19(3):625-628.
[17]葉繼倫,鄭崇勛,黃燕.心率變化對心電信號各波間期的影響分析[J].生物醫學工程學雜志,1999,16(1):50.
[18]Sethares W A,Staley T W.Periodicity Transforms[J].IEEE Trans on Sig Proc,1999,47(11):2 953-2 964.
[19]Vapnik V N.Statistical Learning Theory[M].New York:Wiley,1998.
[20]The MIT-BIH Database.http://physionet.org/physiobank/database.
[21]尹忠科,邵君,Pierre Vandergheynst,等.利用FFT實現基于MP的信號稀疏分解[J].電子信息學報,2006,28(4):614-618.