石 屹,金登男
(華東理工大學 信息科學與工程學院,上海 200237)
心電圖(ECG)是檢驗心血管疾病的一種很有效的方法,伴隨著計算機技術的發(fā)展,計算機輔助心電信號檢測已經逐漸融入到了醫(yī)生的日常診斷過程中。ECG模式分類主要的兩個部分是特征提取和分類,大多數的ECG 特征提取可以通過傅里葉變換[1]等方法獲得較準確的頻域信息[2-3]和時域信息[4],但是這種方法對于心電波形的形態(tài)特征提取的效果較差,提取的特征向量不能準確的反應出波形的形態(tài)特征,并且容易受到噪聲的干擾。基于Hermite函數的ECG 特征提取方法[5]雖然可以在高階的Hermite函數下達到較好的效果,但是由于函數的階數較高和時間較長等因素還需要進一步改善。KPL 特征提取[6]、小波分析[7]和基于向量機分類[8]方法雖然各有特點,但從準確性和抗干擾性上都存在不足[9]。不確定性推理模型[10]等基于知識模型的應用為獲取診斷過程中隱含和潛在的知識提供了有效途徑。但是,領域知識完整性和不確定性問題仍然是此類方法研究中的難點。本文提出了一種新的心電信號波形形態(tài)的特征提取方法,目標是準確的提取心電波形的形態(tài)特征,并且減小噪聲帶來的干擾。結合之前做過的心電信號形態(tài)特征[11]以及神經網絡分類[12]的研究,論文針對心電信號分段結合貝塞爾曲線來提取心電信號的特征,大大提高了心電信號特征提取的準確度和效率,并且使用自組織神經網絡針對提取的特征進行分類,把形態(tài)相似的波形聚合到一起,達到了較好的效果。
ECG 是使用心電采集儀器(如心電監(jiān)護儀)記錄人體心臟電位變化,并據此應用于臨床心臟疾病監(jiān)護、診斷的可見圖形記錄,主要分為P 波、QRS 波、ST 波和U 波(見圖1)。P波位于一次心動周期的開始,表示心房除極過程。QRS波群是主要結構,反映心室除極全過程。T 波反映了心室快速復極。PR 段、PR 間期、ST 段、QT 間期等則反映了心臟各項功能交替的時間。

圖1 心電信號波形
ECG 屬于典型的視覺信息,醫(yī)學專家對其判讀的過程中融入了大量經驗知識。醫(yī)生們主要依據是ECG 波形的形態(tài),主要是P波段、QRS波段和ST 段來進行診斷的。
心電信號數據庫:MIT-BIH 心率失常數據庫包含有48組30分鐘的心電圖記錄。每條記錄包含兩個導聯(lián)的數據,采樣頻率為360Hz。MIT-BIH 數據庫包含10 萬條以上心拍,且每個心拍都經過兩位及以上專家獨立標注,MITBIH 數據庫包括了基本上全部類型的心電信號波形,并且噪聲相對較少,可以使用濾波算法對噪聲較大的波形先進行預處理,過濾出高頻的噪聲信號,對波形的整體形態(tài)不會有很大的影響。
本文的實驗將主要針對MIT-BIH 數據庫進行。
基于貝賽爾曲線的分段特征提取分為三個部分,一個是波形的分段,然后對分段的波形進行貝塞爾特征提取,最后把分段信息和貝塞爾特征提取的信息結合起來作為ECG的波形特征。對波形分段的是為了降低波形的復雜程度,這樣在做貝塞爾特征提取的時候可以達到更高的精確度并且獲得更快的速度。
ECG分段分為兩個步驟:首先,根據醫(yī)學上的概念進行ECG 波段的分割;然后基于波段分離基礎上的貝塞爾曲線分段,這樣可以獲得更快的特征提取速度以及精確程度。
按照醫(yī)學上的波形分段把波形分成P 波、QRS波以及T 波。分段可以使用麻省理工學院提供的ECGPuwave工具[13]。P波和T 波作為一次心跳的起始波和恢復波,其標準形態(tài)比較簡單,而QRS波則相對復雜,下面主要就QRS波的分段及特征提取來介紹基于貝塞爾曲線的特征提取。
QRS波段的基本形態(tài)如圖3的實線部分??梢灾苯邮褂迷嫉腝RS波段進行貝塞爾特征提取,但是因為QRS波段的頻率較高,很大程度上的影響到了波形特征提取的效果。針對這樣的情況,對QRS波段再進行分段來提高貝塞爾特征提取的效率和精確程度。
假設圖2的實線波形為QRS的標準波形,對現有的波形進行濾波和歸一化處理后都可以近似達到這樣波形形態(tài)。對波形進行變化率分析(圖2虛線)后可以得出波形高頻分量的集中位置,結合原始波形數據,根據差值原則取R點周圍導數為零的點為分割點,把波形分成4段(見圖3)。然后根據貝塞爾特征提取的原理,分別對4段波形進行特征提取。


2.2.1 貝塞爾曲線
貝塞爾曲線是圖形學和數值分析中常用的參數曲線,它根據曲線的首末點和中間的控制點來構成曲線。其中起重要作用的是位于曲線中央的控制線。這條線是虛擬的,中間與貝塞爾曲線交叉,兩端是控制端點。移動兩端的端點時貝塞爾曲線的曲率(彎曲的程度)也會發(fā)生對應的變化,移動中間點時,貝塞爾曲線在起始點和終止點鎖定的情況下做均勻移動。
任意一條m 階的貝塞爾曲線可以用如下的方程描述

式中:q(ti)——ti點對應的插值,m——貝塞爾曲線的階數,Pk——第k個控制點。如果要在首末點插入n個插值點,那么參數ti就需要均勻的分成n-1段間隔,并且每段間隔的ti值都要在0到1之間。因此,三階貝塞爾曲線的方程如下

傳遞首尾點的值(P0和P3),擬合后得到曲線中間的控制點(P1和P2),由此來確定曲線的形態(tài)。因為分段后的心電信號特征去除了頻率變化率較大的波形的干擾,針對每段的曲線,可以使用貝塞爾曲線對每一段進行擬合,從而提取曲線的控制點并整合作為波形的特征。
2.2.2 最小二乘法貝塞爾擬合
對于貝塞爾擬合的輸入數據,可以把輸入的第一點和最后一點作為擬合的第一個和最后一個控制點,也可以通過定義初始的分割點可以把輸入分割成段來處理。擬合的目標是使用最小二乘法確定三階貝塞爾曲線的中間控制點P1和P2。使用最小二乘法可以求出使擬合曲線和原始曲線誤差最小的控制點的位置。對于曲線上的n個點,pi和q(ti)分別是原始數據和擬合數據,最小二乘法可以表示如下

帶入三階貝塞爾曲線方程,可得

其中P1和P2滿足

設參數

則可求出貝塞爾曲線的控制點

求出貝塞爾曲線的控制點后,可以使用控制點來擬合原始的心電信號波形。
假設心電信號的原始波形為O={p1,p2,…pn}我們使用三階貝塞爾曲線進行擬合。輸入為心電信號的分割點和最大允許的誤差,心電信號根據分割點來確定分段的個數,對每一段都使用三階貝塞爾曲線進行擬合,生成擬合的曲線數據Q={q1,q2,…qn},然后使用最小二乘法測量原始數據和擬合數據的誤差,迭代進行直到誤差達到標準范圍內。
擬合的過程中使用分割擬合的策略。當三階貝塞爾擬合不能達到標準誤差范圍內,則自動對原始的數據進行分割,自動增加分割點,再對分割后的數據進行擬合,直到擬合的數據達到標準誤差范圍內。
自組織神經網絡(self-organization mapping net)是基于競爭式學習的一種網絡,它是一種無指導的聚類方法。它的基本特點是在樣本群中競爭尋找相似的特征、規(guī)則或是聯(lián)系,然后再將這些有共同特色的樣本聚集成同類。假設輸出神經元之間互相競爭,在競爭的神經元中,只有一個最終會被激發(fā),而其他的神經元將會被抑制,然后在下一輪競爭中,之前被激發(fā)的神經元才會進行調整(學習),被抑制的神經元保持不變,最終產生穩(wěn)定的分類網絡。自組織神經網絡的拓撲結構如圖4所示。

圖4 自組織神經網絡基本結構
輸入層神經元和輸出層的神經元相互連接。輸入神經元的個數由輸入個數決定,輸出層的神經元要根據實際情況來指定。一般來說,輸出層的神經元個數遠多于輸入層的神經元個數。
自組織神經網絡聚類的方法是為輸入神經元和輸出神經元找到最佳的匹配,最佳匹配的輸出神經元和樣本特征之間距離最小。即若第n個樣本的獲勝單元為i,則有

式中:Xn——第n個輸入樣本向量,Wj——第j個輸出神經元的相連的權向量。
SOM 網絡的學習算法過程如下:
(1)網絡初始化。對輸出層每個節(jié)點權重Wj賦初值,定義結束條件。
(2)將訓練數據樣本的特征值逐一輸入自組織神經網絡,對每一個樣本執(zhí)行步驟3~6。
(3)計算輸出層和輸入層之間的神經網絡節(jié)點距離。
(4)修改神經網絡節(jié)點的權值。
(5)調整網絡結構,降低鄰域大小。
(6)迭代結束,檢查推出條件(達到最大迭代次數),否則重復步驟2。
心電信號實驗數據取自MIT-BIH 心律失常標準數據庫,數據庫中共有48組病人的心電信號,包含了幾乎所有種類的心電信號數據。這些心電信號的記錄中通常會摻雜一些噪聲,對數據處理帶來了困難。本實驗的心電信號對象是以R 峰為標志的前后200個采樣點,共112605 段波形,這些采樣點波形已經包含了心電信號的所有形態(tài)特征。
首先使用小波分析對波形進行濾波處理,過濾掉心電信號的高頻噪聲。然后使用MIT 提供的ECGPuwave方法選取出每段波形QRS波。
針對QRS波段的R點,分別計算R點周圍距離最近的極值點。在計算極值點的過程中有可能受到噪聲信號的影響,比如對于圖5中灰色的波形的T 波處,突然的高頻噪聲對波形的形態(tài)產生了影響,因此在判斷極值點的過程中要結合平滑函數來計算極值點。本實驗在計算極值點的過程中采用5點平均法平滑R點周圍的數據,當確定了距離R點最近的極值點后恢復成原始波形。此方法保證了心電信號分段的準確性,在之后的三階貝塞爾擬合的過程中使用原始的波形又可以確保波形形態(tài)特征的準確性。

圖5 5點平均處理的心電信號
完成心電信號的分段之后使用三階貝塞爾函數分別對每段波形進行特征提取。貝塞爾擬合的輸入為分段波形信號。因為之前的分段已經保證了每段的心電信號的形態(tài)相對單一,因此貝塞爾擬合函數不需要額外的增加分割點。
使用三階貝塞爾函數進行特征提取的結果如圖6所示,可以看出根據特征點還原的波形和原始波形基本相同,折線為波形控制點連線。使用三階貝塞爾曲線擬合之后,原始波形的誤差被有效的抑制,而且控制點很好的表述了波形的形態(tài)信息。因此三階貝塞爾擬合的特征提取達到了很好的效果。

圖6 三階貝塞爾擬合
采用三階貝塞爾函數對5000個心電信號波形采樣進行分段擬合,最終得到擬合的均方誤差如圖7所示,可以看出三階貝塞爾函數對心電信號分段擬合達到了很好的效果。

圖7 貝塞爾擬合均方誤差
提取三階貝塞爾擬合的控制點的24個特征,使用自組織神經網絡進行分類。把24個特征作為神經網絡輸入,映射到6*6的二維輸出上。使用Hextop作為自組織神經網絡的拓撲結構,設置初始的鄰域足夠大,使神經網絡有足夠的空間訓練調整。使用自組織神經網絡對心電信號分類的結果如圖8所示。

圖8 自組織神經網絡分類
通過擴大自組織神經網絡的輸出神經元可以映射更多的聚類中心,從而達到更好的分類效果,但是另一方面,過多的輸出也會對醫(yī)生的識別造成困難,6*6的輸出作為類別數和準確度的權衡,在現階段達到了很好的效果。
通過對醫(yī)學專家診斷心電圖的思維過程和統(tǒng)計學的分析,本文提出了一種以醫(yī)生經驗為基礎,基于心電信號分段特征提取的方法,結合三階貝塞爾函數和自組織神經網絡的心電信號分類方法。從MIT-BIH 數據的實驗結果來看,分段提取的貝塞爾特征可以很好描述心電信號的特征,結合自組織神經網絡可以達到較好的分類效果。
與已有的心電信號模式分類方法相比,本文的創(chuàng)新在于:第一,重視統(tǒng)計數據和經驗知識在計算機中的表示;第二,突破了心電信號模式分類器特征表示方式單一的局限,使用分段的方式更加準確的描述心電信號的特征,構造出了更有效的心電信號特征空間。第三,研究工作面向實際應用,具有明確的背景和真實的臨床數據支持。
本文提出的方法是分類模型中引入形態(tài)特征的初步嘗試。在接下來的工作中,我們將繼續(xù)圍繞實際心電信號診斷過程,重點考慮經驗知識在計算機的表達和表示,從而進一步完善心電信號波形的分類。
[1]SHANG Yu,XU Ting,HE Yonghui.The applications of the fractional fourier transform in the ECG processing[J].Electronic Science and Technology,2011,24(8):116-118(in Chinese).[尚宇,徐婷,何永輝.分數階傅里葉變換在心電信號處理中的應用[J].電子科技,2011,24(8):116-118.]
[2]WANG Liping,ZHU Jiangchao,SHEN Min.An electrocardiogram classification method combining morphology features[C]//Chongqing:Pattern Recognition,2010:1-5(in Chinese).[王麗蘋,朱江超,沈蜜.一種結合形態(tài)特征的心電圖模式分類方法[C].重慶:全國模式識別學術會議,2010:1-5.]
[3]Kuo Kuang Jen.ECG feature extraction and classification using cepstrum and neural networks[J].Journal of Medical and Biological Engineering,2007,28(1):31-37.
[4]Mahesh A Nair.ECG feature extraction using time frequency analysis[M].Germany:Springer,2010:461-466.
[5]Park K S,Cho B H,Lee D H.Hierarchical support vector machine based heartbeat classification using higher order statistics and hermite basis function[J].Computers in Cardiology,2008,14(3):229-232.
[6]LI Xuehua,MO Zhiwen,SHU Lan.The research of KPL feature extraction method for ECG recognition[J].Microcomputer Information,2009,1(27):3-5(in Chinese).[李學華,莫智文,舒蘭.KPL特征提取在心電識別中的應用研究[J].微計算機信息,2009,1(27):3-5.]
[7]Llamedo Soria M.An ECG classification model based on multilead wavelet transform features[C]//Durham,NC:Computers in Cardiology,2007:105-108.
[8]JIANG Xing,ZHANG Liqing,ZHAO Qibin,et al.ECG arrhythmias recognition system based on independent component analysis feature extraction[C]//IEEE Region 10Conference TENCON.Hong Kong:IEEE Press,2006:1-4.
[9]Karpagachelvi S.ECG feature extraction techniques a survey approach[J].International Journal of Computer Science and Information Security,2010,8(1):76-82.
[10]WANG Liping,SHEN Mi,TONG Jiafei,et al.A uncertain reason method for abnormal ECG detection[C]//IEEE International Symposium on IT in Medicine &Education.JiNan:IEEE Press.2009:1091-1096.
[11]ZHAO Xudong,JIN Dengnan.Extraction method based on construction operator and morphological characteristics of waves[J].Computer Era,2007(12):1-3(in Chinese).[趙旭東,金登男.基于結構算子的波形形態(tài)特征提取方法的研究[J].計算機時代,2007(12):1-3.]
[12]WANG Jinjun,JIN Dengnan.Research on pattern classification of DCG based on NN[J].Computer Applications and Software,2006,23(3):83-85(in Chinese).[王進軍,金登男.應用神經網絡的理論對動態(tài)心電信號模式分類的研究[J].計算機應用于軟件,2006,23(3):83-85.]
[13]MIT-BIH ECGPuwave Tool[EB/OL].[2010-01-01].http://www.physionet.org/physiotools/ecgpuwave/.