999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

融合多標簽特征在心電異常事件分類上的應用

2022-09-28 09:55:06楊小童陳月明
計算機仿真 2022年8期
關鍵詞:特征實驗模型

楊小童,陳月明,楊 坤

(安徽醫科大學生物醫學工程學院,安徽合肥 230032)

1 引言

據國家心血管病中心組織編撰的《中國心血管病報告2018》顯示,中國心血管病患病率及死亡率仍處于上升階段,現有心血管病患者約有2.9億,占居民的疾病死亡構成的40%以上[1]。因此實現心血管疾病的檢測和防治顯得尤為重要。

心電圖能測量和記錄心臟的電活動,因其有效、簡單、無創、成本低而被廣泛應用于心血管疾病的診斷[2]。傳統的方法首先利用離散小波變換和Pan Tompkins算法等不同技術從ECG記錄中提取各種特征,然后采用支持向量機(SVM)[3]、隨機森林[4]等分類方法進行分類。因此,這些方法最關鍵問題在于特征的提取。目前已經有多種方法提取詳細的心電特征,如時域信息、高階統計、隱馬爾科夫建模等。但是,這些方法嚴重依賴于精心選擇的特性,因此使用這些方法很難處理多類分類任務。近些年來,隨著深度學習[5]在疾病診斷展現出強大的性能,應用深度學習在心電異常事件分析已經成為醫學領域的一個研究熱點。 Ozal Yildirim[6]提出一種新的基于深度雙向LSTM網絡的小波序列模型DBLSTM-WS用于心電信號分類,使用小波將心電信號分解成不同尺度的子頻帶作為輸入,實現了對五種心電異常事件的準確分類,小波網絡層的存在顯著提高了傳統網絡的識別性能。吳恩達等人[7]使用改進的34層殘差網絡模型進行12種心電異常事件檢測,神經網絡模型在測試集上的預測準確率表現甚至超過了6位心臟病專家。

然而,這些方法將多種心血管疾病的識別視為多類分類問題,其中多種異常被視為互斥類。

但在實際臨床中,并發多種心律失常是常見的。ML-KNN算法和LIFT算法[8]可以解決多標簽分類問題,但是沒有考慮標簽之間可能存在的相關性。因此,需要進一步識別標簽之間的相關性,而不是單獨處理每個標簽。此外,目前在心電異常分析領域大多使用單導聯或雙導聯心電信號,未能有效利用多導聯心電信號的結構信息。如李全池[9]、束偉偉[10]等的研究。

針對上述問題,本文提出了一種融合多標簽相關性特征的神經網絡心電異常識別方法。利用點互信息、皮爾遜相關系數、余弦相似度將心電數據集的標簽轉化為標簽相關性矩陣,使用卷積神經網絡對標簽相關性矩陣進行特征提取。從標簽相關性的角度增加多標簽心電異常信號提取的特征數量。根據多導聯心電信號的結構特征,使用逐通道卷積對各導聯信號提取標簽特征,從而減少參數量與計算量。

2 數據預處理

2.1 實驗數據

實驗使用的數據是天池杯“合肥高新杯”心電人機智能大賽的數據集,以此來驗證融合多標簽特征的神經網絡心電異常識別算法的有效性。實驗數據集概況如下表1所示。

表1 實驗數據集概況

表1表示實驗數據集的基本信息,其中T表示樣本總數,L1表示樣本標簽總數,L2 表示標簽類別總數,VA表示數據集的平均標簽數,VS表示樣本最少標簽數,VB表示樣本最多標簽數。

圖1 心電波形

每個樣本有8個導聯數據,分別是I,II,V1,V2,V3,V4,V5和V6,同步采集10秒的心電波形,采樣頻率為500 Hz,單位電壓為4.88mV。每導聯有5000個采樣點,故樣本由[5000,8]的二維矩陣構成。

1)本文將24106份數據隨機打亂后,采用5折交叉驗證。將原始數據分成5組,將每個子集數據分別做一次驗證集,其余4組子集數據作為訓練集,用5個模型最終在驗證集上的分類準確率的平均值作為5折交叉驗證的性能指標。

2)為了對心電信號異常判斷更加全面,將8導聯數據拓展至12導聯。新增的4導聯數據可由式(1)~(4)計算得到。

III=II-I

(1)

aVR=-(I+II)/2

(2)

aVL=I-II/2

(3)

aVF=II-I/2

(4)

2.2 心電信號降噪處理

心電信號采集過程中通常會受到電力線干擾、基線漂移、電極運動偽影、儀器等干擾,因此必須去除心電信號的噪聲[11]。原始心電信號的波形圖2所示,心電信號的能量主要集中在0.1-35Hz,是一種低頻信號,其中占頻譜最大分量的是QRS波群,匯集在5-15Hz處。

1)小波軟閾值降噪。原始心電信號存在一定的噪聲。由于頻帶重疊,無法使用傳統的傅里葉變換去除,而小波變換在非平穩信號的時頻域分析上具有十分顯著的效果。選擇db8小波將含噪音的心電信號進行8層小波變換分解。使用極大極小閾值和使小波系數整體連續性較好的軟閾值函數進行濾波,最后將處理后的各尺度系數進行重構得到降噪后的心電信號,重構的信號如圖3所示。

2)為了加快神經網絡模型收斂,使用Z-score方法將心電信號進行歸一化處理。

圖2 原始信號

圖3 小波降噪后的心電信號

3 傳統特征提取和標簽相關性矩陣

3.1 傳統特征提取

為了避免干擾對心電信號造成的影響,本文使用預處理后的信號進行8尺度小波變換后,采用4尺度的細節信號對 R波峰值點定位及QRS波的檢測。

1)R波峰值點。4尺度小波系數中的12個正極值是R波峰值點。為了保證數據的準確性,本實驗中R波峰的取值點去掉12個正極值的第一個和最后一個。

2)心拍劃分。心電數據采樣頻率為500Hz,以心率為60~100次/分鐘為準,則一個心拍的采樣點數在300-500之間。使用R波峰分割心拍,1)中得到的10個R波峰值點的幅值的中值作為基點,R波峰向前200個采樣點,R波向后250個采樣點,將這450個采樣點的數據截取出來,作為一個心拍樣本,則單個導聯有10個心拍。

3)其它特征值提取。在劃分的心拍中使用差分閾值法檢測QRS波群、P波、T波等。再通過交叉計算,得到相應的特征。本文需要計算的傳統特征值有P、Q、R、S、T幅值,RR、PR、PJ、QT、QRS、ST、PP間期值。具體各傳統特征值在心電圖上的表示如圖4所示。

圖4 心電傳統特征值表示

3.2 標簽相關性矩陣

根據數據的潛在特征設計對應的數學模型能夠有效地提高模型的性能,為了將多標簽之間的關聯性融入模型中,必須衡量不同標簽之間的關聯性。

圖5是各樣本標簽之間的關系圖,橫、縱坐標均為各心電異常類別,顏色越深代表標簽之間的相關性越強。從圖3中可得出對應多個心電異常事件的同一段心電信號,不同的心電異常事件之間存在一定的關聯性。因此,患有某種心血管疾病的患者往往有很大可能同時患有另一種心血管疾病。

圖5 心電異常相關性

本文使用了點互信息(PMI)、皮爾遜相關系數、余弦相似度評估兩兩標簽之間的相似度。

1)點互信息

PMI從統計的角度發現詞語共現的情況,從而分析出詞語間是否存在語義相關或者主題相關的情況。本文使用PMI計算兩兩標簽之間的關聯程度。PMI>0,兩統計量是相關的;值越大,相關性越強;PMI<0,兩統計量是不相關的,互斥的;PMI=0,兩統計量獨立,不相關也不互斥。PMI計算方法如式(5)所示。

(5)

其中p(x)表示標簽x出現的概率,p(y)表示標簽y出現的概率,p(x,y)表示標簽x和標簽y共同出現的概率。

2)皮爾遜相關系數

皮爾遜相關系數用于度量兩個向量組之間的關聯性,皮爾遜系數介于-1和1 之間,-1、0、1分別表示完全負相關,不相關和完全正相關。皮爾遜系數的計算方法如式(6)所示。

(6)

3)余弦相似度

余弦相關度是指兩個向量之間夾角的余弦值,可以衡量兩個向量之間的差異,余弦相似度的計算方法如式(7)所示

(7)

其中,x,y表示兩個標簽,·表示點積,表示向量x的L2范數。

類別標簽向量使用one-hot編碼,得樣本標簽矩陣LT*55,T表示樣本總數,分別計算某一列與其它列之間的PMI、皮爾遜系數和余弦相似度,可以得到的標簽相關性矩陣S55*55。

圖6 多標簽相關性矩陣

4 神經網絡模型搭建與訓練

4.1 神經網絡模型

多標簽分類問題與單一標簽問題區別在于訓練樣本存在一個或者多個標簽,假設X=d表示輸入樣本有d維特征空間,Y={y1,y2,…,yq}表示所有類別標簽集合,共有q個類別標簽。通過訓練集D={(xi,Yi)|1≤i≤n}訓練樣本得到分類器f:X→2Y,其中xi∈X是輸入空間X的訓練樣本,Yi∈Y是xi的類別標簽集合,最終通過分類器f得到測試樣本的所屬標簽集合[12]。

融合多標簽特征在心電異常預測模型如圖7所示。心電異常預測模型主要分為輸入層,特征提取層,特征拼接層,全連接層和sigmod分類器。輸入層包含四個部分,分別為心電信號傳統特征,降噪后的原始心電信號,數據集的標簽特征,樣本的年齡、性別個體特征。通過卷積神經網絡和長短時記憶網絡將特征提取輸出到特征拼接層,在特征拼接層將所有的特征融合起來,經過全連接網絡輸出到sigmod分類器,可以得到關于心電信號和心電異常的關系映射。

圖7 心電異常預測模型

4.1.1 卷積神經網絡

卷積神經網絡可以提取心電信號的局部特征。相對于全連接網絡而言,卷積神經網絡減少了訓練過程中的參數量,一定程度上也避免模型過擬合。本文使用多個大小不同的卷積核對心電信號進行特征提取,可以得到多個大小不同的特征向量,可以對多導聯心電信號進行特征表示。

池化層對卷積層特征進行采樣,降低特征數量,進一步降低參數數量,本文提出的模型選用最大池化操作,通過對局部區域取最大值對數據進行壓縮。

考慮各導聯結構的相似性,本文在使用CNN提取心電特征時,方法如下:

1)提取各導聯心電特征。結合深度可分離卷積中的逐通道卷積思想,卷積層使用相同的卷積核,一個卷積核負責一個通道,一個通道只被一個卷積核卷積,如圖8左側部分所示。將12導聯視為12通道,每一通道分別使用相同的卷積核和池化方法進行操作,最后輸出12張特征圖。

2)12導聯心電特征融合。結合二維卷積多通道卷積思想,使用1*1*12的卷積核對 1)中輸出的12張特征圖做卷積操作,最終輸出一張特征圖,如圖8右側部分所示。

圖8 神經網絡結構圖

4.1.2 長短時記憶網絡

LSTM可以提取心電信號的時序特征,是一種改進之后的循環神經網絡,相對于RNN,LSTM的神經元加入了輸入門i、遺忘門f、輸出門o和內部記憶單元c,這些部分共同控制神經元的輸出h的設計,使得整個網絡更好地把握序列信息之間的關系[13]。

圖9 LSTM神經元結構圖

4.1.3 超參數設置

1)損失函數。從表1可以看出,實驗使用的數據集存在嚴重的樣本分布不均衡的問題。部分類別的樣本數量極少,模型在訓練的過程中很難提取規律。且即使得到分類模型,也容易因過度依賴有限樣本而產生過擬合,當樣本應用到新數據上時,模型的準確性和魯棒性將會很差。因此根據每一類標簽的樣本數量,在損失函數BCELoss中對不同標簽進行加權求損失值,能夠有效的解決樣本分布不均衡的問題。樣本標簽的損失值權重計算方法如式(8)所示,加入權重后的損失函數計算方式如(9)所示。樣本數量越大的標簽損失值對應的權重越小。

wi=1/(log(ci+1))

(8)

(1-y′i)*log(1-yi)]

(9)

2)激活函數。通過特征融合的方式可以同時利用不同神經網絡的各自特點,獲得不同層次上的心電信息特征,提高分類效果。本文采用合并拼接的融合方式形成包含信息豐富的特征向量,最后使用sigmod分類器,sigmod分類器計算公式如式(10)所示。

F(M)=1/(1+e-M)

(10)

函數返回向量M屬于各個類別標簽的概率,概率值在[0,1]之間,本實驗選取的閾值為0.5,如果標簽的概率大于0.5,則認為屬于該類別。

4.2 模型參數設置

本實驗搭建的神經網絡模型結構參數如表2所示。為了避免神經網絡過擬合的問題,在神經網絡中加入丟棄層(Dropout),丟棄概率P設置為0.5時。除此之外,還增加了BN(Batch Normalization)層。BN層對每一層網絡的輸出做歸一化處理,使其服從標準的正態分布,可以阻止網絡中每一層的輸入分布發生改變。

表2 模型結構參數

4.3 模型訓練

本文使用pytorch1.0 框架。通過多次實驗,選擇最優的實驗參數。選擇Adam優化器優化神經網絡,學習率為 1e-3;設置迭代次數為1000次,批大小設置為256,使用提前停止的方法訓練神經網絡。

5 模型評估

5.1 模型評價標準

本文使用四個性能評價指標衡量模型訓練的結果,分別是精準率P、召回率R、F1 值,漢明損失HL,計算方法如式(11)~(14)所示。

(11)

(12)

(13)

(14)

其中,TP表示真正例,FP表示假正例,FN表示假負例,|D|表示樣本總數,|L|表示標簽總數,xi和yi分別表示真實標簽和預測的標簽結果,xor表示異或運算。在P、R、F1、HL四個評價指標中,P、R、F1 值越大,模型性能越好,HL值越小,模型性能越好。

5.2 實驗結果與討論

本實驗的基線模型設計為僅使用神經網絡從傳統特征提取特征的模型(T-NN)。

1)為了驗證神經網絡從全部心電信號提取的特征對心電異常事件預測的有效性,設計加入CNN和LSTM并行模型提取的特征(T-AN)實驗。

2)為了驗證多標簽相關性特征對心電異常事件預測的有效性,設計加入PMI多標簽特征(T-AM),加入皮爾遜系數多標簽特征(T-AP),加入余弦多標簽特征(T-AC)三組實驗。

1)和 2)實驗結果如表3所示。

表3 實驗結果1

3)通過表3可知,模型中融合神經網絡從全部心電信號提取特征和多標簽相關性特征均提高了心電異常事件預測的正確性。因此設計神經網絡從全部心電信號提取特征模型分別和加入PMI的多標簽特征(T-AN-AM),加入皮爾遜系數的多標簽特征(T-AN-AP),加入余弦多標簽特征(T-AN-AC)三組實驗。實驗結果如表4所示。

表4 實驗結果2

上述實驗結果表明,將神經網絡從全部心電信號提取的特征和多標簽相關性特征加入到模型中,均可以提高心電異常事件預測的準確性,F1值分別提升至87.60和90.45,比基線模型(T-NN)分別提升2.12%和4.98%。其中本文提出的融合神經網絡特征和多標簽特征的模型(T-AN-AC)在四個評價指標上性能最好,F1最高達到91.64,比基線模型(T-NN)提升了6.17%。

對T-AN-AC模型的實驗結果進行進一步分析,比較了數據集中不同類別的F1值差異,如圖10所示。縱軸表示測試集中每個類別標簽的分類效果,橫軸表示類別標簽。

圖10 各心電異常F1值

6 總結

1)本文對多標簽的心電異常事件建模方法進行了深入的研究。使用小波變換實現心電信號特征點定位和波形檢測。相比較基于傳統特征的心電異常分類器準確率有了明顯的提升。

2)相比較其它工作的研究,本模型并未采用深度神經網絡采用深度殘差神經網絡等方法,依靠增加網絡深度和參數數量來提升模型性能,而是從心電數據的內在特征出發,設計出符合心電特征的神經網絡模型。本模型極大降低了參數數量和訓練時間,并且具有較高的分類準確性,分類的精準率、召回率、F1和漢明損失分別達到92.12、91.16、91.64、0.0192。

3)然而并未深入研究心電異常事件背后的致病機理與心電波形的關系,在后續研究中,會對心電異常事件預測病理進行研究,并與心電信號的波形結合起來,選擇與疾病相關度更高的心電特征,研究其中的內在聯系。

猜你喜歡
特征實驗模型
一半模型
記一次有趣的實驗
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
做個怪怪長實驗
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
3D打印中的模型分割與打包
NO與NO2相互轉化實驗的改進
主站蜘蛛池模板: 亚洲欧美日韩天堂| 日本精品一在线观看视频| 国产日韩丝袜一二三区| 亚洲精品国偷自产在线91正片 | 亚洲日韩日本中文在线| 91精品国产丝袜| 久久狠狠色噜噜狠狠狠狠97视色| 怡春院欧美一区二区三区免费| 91毛片网| 成人午夜免费观看| 91毛片网| 国产精品嫩草影院视频| 91精品国产综合久久香蕉922| 欧美日本在线播放| 九九线精品视频在线观看| a级免费视频| 福利在线不卡| 国产剧情一区二区| 亚洲国产亚综合在线区| 国产综合另类小说色区色噜噜| 国产成人高清亚洲一区久久| 欧美亚洲国产日韩电影在线| 高清无码一本到东京热| 亚洲天堂网2014| 国产91九色在线播放| 最近最新中文字幕免费的一页| 国产区人妖精品人妖精品视频| 国产精品福利一区二区久久| 日韩精品一区二区三区免费| 亚洲一区精品视频在线| 欧美一区二区自偷自拍视频| 久久无码免费束人妻| 亚洲中文在线视频| 精品自窥自偷在线看| 制服丝袜亚洲| 看你懂的巨臀中文字幕一区二区| 国产激情无码一区二区三区免费| 亚洲无码视频喷水| 亚洲精品无码AV电影在线播放| 国产综合色在线视频播放线视| 久久精品丝袜| 亚洲免费人成影院| 9999在线视频| 日日噜噜夜夜狠狠视频| 国产亚洲视频在线观看| 免费看一级毛片波多结衣| 亚洲A∨无码精品午夜在线观看| 2021国产精品自拍| 久久久久人妻一区精品色奶水 | 国产美女视频黄a视频全免费网站| 乱人伦中文视频在线观看免费| 欧美特级AAAAAA视频免费观看| 狠狠躁天天躁夜夜躁婷婷| 九色在线观看视频| 久久这里只有精品国产99| 免费va国产在线观看| 熟女日韩精品2区| 98超碰在线观看| 国产精品亚欧美一区二区| 精品无码专区亚洲| 欧美精品在线看| 亚洲国产成人精品无码区性色 | 无码人中文字幕| 国产精品成人久久| 在线无码九区| 日韩无码视频播放| 伊人久久大线影院首页| 欧美特黄一级大黄录像| 国产女人18毛片水真多1| 欧美人人干| 久久这里只精品国产99热8| 亚洲A∨无码精品午夜在线观看| 欧美日本在线| 日韩成人免费网站| 国产成人亚洲毛片| 亚洲第一中文字幕| 国产真实二区一区在线亚洲| 黄色福利在线| 国内精品免费| 老色鬼欧美精品| 日本不卡在线播放| 免费在线a视频|