王 銳,周作建,李 燦,李紅巖,郎許鋒,宋懿花
(南京中醫藥大學人工智能與信息技術學院,江蘇 南京 210023)
房顫(心房顫動)是一種不致命的心臟疾病,但它可能導致心臟功能不全、血栓形成或中風等嚴重后果。房顫常常伴隨心悸、心率不齊、氣短、胸痛等癥狀[2]。2015 年中國高血壓調查發現,大于35 歲的居民房顫患病率為0.7%,農村居民高于城市居民,分別為0.75%和0.63%[3]。因此,對于房顫患者而言,及早診斷和治療非常重要。根據房顫的持續時間,可將其分為三個階段:陣發性房顫、持續性房顫和永久性房顫[4]。
隨著科技的發展,利用計算機分析心電圖已成為目前最便捷的診斷手段之一。檢測心電信號的方法主要分為兩大類,即機器學習和深度學習。機器學習方法通常需要手動提取特征[5],當原始信號出現噪聲過多等情況時,手動提取的難度大大增加,此時端到端的深度學習算法的優勢就顯現出來[6]。深度學習算法通常比機器學習算法更具優勢。例如,卷積神經網絡(CNN)可以直接輸入原始心電信號,并自動從中學習特征,從而實現心律失常的自動檢測和診斷。如Zhao Renxing 等人將處理后的數據輸入到用卷積神經網絡構建的深度學習模型中,得到從心電信號中自動提取出的心房顫動特征,用五種交叉驗證策略來證明該模型的可操作性[7]。因此,目前利用計算機分析心電圖已經成為一種非常便捷和可靠的心律失常診斷手段。
本文使用的數據集可以分類為三種不同的數據標簽:非心房顫動(non atrial fibrillation),持續性心房顫動(persistent atrial fibrillation),陣發性心房顫動(paroxysmal atrial fibrillation)。將以上三類數據輸入模型中,為了增加神經網絡的復雜度和增強其學習能力,可以采用Swish 激活函數,并在卷積層之后使用Batch Normalization(BN)技術,可以將數據進行標準化。此外,在每一層輸入的時候加個預處理操作,將數據歸一化,以提高訓練效果;模型后端則使用了LSTM 網絡,引入了注意力機制,以調整不同特征的重要性,并能夠更好地處理長序列數據。
卷積神經網絡是一種深度神經網絡[7],通過對特征的提取,來實現對圖像的分類、分割等任務。卷積神經網絡是由隱含層、輸出層和輸入層三個基本結構組成的[8]。卷積神經網絡通過引入卷積層和池化層的結構,能夠更有效地提取圖像和語音信號中的特征,實現更高水平的分類和識別,得到一系列特征圖,并增強特征的不變性和泛化能力。池化層可以進一步減少特征圖的大小,同時保留重要的特征信息,全連接層可以將所有的特征信息進行匯總,最終輸出分類或回歸的結果。除了基本結構外,卷積神經網絡還有許多擴展和改進,這些擴展和改進能夠處理更復雜的問題。卷積層在深度學習模型中的本質是對輸入的數據進行特征提取以及強化處理。CNN 通常采用梯度下降等優化算法進行訓練,增加特征的多樣性[9]。卷積神經網絡優化的方式有很多種,如引入注意力機制、使用變形卷積等新技術,進一步提升了模型的性能和效果。
長短期記憶網絡是一種特殊RNN,1997 年由Schmidhuber和Hochreiter提出的[10]。它可以有效解決長序列訓練過程中易出現的梯度消失和梯度爆炸的問題[11],LSTM 結構中有記憶單元和輸入門、輸出門、遺忘門這三類門。這三類門都是邏輯單元,自身輸出不能被送入其余的神經元中,而是承擔在網絡的其余部分和記憶單元相接的邊際處設置權值,誤差函數選擇性的記憶反饋并且隨著梯度下降的過程修正參數[12]。LSTM 是一種循環神經網絡的變體,適合于處理時間序列數據[13]。LSTM 可應用于分類、預測和序列到序列的翻譯等任務,如股票價格預測、自然語言情感分析和語音識別等。此外,LSTM 還可以處理非常長的時間序列數據,廣泛應用于多個領域,表現出優秀的性能。
注意力機制的輸入通常是一組向量表示的信息,例如序列中的單詞或句子中的詞向量。通過注意力機制,模型能夠自適應地從輸入中選擇性地關注不同的信息,并且不需要事先確定關注哪些部分。其基本思想是在給定一組查詢和一組鍵值對的情況下,計算每個查詢與鍵的兼容性,將每個鍵的值乘以其對應查詢的權重,然后將所有乘積加起來得到最終輸出。在這個過程中,注意力機制將一組鍵值對映射到一組輸出向量,這些輸出向量捕捉了查詢與鍵的交互信息。其計算步驟可以分以下三步。
⑴相似度計算:計算每個查詢與每個鍵之間的相似度,這通常涉及到計算兩個向量之間的點積或者其他相似度度量方式。
⑵權重計算:將相似度轉換為對應的權重,這通常通過將相似度傳遞給softmax 函數來完成,softmax函數會將相似度轉換為概率分布,使得所有權重的和為1。
⑶加權求和:將每個鍵-值對表示為一個向量,使用權重向量對這些向量進行加權求和,得到最終的輸出向量。
本文的點積模型是一種常見的注意力機制模型,如圖1所示。其利用矩陣乘積計算,提高了計算效率,具有簡單、高效和易于解釋等優點,如式⑴所示。式⑴中qi表示查詢序列,ki表示鍵序列。
注意力機制在深度學習中的應用非常廣泛。例如,在機器翻譯任務中,注意力機制被用來對源語言句子中的每個單詞進行加權,以便更好地捕捉與目標語言句子的對應關系。在語音識別中,注意力機制可以用來對語音信號中的不同時間步進行加權,以便更好地捕捉與文本之間的對應關系。
本研究是將CNN 與LSTM 結合,建立一種新的深度學習網絡模型,通過數據預處理將CPSC 2021(2021 年中國生理信號挑戰賽)數據輸入本文所設計的網絡模型之中,利用CNN的多次卷積和池化操作提取心電數據的局部特征,將提取的特征輸入下一層的LSTM網絡,結合注意力機制對心電信號進行分類。
數據的采集分為兩個階段,第一階段一共719 條記錄,采集了10 名房顫患者(5 名陣發性房顫患者)和39名非房顫患者的數據,第二階段一共706條記錄,采集了37 名房顫患者(18 名陣發性房顫患者)和14 名非房顫患者的數據。
心電信號是人體的一種微弱生理信號,通常采集到的心電信號會伴隨有基線漂移、工頻干擾、肌電干擾等噪聲的影響[14]。常見的降噪方式有濾波降噪和小波降噪兩種。本文只進行簡單的濾波,采用小波變換的降噪方式,主要解決心電信號中基線漂移的問題。本文隨機選取了“data_104_23”號數據的20s信號數據進行預處理展示,如圖2所示。

圖2 心電信號預處理前后對比
心電信號具有一維的時序性,我們根據這一特點將LSTM 融入到CNN 網絡中,并引入注意力機制。就CNN 算法而言,它對心電信號的波形識別比較敏銳,LSTM 算法可以對心電信號中的時間序列特征進行深度挖掘,在不用進行繁瑣的超參數的調試下,記憶長期信息。而注意力機制的加入可以完成對模型的優化。本文所設計的具體結構如圖3所示。
江浙滬地區縣域鄉村旅游公路屬于我國縣域鄉村旅游公路的組成部分,并不能代表我國全部縣域鄉村旅游公路,關于縣域鄉村旅游公路選線適宜性的指標體系和評價模型還需要更深入的研究和探討。期待未來能夠不斷完善和健全縣域鄉村旅游相關的研究,為鄉村旅游業的發展提供一個積極、理想的載體。

圖3 本文模型結構圖
本文的模型利用CNN 提取心電信號中的特征,并通過LSTM 模塊對特征進行處理,最后采用點積注意力機制和softmax分類器進行分類識別。
具體地,CNN 模塊采用了三個卷積層,卷積核邊長設置為5,三層隱藏單元數分別設置為256、128 和64。在每個卷積層后使用批量歸一化BN,加快收斂速度,提高模型的泛化能力。Swish 函數被用作激活函數,以控制數據的幅度,避免數據幅度過度變化。為了防止過擬合,卷積層后加入了最大池化操作,對特征數據進行降維,然后輸入到LSTM模塊中。
在本文的模型中,經過CNN 模型生成的通道維數作為LSTM 輸入的特征維度輸入,設置dropout 為0.2,將隱藏單元數設置為64。使用tanh 作為激活函數,以實現對輸入數據的非線性變換,加快收斂速度,接著進行全局平均池化操作,將整個特征信息壓縮到一個數值上,減少模型的參數量,該層輸出后經過一個全連接層,將向量映射到指定輸出大小的向量空間,這樣可以進一步提取到數據的特征,得到模型的輸出。
最后,通過點積注意力機制對特征進行處理,實現特征的加權,在使用softmax 分類器進行分類識別時,softmax 函數將多個神經元輸出,并將結果映射到(0,1)區間,從概率論的角度來看,完成了多分類。然后,我們選擇具有最高概率的類別作為輸出結果,即將概率最大的類別作為輸入向量的分類標簽。完成對三種樣本數據的識別,實現原始信號的分類。本模型的設計采用了多種優化方法,使得模型具有更高的泛化能力和魯棒性,可以用于心電信號的分類和診斷。
實驗分所用的數據集為訓練集和測試集,其數據分布如表1所示。

表1 實驗數據分布
針對本文提出的網絡模型,引入混淆矩陣,并從中提取出四個指標Acc、F1、P、R,即分類準確率Acc、F1分數、精確率和召回率,其定義如下:
⑴分類準確率:
⑶精確率:
⑷召回率:
通過對本文所設計模型的反復訓練和網絡超參數的調整,輸出相應的三分類結果。本文采取將CNN、LSTM 與改進后的模型進行對比,改進后的模型是將CNN 與引入注意力機制的RNN 模塊的融合,對比的CNN 和LSTM 模型都是改進模型的子模塊。三個模型的對比結果如表2所示。

表2 模型結果對比
由表2 結果可知,本文所提出的模型在準確率為0.9771,F1 為0.9609,精確率為0.9765,召回率為0.9799。在準確率方面本文模型略低于LSTM 模型,但高于CNN 模型,在其他三個指標中,本文模型都優于其他兩個模型,且效果有顯著提升。從對比實驗的結果來看,本文提出的模型在準確率方面比CNN模型提高了0.89%,在F1 得分方面分別提高了12.54%、8.77%,在精確率方面分別提高了12.09%、8.33%,在召回率方面分別提高了9.61%、6.42%。可以看出,注意力機制的引入可以使網絡更加關注訓練數據中的關鍵特征,從而提高網絡的泛化能力,使其在處理新數據時表現更好。總體而言,將CNN 和LSTM 融合并加入注意力機制在一定條件下優于CNN 和LATM 單獨構造的分類模型的性能。
本文提出基于心電信號的房顫識別算法,利用心電信號的一維時序性特征,將卷積神經網絡和加入注意力機制的長短期記憶網絡進行融合,用于三分類的房顫信號識別。模型主要在CNN 模塊使用了Swish函數作為激活函數,以控制數據的幅度,避免數據幅度的過度變化。并在LSTM 中引入了點積注意力機制,減小運算量,提高了模型的準確性。在通過預處理的訓練數據上進行訓練,在測試集上進行了測試,通過對比其子模塊,該模型雖在準確率方面略低于LSTM模型,但綜合四項評價指標而言,其性能優于另外兩種模型。
本文提出的模型在以下幾方面還有提升的空間:①本研究所使用的數據量較大,在使用模型對數據進行訓練和驗證的時候花費的時間較長。②僅采用CPSC2021的數據集進行了實驗,并未在其他公開數據集和臨床真實數據中測試過性能。