吳柯薇 白 玫*
世界上約有6%的成年人患有冠心病(coronary heart disease,CHD),冠狀動脈粥樣硬化會導致血管閉塞從而危機生命[1]。隨著我國老齡化情況不斷加重,全國范圍內CHD患者明顯增多,CHD已經成為威脅人們身體健康的主要疾病之一。冠狀動脈造影作為診斷冠狀動脈狹窄的金標準,因其有創,風險大,檢查費用高,目前不作為臨床診斷CHD的首選。隨著CT硬件技術的不斷更新和CT血管造影(computed tomography angiography,CTA)技術的普及,冠狀動脈CT血管造影(coronary computed tomography angioplasty,CCTA)技術在CHD的診斷過程中應用越來越廣泛。
近年來,卷積神經網絡(convolutional neural networks,CNNs)作為深度學習(Deep learning)的一種技術備受關注,該技術已經被廣泛地應用于一系列復雜的圖像處理案例中,例如圖像識別,圖像分類和目標檢測[2]。CNNs不用人工提取圖像特征,而是自主學習輸入圖像的特征,從第一次成功應用于肺結節的檢測后,已經被廣泛應用于醫學圖像處理的各個領域[3]。
本研究為了提高分析的效率和準確率,通過深度學習技術,構建冠狀動脈CTA圖像斑塊識別模型。對已有的常規圖片識別模型進行遷移學習,對模型進行預訓練和微調,從而提升模型對于醫學圖像的特征提取能力,進而獲得更好的精度,達到可應用于臨床計算機輔助診斷的要求,為診斷醫生精準的判斷提供參考[4]。
建立殘差網絡(residual network,ResNet)模型對CCTA圖像有無斑塊進行識別。使用ResNet模型對冠狀動脈CTA圖像進行自動分類,該模型主要分為源數據的預訓練、遷移學習、目標數據的微調訓練、模型性能的檢驗等內容。模型流程見圖1。

圖1 模型流程圖
卷積神經網絡的結構在特征學習中至關重要,常規認為網絡設計的越深越好,但實際網絡越深會遇到更多問題,主要問題是梯度消失和梯度爆炸[5]。將最新一代卷積神經網絡(深度殘差神經網絡,ResNet-152)[6]引入殘差連接,能夠在深層次的卷積神經網絡訓練時解決其性能退化問題。而殘差連接可以加速深度網絡的收斂,并通過大幅度提高網絡深度來保持準確率的提高。ResNet基本結構單元見圖2。

圖2 ResNet基本結構單元
ResNet模型基本思想是提出一個殘差學習結構,將原來需要學習的函數H(x)變為F(x)+x,這種擬合函數的求解要比之前求解H(x)簡單。根據圖像中的殘差向量編碼,通過一個重制,將一個問題分解成多尺度的殘差問題,以解決深度網絡訓練優化難的問題。因此,ResNet網絡與之前的CNNs網絡相比,在深度增加的同時網絡性能也得到了提升[7]。
利用ResNet模型,進行冠狀動脈CTA圖像斑塊的識別,并且研究了不同深度的ResNet網絡,進行反復對比,選擇最適合臨床應用的最適宜層數的ResNet。不同深度ResNet的網絡結構見表1。
1.2.1 CCTA圖像后處理
CCTA的原始圖像中不僅包含冠狀動脈,還包含有心肌、骨骼及軟組織。為了更準確的識別出目標血管的斑塊信息,本研究所識別的CCTA圖像是經過三維重建后處理的冠狀動脈血管圖像。三維后處理可以選擇的二維(two dimensional,2D)圖像有曲面重建(curve planar reformation,CPR)圖和拉直圖像,但拉直圖像會導致冠狀動脈內部形態發生改變,而形態輪廓信息也是判斷斑塊的重要信息,因此本研究選擇的是冠狀動脈的CPR圖像。冠狀動脈CTA重建見圖3。
1.2.2 圖像歸一化
ResNet 需要使用固定大小的圖像作為輸入(227×227或224×224)。將圖像進行尺度調整,使所有圖像具有相同的大小,以便進行訓練或特征提取。首先將后處理圖像去除無效區域后調整圖像大小到256×256像素矩陣,轉換成聯合攝影組(joint photographic group,JPG)格式保存,建立統一數據集。通過減去在整個訓練數據集上計算出的平均像素值來對圖像進行歸一化。

表1 不同深度ResNet的網絡結構

圖3 冠狀動脈CTA重建圖
卷積神經網絡采用softmax[8]分類器,softmax層接在全連接層后。softmax層的輸出為一個概率分布,可以得到輸入屬于每一種類別的概率,且輸出概率總和為1,輸出概率的計算為公式1:

式中k的值為2(本研究是二分類問題,故k=2)。
數據集中的CCTA圖像來源于醫院有數字減影血管造影(digital subtraction angiography,DSA)對照的100例患者。100例患者均選擇三支冠狀動脈的CPR圖像,分別為右冠狀動脈(right coronary artery,RCA),前降支(anterior descending artery,LDA),左回旋支(left circumflex artery,LCX)。CPR在重建時選擇360°內重建20幅圖像,整個數據集數量為6000幅,具體分布見表2。

表2 數據集數據類型分布(幅)
將數據集整體打亂后,劃分為訓練集(60%),驗證集(20%)和測試集(20%)三個部分,采取相同的預處理操作,以保證驗證和測試的結果準確。
實驗中所用的計算機硬件配置為64位Windows10操作系統,2.80 GHz Intel i7 CPU,軟件方面,選擇Google的深度學習開源框架TensorFlow作為程序框架,版本為1.30,前端為Keras2.0.8,程序使用Python3.6編寫設計。
對于評價的性能指標,選取通過整體準確率(accuracy,Acc)、靈敏度(sensitivity,Se)和特異性(specificity,Sp)來衡量,其中準確率是正確分類的斑塊比例。每個指標具體計算方法為公式2~4:

式中,TP為真陽性(true positive,TP),表示本來是陽性,被正確分類的樣本個數;FP為假陽性(false positive,FP),表示本來不是陽性,被分類為陽性的樣本個數;TN為真陰性(true negative,TN),表示本來是陰性樣本,被正確分類的樣本個數;FN為假陰性(false negative,FN),表示本來不是陰性,被錯誤地分類為陰性的樣本個數[13]。
三種深度的網絡在實驗中的超參數為,學習率0.001,每個卷積核batch的大小是32。
2.3.1 不同層數網絡評價
由于網絡的層數和復雜度會影響訓練結果,因此選擇3種層數的ResNet進行研究,不同深度的CNNs各參數的比較結果見表3。

表3 不同深度ResNet性能參數對比(%)
表3顯示,ResNet-50的靈敏度最高,ResNet-152的準確率和特異度最高。但由于網絡層數的增加直接影響了網絡的運算速度,ResNet-152的訓練速度要比ResNet-50的速度低數十倍,在臨床工作中,有良好的網絡性能,快速的運算時間再輔以醫師的臨床經驗方能達到更好的診斷效能。
2.3.2 ResNet-50輔助醫師評價評測
以DSA結果為金標準,對100例患者的CCTA圖像進行評測。選取已訓練好的ResNet-50,由兩名具有5年以上診斷經驗的醫生進行單獨評價及參考ResNet結果的基礎上進行評價,其評價結果見表4。

表4 ResNet-50輔助醫師評價評測結果(%)
表4顯示,在ResNet神經網絡的輔助下,兩名醫師的診斷準確性都得到了顯著提升,并且在保證較高特異性的同時顯著的提高了診斷的靈敏度。
冠狀動脈粥樣硬化斑塊根據CT值水平可分為軟斑塊(CT值<50 HU)、纖維斑塊(CT值50~120 HU)和鈣化斑塊(CT值>120 HU)[9]3類。由于鈣化斑塊的硬化偽影和注入造影劑后纖維斑塊的局部強化影響,并不能通過肉眼準確的判斷是否存在斑塊及斑塊的性質。前期的臨床實踐和大量文獻的比較研究中發現,CCTA對其狹窄程度的評估存在著一定的誤差率,這些誤差的造成大多是建立在診斷醫師個人經驗判斷的基礎上。CNNs的主要優點是根據給定的訓練數據集,自動地學習對象特征[10]。但是,CNN需要大量的訓練數據進行特征的學習,在醫學圖像處理領域,通常樣本數據缺乏、采集和標注也十分困難,因此其應用往往存在局限性。有研究[11-12]表明,即使未經過重新訓練,通過遷移學習深度卷積特征也可以用作通用視覺表達,比如在大型自然圖像ImageNet數據集[13]上預先訓練的CNNs特征,在其他很多圖像識別任務中也取得了很好的結果。利用ResNet網絡對CCTA圖像斑塊進行識別,并對不同深度網絡的識別效能做出了統計。實驗中模型的殘差塊有效克服了網絡的退化問題,在網絡深度加深的同時,保證了性能不會過度下降[14]。但考慮到臨床應用上結合醫師的診斷,需要一個訓練速度快且敏感性好的網絡,因此選擇ResNet-50作進一步研究對象。由于在冠狀動脈斑塊的診斷過程中,準確性一直依靠于診斷醫師的臨床經驗,和DSA相比較下,往往鈣化斑塊假陽性率高,非鈣化斑塊假陰性率高。本研究中,診斷醫師在參考ResNet-50的診斷結果后再對斑塊類型進行判別,均在保證特異度的同時提高了準確性和診斷靈敏度。
在傳統的機器學習中,機器學習的是人標注的特征,但在深度學習中,計算機自主學習特征,所提取的特征是看不到的。因此,深度學習中的黑箱效應一直是模型優化過程中的難點。臨床應用中,可以將ResNet作為輔助診斷技術,醫師對于診斷結果有最終決定權,通過這種模式可以更好的利用CNNs提高臨床中的應用價值[15]。本研究只對斑塊進行有無二分類,但在臨床診斷中是遠遠不夠的,需要對斑塊的種類做進一步的識別才能對于診斷及后續治療起到關鍵作用,也是本研究之后需要解決的主要問題。