黃冕 劉順有 楊林海
(云南國土資源職業學院 云南昆明 652501)
根據2020年全球癌癥統計數據,肺癌的死亡率(18.0%)高居第一,發病率(11.4%)位居第二,僅次于乳癌(11.7%),肺癌已嚴重威脅人類的身體健康。隨著近年來深度學習的興起,在計算機輔助診斷這一領域,深度學習同樣有著突出的貢獻。在這一大背景下,近年來的肺結節檢測方法均采用深度學習有關的網絡。宋尚玲[1]等人在提出一種大樣本條件下的基于Faster-RCNN 的肺結節檢測算法,給出一種通用的隨著樣本數量增加肺結節檢測率持續提升的策略。Zhu[2]等人提出了一個3Dfaster-RCNN 算法,使用雙路徑模塊和基于語義的編碼解碼結構學習肺結節特征。李新征[3]等人提出一種基于非對稱卷積核YOLO V2 網絡的CT影像肺結節檢測方法。席孝倩[4]等人提出一套將閾值分割算法和數字形態學處理相結合的肺實質CT 影像處理流程。王波等人[5]提出一個以YOLO 算法為基礎,結合Darknet-53網絡和Densenet網絡的思想,在多尺度間具有緊密連接的深度卷積神經網絡。王乾梁[6]等人提出基于改進YOLO V3的肺結節檢測方法,首先進行重采樣和肺實質分割等預處理操作,然后修改YOLO V3的基礎網絡結構。
本文方法主要聚焦在有效性和肺結節檢測效率上,為此,選擇YOLOV4作為本方法的主干網絡。方法分為兩步:第一步,在模型設計階段,為了提示肺結節的檢測的有效性,在YOLOV4主干網絡的基礎上,結合了CT圖像的特性和現在一些先進的方法,設計一個高精度的模型,稱為YOLO-DCF,結構如圖1所示。第二步,為了提升檢測器的效率,把YOLO-DCF 模型的一些多余的通道裁剪了,減少了模型的參數,提升了檢測器的效率。

圖1 改進YOLOV4網絡結構圖
深度學習方法對圖像特征的提取主要源自卷積操作,如果對卷積層進行改進,可以大幅提升檢測性能。DO-Conv 層(Depthwiseover-parameterizedconvolutional layer)結合了傳統卷積和深度卷積,提升了整個卷積層的性能。在深度卷積過程中,對每個輸入通道都使用不同的二維深度卷積核進行操作,并且兩種卷積的結合使用提升了參數的可學習性,因此,對整個網絡的特征提取能力和語義代表性都有著重要的意義。在主干網絡殘差塊中加入DO-Conv,不僅可以很好地表現真肺結節特性,還可以降低錯誤率。DO-Conv 如式(1)所示:

在深度學習網絡中,現在很多方法都將不同大小的特征圖進行融合以提升網絡的性能。隨著網絡越來越深,肺結節的位置和語義信息也越容易丟失,造成不同大小特征圖融合效果不理想。為了解決上述問題,在主干網絡中加入了3 種卷積注意模塊(convolutional block attention module),其中,通道注意模塊和空間注意模塊增加了網絡中肺結節的空間信息和語義信息。不同于一般的特征圖融合方法,本文的方法更加集中在提升肺結節信息的注意力機制。
通道注意模塊如式(2)所示:

空間注意模塊如式(3)所示:

在CT圖像中,由于肺結節在圖像中非常的小而且數量也很少,會導致正樣本中有一個致命的缺點。在YOLOV4 網絡訓練時,大部分的候選邊界框會被分為負樣本,這樣極度不平衡的正負樣本分布會使置信度損失的梯度更新方向總是為負樣本,從而導致網絡很難學習到肺結節的信息。YOLOV4中使用的交叉熵損失函數很難避免這個問題,所以在交叉熵損失函數基礎上加入focal loss。新的損失函數如式(4)、式(5)所示。

在實驗過程中,設置λ=0.5,α=0.25,?=1.5。
本文方法合理減少了通道數,以保證網絡的有效性和效率達到平衡。本網絡會通過權重和η評估通道的重要性(importance of the channels),然后設置不同的修剪通道比例,獲得更加有效率的網絡。
整個實驗的訓練和測試都是使用NVIDIA Tesla K80 GPU。數據集使用的是LIDC-IDRI 數據集。網絡輸入圖像大小為512 × 512,批大小為4,梯度優化函數為momentum-SGD。FPS用于評價網絡速度,precision、recall 和AP用于評價網絡性能,如式(6)、式(7)、式(8)所示:

本網絡precision 為0.936,recall 為0.954,ap 為0.937。實驗結果表明,DO-Conv 增強了特征提取和整個網絡的代表性,多尺度特征圖融合增強了網絡的肺結節語義和位置信息。focal loss使得網絡了解更多肺結節信息通過調整肺結節圖像正、負樣本比例。上述3個對YOLOV4網絡的改進以獲得性能最好的網絡,與YOLOv4相比,AP 總增加了4.9%。為了平衡有效性和效率,選擇對網絡的冗余通道進行修剪。當修剪比率為0.7 時,AP 為90.5%,參數為6.318M,最后結果表明網絡的性能沒有受到減少通道數的影響。
針對在實際場景中可能數據有限且硬件有限,本文提出了一種平衡有效性和效率的實用肺結節方法。首先,基于YOLOv4算法和根據肺結節在CT圖像中的特點,逐步采用DO Conv、CBAM 和focal loss 這3 個改進方法,以獲得高精度的肺結節檢測網絡。然后,設置一個合適的修剪比率來減少網絡中冗余通道,并獲得更高性。實驗證明,此方法在保證了性能的情況下也有很好的檢測速度,比其他方法更適合實際場景,如在醫院部署。