





摘要:肺結節分類問題是早期肺癌檢測與診斷的重要問題之一,針對現有的肺結節分類方法存在多尺度特征融合的信息冗余和缺乏判別性特征表示等問題,提出了一個基于多尺度特征互補與聚合約束(Multi-scale Feature Complementation and Aggregate Constraint, MFCAC)的肺結節分類方法,并提出了多尺度特征互補模塊用于學習相鄰尺度特征的差異信息,從而避免特征融合過程中的信息冗余;同時在網絡特征層引入了聚合約束損失,實現對同類特征的聚集,提高網絡判別性特征表示能力;將兩個模塊融入在編碼器-解碼器架構中形成MFCAC,共同作用實現高效分類。本文在LIDC-IDRI 數據集上進行了對比實驗,并通過消融實驗分析了該方法中各組成部分的貢獻和影響,結果表明,相較于對比算法,MFCAC 在肺結節分類上具有更優的性能。
關鍵詞:早期肺癌診斷;肺結節分類;深度學習;多尺度特征;卷積神經網絡
中圖分類號:TP183 文獻標志碼:A
肺癌是患病比例和致死率最高的癌癥[1],是對人群健康和生命威脅最大的惡性腫瘤之一[2-3],如果能在早期階段及時發現并積極地治療,可以有效降低肺癌死亡率。肺部中結節的診斷是肺癌診斷的重要依據,因此識別和準確分類肺結節也是肺癌診斷的關鍵,可以幫助醫生有效識別結節的良惡性,利于醫生根據癥狀進行有效干預和治療。在臨床場景中,放射科醫生通過CT 掃描圖進行病情篩查和診斷,而CT 由多個切片組成,且經常存在微小肺結節的情況,難以區分結節的良惡性,對醫生而言手工診斷患者的任務耗時且易錯[4]。
由于肺癌的危害日益增加[2],人們對肺部良惡性結節的分類進行了大量的研究[4-6]。在傳統的機器學習中,通常是通過手工進行特征提取[7-8],即通過手工制作的特征來表示肺結節,然后使用一個分類器預測結節的類別,通常使用有監督學習算法作為分類器,如支持向量機[9] 和隨機森林[9] 等。近年來,基于計算機視覺和深度學習技術的肺結節分類方法逐漸成為研究熱點,并取得了顯著的進展。Shen 等[5] 使用多尺度卷積神經網絡提取結節異質性特征,推進了多尺度特征在肺結節分類的應用。Shen 等[6] 在多尺度特征的基礎上設計了新穎的池化策略用于裁剪不同尺度特征,獲得當時最優的性能。以上研究均基于單一的2D 肺部CT 切片, Yan 等[10] 開始向3D方向探索,通過同時對一結節的多層切片提取多尺度特征和分類,其效果相比過往工作略有提升,但因其僅用幾層切片,難以實質性地挖掘結節在立體空間上的特征。Zhu 等[11] 直接將3D 結節作為其網絡的輸入,并設計了雙路徑特征提取模塊和編碼器-解碼器架構網絡,結合了3D 數據、多尺度特征融合和類殘差連接的優勢。文獻[4] 中AE-DPN 通過集成3D 雙路徑網絡和設計上下文注意力機制提高網絡的分類性能,集成多個模型提高預測魯棒性。雖然上述網絡在肺結節分類任務上有較好的表現,但仍存在一定的局限性:第一,在多特征融合過程中忽略了信息冗余的問題,不同尺度的特征往往包含了不同的信息,如細節信息、語義信息等,為了獲得更全面的信息,通常需要將不同尺度的特征進行融合。然而融合后的特征可能會導致信息冗余,這不僅會影響特征的表達能力,還可能會導致過擬合等問題;第二,缺乏判別性特征表示,現有方法雖然在整體分類準確率上都有較好的表現,但在對結節良惡性的識別能力上差異較大,這限制了肺結節分類的準確性和可靠性。