白宛鷺,邢 華,李海濱*
(1.北華大學附屬醫院 乳腺外科,吉林 吉林 132011;2.吉林大學中日聯誼醫院 乳腺外科,吉林 長春 130033)
乳腺癌已經成為女性最常見的癌癥,核磁共振成像(MRI)在乳腺癌診斷、治療和預后評估中的作用已逐漸被臨床醫師認可。隨著計算機技術的進步,深度學習已應用于醫學的諸多領域,提高了診斷準確率和診療效率。本文就深度學習技術在乳腺癌MRI診斷及亞型識別的研究進展進行綜述。
目前乳腺疾病的常規檢查方法包括:彩色多普勒超聲、乳腺鉬靶、MRI等方法。動態增強MRI檢查是乳腺MRI診斷的必要檢查序列;T1加權像(T1WI)可以很好的體現乳腺脂肪和腺體的分布情況;而T2加權像(T2WI)可以分辨液體成分,這些序列可以提供乳腺腫瘤更多的信息。動態增強(DCE)MRI檢查具有較高的空間分辨率和時間分辨率,通過無間距掃描,獲得圖像重建,可發現小乳腺癌,對于診斷有更高的靈敏性。有研究表明,以病理結果為標準回顧超聲診斷時發現,超聲檢查雖具有操作便捷,成本較低等特點,但對非典型圖像認識不足,較易誤診[1]。另有研究人員將乳腺超聲及MRI對乳腺腫物的診斷以病理為“金標準”進行對比,結果顯示MRI對乳腺腫物診斷的靈敏性、特異性和準確性均明顯高于超聲[2]。
目前臨床更多的是醫生得到影像學圖像后根據臨床經驗的診斷,Uematsu等[3]在MRI圖像上發現了三陰性乳腺癌特點,即單灶性病變、腫塊病變、腫塊邊緣光滑、邊緣增強不均勻、增強模式持續以及T2加權圖像信號強度非常高的MR成像結果。Youk等[4]發現三陰性乳腺癌在DCE-MRI和彌散加權像(DWI)MRI上表現出了一些不同于雌激素受體(ER)+和HER2+的特征。這些方法雖正確,但具有一定醫生的主觀因素,耗費精力與時間,使患者無法較快的了解自己的病情,降低臨床就診率。放射組學的研究模式推動了MRI乳腺診斷中的應用。通過提取乳腺MRI的放射組學特征,可以通過有監督和無監督的經典機器學習算法訓練識別腫瘤良惡性和分子亞型的模型。關于放射組學及其相關的傳統機器學習研究本文不做更多的綜述。
深度學習在計算機視覺領域已經成功應用,在醫學影像分析中也獲得巨大進展。關于乳腺癌MRI的深度學習研究也從傳統的機器學習模型向深度學習模型發展,從分析流程角度和任務角度,本文就深度學習在乳腺癌MRI診斷中的應用進行綜述。
深度學習的興起和突出表現及在圖像識別、分割、標記等方向的成功應用,向傳統的機器學習策略提出了挑戰。深度學習在乳腺癌MRI方向的應用也使乳腺癌MRI診斷和亞型識別等能力得到進一步提升。
在MRI圖像上診斷乳腺癌及鑒別其分子亞型上主要需要三大步驟:數據集的選取、數據集預處理、構建模型和驗證。對于數據集的選取通常來源于網絡公開數據集或各中心的數據集,而現擁有的數據集均存在數據量少、形式單一等缺點,無法滿足訓練網絡模型的需求,同時考慮到不同的深度學習模型需要不同的數據類型,故需要對數據集進行預處理。如陳彤[5]將2400幅288×288尺寸的DICOM格式數據通過旋轉、鏡像、剪裁等數據增強方法,得到6000個數據樣本,用于滿足訓練需求。但在公共數據集中得到的核磁共振成像樣本,由于是從不同設備采集,其像素之間存在差異,可能影響最終結果。Zhu等[6]選擇了最常出現的空間分辨率為目標分辨率,并將所有圖像配準到這一分辨率中,然后使用雙線性插值將具有其他空間分辨率的核磁共振成像縮放至目標分辨率,再將其按比例剪裁,隨機平移和旋轉并可得到一個同像素且較大的數據集。
從頭開始訓練是訓練卷積神經網絡(CNN)最直接的方法,此方法的成功需要兩個重要的因素:數據集和網絡結構。目前的神經網絡包含數十層甚至數百層,導致有眾多的參數需要訓練,這就對龐大的數據集有嚴格的要求。而MRI圖像數據集可用數據恰恰不足,對于提高數據集并訓練模型極具挑戰性。遷移學習是目前研究的主要方法,主要分為兩步,第一步使用較大的自然數據集對模型進行預訓練,也可基于其他的醫學影像數據集進行預訓練;第二步也是目前作為研究熱點的一步,是用所要研究的數據集上對預先訓練好的模型進行微調。
乳腺癌病灶檢測和分割是實現乳腺腫瘤良惡性鑒別和亞型識別的前提。包括乳腺癌放射組學特征的提取,都需要提高MRI的分割能力。深度學習在圖像分割中表現突出,也在乳腺MRI領域中得到應用[7]。U-Net是乳腺癌MRI病灶分割最常用的深度學習算法,基于此發展的3D U-Net在充分的訓練下,能夠達到放射住院醫師的診斷準確率[8]。此外還包括區域掩膜卷積神經網絡[9]。陳彤[5]將深度神經網絡YOLACT網絡進行微調,引入難樣本挖掘機制,并以MRI乳腺圖像數據庫為數據集進行模型訓練,與YOLACT網絡、Mask R-CNN網絡進行對比,發現與原模型相比準確率更高,與Mask R-CNN相比運行速度更快。還有研究基于DENSE項目的篩查數據,共對來自4581名女性的致密型乳腺進行的MRI檢查,判斷正常和發現MRI病變的深度學習模型ROC下的AUC平均面積為0.83(95%CI 0.80-0.85)[10]。周潔潔等[11]選取152例乳腺病變患者,運用模糊C均值聚類法切割病灶,對于乳腺非腫塊型病變,選用區域生長法獲得腫瘤邊界,并對各切割病灶進行分析獲得多個特征參數進行后續分割。
深度學習的一個分支CNN在醫學影像分析方面也取得了長足的進步。CNN是一種臨床上常用的深度學習網絡,主要應用于病理和影像學圖像的識別與分析,并有報道表明其在分割、異常檢查、疾病分類和診斷等各種臨床任務中具有巨大潛力[12]。卷積神經網絡在圖像分類任務中表現突出。乳腺MRI分類的主要任務之一就是基于CNN進行良惡性鑒別。Truhn等[13]對人工神經網絡(ANN)與CNN對乳腺MRI圖像的良惡性診斷進行研究,結果表明盡管對ANN方法進行了調整,但CNN準確率仍高于ANN。應用ResNet50模型[14]把病灶周圍組織的特征考慮進來,結合放射組學進行良惡性鑒別,與單獨使用腫瘤或使用較大的框相比,使用包含近端周圍組織的最小邊界框作為輸入具有更高的準確性。深度學習還把不同檢查時間點的動態增強MRI數據進行整合分析,如應用循環神經網絡(RNN)、長短期記憶網絡(LSTM)。
盡管對于提取MRI特征的乳腺癌亞型預測方面取得了很大的成功,這些研究都主要依賴于半自動特征提取的方法,關于亞型識別的傳統機器學習模型遠多于深度學習建模[15]。遷移學習和CNN也是應用深度學習進行乳腺癌亞型識別的主要方法之一。Zhu[16]等人為應用預先訓練的VGGNet網絡使用MRI數據集對乳腺癌分子亞型進行分類,由于該方法使用的是預先訓練的網絡提取特征,可再用提取的特征訓練傳統網絡模型,避免過擬合的出現。如前所述,T1WI、 T2WI和 DWI是常用的多參數乳腺MRI成像方法。有人應用CNN提取多參數MRI特征預測Ki-67高表達亞型獲得了0.875的AUC值[15]。整合多參數MRI CNN在術前預測腋窩淋巴結轉移的準確率達到0.970,AUC值為0.996[17]。基于乳腺癌MRI影像的深度學習還能實現預測新輔助治療的療效,準確率達到70%[18]。有人[19]將216名乳腺癌患者的術前MRI圖像進行處理,將其在三維仿射矩陣中隨機旋轉獲得更多圖像,并制定了14層CNN,使乳腺癌分子亞型預測的準確率達70%。在判斷乳腺癌分子亞型的研究中,把患者分為3個亞型,即HR+/HER2-、 HER2+和三陰性乳腺癌,CNN和LSTM的準確率均較高,部分驗證集的準確率分別達到了0.91和0.83[20]。
目前較大規模的乳腺MRI數據集還十分有限。迫切需要建立數據量大,圖像信息豐富,有專業標記信息的乳腺MRI影像數據集,為訓練專業領域的病灶分割,良惡性腫瘤分類和亞型識別提供數據支持。同時還要考慮到不同掃描參數可能對后續分析的影響,如何標注數據集,如何充分利用多中心或不同來源的數據也是研究的方向之一。
可解釋研究是乳腺癌MRI深度學習研究的另一方向。深度學習的圖像分割和分類效果令研究者滿意,但所提取的特征和決定背后的邏輯仍然無法解釋清晰。因此進一步的探討乳腺癌MRI深度學習研究中存在的“可解釋性”問題是該領域的研究方向之一,這樣的研究目前還不多[15]。
多組學研究也是目前研究的熱點。目前的研究主要是探討不同組學之間的相關性。結合分子組學和病理組學等多組學的信息,可以對腫瘤的認識更加全面,有助于對預后、分型和療效等的判斷。但目前把乳腺MRI同時結合分子組學和病理組學的研究有限[21]。
因此應用乳腺MRI影像數據運用深度學習算法,創建更大的數據庫、并在此基礎上優化更為便捷的模型、快速發現腫瘤并提取乳腺癌各個亞型的特征并進行可解釋分析,融合多組學信息并用于臨床,是今后所要探索的方向。