周潔潔,張洋,蘇敏瑩,何遐遐,徐妮娜,葉舒欣,李建策,王甌晨,王美豪
(1.溫州醫科大學附屬第一醫院 放射科,浙江 溫州 325015;2.美國加州大學歐文分校 功能腫瘤影像中心,加利福尼亞州 歐文 96214;3.溫州醫科大學附屬第一醫院 甲乳外科,浙江 溫州 325015)
乳腺動態增強磁共振成像(dynamic contrastenhanced magnetic resonance imaging,DCE-MRI)具有很高的靈敏度[1-2],可以檢測到許多良性病變。隨著越來越多的篩查和術前MRI檢查的開展,更好地描述MRI檢測到的增強病變性質對于提高診斷的準確性至關重要。利用計算機軟件從影像學圖像中高通量地提取海量的臨床醫師肉眼無法獲取的定量信息,再利用大數據分析方法獲得有價值的特征用于臨床分析和診斷[3]。近年來,人工智能算法,特別是深度學習在醫學圖像分析方面取得了顯著進展,使醫學圖像分析領域迅速向前發展[4]。卷積神經元網絡(convolutional neural network,CNN)是一種常用的深度學習方法,應用于分析攝影、病理和影像學圖像,并報道其在分割、異常檢測、疾病分類和診斷等各種臨床任務中具有巨大的潛力[5]。 本研究探討和比較影像組學和5種不同的CNN方法在DCE-MRI上對乳腺良惡性病變的診斷準確性。
1.1 一般資料 選取2017年1月至2018年6月經溫州醫科大學附屬第一醫院手術或穿刺病理證實的乳腺病變患者152例,所有患者均為女性,術前均行GE 3.0T機器進行MRI平掃及增強檢查,所有結果均經病理檢查證實。其中惡性腫瘤患者93例,平均年齡(52±11)歲,惡性病變103個;良性病變患者59例,年齡(45±9)歲,良性病變73個。納入標準:①MRI檢查前未行任何放化療者;②MRI檢查前未行穿刺或手術治療者。排除標準:①MRI檢查禁忌證者;②無法行釓噴替酸葡胺(Gd-DTPA)增強檢查者;③MRI圖像模糊影響分析者。所有患者均簽署知情同意書,本研究經醫院倫理委員會審查通過。
1.2 磁共振掃描方法 采用GE SIGNA HDx 3.0T MR掃描儀,使用GE 8通道乳腺專用相控陣表面線圈。患者俯臥位,雙乳自然懸垂于線圈洞穴內。常規掃描序列包括:軸位STIR序列、軸位FSE T1WI序列、矢狀位FS T2WI序列、軸位DWI序列以及動態增強磁共振掃描。DCE-MRI在DWI序列之后進行,采用軸位乳腺優化容積成像三維梯度回波(volume imaging for breast assessment,VIBRANT)序列,具體參數:TR 5 ms,TE 2 ms,FA 10°,層間距1.2 mm,層厚1.2 mm;掃描野34 cm×34 cm,矩陣416×416。每期掃描時間90 s,共掃描6期(1期增強前蒙片、5期增強)。對比劑為Gd-DTPA,按 0.1 mmol/kg,以2.5 mL/s高壓注射器靜脈注射。
1.3 圖像處理方法
1.3.1 影像組學分析:增強掃描共6期,1期增強前蒙片(F1),5期增強(F2-F6)。利用計算機算法自動分割強化病灶。對于腫塊型病灶,采用模糊C均值(fuzzy-C-means,FCM)聚類算法[6]。對于非腫塊型病變,FCM不能很好地分割病灶,采用區域生長法(region growth)獲得腫瘤邊界。DCE參數圖根據以下公式獲得:早期流入信號增強圖(signal enhancement ratio,SE ratio)=[(F2-F1)/F1];最大信號增強圖=[(F3-F1)/F1];流出斜率圖=[(F6-F3)/F3][7]。惡性病灶和良性病灶的DCE參數,浸潤性導管癌見圖1,纖維腺瘤見圖2。進行影像組學分析前,對每幅參數圖上的分割病灶進行分析,獲得12個直方圖參數和20個GLCM紋理特征參數[8-9]。為了區分良惡性病變,采用隨機森林算法選擇具有最高意義的特征[10],再利用這些特征訓練邏輯模型作為分類器。以上計算采用Matlab 2013b(MathWorks,Natick,MA)編寫程序進行。
1.3.2 深度學習分析:采用5種不同的CNN進行深度學習,包括ResNet50[11]、VGG16[12]、VGG19[12]、Xception[13]和InceptionV3[14]。基于三個DCE參數圖進行分析。對于每個病灶,都會生成包含整個腫瘤的最小方形邊界框。為了增加例數,所有層面都被用作獨立的輸入,數據集被隨機仿射變換進一步擴充。損失函數為交叉熵,優化器為Adam,學習率為0.001[15]。ImageNet作為這些模型中參數的初始值工作[16]。使用10倍交叉驗證評估準確性。為了評估腫瘤周圍組織的作用,采用5種不同輸入框的方法進行分析:①僅包含腫瘤;②包含少量腫瘤組織的最小邊界框;③放大1.2倍邊界框;④放大1.5倍邊界框;⑤放大2 倍邊界框。邊界框被調整到64×64作為深度學習輸入。見圖3。
1.4 統計學處理方法 采用SSPS22.0統計學軟件進行統計分析。計量資料用 ±s 形式表示,2組比較用獨立樣本t 檢驗;計數資料用百分數表示。利用每個病灶層面的惡性概率預測進行ROC分析,以≥0.5為惡性概率閾值計算診斷準確率;ResNet50分析中,不同尺寸邊界框分析的結果采用DeLong檢驗進行比較分析;5種不同CNN的深度學習在交叉檢驗中獲得AUC,ResNet50與其他4種網絡的結果分別進行獨立樣本t 檢驗。P <0.05 為差異有統計學意義。

圖1 56歲右乳浸潤性導管癌患者MRI成像及相應參數圖

圖2 66歲右乳纖維腺瘤患者MRI成像及相應參數圖
2.1 良惡性病灶情況 惡性病灶103 個,其中導管原位癌12個(占11.6%),浸潤性導管癌84個(占81.6%),其他類型浸潤性癌7個(占6.8%);良性病灶73個,其中腺病38個(占52.1%),纖維腺瘤17個(占23.3%),導管內乳頭狀瘤12個(占16.4%),其他良性病變6個(占8.2%)。惡性組病灶體積為(3.77± 3.08)cm3,良性組病變體積(1.18±1.66)cm3,2組差異有統計學意義(P<0.001)。
2.2 影像組學和不同CNN深度學習分析結果 影像組學分析的診斷準確度為80%。對于深度學習,5個不同大小輸入邊界框的5種CNN模型的診斷效能見表1。對于ResNet50模型,包含腫瘤的最小邊界框效果效能最好,隨著邊界框越來越大,診斷效能逐漸下降。含少量腫瘤周圍組織的最小邊界框診斷效能高于僅包含腫瘤邊界框、1.2 倍、1.5 倍和2.0倍邊界框分析,差異有統計學意義(Z=1.37、1.15、2.74、3.25,均P<0.05);針對含少量腫瘤周圍組織的最小邊界框分析中,ResNet50(93%)與Xception(94%)和InceptionV3(93%)的診斷準確性差異無統計學意義(t=-0.48、-0.09,均P>0.05);且ResNet50高于VGG16(80%)和VGG19(79%),差異有統計學意義(t=5.2、4.7,均P<0.01)。
DCE-MRI被認為是乳腺病變最精準的影像學檢查,能準確、直觀地顯示病灶,并能很好地顯示病灶的形態特征、內部動態強化特征以及病灶與周圍組織的關系[1-2]。但影像醫師肉眼閱片獲得的信息具有一定的主觀性,并且對醫師的技術水平、專業知識以及臨床經驗都有極高的要求,因此診斷的準確性差異較大。隨著計算機輔助診斷,包括紋理分析及影像組學等一系列影像分析及機器學習技術的發展,實現了影像大數據的自動化高通量特征提取、分析,獲得更客觀的診斷結果,提高診斷的敏感性和特異性[17]。

圖3 2例乳腺惡性病變MRI和不同尺寸邊界框分析圖

表1 5種不同深度學習算法分析的診斷準確度
自2012 年影像組學概念提出以來[3],大量研究證實基于DCE-MRI的影像組學分析能夠有效判斷腫瘤良惡性,預測乳腺癌組織病理分級、淋巴結情況、分子亞型以及新輔助化療療效評估等[8,18]。隨著人工智能技術的進一步發展,深度學習已被應用于乳腺X光攝影的乳腺癌檢測和診斷,其對于腫塊病變的檢測表現與放射科醫師具有相近的診斷準確 度[19]。乳腺MRI獲取多組具有不同組織對比度圖像以及增強后不同時間的不同信號強度圖像,這使得深度學習算法的實現更具挑戰性。TRUHN等[20]利用影像組學和深度學習技術對MRI良惡性病變的診斷性能進行了研究,多參數MRI分析結果顯示,CNN對于強化病灶的良惡性鑒別優于影像組學。但臨床上由于乳腺MRI價格高、需要使用造影劑、檢查時間長等原因,其使用仍有一定限制。
因此,在本研究中我們選擇5種較常見的CNN模型,結合影像組學,比較并初步探討不同分析技術在乳腺MRI增強良惡性病變診斷中的價值。結果顯示,盡管使用的病例數量相對較多,但基于直方圖和紋理特征的影像組學的診斷準確度僅為80%,與TRUHN等[20]的研究結果相似。當使用深度學習分析時,診斷準確度不同程度提高,但所使用的模型算法不同,其結果變化很大。Xception和InceptionV3模型分析的準確度略高于ResNet50,顯著優于VGG16和VGG19。筆者認為,原因可能是相對于其他類型的網絡結構,Xception與InceptionV3并行使用了多種不同的卷積核,可以提取各種不同類型的圖像特征。同時,Xception與InceptionV3將通道內特征與通道間特征獨立處理,既能夠從同一張特征圖中提取足夠多的圖像特征,又能比較不同特征圖的動態特征。并且Xception和InceptionV3的網絡深度遠大于Resnet50和VGG,內部所包含的大量可訓練參數提高了網絡性能。此推測需要在后續研究中通過增加病例數及優化模型進一步驗證。
以往研究表明腫瘤周圍環境包含與腫瘤侵襲性相關的重要信息,能反映血管淋巴侵襲和血管生長,以及脂質和水腫成分或腺體組織的癌變信息,有助于疾病的診斷和預后判斷[21]。因此在本研究中,我們使用不同大小的邊界框作為深度學習的輸入來評估腫瘤周圍組織的作用。結果表明,與僅包含腫瘤相比,包含少量周圍組織的最小邊界框分析具有更高的診斷準確率,這提示腫瘤鄰近的周圍組織可為診斷提供有用的信息。但隨著邊界框尺寸的增大,診斷效能逐漸下降,筆者認為原因可能是包含太多正常組織導致神經網絡輸入圖像分辨率降低,并且腫瘤信息被稀釋而影響診斷效能。
綜上所述,在乳腺增強良惡性病變的診斷中,深度學習比影像組學具有更高的診斷準確性,且Xception、ResNet50和InceptionV3優于VGG16、VGG19模型。在深度學習中,包含適量腫瘤周圍組織可能有助于提高良惡性病灶鑒別的準確性,但過多的周圍組織可稀釋腫瘤信息而降低診斷效能。