姜文研,牛淑嫻,張夢瑤,崔林鵬,董 越,艾 華,周曉婭,于 韜,羅婭紅
(1.遼寧省腫瘤醫院(中國醫科大學腫瘤醫院)醫學影像科,遼寧 沈陽 110042;2.中國醫科大學生物醫學工程系,遼寧 沈陽 110122;3.濟寧醫學院基礎醫學院分子醫學與化學實驗室,山東 濟寧 272067)
近年來,乳腺癌發病率逐年升高,嚴重威脅著全世界女性的生命健康[1]。乳腺癌的早診早治是有效提高患者預后的關鍵[2]。臨床上對乳腺癌的早期篩查長期依賴于價格低廉且操作相對簡單的X 線檢查,然而,由于常規乳腺X 線掃描為固定角度的二維成像,X 線圖片中存在大量密度較高的腺體或其它正常人體組織,會對乳腺病灶區域造成部分遮擋,不利于醫生對乳腺病灶的識別和診斷[3]。乳腺DBT成像是按照一定角度旋轉X 線球管進行的三維掃描過程,再經過計算機后處理重建輸出一系列高分辨率的斷層圖像,可以有效解決乳腺組織重疊遮擋的問題,能極大提高乳腺疾病的檢出率,降低召回率,減少假陰性和假陽性,具有重要的臨床價值[4-5]。由于DBT 掃描進入臨床乳腺癌早期篩查應用的時間較晚,當前尚沒有針對DBT 影像的較為成熟的計算機輔助(Computer-aided diagnosis,CAD)分析方法,臨床上主要依靠有經驗的醫生通過肉眼觀察DBT 圖像,并基于病灶的形態、尺寸和灰度變化等特征給出診斷結論[6]。
近年來,基于影像組學的CAD 技術在醫學影像分析領域發展較快,受到了醫學影像工作者的高度重視。影像組學通過提取和篩選臨床影像數據中的量化特征,轉化為可挖掘的高維度數據,用于建立計算機預測模型,能夠準確反應腫瘤的深層生物學特性,從而為臨床提供輔助診斷決策支持[7-8]。影像組學的分析流程主要包括:①影像病灶區域(ROI)的勾畫;②影像特征的提取和篩選;③計算機風險預測模型的建立和驗證[9]。當前已有針對乳腺X 線[10]、超聲[11]和MRI[12]數據的影像組學分析報告,但針對乳腺DBT 影像則鮮見報道[13],因此缺乏一種用于乳腺DBT 數據的可靠的影像組學分析方法和預測模型。
本研究回顧性收集了2017 年9 月—2018 年4月在遼寧省腫瘤醫院就診的160 例女性患者的乳腺DBT 影像數據,其中經過病理確定為良性和惡性患者數量分別為82 例和78 例。入組標準為:①年齡大于18 歲;②病理檢查前進行乳腺DBT 掃描。排除標準為:①同時患有其它腫瘤疾?。虎谟腥橄偈中g史或放化療史;③處于孕期;④影像數據不完整或存在偽影。本研究方案和內容通過遼寧省腫瘤醫院倫理委員會的批準。
乳腺DBT 掃描采用遼寧省腫瘤醫院的Hologic乳腺DBT 掃描儀(Hologic Selenia Dimensions,USA)。掃描參數:X 線管電壓20.0~49.0 kV(Step=1.0 kV),電流300.0~400.0 mAs,掃描時間<4.0 s,重建時間2.0~5.0 s,像素尺寸70.0 um。掃描圖像按照1.0 mm間距重建后進行分層輸出分辨率為2 457×1 996 的二維圖像。使用Hologic 乳腺分析工作站(Secure-ViewDx,USA)對圖像進行檢測分析。產生的DICOM圖像保存于醫院PACS 系統,由一名具有15 年工作經驗的醫生使用ITK-SNAP(3.6.0 版本)對乳腺腫塊區域(ROI)和邊緣進行精確勾畫,輸出MHA 格式ROI 文件。
通過Python(3.6.5 版本)編程,從DBT 圖像ROI區域中提取影像組學特征,主要包括一階統計量特征、灰度共生矩陣、灰度區域大小矩陣(Gray-level size zone matrix,GLSZM)和灰度行程紋理矩陣(Gray-level runlength matrix,GLRLM)、形態學特征和小波變換特征[14]。使用最大相關最小冗余(mRMR)算法[15]和LASSO 回歸分析對提取的特征進行降維篩選[16]。使用SPSS 軟件(24.0 版本)計算篩選特征值的均值與標準差,使用統計學Wilcxon 秩合檢驗方法計算特征P 值。
通過LASSO 回歸計算各影像組學特征的權值系數,使用R 語言“rms”軟件包(3.5.1 版本)繪制諾模圖模型。
本研究選取了三種常用的機器學習分類器進行測試比較,支持向量機(SVM)、隨機森林(RF)和K-最近鄰(KNN),三種分類器算法均由Matlab(2016a版本)編程實現。
繪制ROC 曲線對諾模圖模型的良惡性鑒別能力進行衡量。使用最大約登指數方法計算獲得ROC曲線的最佳閾值[17],計算AUC 值、準確度(ACC)、敏感性(SEN)和特異性(SPE)。繪制決策曲線(DCA)計算閾值概率范圍內的凈效益來評估本研究建立的諾模圖模型的臨床價值。本研究所使用算法的運行平臺為一臺具有6 核心3.7 GHz Intel i7-8 700 CPU和128 GB 3 000 MHz DDR4 RAM 的臺式計算機。
本研究收集乳腺癌患者DBT 醫學影像,由影像科醫生勾畫ROI 區域(圖1),根據此ROI 區域構建分類器進行分析和研究。
本研究從患者DBT 圖像中提取的影像組學特征經mRMR 和LASSO 降維篩選后,計算了單獨特征預測AUC 值和統計學P 值 (表1)。由表1 可見AUC>0.65 且P<0.05 的影像組學特征對乳腺腫塊具有良好的鑒別能力。表1 篩選出的7 個特征中,有2個屬于時域特征,5 個屬于小波域特征。

圖1 乳腺癌惡性與良性DBT 影像與ROI 區域。圖1a:惡性乳腺癌患者右側乳房的DBT 影像。圖1b:良性乳腺癌患者右側乳房的DBT 影像。Figure 1.The malignant and benign DBT image and the ROI region of the breast cancer.Figure 1a:A DBT image of the right breast of malignant breast cancer.Figure 1b:A DBT image of the right breast of benign breast cancer.

表1 篩選獲得的乳腺腫塊良惡性鑒別的DBT 影像組學特征
本研究構建了用于乳腺腫塊良惡性鑒別的諾模圖風險預測模型(圖2a),患者乳腺腫塊的惡性風險可由計算得到的分數在總分數軸上(Total Points,范圍0~100),垂直于軸向下畫一條直線與模型底部的總風險軸(Probability,范圍0.1~0.9)相交,從而得到風險值。校正曲線表明建立的諾模圖模型對預測風險和真實標簽(病理檢測結果)之間具有良好的一致性(圖2b,2c)。其中,校正曲線的橫軸和縱軸分別代表諾模圖模型計算得到的風險值和真實標簽值;經過原點的45°斜線以及圖中的虛線分別代表理想診斷結果和諾模圖模型的預測結果,虛線與45°斜線越靠近,表明所建立的諾模圖模型的鑒別效果越好。本研究建立的諾模圖模型在訓練集和測試集上的良惡性鑒別AUC 值均較高,分別可以達到0.942 和0.928(圖2d,2e)。
諾模圖模型的決策曲線見圖3,橫軸和縱軸分別代表閾概率值和凈獲益率;藍色曲線代表假定全部患者均為良性乳腺腫塊,紅色曲線代表構建的諾模圖模型,黑色直線代表假定全部患者均為惡性腫塊。由決策曲線分析可知,當閾值概率大于0.07 時,本研究建立的諾模圖預測模型對乳腺腫塊患者有著更大的獲益性,表明該模型具有良好的臨床應用價值和潛力。

圖2 用于乳腺腫塊良惡性輔助鑒別的諾模圖模型。圖2a:諾模圖模型。圖2b:諾模圖模型在訓練集上的校正曲線。圖2c:諾模圖模型在測試集上的校正曲線。圖2d:諾模圖模型在訓練集上的ROC曲線。圖2e:諾模圖模型在測試集上的ROC 曲線。Figure 2.A nomogram model for auxiliary differentiation of benign and malignant breast masses.Figure 2a:Nomogram model.Figure 2b:Calibration curve of nomogram model on training set.Figure 2c:Calibration curve of nomogram model on test set.Figure 2d:ROC curve of nomogram model on training set.Figure 2e:ROC curve of nomogram model on test set.

圖3 基于諾模圖模型繪制的決策曲線(DCA)分析。Figure 3.Analysis of decision-making curve (DCA) drawn based on nomogram model.
機器學習分類器廣泛應用于醫學影像分析領域,本研究對比了三種常見分類器對乳腺腫塊的良惡性鑒別能力(表2),由表2 可見KNN 分類器在AUC 值、準確率和敏感性三個指標方面均優于SVM和RF 分類器,而SVM 分類器在AUC 值和準確率方面均最低,不適用于乳腺腫塊的良惡性鑒別。

表2 機器學習分類器對乳腺DBT 影像腫塊良惡性的鑒別
乳腺DBT 掃描為新近發展起來的一項乳腺癌早期篩查技術,已有臨床工作證明乳腺DBT 通過旋轉改變掃描角度,能夠對乳腺腫瘤及正常組織進行清晰成像,診斷效果顯著優于傳統的X 線檢測,特別適合于亞洲女性的乳腺癌早期篩查工作[18]。由于乳腺DBT 掃描進入臨床應用的時間較短,目前缺乏相關計算機輔助分析的研究,2019 年Bevilacqua 等[13]初步提出了一種乳腺DBT 影像的CAD 分類方法,但該研究使用的臨床樣本量僅為39 例,缺乏臨床價值。
為了深入探討對乳腺DBT 影像進行計算機輔助分析的影像組學技術,本研究收集了160 例經病理驗證的乳腺腫塊DBT 影像數據,并進行了人工勾畫病灶區域和提取影像組學特征。經mRMR 和LASSO 算法篩選后得到的7 個具有良好鑒別能力的影像組學特征中,有1 個屬于GLRLM 特征,1 個屬于形狀特征,還有5 個屬于小波變換特征。其中,GLRLM_Run Entropy 特征主要反應影像灰度變換特性,本研究結果表明,與良性腫塊相比,惡性腫塊在DBT 影像中表現出更大的灰度變化 (如表1 所示,GLRLM_Run Entropy 特征值在惡性組中比良性組中更大)。而Shape_Minor Axis Length 形狀特征表明乳腺腫塊的形狀變化對良惡性有重要影響。此外,在DBT 影像中對良惡性鑒別力最強的7 個影像組學特征里有5 個是屬于人類難以理解的小波域特征,這或許可以部分解釋臨床醫生對乳腺DBT 影像的良惡性鑒別存在一定的困難(在很多情況下需要同時參考同一病灶的MRI 影像才能給出診斷結論)的原因。
諾模圖是近年來在醫學圖像的影像組學分析領域中廣泛使用的一種形象直觀的風險評估模型方法,已有大量研究表明諾模圖模型在針對乳腺的醫學影像分析中具有良好的臨床應用價值[19-20]。為了利用獲得的影像組學特征建立計算機輔助模型,本研究進一步繪制了基于乳腺DBT 影像的良惡性鑒別諾模圖模型,在測試集中獲得了0.928 的高AUC值,并具有良好的特異性(0.839)和敏感性(0.926),表明建立的諾模圖模型具有較低的誤診率和漏診率。DCA 分析也表明模型展示出良好的臨床應用潛力。
本研究的一些局限性如下:①本研究使用的乳腺DBT 影像樣本量相對較?。?60 例患者)。但由于乳腺DBT 檢測為新近引入我國的一項乳腺早期篩查新方案,因此當前已積累的數據量確實較少,2019年國外一項最新的乳腺DBT 影像組學分析也僅使用了39 例患者[13]。在今后的研究中我們擬繼續擴大樣本量以提高建立模型的可信性。②本研究使用的影像數據均來自同一家醫院,可能會存在一定的數據偏倚性。未來的研究中,我們擬進一步聯合多家醫院的采集多中心數據,從而建立魯棒性更強的計算機輔助分析模型。③本研究對乳腺腫塊ROI 的勾畫為人手工操作,較為耗時耗力。在下一步研究中我們擬采用深度學習自動分割方法對ROI 區域進行自動分割勾畫,以節省醫生的精力。
本研究針對臨床乳腺DBT 影像進行了特征提取和篩選,并建立了用于良惡性鑒別的諾模圖模型。結果表明所建立的模型具有良好的鑒別準確性、特異性和敏感性,具有較好的臨床應用潛力,適合于乳腺早期篩查工作中的計算機輔助分析。