李高仙,徐 成,任嘉梁
[1.山西醫科大學醫學影像學系,山西 太原 030001;2.山西省人民醫院MR室,山西 太原 030012;3.通用電氣藥業(上海)有限公司,上海 210000]
直腸癌是消化道最常見惡性腫瘤之一,其病理分期是影響治療及預后的關鍵因素。MRI是目前臨床評估直腸癌最有價值的方法,尤其對顯示腸壁結構、腸壁浸潤深度及周圍臟器受累情況具有優勢,并在直腸癌術前分期方面取得了新的突破[1-3]。影像組學的出現進一步擴大了醫學圖像的應用范疇[4-5],在預測腫瘤預后[6-7]、術前腫瘤分期[8]和評價療效[9]方面具有潛在臨床應用價值。本研究對比直腸癌患者術前MRI與術后病理結果,選擇MR結構(高分辨T2WI)和功能(DWI)圖像,結合局部腫瘤自身特征及臨床資料,探討基于高分辨T2WI的影像組學術前判定直腸癌T分期的臨床價值。
1.1 一般資料 收集2016年3月—2018年3月就診于山西省人民醫院、經術后病理證實為直腸腺癌的191例患者的臨床及影像學資料,男109例,女82例,年齡40~87歲,平均(63.4±10.9)歲。納入標準:①經病理確診為原發性直腸腺癌并接受根治術;②術后有完整的包括T分期的病理報告;③術前2周內接受MR檢查,并有所有序列包括病灶的完整圖像;④MR檢查前未經過任何治療。排除標準:①MR檢查禁忌者及無法耐受檢查者;②既往有其他器官腫瘤病史;③圖像質量差,運動偽影明顯,影響圖像分割及影像組學特征提取。本研究經山西省人民醫院倫理委員會批準,所有患者均簽署知情同意書。
1.2 儀器與方法 采用Siemens Avanto 1.5T MR掃描儀,12通道體部相控陣線圈。囑患者仰臥,掃描前30 min內使用2支開塞露,進行腸道準備。掃描序列和參數:①高分辨T2W,根據矢狀位圖像定位,掃描層面與腫瘤處腸管方向垂直,TR 6 680 ms,TE 97 ms,FOV 160 mm×160 mm,矩陣256×192,層厚3 mm,層間距0.3 mm;②DWI,軸位掃描,TR 6 200 ms,TE 78 ms,FOV 380 mm×380 mm,矩陣192×188.16,層厚5 mm,層間距0.5 mm,b值分別為0和800 s/mm2。
1.3 病理診斷 根據第七屆美國癌癥聯合委員會(American Joint Committee on Cancer, AJCC)TNM分期標準,對所有手術切除標本進行病理診斷并分期。根據病理結果,將T1~T2期歸為早期,T3~T4期歸為局部進展期。以病理結果為真值進行模型訓練和驗證。
1.4 圖像分析 由2名高年資影像科醫師以盲法評價MR圖像,意見不一時協商達成共識。根據AJCC的TNM分期標準,基于高分辨率T2WI上直腸壁解剖及腫瘤與黏膜下層和固有肌層的關系,將T分期定義如下:T1期,腫瘤局限于黏膜下層,且腫瘤與固有肌層之間可見高信號的黏膜下層;T2期,腫瘤延伸到固有肌層但不超過固有肌層,此時未見高信號的黏膜下層,但固有肌層完全保留;T3期,腫瘤延伸超過固有肌層進入直腸系膜脂肪層;T4期,腫瘤侵犯周圍結構或器官。
1.5 影像組學分析 在ITK-SNAP(Version 3.60,www.itksnap.org)軟件上進行圖像分割[10]。由1名具有多年腹部MRI診斷經驗的影像科醫師在高分辨T2WI上沿腫瘤邊緣逐層手動勾畫ROI,盡量排除未受侵的直腸壁和腸腔內的氣體。
勾畫ROI后,將DICOM圖像和ROI輸出,進行影像組學特征提取和分析:①數據預處理,先以中值代替所有數據中的缺失值,對特征做z-score標準化,以統一所有特征的尺度;②特征數降維,包括直方圖類、形態特征類和紋理特征類(共生矩陣類和步長矩陣),共396個特征,其中直方圖特征42個,形態特征9個,紋理類特征345個;使用廣義線性模型LASSO(Least Absolute Shrinkage and Selection Operator)算法進行特征選擇(圖1),最終篩選出14個特征,包括Compactness1,Correlation_All Direction_offset4_SD,GLCM Energy_angle90_offset1,Hara Entroy,Haralick Correlation_All Direction_offset1_SD,Long Run High Grey Level Emphasis_All Direction_offset7_SD,Low Intensity Large Area Emphasis,Maximum 3D Diameter,Min Intensity,Quantile 0.025,Run Length Nonuniformity_All Direction_offset4_SD,Run Length Nonuniformity_All Direction_offset7_SD,Spherical Disproportion和Zone Percentage;③對篩選出的特征建立預測模型,通過隨機森林算法(random forest, RF)先建立組學模型,再利用組學產生的Rad-分值與臨床數據結合建模;④模型評估,即數據驗證,對建立的模型進行回歸診斷后,將驗證數據帶入模型中進行驗證。
1.6 統計學分析 采用SPSS 22.0統計分析軟件和Python 3.6軟件。計量資料以±s表示,2組間比較采用獨立樣本t檢驗;計數資料比較采用χ2檢驗。繪制預測模型的ROC曲線,計算AUC、準確率、敏感度、特異度,以及F1值和Brier值,以評估模型與驗證數據集的可預測性。采用決策曲線分析(decision curve analysis, DCA)方法,以病理結果為標準,計算常規MRI診斷直腸癌T1~T2期與T3~T4期的準確率、敏感度和特異度,并與影像組學模型對比。P<0.05為差異有統計學意義。

表1 訓練組與驗證組患者一般資料比較

圖1 影像組學特征的篩選 A.LASSO算法調節參數log(alpha)的選擇; B.396個影像組學特征在模型中的系數,垂直線表明經過10倍交叉驗證后的最佳選擇log(alpha)值,獲得14個系數非零的特征

圖2 基于影像組學特征的預測模型診斷T1~T2與T3~T4分期的ROC曲線 A.訓練組; B.驗證組
本組191例直腸癌中,病理結果顯示早期(T1~T2期)68例,局部進展期(T3~T4期)123例;隨機分為訓練組和驗證組,訓練組134例,驗證組57例。2組性別、年齡、腫瘤原發位置及T分期差異均無統計學意義(P均>0.05,表1)。
2.1 影像組學模型的構建與驗證 將驗證數據帶入組學模型中,得到的混淆矩陣顯示訓練組中陽性預測值和陰性預測值分別為0.946(70/74)和0.733(44/60);驗證組中陽性預測值和陰性預測值分別為0.850(34/40)和0.824(14/17)。
2.2 組學模型的診斷效能 ROC曲線(圖2)結果顯示,基于影像組學特征的預測模型診斷T1~T2與T3~T4期的預測模型在訓練組和驗證組的AUC分別為0.927、0.885(P均<0.05),準確率為0.851(114/134)、0.842(48/57),特異度為0.917(44/48)、0.700(14/20),敏感度為0.814(70/86)、0.919(34/37);F1值為0.861、0.829,Brier值為0.149、0.159。醫師以常規MRI診斷T分期的準確率、敏感度和特異度分別為0.817(156/191)、0.854(105/123)、0.750(51/68)。
預測模型的訓練組和驗證組的Rad-分值圖(圖3)中,分值越大越傾向于直腸癌局部進展期,分值>0代表預測為局部進展期(T3~T4期),分值<0代表預測為早期(T1~T2期)。模型在驗證組中的DCA(圖4)表示不同風險閾值下的凈獲益,當風險閾值在訓練組與驗證組中分別為38%~95%、40%~95%時,采用影像組學方法預測直腸癌病理局部進展期的方法優于將所有患者視為進展期或早期。
本研究利用基于高分辨率T2WI提取的影像組學特征術前判斷直腸癌患者T分期,結果表明,作為預測模型,影像組學特征在判定T分期方面具有可行性,且診斷效能略高于醫師對于常規MRI的評估;后期通過提高數據量,有望進一步增加模型診斷的準確率。
3.1 基于MRI的影像組學模型評估直腸癌術前T分期的價值與現狀 目前治療直腸癌的標準方法為對早期(T1~T2期)病變行手術切除,而對局部進展期(T3~T4期)病變先行新輔助放化療,然后再行全直腸系膜切除術。因此,術前正確區分T1~T2與T3~T4期對于臨床制定治療計劃具有重要意義。目前采用高分辨MRI術前判定直腸癌T分期的準確率尚不理想,Meta分析[11]顯示其準確率差異較大,范圍從44%~100%,主要原因可能為MRI定性評估受醫師主觀判斷及經驗水平的影響較大。

圖3 訓練組(A)與驗證組(B)的預測分值圖,紫色代表病理診斷為早期,藍色代表病理診斷為局部進展期,分值越大越傾向于局部進展期

圖4 訓練組(A)與驗證組(B)的DCA曲線,表示不同風險閾值下的凈獲益 (LR:預測模型;None:無處理;All:完全處理)
定量的影像組學分析在鑒定腫瘤特征方面具有一定價值,可應用于腫瘤診斷和預后評估[12-15]。本研究結果表明,提取大量高通量影像組學特征并使用LASSO降維分析后,采用RF模型分析方法構建影像組學模型并據此術前識別直腸癌T1~T2與T3~T4期具有一定臨床價值,有望用于指導臨床制定個體化治療方案、確定手術方式,與Sun等[16]的研究結果一致。本研究中使用影像組學特征結合臨床資料診斷T分期的預測模型的準確率較高,且與醫師評估MRI分期相比客觀性更好。Liu等[17]基于ADC圖提取組學特征,并將偏度和熵等影像組學特征作為T3~T4期直腸癌的獨立預測因子,其結果亦表明MRI影像組學特征對于判定直腸癌T分期具有潛在價值。
3.2 采用RF算法構建的影像組學模型對于直腸癌T分期的診斷效能 RF是一種統計學習理論,使用重采樣技術生成多個樣本形成的決策樹,多個決策樹聯合進行投票,選擇票數最多的類別。與傳統分類方法(如線性回歸分析和邏輯回歸分析)相比,RF是一種集合算法,具有較高的準確率及容忍度,其最大優勢在于可預測多變量的數據,分析復雜的非線性關系[18]。本研究從MRI及臨床資料中提取定量信息,采用RF算法建立預測模型,并通過外部驗證模型的分類效果,發現預測模型對于直腸癌T分期具有良好的判別能力,有助于為個體化治療直腸癌提供依據。
F1值是一個新的機器學習指標,F1值是精確率和召回率的加權平均值,最佳F1值為1,最差為0。Brier值是衡量概率校準的參數,Brier分數越低,預測校準越好。本研究中訓練組和驗證組中F1值分別為0.861、0.829,Brier值分別為0.149、0.159,顯示模型具有良好的診斷效能和較高的可預測性。
本研究的局限性:①影像組學依賴于“大數據”,而此項單中心隊列研究樣本量相對較小,需要更大樣本量的多中心試驗加以驗證;②本組數據T1與T4期患者的數量不均衡,可能導致T分期的分組偏倚;③本研究為回顧性研究,存在不可避免的選擇偏倚;④影像組學的中心假設是基于該方法可以描述腫瘤的異質性,并通過醫學圖像捕獲,從而輔助評估腫瘤的生物特性,但本研究無法獲得腫瘤的異質性。
綜上所述,基于T2WI提取的影像組學特征術前判定直腸癌T分期具有可行性。