徐家軍,李 瓊,張 虎,唐曉磊,劉希勝
(1.南京醫科大學第一附屬醫院 放射科,江蘇 南京 210029;2.蕪湖市第二人民醫院 醫學影像科,安徽 蕪湖 241000;3.皖南醫學院第二附屬醫院 轉化醫學中心,安徽 蕪湖 241000)
胃癌位列全球惡性腫瘤發病率第5位、病死率第4位[1],在我國初治胃癌患者仍以進展期居多[2],根治性胃癌切除術仍為首選治療方案,但5年生存率卻較低。目前已有多項研究表明,新輔助治療在降低胃癌分期、減滅微轉移灶等方面具有潛力[3-5]。中國臨床腫瘤學會胃癌診療指南推薦對于T3-4/N+的患者在術前進行新輔助治療[3]。因此,在術前建立預測模型識別胃癌臨床分期對臨床決策有重要的指導意義。雙能CT(dual energy computed tomography,DECT)能譜成像具有多參數成像特點,其碘圖及低能級的虛擬單能量圖像可客觀定量地評估腫瘤浸潤胃壁的深度和淋巴結有無轉移,診斷效能高于常規增強CT,為術前胃癌臨床分期提供了一種更加有效的檢查手段。本研究基于DECT構建隨機森林(random forest,RF)模型探討其在胃癌術前臨床分期中的價值,為臨床決策提供參考。
1.1 研究對象 收集2018年12月~2021年7月于南京醫科大學第一附屬醫院行DECT掃描的胃癌患者200例,男149例,女51例,年齡26~79歲。納入標準:①病理證實為胃癌,并接受胃癌根治術;②術前接受過DECT檢查、胃充盈良好的增強圖像;③術前無新輔助化療、放療等治療史。排除標準:①病灶難以分辨或胃周脂肪薄弱無法準確測量影響評估;②碘對比劑過敏或腎功能不全、惡病質者;③同時合并其他惡性腫瘤或轉移者。200例患者中,Ⅰ+Ⅱ期95例、Ⅲ期105例,按3∶1隨機分成訓練集、測試集,訓練集150例(Ⅲ期組79例、Ⅰ+Ⅱ期組71例),年齡(62.01±10.84)歲;測試集50例(Ⅲ期組26例、Ⅰ+Ⅱ期組24例),年齡(61.04±10.23)歲。
1.2 檢查方法 患者禁食6~8 h,掃描前5~10 min飲水800~1 000 mL,并進行呼吸憋氣訓練。采用Siemens Definition Flash雙能CT機,掃描模式為雙能量、雙期增強,A球管電壓100 kV、管電流220 mAs,B球管電壓150 kV、管電流110mAs,開啟實時動態曝光劑量調節,螺距1.15,球管旋轉時間0.5 s,矩陣512×512,掃描層厚5 mm,并以1.5 mm自動薄層重建。通過靜脈留置針高壓注射非離子型碘對比劑優維顯1.5 mL/kg(300 mgI/mL),流速3.0 mL/s,將閾值感興趣區(region of interest,ROI)置入腹主動脈,在腹主動脈CT值達到100 HU后延遲10 s和40 s后分別行動脈期(arterial phase,AP)、靜脈期(venous phase,VP)掃描。掃描范圍自膈肌至胃下緣層面。0.6融合圖像:由100kV和Sn150kV的數據以0.6加權系數融合而成(即相當于120 kV常規CT圖像)。
1.3 圖像分析 使用Liver VNC軟件,先將圖像歸一化操作,即在腫瘤軸位最大層面腹主動脈畫ROI,可分別獲得AP和VP碘圖。根據Küpeli等[6]標準,在癌周脂肪組織距胃壁約1 mm處沿其漿膜走行區和遠離胃癌正常胃周脂肪組織區分別劃取條形或圓形ROI(25~50 mm2),寬度≤5 mm,然后在雙期圖像上分別測量癌灶、胃癌周圍脂肪組織及正常胃周脂肪組織的的碘基值、融合圖像CT值和VP 70 keV單能量圖像CT值、最厚徑與最大徑。避開血管、壞死或氣-液平交界面存在的偽影區。ROI確定后可獲得雙期融合圖像的CT值以及相對應的碘值(iodine concentration,IC)、標準化碘值(normalized iodine concentration,NIC)(NIC=IC腫瘤/IC腹主動脈)及VP 70 keV單能量圖像CT值。兩名有6年、10年豐富胃癌診斷經驗的醫生進行獨立閱片和測量,意見分歧時共同協商決定。同一病例在雙期圖像上劃取的ROI形狀、位置及大小盡量相同,分別測量2次取其平均值,見圖1。

患者男性,66歲,胃癌。A~C.動脈期碘圖,IC癌灶-AP、IC癌脂-AP、IC正脂-AP分別為2.0、0.0、0.0 mg/mL,對應NIC值及融合圖像CT值分別為0.21、0.00、0.00和76.20、-99.50、-93.40 HU;D~F.靜脈期碘圖,IC癌灶-VP、IC癌脂-VP、IC正脂-VP分別為4.0、0.0、0.0 mg/mL,對應NIC值及融合圖像CT值分別為0.78、0.00、0.00和86.70、-80.30、-96.80 HU;G~I.靜脈期70 keV單能量圖,單癌灶-VP、單癌脂-VP、單正脂-VP的CT值分別為107.80、-85.40、-99.10 HU。
1.4 模型的建立與驗證 本研究使用訓練集來構建RF模型,使用獨立測試集進行驗證。首先將所有的臨床及影像變量納入單因素分析,篩選單因素分析中P<0.2[7]的變量納入RF模型中進行特征篩選。該模型使用平均下降基尼指數(mean decrease gini index,MDGI)來評估變量的重要性。Gini指數是計算每個變量對分類樹上每個節點觀測值的異質性的影響,并以此來衡量各變量的重要性,Gini值越大對應變量的重要性越大,并以此得到重要性排序。

2.1 訓練集和測試集單因素分析 訓練集中的AP胃癌的癌灶IC值(IC癌灶-AP)、胃癌周圍脂肪組織IC值(IC癌脂-AP)、NIC癌灶-AP、NIC癌脂-AP、融合圖像癌灶的混合能量CT值(混癌灶-AP)、混癌脂-AP、混正脂-AP和IC癌脂-VP、NIC癌脂-VP、混癌灶-VP、混癌脂-VP、混正脂-VP、70 keV單能量癌灶CT值(單癌灶-VP)、單癌脂-VP、單正脂-VP及最厚徑、最長徑的P值均<0.2,見表1。

表1 訓練集和測試集中患者的臨床、影像定量參數資料單因素分析
2.2 RF模型的建立與驗證 本研究將所有的臨床及影像變量經單因素分析后,將P<0.2的候選變量納入訓練集并采用RF算法篩選出5個變量:IC癌脂-VP、最厚徑、NIC癌脂-VP、最長徑、單癌脂-VP,進行模型構建,其Gini值依次分別為0.201、0.197、0.190、0.159、0.141。通過十折交叉驗證的方法發現,聯合使用這5個變量的模型綜合預測效能較高,訓練集和測試集術前預測Ⅲ期組和Ⅰ+Ⅱ期組胃癌的曲線下面積(AUC)分別為0.924、0.917,見表2、圖2。

表2 RF模型訓練集及測試集預測臨床分期的ROC曲線

圖2 RF模型訓練集(A)與測試集(B)的ROC曲線
本研究基于DECT定量參數構建RF模型,對胃癌術前臨床分期進行了研究,RF模型對胃癌術前臨床分期有較好的鑒別能力,區分Ⅲ期與Ⅰ+Ⅱ期胃癌的AUC>0.9。為了更好地適應臨床胃癌初診治療決策和個體化精準醫療需求,2016年10月的第8版胃癌TNM分期系統新劃分出了臨床分期(cTNM)[8],本研究以此為依據將cT3-4aN+M0列為Ⅲ期,而cT1-2NanyM0與cT3-4aN0M0則列為Ⅰ期+Ⅱ期。目前,對于無遠處轉移的Ⅲ期胃癌國內、外指南[3,9]均推薦在手術前進行新輔助治療,通過降低局部和遠處復發風險來改善患者的總生存期,還可提高局部晚期胃癌患者的病理完全緩解率,是患者預后的獨立預測因素[10]。
DECT突破了以往常規增強CT在胃癌術前分期診斷方面的局限性,不僅可以獲得胃癌的形態結構信息,而且利用多參數成像可定量評估癌腫浸潤胃壁的深度及淋巴結有無轉移。碘圖可對組織內的碘含量進行直觀偽彩顯示,且人眼對色彩的敏感性優于灰階圖像。嚴映等[11]研究發現,利用DECT靜脈期碘圖的漿膜高強化征可區別T3與T4a期胃癌,且陽性診斷率高于融合圖像(P<0.05)。另外具有高對比噪聲比的低能級單能量圖像,可優化顯示低對比度組織結構的細節。王學東等[12]研究顯示,靜脈期DECT的低能級單能量CT值、IC值及NIC值可鑒別T2與T3期胃癌,聯合NIC和單能量CT值可使診斷效能進一步提升。前期研究顯示,DECT靜脈期的定量參數診斷效能高于動脈期,與本研究的結果一致。可能由于動脈期主要反映腫瘤功能性微血管的血供特點,而靜脈期反映的是腫瘤血供平衡及部分非功能性新生血管,碘對比劑受限于腫瘤組織周邊纖維成分的阻隔而廓清延遲,所以靜脈期的碘值能更準確地反映腫瘤內部的碘含量及其分布情況。有研究表明,浸潤深度可作為早期胃癌淋巴結轉移的獨立預測因素[13]。另有學者通過測量靜脈期甲狀腺乳頭狀癌原發灶的碘基值可預測頸部中央組淋巴結的轉移[14]。王睿等[15]研究顯示,胃癌的T分期、最厚徑及靜脈期NIC值是影響淋巴結轉移狀態的獨立預測指標,可提高術前診斷N分期的準確性。胃癌的最大徑、最厚徑代表腫瘤累及的范圍和浸潤的深度,而胃壁間的毛細淋巴管最終匯入淋巴管道豐富的漿膜下層,隨著癌腫浸潤深度的增加,與毛細淋巴管網的接觸面越大,淋巴結轉移的概率也會升高。
RF是基于決策樹的一種集成學習方法,其處理大數據能力較強,對多元共線性不敏感,可很好地預測多達幾千個變量,且在分類預測方面具有穩定、易操作、精確和不易過度學習等優勢。在綜合預測效果方面RF模型優于Logistic回歸模型[16]。且相較于支持向量機、人工神經網絡等機器學習運算法則,RF也具有優勢[17]。徐青青等[18]利用門脈期CT圖像紋理特征構建的RF模型在鑒別結直腸癌KRAS基因突變最終模型的AUC為0.93,留組交叉驗證顯示平均AUC為0.81。近來有學者采用RF算法構建的基于靜脈期DECT影像組學模型和組合模型在診斷胃癌漿膜侵襲方面均表現出較高的診斷效能,在訓練集和測試集隊列中,影像組學模型AUC分別為0.90、0.90,組合模型AUC分別為0.93、0.93[19]。本研究建立的RF診斷模型也有著較高的診斷效能,訓練集和測試集AUC值分別為0.924、0.917,與既往研究結果相似,具有臨床實用性。
本研究存在一定的局限性。首先,研究納入的樣本量較小,故需要納入更多患者進行結果驗證;其次,研究缺乏外部驗證,故模型的泛化能力優勢尚不得知,后續需收集獨立的外部數據進行結果驗證。
綜上,本研究通過RF算法對變量進行了篩選、去冗余,并構建及內部驗證了胃癌新輔助治療診斷模型,為臨床決策提供了一種新思路和參考依據,使得患者在個體化治療中受益。