張古沐陽,許梨梨,毛 麗,李秀麗,金征宇,孫 昊
1中國醫學科學院 北京協和醫學院 北京協和醫院放射科, 北京 1007302深睿醫療人工智能研究院, 北京 100080
膀胱癌是泌尿系統最常見的惡性腫瘤,發病率位居全球惡性腫瘤的第9位[1]。較高的復發率是膀胱癌診治過程中面臨的嚴峻問題,尤其非肌層浸潤性膀胱癌的5年復發率高達50%~70%[2]。對高復發風險的膀胱癌患者,早期予以更積極的初始治療,并制訂更緊密的隨診方案,有望改善其預后。因此,準確預測膀胱癌復發風險具有重要意義。
CT是評估腫瘤患者病情嚴重程度最常用的術前檢查手段之一,可對腫瘤病灶進行準確定位,并輔助判斷病灶數目、大小、與周圍組織的關系以及有無淋巴結和遠處轉移。但常規CT對膀胱癌組織的分辨率不高,提供的腫瘤信息受限。近年來,新興的影像組學技術通過從醫學影像中高通量地提取肉眼不可見的定量特征數據,深度挖掘醫學圖像的生物學本質,并通過人工智能技術對海量的影像數據進行處理和分析,可構建對腫瘤進行無創定量診斷、療效評估及預后預測的模型[3- 6]。本研究基于術前CT圖像探究通過新興的影像組學技術構建膀胱癌術后1年復發預測模型的可行性,旨在為該類患者臨床診治方案的選擇提供輔助支持。
回顧性納入2014年5月至2018年7月北京協和醫院診治的膀胱癌患者。納入標準:(1)均行手術治療,組織病理學證實為原發性膀胱尿路上皮癌;(2)術前在本院行CT泌尿系成像(CT urography,CTU)檢查;(3)術后規律隨訪時間超過1年。排除標準:(1)術前CTU圖像不清晰者;(2)合并其他系統腫瘤者;(3)臨床資料不完整者。
本研究已通過北京協和醫院倫理審查委員會審查(審批號:ZS- 1271)。
1.2.1 臨床資料收集
記錄患者的年齡、性別、T分期、手術方式等臨床資料。
1.2.2 CTU圖像采集與病灶分割
CTU檢查設備為美國GE公司能譜CT (GE Discovery)和德國Siemens公司雙源雙能量CT(Siemens Definition Flash)。患者取仰臥位,掃描范圍為整個腹盆腔。掃描參數:管電壓120 kVp,管電流為實時自動調節,掃描視野350 mm×350 mm,螺距0.9 mm,準直64 mm×0.6 mm,層厚、層間距均為1 mm。增強掃描時,采用雙筒高壓注射器以4.5 mL/s速度注入100 mL非離子對比劑(碘帕醇 370 mg I/mL,上海博萊科信誼藥業有限責任公司產品),之后注射100 mL生理鹽水。采用Bolus tracking閾值觸發掃描技術行增強掃描,觸發掃描感興趣區(region of interest, ROI)置于降主動脈與腹主動脈交界處。自動觸發閾值設定為120 HU,達到閾值后延遲25 s、75 s、300 s分別采集皮髓質期、實質期和排泄期圖像。本研究僅選取實質期圖像用于后續分析。
由2名放射科醫師(分別具有6年和14年泌尿系統疾病影像診斷經驗)在未知患者病情的情況下共同完成CTU實質期圖像閱片,意見不一致時協商解決。記錄病灶數量、最大病灶直徑及最大病灶CT值。采用深睿科研平臺Deepwise Research Platform(http://label.deepwise.com)半自動勾畫3D 腫瘤病灶ROI。病灶區域ROI勾畫過程中,首先基于水平集的分割算法進行自動勾畫,然后放射科醫師手動修正錯誤的分割。多發病灶,僅勾畫最大病灶。
1.2.3 特征提取
采用Pyradiomics 2.1.2軟件提取腫瘤病灶ROI內影像組學特征。為抵消CT各向空間分辨率不統一導致的干擾,對所有圖像進行重新采樣,使得3個解剖方向上的像素均為1.0 mm。然后對圖像進行預處理,包括使用小波濾波器對圖像進行高通或低通濾波,以及使用不同σ參數的拉普拉斯高斯濾波器對較粗糙的紋理或較細致的紋理進行強化。
1.2.4 特征篩選和模型構建
采用Python3.6和Scikit-learn 0.20.3軟件進行影像組學特征篩選和模型構建。在進行特征篩選和模型構建前,所有提取的影像組學特征均經Z-score歸一化處理,然后采用JMIM特征選擇算法選擇最優特征子集,保障篩選后的特征子集與膀胱癌復發的交互信息量最大。共構建3個基本模型,包括隨機森林(random forest)模型、自適應增強(AdaBoost)模型和梯度提升樹(gradient boosting)模型。根據驗證集中受試者工作特征(receiver operating characteristic, ROC)曲線的曲線下面積(area under the curve, AUC)逆向選擇模型的最優超參數,包括隨機森林模型的決策樹棵數、判斷劃分葉子節點質量的標準、最大決策樹深度;自適應增強模型的決策樹棵數、學習率和提升算法;梯度提升樹模型的損失函數、學習率、決策樹棵數、判斷劃分葉子節點質量的標準、最大決策樹深度。3個基本模型構建完成后,對其預測結果進行軟投票(soft voting),得到3個基本模型相結合構成的組合模型的預測結果。其中,隨機森林模型的預測結果由模型中所有決策樹的預測概率均值計算得到,自適應增強模型和梯度提升樹模型的預測結果是由模型中所有決策樹的預測概率進行加權平均而來。
基于10次10折交叉驗證法對預測模型進行驗證,評估3個基本模型和組合模型的預測效能,效能指標包括AUC、準確度、靈敏度、特異度。具體做法:將數據隨機分為10份,依次將其中9份作為訓練集,剩余1份作為驗證集,每次試驗均可得出相應的模型預測概率,將10次預測結果的均值作為對模型精度的估計;共進行10次10折交叉驗證,計算各預測效能指標的均值,作為對模型效能的最終評估結果。為進一步對模型進行解釋,對3個基本模型中影像組學特征的基尼重要性進行可視化分析。
對所有患者進行隨訪,隨訪時間間隔根據患者具體情況而定,隨訪內容包括臨床癥狀、尿常規、腹盆CT、膀胱鏡等,總隨訪時間不少于1年。隨訪1年時,經膀胱鏡及病理檢查證實為膀胱癌復發則定義為復發組,其余患者為未復發組。
樣本量估算:根據公式n=[Z2×P(1/P)]/e2計算樣本量。其中Z為1.96;P為預估的膀胱癌復發率,本研究設為0.2;e為研究的精度,設為0.05。經計算樣本量為174例。
偏倚控制:在影像特征篩選和模型構建前,對所有提取的影像組學特征進行歸一化處理,以減少檢查設備不同造成的干擾。
采用SPSS 22.0和R 3.6.0軟件進行統計學分析。年齡為計量資料且符合正態分布,以均數±標準差表示,組間比較采用獨立樣本t檢驗;最大病灶直徑、最大病灶CT值不符合正態分布,以中位數(四分位數)表示,組間比較采用非參數檢驗。病灶數量為計數資料,以例數(百分數)表示,組間比較采用χ2檢驗。采用ROC曲線分析法計算各模型預測膀胱癌術后1年復發的準確度、靈敏度、特異度、AUC及其95%置信區間(confidence interval, CI),并采用Delong檢驗對各模型的AUC進行比較。雙側檢驗,檢驗水準α=0.05。
共228例符合納入和排除標準的膀胱癌患者入選本研究。其中男性168例,女性60例;平均年齡(64.4±11.1)歲;行經尿道膀胱腫瘤切除術(transurethral resection of bladder tumor, TURBT)者220例,行全膀胱切除術者5例,行膀胱部分切除術者3例。
術后平均隨訪(31.5±14.3)個月,隨訪1年時51例患者復發(復發組),177例患者未復發(未復發組)。復發組患者均行TURBT;非復發組患者中,169例行TURBT,5例行全膀胱切除術,3例行膀胱部分切除術。復發組患者與未復發組患者的最大病灶直徑(P=0.017)、病灶數量(P=0.005)有顯著性差異。兩組患者的年齡、最大病灶CT值及T分期均無顯著統計學差異(P>0.05),見表1。

表1 膀胱癌術后1年復發組與未復發組患者臨床資料比較
基于原始圖像和濾波后的圖像,共提取1218個影像組學特征,包括252個描述腫瘤內部CT值統計分布的一階特征,14個描述腫瘤形態的特征,308個描述腫瘤紋理的灰度共生矩陣(gray level co-occurrence matrix, GLCM)特征、224個灰度游程矩陣(gray level run length matrix, GLRLM)特征、224個灰度區域大小矩陣(gray level size zone matrix, GLSZM)特征和196個灰度依賴矩陣(gray level dependence matrix, GLDM)特征。基于特征之間的相關性分析結果,將1218個影像組學特征過濾掉887個,保留331個。進一步基于JMIM特征選擇算法篩選,得到100個P值較小的影像組學特征用于構建3個預測模型。3個基本模型中影像組學特征的基尼重要性見圖1(僅顯示重要性不為零的特征)。

圖1 3個基本模型中影像組學特征的基尼重要性分析
影像組學特征篩選完成后,共構建3個基本模型和1個組合模型。根據交叉驗證的結果,隨機森林模型、自適應增強模型、梯度提升樹模型和組合模型預測膀胱癌術后1年復發的AUC分別為0.729、0.710、0.709、0.732(表2,圖2),Delong檢驗提示,各AUC之間均無顯著統計學差異(P均>0.05)。

圖2 經交叉驗證影像組學模型預測膀胱癌術后1年復發的ROC曲線圖AUC:同表2;ROC:受試者工作特征

表2 影像組學模型在訓練組和經交叉驗證對膀胱癌術后1年復發的預測效能
本研究基于CT圖像構建膀胱癌術后1年復發的多個影像組學預測模型,包括隨機森林模型、自適應增強模型、梯度提升樹模型及3個基本模型構成的組合模型。經交叉驗證,隨機森林模型、自適應增強模型、梯度提升樹模型及組合模型預測膀胱癌術后1年復發的AUC分別為0.729、0.710、0.709和0.732,提示CT影像組學模型可準確預測膀胱癌術后1年復發的風險,有助于早期識別高復發風險人群,進而提前進行個體化干預。
高復發率是影響膀胱癌患者預后的關鍵因素,降低復發風險是該類患者的重要診治目標[7]。預測膀胱癌復發風險有助于膀胱癌治療和隨診方案的選擇,具有重要臨床意義,是國內外泌尿外科領域研究的熱點。既往有關膀胱癌復發風險預測的研究主要通過整合膀胱癌術前與術后臨床資料、病理信息進行預測[8]。較為認可的2個預測模型分別是歐洲癌癥研究和治療組織(European Organisation for Research and Treatment of Cancer, EORTC)泌尿生殖系統癌癥組制定的風險評估表和西班牙泌尿系統腫瘤治療俱樂部(Spanish Urological Club for Oncological Treatment, CUETO)構建的評分模型[9- 10],但前者預測膀胱癌術后1年復發的準確度僅為61%,后者的準確度亦不足70%;且2個模型的陽性預測值均較低,尤其對于高級別非肌層浸潤膀胱癌,陽性預測值均在20%左右,因此臨床應用受限。部分研究通過篩選一些分子標志物如Ki- 67指數、纖維細胞生長因子受體3(fibroblast growth factor receptor 3,FGFR3)和p53等構建膀胱癌術后復發的預測模型[11- 13],但其是否具有臨床應用價值尚需驗證。
影像學在疾病的早期診斷、療效監測及預后評估中發揮重要作用。CT檢查具有價格低、掃描快、設備普及度廣,對膀胱癌診斷效能高的優勢,但其對軟組織的分辨率不高,常規CT難以提供除解剖結構之外的更多信息,因而近年來膀胱癌診療的影像學相關研究主要集中于MRI[14]。但MRI檢查價格高、掃描慢、設備普及度低,相關研究成果在國內的臨床應用前景不如CT。另一方面,影像組學技術的出現為CT影像實現對膀胱癌復發風險的精準預測提供了可能。
影像組學技術通過高通量地提取病灶圖像的信息特征,深入挖掘與疾病診斷、預后相關的影像特征,為臨床診療提供了新的思路。截至目前,已有相關研究報道了基于CT圖像的影像組學技術在膀胱癌診療中的應用價值[15- 17]。關于膀胱癌淋巴結轉移預測方面,Wu等[15]納入118例膀胱癌患者,分為訓練集(80例)和驗證集(38例),將影像組學特征與臨床傳統危險因素相結合以構建預測膀胱癌淋巴結轉移風險的諾模圖。訓練集中,該諾模圖預測效能的AUC為0.926,在驗證集中AUC亦達0.899。有關膀胱癌病理分級鑒別方面,本研究團隊在2020年發表的一項包含145例膀胱癌患者(訓練集108例,驗證集37例)的研究中,基于增強CT圖像構建的影像組學模型鑒別膀胱癌病理高/低級別的AUC達0.860,靈敏度和特異度分別為88.5%和72.7%[16]。有關膀胱癌肌層浸潤預測方面,Garapati等[18]研究顯示,應用機器學習法構建的腫瘤形態學和紋理特征模型預測膀胱癌肌層浸潤情況的AUC約為0.90。但目前基于CT影像組學預測膀胱癌術后復發風險的相關研究鮮有報道。
本研究通過從原始圖像和濾波圖像中提取海量影像組學特征,經篩選后獲得與膀胱癌術后復發相關度最高的特征進行模型構建,并將多個模型進行結合構建組合模型以綜合評估膀胱癌術后復發的風險。結果顯示,隨機森林模型、自適應增強模型、梯度提升樹模型和組合模型預測膀胱癌術后1年復發的AUC均為0.7以上,且兩兩比較均無顯著性差異,提示借助CT影像組學技術實現對膀胱癌術后早期復發風險預測具有可行性。但該模型未兼具高靈敏度和高特異度,如梯度提升樹模型的靈敏度高達80.4%,其特異度僅為56.5%;隨機森林模型的特異度高達83.6%,靈敏度卻僅為52.9%,提示僅憑單一模型難以全面準確地預測膀胱癌術后1年的復發風險。雖然本研究未能構建一個“最優”模型,但與EORTC模型和CUETO模型相比,本研究構建的預測模型準確度更高,具有良好的臨床應用前景。另一方面,本研究基于術前CT圖像進行膀胱癌術后復發風險預測,而EORTC模型和CUETO模型則是根據患者的臨床資料進行預測,本研究構建的預測模型可作為EORTC模型和CUETO模型的補充,進一步完善膀胱癌患者的術前評估內容。本研究結果提示,借助影像組學技術,可從常規CT影像中挖掘更多的信息,優化膀胱癌患者的診治方案;而將基于多方面臨床資料的多個模型相結合,可能有助于提高模型的預測效能。
本研究局限性:(1)為單中心回顧性分析,后續仍有必要開展多中心前瞻性研究進一步驗證模型的預測效能。(2)由于樣本量受限,本研究采用的交叉驗證法可能高估預測模型的準確性,今后需考慮納入更多病例,設定獨立的訓練集和驗證集。(3)隨機森林模型、自適應增強模型、梯度提升樹模型及組合模型預測膀胱癌術后1年復發的AUC均在0.70~0.75之間,從臨床應用的角度考慮,AUC仍偏低,需對模型進一步優化。(4)術后膀胱癌是否復發與多種因素相關,如患者的臨床特征、手術方式、術后放化療等,本研究僅聚焦于CT圖像,未進行多方面因素的整合。后續考慮納入更多的臨床資料,以構建更完善、診斷效能更高的預測模型。
綜上,基于CT圖像構建的多個可預測膀胱癌術后1年復發的影像組學模型,有助于早期識別高復發風險患者,輔助指導個體化診療方案的制訂。
作者貢獻:張古沐陽負責研究設計、數據分析、論文撰寫;許梨梨負責臨床數據收集及整理;毛麗負責數據分析和論文修改;李秀麗負責數據分析指導;孫昊負責指導研究設計與數據分析及論文修改;金征宇負責研究項目設計。
利益沖突:本研究所使用影像組學平臺由深睿醫療人工智能研究院提供,毛麗、李秀麗為深睿醫療人工智能研究院員工,其余作者均無利益沖突