李隴超 常鴻志 楊艷蓉 折霞 湯敏 雷曉燕 張小玲 張瀝
膀胱癌是泌尿系統最常見的惡性腫瘤之一[1]。臨床將膀胱癌分為非肌層浸潤性膀胱癌(nonmuscle-invasive bladder cancer,NMIBC)和肌層浸潤性膀胱癌(Muscle-invasive bladder cancer,MIBC),二者治療方式完全不同,前者主要采用經尿道腫瘤切除術,后者需行根治性膀胱腫瘤切除術,術前準確分期對膀胱癌患者治療和預后至關重要[2-5]。目前臨床分期主要依賴診斷性經尿道電切術和MRI 檢查。診斷性電切術,有創且結果依賴病理標本獲取準確性[6,7]。多參數磁共振成像(multiparmetic MRI,mpMRI)已越來越多應用于膀胱癌的術前分期,但其診斷準確性仍需進一步提高[8-12]。
近年來,隨著人工智能技術不斷發展,基于機器學習的影像組學方法已廣泛應用于全身各系統疾病的診斷與評估中[13-17],采用自動化數據特征化算法將醫學影像圖像轉化為具有高分辨率的、可挖掘的特征空間數據,量化病灶形態學特征及內部的異質性,獲取主觀視覺無法看到的信息,用于疾病診斷與評估等方面。本研究旨在探討基于機器學習的影像組學模型預測肌層浸潤性膀胱癌的診斷價值。
收集本院2017 年9 月~2020 年4 月經病理證實的膀胱癌患者資料。納入標準:(1)患者術前均接受3.0 T MRI 掃描,序列包括T2WI 和DWI,自動生成ADC 圖;(2)所有患者均于MRI 檢查后1個月內行手術治療,病理證實為膀胱癌。排除標準:(1)術前接受過放療、化療等治療;(2)MRI 圖像存在偽影,影響評估;(3)病理結果無準確分期;(4)腫瘤直徑小于1.0 cm(因腫瘤小于1.0 cm 時幾乎全部為非肌層浸潤性膀胱癌[18]),無納入研究的必要,且較小腫瘤在勾畫VOI 時因部分容積效應影響較大。最終,共計納入132 例膀胱癌患者,其中肌層浸潤性膀胱癌51 例,非肌層浸潤性膀胱癌81 例。
MRI 檢查采用Philips 3.0 T MR 掃描設備,16通道腹部相控陣線圈。掃描序列及參數:(1)快速自旋回波(turbo spin echo,TSE)序列,軸位T1WI:TR 498 ms,TE 8 ms,層厚4 mm,視野260×260,矩陣288×229,激勵次數1;軸位T2WI:TR 3020 ms,TE 100 ms,層厚4 mm,視野260×260,矩陣372×363,激勵次數1;矢狀位T2WI:TR 3541 ms,TE 90 ms,層厚4 mm,視野260×260,矩陣348×325,激勵 次1。(2)擴散加權成像(diffusion weighted imaging,DWI),軸位:b=0、1000 s/mm2,TR 2000 ms,TE 72 ms,矩陣128×96,視野28 cm×28 cm,層厚4 mm,自動生成ADC圖。
所有患者均在MRI 后1 個月內行手術治療,91 例行經尿道膀胱腫瘤切除術,10 例行部分膀胱切除術,31 例行根治性膀胱全切術。對于首次行經尿道膀胱腫瘤切除術后存在切緣腫瘤組織殘余患者,均行二次切除術確保腫瘤組織完整切除并最終確認病變分期。
腫瘤3D 分割:將T2WI 和ADC 圖像導入ITKSNAP 軟件(3.8 版本)進行病灶分割,對于多灶性腫瘤,選取最高分期病變進行分割,分別由兩名有5 年和6 年膀胱癌MRI 診斷經驗的醫生手動逐層勾畫三維體積興趣區(volume of interest,VOI),選擇每個序列的軸位圖像,避開壞死區及腫瘤蒂的區域。特征提取:通過分層抽樣方法將所有病例以7∶3 的比例分為訓練集及驗證集。應用AK(GE Healthcare Analysis Kit)軟件,對獲得的VOI 進行特征提取,自動獲得6 大類共402 個影像組學特征,包括直方圖參數、形態學參數、紋理特征參數、灰度共生矩陣參數、游程矩陣參數、灰度區域大小矩陣參數。特征篩選;在訓練集中,采用單因素方差分析、Mann-Whitney U 檢驗進行初篩,然后通過相關系數法去冗余,最后采用十倍交叉驗證LASSO 算法對特征進行降維選擇。機器學習建模;采用Logistic 回歸分析算法和R-Tree 對上述篩選的特征參數構建模型。分別構建3 組模型:(1)ADC特征集;(2)T2WI 特征集;(3)ADC+T2WI 特征集。驗證:使用訓練集數據構建模型,通過混淆矩陣的方法對驗證集進行驗證,采用ROC 分析評價模型的診斷效能,并計算特異度、敏感度和符合率。以上影像組學流程見圖1。

圖1 影像組學研究流程圖。a)VOI 勾畫;b)影像組學特征提取;c)影像組學特征篩選及模型建立評估 圖2 a)應用Logistic 回歸算法3組模型驗證集的ROC 曲線,ADC、T2WI、ADC+T2WI 模型的AUC 分別為0.800、0.878、0.910;b)應用R-Tree 算法3 組模型驗證集的ROC曲線,ADC、T2WI、ADC+T2WI 模型的AUC 分別為0.793、0.863、0.913
采用SPSS 22.0 和AK 軟件進行統計分析。采用組內相關系數(intraclass correlation coefficient,ICC)進行一致性檢驗,ICC>0.8 顯示一致性好。預測模型的診斷效能評估通過繪制受試者特征(receiver operating characteristic,ROC)曲線并計算曲線下面積(area under curve,AUC)、符合率、敏感度和特異度。P<0.05 為差異有統計學意義。
共計132 例膀胱癌患者,肌層浸潤性膀胱癌51 例,非肌層浸潤性膀胱癌81 例;單發98 例,多發34 例;MIBC 組年齡(65.4±9.2)歲,男44 例,女7 例;NMIBC 組年齡(64.3±8.9)歲,男68 例,女13例。隨機分組中,訓練集91 例,35 例MIBC,56 例NMIBC;驗證集41 例,16 例MIBC,25 例NMIBC。
兩名醫師在T2WI 和ADC 圖上勾畫VOI 一致性檢驗的ICC(95%CI)值分別為0.905(0.857~0.954)和0.924(0.865~0.967),均顯示較好的一致性。最終選擇較高年資醫生勾畫的VOI 進行影像組學分析。ADC 圖篩選出4 個影像組學最優特征,T2WI 篩選出13 個影像組學最優特征,ADC 與T2WI 一起篩選出6 個影像組學最優特征。
通過AK 軟件自動學習建模后,驗證集中應用Logistic 回歸分析算法三組模型(ADC、T2WI、ADC+T2WI)的AUC 值分別為0.800、0.878、0.910;特異度分別為0.680、0.880、0.880;敏感度分別為0.750、0.625、0.875;符合率分別為70.7%、78.1%、87.8%。驗證集中應用R-Tree 算法三組模型(ADC、T2WI、ADC+T2WI)的AUC 值分別為0.793、0.863、0.913,特異度分別為0.760、0.880、0.800;敏感度分別為0.750、0.688、0.875;符合率分別為75.6%、80.5%、83.0%(表1)。兩種機器學習算法均為ADC+T2WI 模型的AUC 最高(圖2);兩種機器學習算法構建的影像組學模型預測肌層浸潤性膀胱癌的診斷效能相當。

表1 兩種機器學習算法3 組模型在驗證集中的診斷效能
近年來,影像組學方法在膀胱癌患者術前評估中的應用,越來越受關注,已有文獻報道影像組學方法可預測膀胱癌肌層侵犯和病理分級[19-23],但是基于多種機器學習算法和不同影像序列的影像組學方法仍需進一步驗證研究。
本研究選擇了T2WI 和DWI(ADC 圖)兩組影像圖像,結果顯示基于兩組序列構建的模型均有較好的預測價值,提示簡單的檢查序列可以構建穩定和有效的模型,有助于未來簡化掃描方案,減少臨床對DCE 檢查序列的依賴。
本研究還發現ADC 聯合T2WI 特征集構建的預測模型,診斷效能最佳,兩種機器學習方法的AUC 分別為0.910 和0.913,可能跟T2WI 序列能提供組織結構信息,DWI 反映組織功能信息,二者結合可以為膀胱癌肌層浸潤預測提供更全面的信息。這兩種檢查序列均無創且易獲取。
本研究另一點優勢是應用Logistic 回歸分析法、R-Tree 兩種機器學習算法,可驗證所篩選特征預測價值的穩定性。這兩種機器學習算法,對ADC、T2WI、ADC 聯合T2WI 三組特征集進行學習建模,結果顯示在驗證集中Logistic 回歸分析法和R-Tree 兩種機器學習算法構建的影像組學模型對肌層浸潤性膀胱癌均有較好預測價值,診斷效能相當。以上兩種學習算法均是臨床中常用的機器學習算法,這兩種機器學習算法均比較適合小樣本和二分類變量的模型構建。上述結果也表明本研究中所篩選的最優特征具有較好的魯棒性,非常適合在臨床推廣。
也有研究者[23]發現將影像組學特征和其他成像信息(腫瘤是否存在蒂)相結合更有利于肌層浸潤性膀胱癌的術前預測,這確實是值得研究推廣的方法,未來可以將更多的臨床或影像信息,如腫瘤大小、VI-RADS 分類等結合起來,用于膀胱癌術前評估。
本研究的幾個局限性:(1)為單中心回顧性分析,需大樣本量的多中心、前瞻性分析進一步驗證;(2)本研究中采用手動勾畫VOI,兩位勾畫者一致性較好,但依然不排除主觀因素引起偏差;(3)本組患者接受了不同手術方式,手術可能導致腫瘤組織灼燒、碎裂等,對真實病理分期結果產生影響;(4)對膀胱腫瘤與膀胱壁更好的分割仍需進一步探索研究。
綜上,基于Logistic 回歸分析法、R-Tree 兩種機器學習算法的影像組學模型對肌層浸潤性膀胱癌均有較好的診斷價值,其中基于ADC+T2WI 特征集構建的預測模型,診斷效能最優。