黃忠江 姜增譽 李健丁 張智星 陳文青
1山西醫科大學醫學影像學院(太原030000);2山西醫科大學第一醫院影像科(太原030000)
血管平滑肌脂肪瘤(angiomyolipoma,AML)是最常見腎臟良性實性腫瘤,通常因其含有脂質成分,在臨床影像診斷中與腎透明細胞癌(clear cells renal cell carcinoma,ccRCC)較易鑒別,而少數缺乏或僅含有少量成熟脂肪成分,被稱為腎乏脂肪AML,其影像學表現與無囊變、壞死、出血的均質性ccRCC 極其相似,影像科醫生對圖像征象的主觀觀察還不足以區分兩者,因此非常容易誤診[1],通常需要活檢或手術才能確診。過往研究中多數是定量分析影像學特征來提高鑒別診斷能力[2-4],然而仍然存在誤診及無法確診的難題。近年來影像組學受到越來越多的關注,與傳統的影像圖像分析不同,影像組學使用數學算法來定量提取大量不能直接觀察到的病灶內部特征[5-6]。影像組學在腎腫瘤領域中已被應用于腎透明細胞癌分級及腎癌亞型的鑒別診斷[7-8]。術前鑒別腎均質ccRCC與腎乏脂肪AML 可減少患者有創活檢及手術痛苦。本研究的目的是探討基于CT 增強影像組學聯合機器學習建立組學模型并聯合臨床特征建立綜合模型術前鑒別腎均質ccRCC與腎乏脂肪AML。
1.1 一般資料回顧性分析2017年9月至2020年12月在我院泌尿外科手術病理證實且影像診斷報告無法確診及誤診的ccRCC 和腎乏脂肪AML 的患者,納入標準:(1)病理結果證實單發ccRCC 和腎乏脂肪AML 的患者。(2)術前在我院行泌尿系增強CT,圖像質量好,可滿足分析要求。(3)臨床資料齊全。排除標準:(1)CT 平掃圖像有可見病灶內脂肪的腎AML 患者;(2)腫瘤有明顯壞死、囊變或出血的ccRCC 患者。研究共納入患者48 例,男19例,女29例,年齡26~83歲,平均(52.7±12.7)歲。經術后病理證實均質性ccRCC 28 例,腎乏脂肪AML 22 例。
1.2 CT 圖像分析及特征提取將原始DICOM 圖像導入ITK-SNAP 軟件(version3.8.0,www.itksnap.org),由2名住院醫師和1名5年工作經驗影像主治醫師對皮質期及髓質期薄層圖像(層厚為0.5 mm)逐層勾畫感興趣區(region of interests,ROIs),要求勾畫不超過腫瘤邊緣且<1 mm,最后保存為三維容積ROIs(圖1),然后由2 名15年以上工作經驗的影像主任醫師對之前影像醫生勾畫感興趣區進行檢驗,最后由主任醫師的標準為最終結果。使用開源python 平臺“Pyradiomics 1.3.0”(http://www.radiomics.io/pyradiomics.html)在原始圖像上和經過濾波處理的派生圖像進行特征提取,具體為在原始圖像上提取了一階統計特征、基于形狀特征和紋理特征,然后將原始圖像小波濾波轉換成高、低頻組合成8 個不同頻率組合的特征,將再次提取一階統計特征和紋理特征,兩期CT 圖像總共可提取1 706 個組學特征。

圖1 腫瘤感興趣勾畫生成三維ROIsFig.1 Tumor region of interests are sketched to generate 3D ROIs
1.3 特征篩選與組學預測模型建立所有數據進行訓練建模,為了保證數據的平衡性采用了合成少數類過采樣技術(SMOTE),然后對特征進行z-score 歸一化處理。選擇皮爾遜相關系數(PCC)降維,使用方差分析(ANOVA)來選擇特征,為了避免模型過擬合,按F 值排名分別選取1~6 個數量的特征進行建模,利用邏輯回歸(LR)、隨機森林(random forest,RF)和支持向量機(support vector machine,SVM)三種機器學習方法建立共18 個預測模型,進行5 倍交叉驗證,選取交叉驗證集AUC值最高的為最佳模型。對模型采用bootstrap 法內部驗證得到受試者工作特征(ROC)曲線分析計算ROC 曲線下面積(AUC)值評估模型的診斷效能。
1.4 臨床特征分析根據患者臨床信息和CT 圖像信息將年齡、性別、腫瘤大小(CT 軸位最長徑)、腫瘤位置(左腎或右腎)納入臨床特征,進行單因素分析,然后將有統計學意義的臨床特征進行二元logistic 回歸分析,建立臨床預測模型并計算ROC 曲線下面積。
1.5 建立綜合模型并繪制列線圖利用所選臨床特征和最佳組學模型預測值進行多因素二元logistic 回歸建立綜合模型,并繪制列線圖,采用Hosmer-Lemeshow 擬合優度檢驗評價綜合模型的擬合度,并繪制校正曲線。繪制決策曲線評價綜合模型鑒別均質性ccRCC 和腎乏脂肪AML 的凈獲益。最后DeLong 檢驗比較臨床模型、組學模型和綜合的ROC 曲線的性能。
1.6 統計學方法臨床組學特征數據處理及構建模型使用開源FAE 軟件,采用SPSS 25.0 分析臨床特征,對定量變量進行獨立樣本t檢驗,對定性變量進行卡方檢驗或Fisher 確切概率法,然后進行多因素二元logistic 回歸分析。使用MedCalc 軟件繪制ROC 曲線并進行DeLong 檢驗。R 軟件使用“RMS”軟件包進行列線的繪制和校準,使用“Generalhoslem”軟件包進行Hosmer-Lemeshow 檢驗,決策曲線使用“dca.R”軟件包。P<0.05 為差異有統計學意義。
2.1 組學模型建立及效能18 個組學預測模型中結果選取5 個特征數LR 模型交叉驗證集AUC=0.70 為最高(圖2),將此模型選為最優模型,所選特征及特征貢獻度(圖3)。此模型經bootstrap 法內部驗證AUC 值為0.836(95%CI:0.701~0.927)。

圖2 LR 模型不同特征數交叉驗證集AUC 分布Fig.2 AUC distribution of cross validation set of different feature numbers in LR model

圖3 最佳模型特征貢獻值Fig.3 Feature contribution value of the best model
2.2 臨床預測模型建立患者臨床信息和CT影像信息分析得出,只有性別差異有統計學意義(表1),因此將性別作為預測因子建立臨床預測模型,模型AUC 值為0.656(95%CI:0.499~0.812)。
表1 臨床特征分析Tab.1 Analysis of clinical features ±s

表1 臨床特征分析Tab.1 Analysis of clinical features ±s
組別腎乏脂AML均質ccRCC t/χ2值P 值例數22 26男/女4/18 14/12 6.467 0.011年齡(歲)51.5±12.1 53.8±13.4-0.645 0.551腫瘤大小(cm)3.15±1.79 2.78±1.31 0.820 0.279右腎腫瘤(例)12 9 1.923 0.244
2.3 繪制綜合模型列線圖與不同模型比較綜合模型的AUC 為0.869(95%CI:0.740~0.949),綜合模型繪制的列線圖(圖4)提供預測為均質性ccRCC 的預測概率。綜合模型的校準曲線(圖5)具有良好的一致性(P>0.05)。決策曲線分析(圖6)顯示大部分概率值綜合模型可獲得更多的凈收益。三種模型的ROC 曲線分析性能比較(圖7),通過DeLong 檢驗,組學模型和綜合模型都比臨床模型的效能高,差異有統計學意義(P<0.05),雖組學模型與綜合模型效能差異無統計學意義(P>0.05),但綜合模型AUC 值更高。

圖4 根據腫瘤大小及組學模型預測值通過多因素二元logistic 回歸分析預測均質透明性細胞癌的列線圖Fig.4 The nomogram for predicting homogeneous clear cell renal cell carcinoma based on tumor size and predicted values of radiomics model by binary logistic regression analysis

圖5 綜合模型的校準曲線Fig.5 Calibration curve of the comprehensive model

圖6 三種模型的臨床決策曲線Fig.6 Clinical decision curves of the three models

圖7 三種模型ROC 曲線性能比較Fig.7 ROC curve comparison of the three models
腎AML 和ccRCC 是最常見的良、惡性腎腫瘤,兩者的臨床決策和預后截然不同[9]。腎乏脂肪AML 與ccRCC 有相似的影像學表現,特別是與無明顯壞死、囊性變或出血的均質性ccRCC 比較時,使得常規影像鑒別診斷相當困難[10]。影像組學是一種新的研究方法。它在醫學圖像中的應用,特別是在癌癥領域的應用,已成為眾多學者研究的熱點[11]。本研究結合影像組學特征聯合臨床因素建立綜合模型鑒別腎乏脂肪AML和均質性ccRCC。首先,最佳組學模型具有良好的鑒別能力,AUC 值為0.836。其次,本研究納入了年齡、性別,腫瘤大小臨床特征因素,經分析得出性別可以作為獨立預測因子,與過往研究結果一致,可能有本研究納入標準嚴格和病例數量有限的原因,并未得到年齡也是一個獨立預測因子[12-14]。利用性別因素建立的臨床模型性能較一般。為驗證組學模型和臨床模型是否具有互補性,因此,本研究建立綜合模型效果最佳。
交叉驗證集AUC 值高的模型穩定即泛化能力好[15]。本研究雖提取出大量特征,但由于樣本量有限,為了避免過擬合特征選擇數少于樣本量的1/8,故本研究值篩選F 值排名前六的特征數開發了基于三種機器學習方法的18 個模型,若樣本量繼續擴大,可選擇更多的特征數建模。目前已有多項研究利用CT 圖像紋理分析鑒別腎乏脂肪AML 和腎細胞癌(renal cell carcinoma,RCC)。HODGDON 等[16]開發了一個CT 紋理模型,使用SVM 分類器在CT 平掃圖像上區分腎乏脂肪AML和RCC,結果AUC 為0.89。LEE 等[17]使用三種特征選擇方法和四種機器學習算法開發了一個基于紋理分析的分類系統,結果得出采用Relief 特征選擇方法使用k 近鄰和SVM 分類器對腎乏脂肪AML和RCC 診斷的準確率分別達到了72.3%和72.1%。VARGHESE 等[18]收集了129 例RCC(包括三種亞型)和45 例良性腎腫瘤(嗜酸細胞瘤和腎乏脂肪AML),用CT 紋理特征在鑒別良、惡性以及其中某一類亞型和其余所有腫瘤的準確性。結果鑒別良惡性的AUC 為0.87,其中某一類亞型和其余所有腫瘤的AUC 為0.80~0.98。與上述研究相比本研究目的更加明確,研究對象只選擇無明顯壞死、囊變或出血的均質性ccRCC 和腎乏脂肪AML,兩者是臨床工作中最常遇到的診斷難題,也最容易誤診。本研究的方法也做了幾點改進。首先,本研究中使用的是三維ROIs,與二維ROIs 相比,實現了分辨效率的提高,三維ROIs 是整體腫瘤分析,比最大橫截面更能提示出腫瘤的異質性[19]。其次,之前多項研究是基于幾十個紋理特征分析。然而,近年來影像組學的快速發展已經可提出更多的特征,能夠更全面地了解腫瘤異質性[20]。本研究提取了原始圖像及小波濾波圖像中特征,每個病例的動、靜脈期CT 圖像中共提取1 706 個特征,提供了更多有價值的特征。本研究的模型所選特征為小波特征是常規紋理分析無法獲取的。
為了探索臨床應用,本研究在綜合模型基礎上建立了一個列線圖,作為鑒別腎乏脂肪AML 和均質性ccRCC 實用工具。綜合模型具有較高的AUC,表明具有較好的鑒別能力及推廣價值。此外,從決策曲線分析可以得到大部分概率值獲得更多凈收益,表明用綜合模型作臨床決策可獲得較好的結果。本研究的列線圖為臨床醫生提供了一個具有前景的工具。具體來講根據列線圖給出的均質ccRCC 的預測概率,可采取不同的治療策略。腎AML 患者可選擇定期觀察,ccRCC 患者則選擇手術治療[21]。
本研究也存在局限性。首先,作為病例對照研究,樣本量小且沒有設置獨立測試集數據,因此模型采用bootstrap 法內部驗證。研究需進一步擴大樣本量,展現出模型的泛化能力。其次,人工分割三維ROIs 既耗時又復雜,特別是對于邊界不清的腫瘤。今后重點應開發一種深度學習算法自動分割腎腫瘤。總之,本研究開發了一種基于臨床因素和CT 影像組學的綜合模型,具有良好的術前鑒別腎乏脂肪AML 和均質性ccRCC 效能,可將其作為一種無創、實用的方法來輔助臨床診療。