姚陽陽 梁長華 韓東明 崔俊偉 潘犇 王慧慧 魏正琦 甄思雨 危涵羽
結核病是僅次于新型冠狀病毒感染的第二大致死性傳染病,位列全球死因第13位,中國結核病負擔僅低于印度和印度尼西亞,位居第三[1]。非結核分枝桿菌(nontuberculous mycobacteria,NTM)系指除結核分枝桿菌復合群和麻風分枝桿菌以外的一大類分枝桿菌的總稱[2],NTM感染肺部而引起的肺病稱為(nontuberculous mycobacteria pulmonary disease,NTM-PD)。NTM-PD與肺結核(pulmonary tuberculosis,PTB)依靠痰涂片難以準確區分[3],分枝桿菌培養是診斷NTM-PD的金標準,而分枝桿菌培養需要2~6周,NTM-PD患者很容易錯過最佳治療時機,因此,亟需一種快速、有效的方法鑒別這兩種疾病。空洞是PTB與NTM-PD的常見影像征象,并且這兩種疾病空洞的病理差異已經得到證實[4]。近年來,影像組學通過高通量提取挖掘數據特征,在肺部疾病的診斷和鑒別診斷中顯示出巨大的潛力[5-6],可能為鑒別NTM-PD與PTB提供一種可行的方法。本研究旨在聯合臨床特征與影像組學開發出一種能方便、快速、準確鑒別NTM-PD與PTB的方法,為NTM-PD與PTB的診療提供幫助。
選擇2019年1月1日至2023年3月31日河南省新鄉醫學院第一附屬醫院收治的經分枝桿菌培養確診為NTM-PD和PTB的患者,共133例。根據分枝桿菌培養結果分為NTM-PD組(58例)與PTB組(75例)。收集所有患者治療前的臨床數據及胸部CT掃描圖像。以空洞性病灶作為研究對象進行提取影像組學特征并建立影像組學模型,共200個病灶被納入研究(NTM-PD:97個,PTB:103個),然后將所有病灶按照7∶3比例隨機分為訓練集和測試集。
納入標準:(1)經痰標本或支氣管肺泡灌洗液培養確診為PTB/NTM-PD的患者;(2)年齡≥18歲;(3)CT圖像中存在空洞病灶;(4)臨床資料及影像資料完整。排除標準:(1)存在其他肺部疾病的患者;(2)PTB并發NTM-PD的患者;(3)合并HIV感染或糖尿病的患者;(4)存在其他惡性腫瘤的患者。
1.一般資料:收集患者性別、年齡、體質量指數(body mass index,BMI)、臨床癥狀(發熱、盜汗、咳嗽、咳痰、乏力、胸痛、咯血、體質量減輕)、分枝桿菌培養結果。
2.實驗室檢查:γ-干擾素釋放試驗(interferon-γ release assays,IGRA)采用結核感染T細胞酶聯免疫斑點試驗進行檢測,使用英國Oxford Immunotec公司的T-SPOT.TB試劑盒于4 h內完成檢測,過程嚴格遵照說明書進行,后使用 ELISPOT 讀板儀(美國 CTL公司) 經酶聯免疫斑點系統讀取并記錄斑點數。結核抗體使用膠體金法進行檢測,試劑盒由北京健乃喜生物科技有限公司提供,檢測步驟嚴格遵循試劑配套說明書進行。
3.胸部CT檢查:采用東芝 Aquilion ONE 320 排 CT 或東芝 Aquilion 64 排 CT 設備行常規胸部檢查。掃描范圍:從肺尖掃描至橫膈水平;掃描條件:管電壓為100~120 kV,管電流采用自動毫安技術,掃描層厚5~8 mm,重建層厚0.625~1.25 mm,螺距為1,矩陣為512×512。
4.感興趣區(ROI)勾畫及影像組學特征提取:影像組學流程如圖1所示。首先由兩名不同經驗(分別具有3年和7年影像診斷經驗)的放射科醫師使用3D slicer 4.11 軟件在1 mm薄層CT肺窗圖像上沿空洞病灶的邊緣(避開大血管和支氣管)進行逐層勾畫ROI,最后自動生成感興趣體積(VOI),如圖2所示。使用3D slicer軟件對所有VOI進行1 mm×1 mm×1 mm 重采樣,以減少不同CT掃描設備之間的差異對結果造成的影響。然后使用3D slicer軟件在VOI中提取影像組學特征,包括一階特征、形態特征、紋理特征,以及小波變換、拉普拉斯變換,共計1037個特征。

圖1 影像組學流程圖

注 圖a~c:患者,女,34歲,肺結核。圖b可見左肺下葉空洞,圖b可見空洞病灶感興趣區,圖c可見分割后的空洞病灶體積;圖d~f:患者,男,34歲,非結核分枝桿菌肺病。圖d可見右肺上葉空洞,圖e可見空洞病灶感興趣區,圖f可見分割后的空洞病灶體積
5.特征篩選及模型構建:(1)首先,對納入患者的一般資料進行單因素邏輯回歸分析,然后將兩組間差異有統計學意義的臨床特征進行多因素邏輯回歸分析,篩選出鑒別NTM-PD與PTB的獨立預測因素,然后使用邏輯回歸分類器建立臨床模型;(2)使用R語言軟件(4.3.0版本)對影像組學特征數據進行Z-score標準化,然后隨機挑選出30例患者進行組間一致性(intraclass correlation coefficient,ICC)分析;(3)分兩步對影像組學特征進行降維。第一步使用最小冗余最大相關性(minimum redundancy maximum relevance,MRMR)算法,第二步使用最小絕對收縮與選擇算子(least absolute shrinkage and selection operator,LASSO)通過10次交叉驗證對上一步降維結果進行進一步篩選(圖3,4);然后使用邏輯回歸分類器將篩選出的影像組學特征建立影像組學模型;(4)將差異有統計學意義的臨床特征與影像組學特征進行結合,使用邏輯回歸分類器建立聯合模型。

圖3 影像組學特征LASSO回歸系數

圖4 非零系數的最佳影像組學特征圖
6.模型診斷效能評估:繪制受試者工作特征曲線(ROC)及校準曲線,分析不同模型的曲線下面積(AUC)、敏感度、特異度、準確率,評估臨床模型、影像組學模型及聯合模型的診斷性能。

在NTM-PD患者中,胞內分枝桿菌感染38例(66.52%),堪薩斯分枝桿菌感染13例(22.41%),鳥分枝桿菌感染4例(6.70%),偶然分枝桿菌感染2例(3.45%),淺黃分枝桿菌感染1例(1.72%)。PTB患者與NTM-PD患者的臨床特征單因素分析結果見表1。PTB組的年齡明顯小于NTM-PD組(P<0.001),而PTB組的BMI明顯大于NTM-PD組(P=0.015),PTB組IGRA陽性率(73.33%)明顯高于NTM-PD組(27.59%),差異均有統計學意義(P值均<0.05)。而性別、吸煙史、飲酒史、結核抗體檢測結果、臨床癥狀(發熱、盜汗、咳嗽、咳痰、咯血、胸痛、乏力、體質量減輕)在兩組間差異均無統計學意義。然后將年齡、BMI及IGRA進行多因素邏輯回歸分析(表2),結果表明,年齡和IGRA在兩組間的差異均有統計學意義,均是鑒別PTB與NTM-PD的獨立預測因素。

表1 肺結核與非結核分枝桿菌肺病患者臨床特征單因素分析

表2 肺結核與非結核分枝桿菌肺病患者臨床特征多因素logistic回歸分析
將年齡及IGRA結果納入臨床模型,模型在訓練集中的AUC值、敏感度、特異度及準確率分別為0.832、89.04%、72.46%、80.99%,在測試集中的AUC值、敏感度、特異度及準確率分別為0.800、85.29%、67.86%、77.42%。2名放射科醫生提取的影像組學特征具有良好的一致性。1037個影像組學特征通過第一步MRMR篩選后,選取20個特征,第二步通過LASSO算法對MRMR篩選出的20個特征進行進一步篩選,最終篩選出10個影像組學特征(圖5)用于構建影像組學模型。該模型在訓練集中的AUC值、敏感度、特異度及準確率分別為0.974、91.78%、95.65%、93.66%,在測試集中AUC值、敏感度、特異度及準確率分別為0.939、97.06%、82.14%、90.32%。將年齡、IGRA結果及10個影像組學特征結合構建聯合模型,該模型在訓練集中的AUC值、敏感度、特異度及準確率分別為0.993、100.00%、91.30%、95.77%,在測試集中AUC值、敏感度、特異度及準確率分別為0.995、94.12%、100.00%、96.77%。影像組學模型診斷性能優于臨床模型,而聯合模型優于影像組學模型和臨床模型,獲得了最高的診斷性能。具體見表3。各個模型在訓練集和測試集中的ROC曲線如圖6、7所示。校準曲線(圖8,9)顯示,聯合模型在訓練集和測試集中的預測概率與實際概率相近,對PTB與NTM-PD具有良好的鑒別診斷能力。

表3 臨床模型、影像組學模型、聯合模型診斷性能分析

圖5 影像組學模型中影像組學特征重要度

圖6 訓練集受試者工作特征曲線

圖7 測試集受試者工作特征曲線

圖8 訓練集校準曲線比較

圖9 測試集校準曲線比較
DeLong檢驗結果顯示,臨床模型與影像組學模型在訓練集中的AUC值差異有統計學意義(Z=3.797,P<0.001),臨床模型與聯合模型在訓練集中的AUC值差異有統計學意義(Z=-4.832,P<0.001),而影像組學模型與聯合模型在訓練集的AUC值差異無統計學意義(Z=-1.956,P=0.050)。
PTB與NTM-PD臨床表現相似,包括低熱、咳嗽、體質量減輕等癥狀,且二者影像學表現具有很大重疊,因此很難將二者區分[7],細菌培養是鑒別結核分枝桿菌與NTM感染診斷的金標準,但細菌培養需要2~6周才能得出結果,而在此期間大多數NTM-PD患者會接受經驗性抗結核治療,由于二者治療方案不同,使得NTM-PD患者錯過最佳治療時機,導致疾病進一步發展[8-9]。IGRA通過檢測T細胞對2種結核分枝桿菌特異性抗原ESAT-6和CFP-10產生的γ-干擾素發揮作用,這2種抗原的基因位于結核分枝桿菌與NTM的基因差異區域(Rd1),大多數NTM無此區域[10]。盡管有一些NTM存在與結核分枝桿菌相同的Rd1區域,如堪薩斯分枝桿菌和蘇爾加分枝桿菌,可能會導致IGRA陽性結果,但這些菌株并不是NTM感染的優勢菌種[11],因此,這種方法仍然可以區分大多數NTM-PD和PTB。并且IGRA可以在1~2 d內得到結果,因此IGRA可以在疾病早期對NTM-PD和PTB進行快速診斷。在本研究中,PTB組IGRA陽性率明顯高于NTM-PD組,這與既往研究結果一致[12]。
此外,NTM-PD組的年齡明顯高于PTB組,這可能是因為NTM是一類機會致病菌,感染NTM的患者發病往往是由于患者年齡增大,機體免疫力降低所致。中國是結核病高負擔國家,約40%的人口IGRA結果呈陽性[13],不明原因的并發結核分枝桿菌潛伏感染會影響患者的IGRA結果。在IGRA的自身局限性和中國人群發病特征的共同影響下,使得臨床模型在鑒別NTM-PD和PTB中的表現稍弱于影像組學模型。即便如此,臨床模型在訓練集和測試集中的AUC值仍然達到了0.832和0.800,表明該模型具有較高的診斷性能,可以在疑似NTM-PD或PTB的人群中進行快速的篩查。
影像組學是近年發展起來的無創、客觀的圖像分析工具,其通過計算機算法挖掘出CT、MRI、PET等圖像中的深層信息,從而反映出病灶間的異質性。Yan等[14]對提取CT圖像中空洞病灶的影像組學特征,使用6種機器學習分類器(K近鄰、支持向量機、極度梯度提升算法、隨機森林、邏輯回歸和決策樹)分別建立6個影像組學模型,結果表明,在訓練集中,6個模型的AUC值均>0.98,在驗證集中,6個模型的AUC值均>0.85,在外部驗證集中,6個模型的AUC值均>0.84。其中,邏輯回歸分類器建立的影像組學模型相較于其他影像組學模型診斷性能最好,在訓練集、驗證集和外部驗證集中AUC值分別為0.99、0.98和0.95。本研究參考Yan等[14]的研究結果,使用邏輯回歸分類器構建影像組學模型,該模型的診斷性能與既往研究結果基本一致。此外,在本研究中加入臨床因素構建了聯合模型,使得模型診斷性能得到了進一步的提升,能夠更加準確地鑒別NTM-PD和PTB。而既往相關的研究中均是單純研究影像組學模型在鑒別NTM-PD 和PTB的表現,本研究第一次進行了影像組學特征與臨床特征相結合的嘗試,試驗結果也證明了聯合模型優秀的診斷性能。盡管NTM-PD和PTB僅依靠胸部CT檢查難以鑒別,但是二者之間的影像學表現仍存在差異。既往研究表明,NTM-PD組薄壁空洞、支氣管擴張及小葉中心性結節較PTB組增多,而厚壁空洞、肺實變、肺不張、肺毀損、肺體積縮小、肺內鈣化、肺門縱隔淋巴結鈣化、腺泡結節、胸膜增厚、胸腔積液均較PTB組少[15],這表明CT征象對于鑒別具有重要作用。在既往的研究中,大多是對臨床特征和CT表現單獨進行研究,而將二者結合進行分析卻少有報道,將臨床特征、CT征象及CT影像組學特征進行結合構建的聯合模型可能具有更高的診斷性能,具有更好的臨床適用性,這需要在后續的研究中進行驗證。
Ying等[16]將T-SPOT.TB與深度學習模型結合后產生了更好的結果,當兩種方法的預測一致時,大大提高了鑒別診斷的準確性。本研究中將臨床特征與影像組學特征結合構建了聯合模型,該模型的診斷性能在訓練集和驗證集中的AUC值均高于臨床模型與影像組學模型,這與Ying等[16]的研究結果是一致的,但是,DeLong檢驗結果顯示影像組學模型與聯合模型在訓練集的AUC值差異無統計學意義,這可能是因為影像組學模型的性能已經很好,影像組學模型的提升空間十分有限,使得加入臨床特征后對于診斷性能的提升不明顯。與既往研究不同的是,Ying等[16]將T-SPOT.TB與深度學習進行綜合分析,但并沒有構建聯合模型,而本研究不僅加入了IGRA結果,還對年齡、性別、結核抗體檢測結果及結核病典型臨床癥狀進行分析。聯合模型的診斷性能優于任意一種單獨模型,這表明臨床特征與影像組學特征結合構建模型能夠提升診斷性能,對于鑒別NTM-PD和PTB具有重要意義。
本研究還有一定的局限性:首先,這是一項單中心研究,樣本量較小,未來還需要在多中心、大樣本的研究中進一步驗證模型的性能;其次,本研究只針對空洞病灶進行研究,而對于結節、樹芽征等其他CT征象并未進行研究,未來需要對各種病灶進行全面研究來驗證該模型的臨床適用性;最后,本研究中使用手動勾畫ROI的方法,不可避免地產生一些微小偏差,而自動分割的方法可能會提高勾畫ROI的準確性,這需要在未來的研究中進一步探索。
綜上所述,臨床特征與影像組學特征對鑒別NTM-PD和PTB方面具有重要作用,結合臨床特征和影像組學特征的聯合模型是一種無創、方便、快捷的診斷方法,在鑒別NTM-PD與PTB方面展示出了優秀的診斷性能,為NTM-PD與PTB的臨床診療提供了幫助。
利益沖突所有作者均聲明不存在利益沖突
作者貢獻姚陽陽:設計實驗、實施研究、采集數據、分析/解釋數據、文章撰寫、統計分析;梁長華:設計實驗、實施研究、分析/解釋數據、論文審閱修訂、統計分析、指導、行政/材料/技術支持;韓東明:設計實驗、實施研究、論文審閱修訂、行政/材料/技術支持、指導;崔俊偉:設計實驗、論文審閱修訂、指導、行政/材料/技術支持;潘犇:設計實驗、實施研究、采集數據、分析/解釋數據、統計分析;王慧慧、魏正琦、甄思雨和危涵羽:實施研究、采集數據、分析/解釋數據、統計分析