江長(zhǎng)思,羅 燕,唐 雪,龔靜山
(深圳市人民醫(yī)院 暨南大學(xué)第二臨床醫(yī)學(xué)院放射科,廣東 深圳 518020)
隨著低劑量CT(low does CT, LDCT)的普及和微創(chuàng)手術(shù)、靶向治療的臨床應(yīng)用,早期肺癌檢出率明顯提高,但肺癌仍是癌癥相關(guān)死亡的首要病因[1-2],早期局限性病變(IA期)術(shù)后局部復(fù)發(fā)率也較高[3]。AMIN等[4-5]發(fā)現(xiàn)肺腺癌患者肺內(nèi)存在與主瘤體不相連的腫瘤細(xì)胞島,且可能經(jīng)空氣于肺泡內(nèi)播散;ONOZATO等[6]研究證實(shí)這些腫瘤細(xì)胞島與主瘤體在各個(gè)方位上均不相連,且與預(yù)后相關(guān)。2015年WHO通過(guò)分析關(guān)于氣腔播散(spread through air space, STAS)與肺腺癌預(yù)后相關(guān)性的隊(duì)列研究[7-8],正式提出該類腫瘤細(xì)胞島是肺腺癌侵襲的一種新模式,即STAS,可見(jiàn)于14.80%~56.40%肺腺癌患者[6-11],是影響肺腺癌術(shù)后預(yù)后的主要危險(xiǎn)因素;對(duì)STAS陽(yáng)性早期肺腺癌,采用全肺葉切除代替局部肺葉切除,可有效降低術(shù)后復(fù)發(fā)率,提高5年生存率。術(shù)前明確肺腺癌患者STAS狀態(tài)對(duì)選擇手術(shù)方案有重要意義,但STAS為組織病理學(xué)表現(xiàn),僅在術(shù)后才能確診。肺癌實(shí)性成分占比、有無(wú)磨玻璃成分等CT征象與STAS狀態(tài)相關(guān)[12-14],可用于術(shù)前預(yù)測(cè)STAS狀態(tài)。本研究探討基于CT機(jī)器學(xué)習(xí)建立預(yù)測(cè)肺腺癌STAS狀態(tài)模型的價(jià)值。
1.1 一般資料 收集2015年4月—2019年4月462例于深圳市人民醫(yī)院經(jīng)手術(shù)病理證實(shí)的原發(fā)性肺腺癌患者,男206例,女256例,年齡20~85歲,平均(58.2±12.4)歲;其中90例STAS陽(yáng)性(STAS陽(yáng)性組),372例STAS陰性(STAS陰性組)。納入標(biāo)準(zhǔn):①單發(fā)病灶,經(jīng)手術(shù)完全切除;②術(shù)前3個(gè)月內(nèi)接受CT檢查,且檢查前未接受任何治療;③病理資料完整,能滿足評(píng)估STAS要求。排除標(biāo)準(zhǔn):①CT圖資料不全;②病理標(biāo)本不能滿足評(píng)估STAS要求。
1.2 儀器與方法 采用Philips Brilliance 16排螺旋CT或Philips Brilliance iCT 256層螺旋CT行胸部CT平掃或增強(qiáng)檢查,探測(cè)器線寬16×1.50 mm,管電壓120 kV,管電流為自動(dòng)調(diào)節(jié);掃描結(jié)束后行薄層圖像重建,層厚2 mm,層間距1 mm。
1.3 圖像分析 由具有2年和3年胸部影像學(xué)診斷經(jīng)驗(yàn)的住院醫(yī)師各1名采用盲法分析圖像,意見(jiàn)不一時(shí)經(jīng)協(xié)商決定。于窗寬1 600 HU、窗位-600 HU圖像上評(píng)估腫瘤最大徑及最大面積(包含磨玻璃成分和實(shí)性成分),實(shí)性成分最大面積及實(shí)性成分百分比(the ratio of consolidation/tumor,C/T),結(jié)節(jié)類型、衛(wèi)星灶、位置(中央/外周)、腫瘤邊緣(分葉/毛刺)、壞死,胸膜牽拉及增厚、空洞、空泡、鈣化、空氣支氣管征、肺門淋巴結(jié)侵犯、縱隔淋巴結(jié)侵犯等25個(gè)CT征象。通過(guò)勾畫腫瘤總體或?qū)嵭猿煞置娣e,在病灶最大層面圖像上設(shè)置ROI,獲得腫瘤或?qū)嵭猿煞肿畲竺娣e。C/T=腫瘤實(shí)性成分最大面積/腫瘤最大面積×100%。腫瘤完全位于肺野內(nèi)、中帶為中央型腫瘤,位于肺野外1/3為外周型腫瘤。衛(wèi)星灶指原發(fā)灶周圍2 cm范圍內(nèi)存在的伴隨病灶[11]。
1.4 病理學(xué)檢查 由具有6年和10年病理學(xué)診斷經(jīng)驗(yàn)的主治醫(yī)師及副主任醫(yī)師各1名根據(jù)WHO提出STAS的定義評(píng)估STAS狀態(tài)。WHO將STAS定義為微乳頭簇,實(shí)心巢或單個(gè)腫瘤細(xì)胞在主瘤體邊緣以外的肺泡腔中擴(kuò)散;其主要形態(tài)學(xué)表現(xiàn)包括:①肺泡腔由無(wú)或偶見(jiàn)中央纖維血管核心的環(huán)狀微乳頭結(jié)構(gòu)填充;②肺泡腔由腫瘤細(xì)胞組成的固體巢或腫瘤島填充;③肺泡腔由不連續(xù)的單個(gè)腫瘤細(xì)胞填充[5,8]。
1.5 統(tǒng)計(jì)學(xué)分析和機(jī)器學(xué)習(xí)建模 采用SPSS 22.0軟件及R軟件3.5.1版本(https://www.r-project.org/)進(jìn)行統(tǒng)計(jì)學(xué)分析。符合正態(tài)分布的計(jì)量資料以±s表示,否則以中位數(shù)(上下四分位數(shù))表示,計(jì)數(shù)資料以頻數(shù)表示。采用獨(dú)立樣本t檢驗(yàn)或χ2檢驗(yàn)分析STAS陽(yáng)性與陰性組間一般資料(吸煙史、性別及年齡)的差異;以Mann-WhitneyU檢驗(yàn)及χ2檢驗(yàn)分析組間CT征象差異。將差異有統(tǒng)計(jì)學(xué)意義的變量納入隨機(jī)森林(random forest, RF)算法,建立機(jī)器學(xué)習(xí)預(yù)測(cè)肺腺癌STAS狀態(tài)模型,其步驟如下:①按7:3比例將所有患者隨機(jī)分為訓(xùn)練集(n=323)和驗(yàn)證集(n=139);②以不同參數(shù)組合于訓(xùn)練集形成多個(gè)預(yù)測(cè)模型,對(duì)每個(gè)模型進(jìn)行五折交叉驗(yàn)證,獲得其預(yù)測(cè)肺腺癌STAS狀態(tài)的平均AUC值;③以平均AUC值最大的模型對(duì)驗(yàn)證集進(jìn)行預(yù)測(cè),計(jì)算AUC值,評(píng)價(jià)其診斷效能。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1 組間一般資料比較 STAS陽(yáng)性組90例,男46例,女44例,年齡27~80歲,平均(55.7±12.1)歲,其中30例有吸煙史;STAS陰性組372例,男160例,女212例,年齡20~85歲,平均(58.8±12.4)歲,其中90例有吸煙史。2組患者年齡差異有統(tǒng)計(jì)學(xué)意義(t=46.22,P=0.01),性別及吸煙史差異均無(wú)統(tǒng)計(jì)學(xué)意義(χ2=1.93、3.15,P=0.17、0.08)。
2.2 組間CT征象比較 單因素分析結(jié)果顯示組間腫瘤最大徑、腫瘤最大面積、實(shí)性成分最大面積、C/T、結(jié)節(jié)類型、胸膜增厚、胸膜牽拉、遠(yuǎn)處轉(zhuǎn)移、縱隔淋巴結(jié)侵犯、血管集束征、分葉征及毛刺征差異均有統(tǒng)計(jì)學(xué)意義(P均<0.05),其余CT征象差異均無(wú)統(tǒng)計(jì)學(xué)意義(P均>0.05),見(jiàn)表1。STAS陽(yáng)性組腫瘤多為最大面積較大、實(shí)性成分較多和C/T值較高的結(jié)節(jié),STAS陰性組腫瘤多為磨玻璃結(jié)節(jié),見(jiàn)圖1、2。

圖1 患者女,35歲,右肺上葉肺腺癌 A.軸位CT示右肺上葉磨玻璃結(jié)節(jié)(長(zhǎng)箭); B.病理圖(HE,×100)清晰顯示腫瘤邊界(黑色虛線)以遠(yuǎn)的肺泡腔 (短箭),為STAS陰性

圖2 患者男,27歲,右肺上葉腺癌 A.軸位CT示右肺上葉實(shí)性結(jié)節(jié)(長(zhǎng)箭); B.病理圖(HE,×100)示腫瘤邊界(黑色虛線)以遠(yuǎn)肺泡腔內(nèi)腫瘤細(xì)胞簇(短箭),為STAS陽(yáng)性
2.3 建立預(yù)測(cè)模型及預(yù)測(cè)結(jié)果 將年齡及12個(gè)與STAS相關(guān)CT征象納入RF建立機(jī)器學(xué)習(xí)預(yù)測(cè)模型,以五折交叉驗(yàn)證獲得平均AUC最大(0.80)的預(yù)測(cè)模型,其敏感度及特異度分別為0.78及0.77;以之預(yù)測(cè)驗(yàn)證集,其AUC值、敏感度及特異度分別為0.77、0.78及0.73,見(jiàn)圖3。

表1 STAS陽(yáng)性與陰性肺腺癌CT征象比較

圖3 基于CT機(jī)器學(xué)習(xí)預(yù)測(cè)模型預(yù)測(cè)肺腺癌STAS狀態(tài)的ROC曲線 A.訓(xùn)練集; B.驗(yàn)證集
表2顯示該模型各變量的節(jié)點(diǎn)純度增加值,其中腫瘤最大徑的節(jié)點(diǎn)純度增加值最大。

表2 RF模型中13個(gè)變量的節(jié)點(diǎn)純度增加值
作為人工智能的重要分支,機(jī)器學(xué)習(xí)通過(guò)深度挖掘、分析大數(shù)據(jù)而建立高維、復(fù)雜數(shù)學(xué)模型,并對(duì)其進(jìn)行大量擬合訓(xùn)練,利用反饋機(jī)制不斷加以優(yōu)化,從而構(gòu)建出最優(yōu)模型[15]。常見(jiàn)機(jī)器學(xué)習(xí)算法包括支持向量機(jī)(support vector machine, SVM)、RF、Logistic回歸及樸素貝葉斯等,在肺癌診斷、分類、治療及預(yù)后中具有重要作用,并已取得了較好效果[16]。既往研究[17]表明,機(jī)器學(xué)習(xí)模型預(yù)測(cè)良惡性肺結(jié)節(jié)的效能較高。本研究利用RF算法建立機(jī)器學(xué)習(xí)模型,術(shù)前預(yù)測(cè)肺腺癌STAS狀態(tài),旨在為制定個(gè)性化治療方案提供參考依據(jù)。
ONOZATO等[6]指出,STAS易發(fā)生于年輕患者和吸煙患者,而性別與STAS狀態(tài)無(wú)明顯相關(guān)。本研究中STAS陽(yáng)性組患者年齡低于陰性組,性別及吸煙組間差異無(wú)統(tǒng)計(jì)學(xué)意義,原因可能在于本研究為單中心研究,樣本量較小,存在一定偏倚。
STAS與CT所示肺實(shí)性結(jié)節(jié)密切相關(guān)[10]。KIM等[12]基于胸部CT圖像建立多變量預(yù)測(cè)模型,發(fā)現(xiàn)實(shí)性成分百分比(percentage of the solid component, PSC)是預(yù)測(cè)STAS的有效影像學(xué)指標(biāo)(PSC=腫瘤實(shí)性成分最大徑/腫瘤最大徑×100%),PSC的優(yōu)勢(shì)比為1.06,且PSC每增加20%,發(fā)生STAS的可能性增加3.2倍,STAS發(fā)生率隨PSC增加而增高。MARGERIE等[14]亦發(fā)現(xiàn),陽(yáng)性腫瘤的總平均徑線、實(shí)性成分平均徑線、實(shí)性成分長(zhǎng)徑及實(shí)性成分比例均明顯大于STAS陰性腫瘤,總平均徑≥20 mm、實(shí)性成分平均徑線和實(shí)性成分長(zhǎng)徑均≥10 mm肺結(jié)節(jié)中的STAS陽(yáng)性者明顯多于STAS陰性者,提示STAS發(fā)生與腫瘤大小及實(shí)性成分含量有關(guān)。本研究STAS陽(yáng)性組與陰性組間腫瘤最大徑、實(shí)性成分最大面積和腫瘤最大面積等12個(gè)CT征象差異均存在統(tǒng)計(jì)學(xué)意義,以上述12個(gè)CT征象及年齡建立預(yù)測(cè)肺腺癌STAS的RF模型,其在訓(xùn)練集、驗(yàn)證集的AUC值、敏感度及特異度分別為0.80、0.78及077和0.77、0.78及0.73,表明基于胸部CT的機(jī)器學(xué)習(xí)模型可用于術(shù)前預(yù)測(cè)肺腺癌STAS狀態(tài);12個(gè)CT征象中,腫瘤最大徑、實(shí)性成分最大面積、腫瘤最大面積、C/T和年齡的節(jié)點(diǎn)純度增加值較大,表明STAS陽(yáng)性現(xiàn)象多見(jiàn)于腫瘤面積較大、實(shí)性成分較多的肺結(jié)節(jié),與既往報(bào)道[10,12,14]相符合。
綜上所述,基于胸部CT征象的機(jī)器學(xué)習(xí)模型可有效預(yù)測(cè)肺腺癌STAS狀態(tài)。本研究的局限性:①為單中心回顧性研究,且僅納入經(jīng)手術(shù)切除的原發(fā)性肺腺癌,結(jié)果可能存在一定偏倚;②STAS陽(yáng)性樣本量較小,可能影響預(yù)測(cè)模型的準(zhǔn)確性;③未對(duì)患者預(yù)后進(jìn)行分析;④評(píng)估CT征象存在一定主觀性。