鄒清藝 周 婷 黃必貴 吳英寧,2
(1 右江民族醫(yī)學(xué)院研究生學(xué)院,廣西百色市 533000;2 右江民族醫(yī)學(xué)院附屬醫(yī)院放射科, 廣西百色市 533000)
【提要】 影像組學(xué)是一種定量映射,是目前醫(yī)學(xué)影像學(xué)領(lǐng)域的前沿?zé)狳c(diǎn)之一,其可從海量影像學(xué)資料和信息中高通量提取大量先進(jìn)的定量成像特征,臨床應(yīng)用潛力較大。本文對(duì)影像組學(xué)的概況及其在非小細(xì)胞肺癌病理組織學(xué)分型中的應(yīng)用研究進(jìn)展進(jìn)行綜述,以期為促進(jìn)影像組學(xué)的發(fā)展與臨床應(yīng)用提供參考。
非小細(xì)胞肺癌(non-small cell lung carcinoma,NSCLC)患者數(shù)量占肺癌總病例數(shù)的80%以上[1]。肺腺癌和肺鱗狀細(xì)胞癌(以下簡(jiǎn)稱肺鱗癌 )在NSCLC中的占比分別約為60%、35%[2],二者在腫瘤生物學(xué)行為、治療方式、臨床特征方面均有顯著差異,如肺腺癌患者的癌細(xì)胞生長(zhǎng)分裂相對(duì)緩慢[3],間變性淋巴瘤激酶陽(yáng)性、表皮生長(zhǎng)因子受體基因突變等改變是其靶向治療應(yīng)用決策的重要因素[4],而晚期肺鱗癌患者對(duì)免疫治療聯(lián)合化療更敏感[5]。因此,病理組織學(xué)分型是NSCLC療效評(píng)估的基礎(chǔ),也是個(gè)性化治療的依據(jù),其不僅關(guān)乎手術(shù)時(shí)機(jī),亦對(duì)分子靶向治療藥物的選擇具有決定性作用。影像組學(xué)能從MRI、CT、PET/MRI、PET/CT等影像學(xué)圖像中提取腫瘤特征,從而挖掘腫瘤內(nèi)部在時(shí)間上和空間上的異質(zhì)性,提供更全面的腫瘤視圖[6],以獲知人類視覺(jué)系統(tǒng)無(wú)法直接辨識(shí)的信息。隨著肺癌病理組織學(xué)亞型診斷技術(shù)的發(fā)展及分子檢測(cè)技術(shù)的興起,影像組學(xué)作為一種無(wú)創(chuàng)性鑒別病理組織學(xué)亞型的手段,可能對(duì)不適合行有創(chuàng)性鑒別檢查的肺癌患者非常有利。本文對(duì)影像組學(xué)的概況及其在NSCLC病理組織學(xué)分型中的應(yīng)用研究進(jìn)展進(jìn)行綜述,以期為促進(jìn)影像組學(xué)的發(fā)展與臨床應(yīng)用提供參考。
影像組學(xué)的概念是由Lambin等[7]于2012年首次提出,是一種定量映射,其從影像圖庫(kù)中提取高通量的大數(shù)據(jù),并加以探索性分析處理,從而全面量化腫瘤內(nèi)部在時(shí)間上和空間上的異質(zhì)性,旨在提取與研究目標(biāo)相關(guān)的影像組學(xué)特征,通過(guò)進(jìn)一步分析及建立模型來(lái)判斷預(yù)測(cè)效果。影像組學(xué)分析主要分為影像圖像資料獲取、勾畫感興趣區(qū)并分割圖像、特征提取及篩選、構(gòu)建模型及驗(yàn)證等階段。
影像圖像資料獲取是影像組學(xué)的基礎(chǔ),須借助X線、CT、MRI等醫(yī)學(xué)影像成像技術(shù)采集高質(zhì)量、標(biāo)準(zhǔn)化的優(yōu)質(zhì)圖像,對(duì)圖像進(jìn)行預(yù)處理、掃描設(shè)備盡可能保持統(tǒng)一標(biāo)準(zhǔn)、維持一致的像素及灰度等措施均有益于避免圖像的“異質(zhì)性”[8-9]。勾畫感興趣區(qū)是影像組學(xué)的關(guān)鍵步驟,勾畫方式主要包括自動(dòng)勾畫、半自動(dòng)勾畫和手動(dòng)勾畫,這3種方式各有優(yōu)劣之處,如自動(dòng)勾畫、半自動(dòng)勾畫的效率高于手動(dòng)勾畫,但準(zhǔn)確性較后者差,而在大樣本研究中選擇手動(dòng)勾畫則需耗費(fèi)大量的時(shí)間和精力,且受醫(yī)師主觀因素影響較大[10]。影像組學(xué)特征主要包括形狀、強(qiáng)度、紋理等,而特征提取和篩選是影像組學(xué)的核心步驟,其中特征提取可通過(guò)Pyradiomics、MaZda、IBEX、3D Slicer等軟件實(shí)現(xiàn)。為避免過(guò)度擬合風(fēng)險(xiǎn)[11],須對(duì)初步獲取的特征進(jìn)行篩選,常用的特征篩選方法有最大相關(guān)最小冗余法、過(guò)濾法、LASSO算法等,其中LASSO算法能夠?qū)μ崛√卣鞯幕貧w系數(shù)進(jìn)行壓縮,甚至使得部分特征系數(shù)歸零,在臨床上較為常用。構(gòu)建模型是驗(yàn)證影像組學(xué)診斷效能的重要手段,而機(jī)器學(xué)習(xí)算法是構(gòu)建模型的重要方法,主要包括Logistic回歸、支持向量機(jī)、決策樹等,在實(shí)際操作中需要根據(jù)數(shù)據(jù)集的類型選擇合適的算法。建立模型之后,需通過(guò)模型測(cè)試及驗(yàn)證來(lái)評(píng)估模型的性能,最終獲取最佳模型。目前,主要的模型性能評(píng)估方法有交叉驗(yàn)證法、受試者工作特征曲線分析等,評(píng)估的指標(biāo)包括曲線下面積(area under the curve,AUC)、特異性、敏感性等。
目前,影像組學(xué)已成為醫(yī)學(xué)影像學(xué)領(lǐng)域研究的前沿?zé)狳c(diǎn)之一,這主要?dú)w因于它能夠從海量影像資料和信息中高通量提取大量先進(jìn)的定量成像特征,其核心假設(shè)是將影像組學(xué)轉(zhuǎn)變?yōu)榭赏诰虻男问?用于構(gòu)建與病灶相關(guān)聯(lián)的描述性生物學(xué)數(shù)據(jù)或臨床數(shù)據(jù),從而為臨床提供有價(jià)值的預(yù)測(cè)、診斷、預(yù)后評(píng)估信息[12]。近年來(lái),針對(duì)肺癌、肝癌、胃癌、乳腺癌等常見(jiàn)惡性腫瘤,采用影像組學(xué)預(yù)測(cè)腫瘤病理組織學(xué)亞型的相關(guān)研究日益增多,并獲得理想效果[13-16],證實(shí)了影像組學(xué)在惡性腫瘤病理組織學(xué)分型中的可行性。
因解剖位置、生長(zhǎng)部位、組織特征、葡萄糖代謝的不同,肺腺癌和肺鱗癌具有各自的最佳臨床決策[2,17-18]。目前,病理組織活檢仍是鑒別診斷肺腺癌和肺鱗癌的金標(biāo)準(zhǔn)。然而,病理組織活檢作為一種侵入性檢查,不僅并發(fā)癥多、費(fèi)用昂貴,而且無(wú)法達(dá)到量化及全面評(píng)估腫瘤異質(zhì)性的目的。因此,在臨床工作中急需一種非侵入性檢查技術(shù)用于NSCLC病理組織學(xué)亞型的術(shù)前有效評(píng)估。雖然影像組學(xué)不可能完全替代病理組織活檢,但其可提供腫瘤內(nèi)部時(shí)間上和空間上的異質(zhì)性等生物學(xué)信息,為臨床實(shí)現(xiàn)無(wú)創(chuàng)性“虛擬病理活檢”提供客觀的量化依據(jù)。
2.1 影像組學(xué)在肺腺癌和肺鱗癌鑒別診斷中的應(yīng)用價(jià)值 對(duì)于病情穩(wěn)定的患者而言,病理組織活檢仍是鑒別肺腺癌和肺鱗癌的首選手段。但對(duì)于基礎(chǔ)狀態(tài)差的患者而言,當(dāng)其無(wú)法耐受CT引導(dǎo)下穿刺活檢或支氣管鏡取材活檢等侵入性檢查時(shí),影像組學(xué)在肺腺癌和肺鱗癌的鑒別診斷中表現(xiàn)出明顯的優(yōu)越性。Zhu等[19]通過(guò)手動(dòng)繪制腫瘤區(qū)域提取129例NSCLC患者的影像組學(xué)特征,結(jié)果顯示訓(xùn)練集和驗(yàn)證集的AUC分別達(dá)到0.905、0.893,表明影像組學(xué)特征對(duì)肺腺癌和肺鱗癌具有良好的鑒別診斷效能,其中紋理特征X2_GLCM_cluster_tendency最能反映腫瘤的異質(zhì)性。Bashir等[20]分析基于CT影像組學(xué)特征、CT語(yǔ)義特征及聯(lián)合特征的隨機(jī)森林模型鑒別肺腺癌和肺鱗癌的效果,結(jié)果顯示基于CT影像組學(xué)特征、CT語(yǔ)義特征及聯(lián)合特征的隨機(jī)森林模型鑒別肺腺癌和肺鱗癌的中位數(shù)錯(cuò)誤率分別為35.8%、24.5%、37.7%,表明基于CT影像組學(xué)特征的隨機(jī)森林模型能夠較為準(zhǔn)確對(duì)NSCLC的病理組織學(xué)亞型進(jìn)行無(wú)創(chuàng)性分析。Tang等[21]采用PET/MRI影像組學(xué)對(duì)肺腺癌和肺鱗癌進(jìn)行鑒別,結(jié)果顯示訓(xùn)練集和驗(yàn)證集的AUC分別為0.886、0.847。Tomori等[22]的研究顯示,非增強(qiáng)CT影像組學(xué)可以區(qū)分肺腺癌和肺鱗癌,并發(fā)現(xiàn)非增強(qiáng)CT影像學(xué)特征與腫瘤細(xì)胞最大活性之間存在顯著相關(guān)性,進(jìn)一步表明通過(guò)分析非增強(qiáng)CT影像組學(xué)特征獲得的腫瘤結(jié)構(gòu)特征與18F-氟脫氧葡萄糖-PET/CT顯示的代謝特征密切相關(guān)。
綜上,基于影像組學(xué)特征進(jìn)行NSCLC病理組織學(xué)分型,在術(shù)前及抗腫瘤治療前即可有效鑒別肺腺癌和肺鱗癌。這不僅能夠使患者避免因有創(chuàng)檢查導(dǎo)致的并發(fā)癥風(fēng)險(xiǎn),還有助于個(gè)性化治療方案的制訂,以及避免因治療導(dǎo)致腫瘤生物學(xué)行為改變而使影像組學(xué)特征產(chǎn)生偏差。
2.2 影像組學(xué)在肺腺癌微乳頭成分術(shù)前預(yù)測(cè)中的應(yīng)用價(jià)值 2011年,在國(guó)際肺癌研究協(xié)會(huì)、美國(guó)胸科學(xué)會(huì)及歐洲呼吸學(xué)會(huì)聯(lián)合公布的肺腺癌國(guó)際多學(xué)科分類中,將肺腺癌分為5個(gè)亞型[4]:微乳頭為主型、腺泡為主型、貼壁為主型、乳頭為主型、實(shí)性為主伴黏液產(chǎn)生型。該分類旨在應(yīng)對(duì)肺腺癌在分子生物學(xué)診斷、病理學(xué)診斷、影像學(xué)診斷及治療方面的新需求。其中,微乳頭成分是肺腺癌侵襲性的獨(dú)立危險(xiǎn)因素,亦是影響患者預(yù)后的獨(dú)特病理形態(tài)學(xué)特征[23],因此在基于5%的增量半定量的組織學(xué)分型中,微乳頭為主型肺腺癌被正式確定為新的組織學(xué)亞型[24]。Zhang等[25]利用風(fēng)險(xiǎn)曲線評(píng)估肺腺癌患者病灶中的微乳頭成分,從而評(píng)估腫瘤復(fù)發(fā)風(fēng)險(xiǎn),發(fā)現(xiàn)即使是Ⅰ期肺腺癌患者,只要病灶中存在微乳頭成分,其就會(huì)持續(xù)存在復(fù)發(fā)風(fēng)險(xiǎn),且術(shù)后早期復(fù)發(fā)風(fēng)險(xiǎn)相對(duì)較高。該研究還通過(guò)分析微乳頭成分占比較低和微乳頭成分占比較高肺腺癌患者的基因檢測(cè)及免疫組化染色結(jié)果,發(fā)現(xiàn)微乳頭成分占比較高者機(jī)體免疫抑制情況更嚴(yán)重、T淋巴細(xì)胞浸潤(rùn)水平及腫瘤突變負(fù)荷更高,提示微乳頭成分占比較高可能與腫瘤免疫治療敏感性存在聯(lián)系[25]。
目前,針對(duì)肺腺癌患者病灶中微乳頭成分的分析研究主要為定性研究,鮮有基于影像組學(xué)的定量研究。陳志鵬[26]術(shù)前采用影像組學(xué)預(yù)測(cè)肺腺癌患者是否存在微乳頭成分,結(jié)果顯示,像素最小值、差異方差及差熵、表面體積比及最大直徑可作為微乳頭成分陽(yáng)性的預(yù)測(cè)因子。He等[27]納入268例肺腺癌患者的CT圖像提取影像組學(xué)特征,并構(gòu)建支持向量機(jī)、樸素貝葉斯、廣義線性模型及隨機(jī)森林分類器4個(gè)預(yù)測(cè)模型,結(jié)果顯示上述4種基于影像組學(xué)特征的模型均可有效預(yù)測(cè)微乳頭成分的存在,其中樸素貝葉斯模型的預(yù)測(cè)性能最佳(AUC為0.75)。Song等[28]采用CT影像組學(xué)對(duì)339例肺腺癌患者進(jìn)行微乳頭成分預(yù)測(cè),發(fā)現(xiàn)陽(yáng)性像素值的方差可用于預(yù)測(cè)微乳頭成分。上述研究表明,影像組學(xué)為術(shù)前鑒別診斷微乳頭成分陽(yáng)性或陰性的肺腺癌提供了可能。然而,目前國(guó)內(nèi)外的相關(guān)研究較少,后續(xù)仍需要通過(guò)大量的研究深入探討影像組學(xué)在預(yù)測(cè)微乳頭成分中的價(jià)值,促進(jìn)影像組學(xué)技術(shù)的進(jìn)一步發(fā)展和成熟。
2.3 影像組學(xué)特征聯(lián)合臨床特征在NSCLC病理組織學(xué)分型中的應(yīng)用價(jià)值 在MRI、CT、PET圖像中均能提取影像組學(xué)特征,但這3種影像學(xué)技術(shù)的成像方式差異導(dǎo)致其臨床應(yīng)用領(lǐng)域有所不同:MRI是利用病理狀態(tài)下人體相關(guān)組織的弛豫時(shí)間差異產(chǎn)生信號(hào),然后通過(guò)收集這些信號(hào)重建圖像,主要用于顯示病灶的細(xì)微形態(tài)結(jié)構(gòu)及腫瘤浸潤(rùn)范圍等;CT成像可反映組織密度的分布規(guī)律,主要用于常規(guī)檢查,如術(shù)前評(píng)估、初步判斷腫瘤良惡性等;PET成像則反映腫瘤代謝的差異性,主要用于評(píng)估腫瘤療效、評(píng)估復(fù)發(fā)或轉(zhuǎn)移等。相關(guān)研究表明,部分臨床特征也能鑒別診斷肺腺癌和肺鱗癌,如年齡、吸煙史、瘤體徑線、免疫組化檢測(cè)指標(biāo),以及影像學(xué)征象(如毛刺征)、微血管密度等[27,29-33]。但是,單純應(yīng)用臨床特征進(jìn)行病理組織學(xué)分型會(huì)受到診斷醫(yī)師的主觀因素或樣本異質(zhì)性及數(shù)量的影響,從而導(dǎo)致診斷結(jié)論具有差異性[34]。
研究表明,影像組學(xué)特征聯(lián)合臨床特征對(duì)NSCLC病理組織學(xué)亞型的評(píng)估效能優(yōu)于單一特征[35]。Tang等[36]納入68例肺鱗癌患者和80例肺腺癌患者,從患者的多模態(tài)MRI圖像中提取影像組學(xué)特征,并構(gòu)建列線圖模型用于預(yù)測(cè)NSCLC病理組織學(xué)亞型,結(jié)果顯示基于影像組學(xué)特征聯(lián)合臨床特征的列線圖模型預(yù)測(cè)效能最佳,訓(xùn)練集和驗(yàn)證集的AUC分別為0.901、0.872。Ren等[37]提取122例肺鱗癌患者和193例肺腺癌患者的PET/CT影像組學(xué)特征,并收集腫瘤標(biāo)志物等臨床特征,隨后分別構(gòu)建臨床特征模型、PEI/CT影像組學(xué)模型及臨床特征-PEI/CT影像組學(xué)組合模型用于預(yù)測(cè)NSCLC病理組織學(xué)亞型,結(jié)果顯示與臨床特征模型、PEI/CT影像組學(xué)模型相比,臨床特征-PEI/CT影像組學(xué)組合模型的預(yù)測(cè)性能最佳。Chen等[38]發(fā)現(xiàn),臨床特征-CT影像組學(xué)聯(lián)合模型鑒別診斷肺腺癌與肺鱗癌的效能優(yōu)于單獨(dú)CT影像組學(xué)模型或臨床特征模型;其進(jìn)一步通過(guò)雙能CT構(gòu)建臨床特征聯(lián)合動(dòng)肝或靜脈相影像組學(xué)模型,結(jié)果顯示臨床特征-靜脈相影像組學(xué)聯(lián)合模型的AUC最大(0.93)。然而Yang等[39]的研究結(jié)果顯示,MRI影像組學(xué)-臨床特征組合模型與MRI影像組學(xué)模型的診斷性能差異無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05),提示臨床特征的納入不一定能進(jìn)一步提高影像組學(xué)特征對(duì)肺鱗癌和肺腺癌的鑒別效能,這與大多數(shù)研究者的觀點(diǎn)不一致,其原因尚需后續(xù)研究進(jìn)一步探究。
將影像組學(xué)特征聯(lián)合臨床特征應(yīng)用于NSCLC病理組織學(xué)分型,是對(duì)影像組學(xué)應(yīng)用價(jià)值的進(jìn)一步探索,其有望通過(guò)更全面的病灶異質(zhì)性評(píng)估來(lái)更準(zhǔn)確地開(kāi)展NSCLC病理組織學(xué)分型。
當(dāng)前,影像組學(xué)面臨的挑戰(zhàn)主要為方法缺乏標(biāo)準(zhǔn)化、黑盒性質(zhì)缺乏深度學(xué)習(xí)性和可重復(fù)性、缺乏基于高質(zhì)量數(shù)據(jù)的大型數(shù)據(jù)集等[40]。同時(shí),影像組學(xué)亦受以下相關(guān)因素的影響:(1)觀察者間的描繪差異。Haga等[41]在每例肺癌患者的CT圖像上勾畫4個(gè)感興趣區(qū),分別基于每個(gè)感興趣區(qū)評(píng)估觀察者間描繪差異對(duì)影像組學(xué)特征的影響,結(jié)果顯示,描繪的不確定性可能導(dǎo)致無(wú)顯著意義的影像組學(xué)特征,從而高估基于單一個(gè)感興趣區(qū)建立的模型對(duì)肺癌患者預(yù)后的評(píng)估能力,因此,瘤體的多輪廓分析對(duì)于避免此類情況至關(guān)重要。(2)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法上的差異。盡管卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)、膠囊網(wǎng)絡(luò)(capsule network,CapsNet)等方法已被廣泛應(yīng)用于影像組學(xué)研究,但算法的不同可能會(huì)對(duì)診斷效能產(chǎn)生影響。Liu等[42]比較CapsNet、CNN和4個(gè)影像組學(xué)模型評(píng)估NSCLC病理組織學(xué)亞型的效能,發(fā)現(xiàn)CapsNet作為一種自動(dòng)亞型識(shí)別模型,在上述模型中表現(xiàn)出最佳的診斷效能。亦有研究表明,在CNN衍生的定量影像組學(xué)特征上使用如支持向量機(jī)、k最近鄰等分類器評(píng)估NSCLC病理組織學(xué)亞型,其效能相當(dāng)[43]。
近年來(lái),影像學(xué)從單純語(yǔ)義演變成囊括深度和傳統(tǒng)影像學(xué)特征的影像組學(xué),在此基礎(chǔ)上,影像組學(xué)采用機(jī)器學(xué)習(xí)與數(shù)字學(xué)習(xí)方法從病灶內(nèi)部提取生物學(xué)特征,以探索生物學(xué)信息與臨床之間的可能聯(lián)系。影像組學(xué)目前存在的難題主要在于如何更高效、更安全地開(kāi)啟與多學(xué)科結(jié)合、融合多模態(tài)圖像的模型訓(xùn)練。作為當(dāng)代醫(yī)學(xué)影像學(xué)研究的前沿與熱點(diǎn)之一,影像組學(xué)的最大優(yōu)勢(shì)在于可通過(guò)高通量提取影像學(xué)圖像中與病灶密切相關(guān)的定量特征,挖掘腫瘤內(nèi)部具有異質(zhì)性的高維數(shù)據(jù)。影像組學(xué)具有術(shù)前評(píng)估NSCLC病理組織學(xué)亞型的潛在價(jià)值,有望為優(yōu)化臨床決策提供更可靠、更科學(xué)、更前沿的影像學(xué)依據(jù)。
盡早確診是對(duì)NSCLC患者實(shí)施有效診治的重要基礎(chǔ),有助于改善患者預(yù)后。影像組學(xué)具備可重復(fù)性、無(wú)創(chuàng)性等優(yōu)勢(shì),在NSCLC病理組織活檢難度大或取材有限時(shí),可通過(guò)定量分析腫瘤異質(zhì)性發(fā)揮病理組織學(xué)分型作用,從而協(xié)助臨床醫(yī)師優(yōu)化并實(shí)施個(gè)性化治療。未來(lái)可通過(guò)大樣本、多中心的研究提高影像組學(xué)模型的泛化能力和穩(wěn)定性。