韓慧福,王鑄
國家癌癥中心/國家腫瘤臨床醫學研究中心/中國醫學科學院北京協和醫學院腫瘤醫院影像診斷科,北京 100021
食管癌是常見的胃腸道惡性腫瘤,發病率居全球第8位[1]。約80%的病例發生在欠發達地區,在東亞和東非的發病率最高[2]。中國是東亞地區最大的國家,食管癌的發病率每年都很高。2012年,中國約有286 700例食管癌新發病例,發病率高達211.7‰[3]。據統計,食管癌患者的5年生存率為30%~45%,手術后胃腸功能障礙的比例高達50%,嚴重影響患者的生活質量和遠期生存[4]。目前,在臨床上,早期食管癌可采用根治性切除術,但由于篩查機制不完善,缺乏早期診斷的敏感指標,絕大多數患者于確診時就已處于中晚期,因此錯過了最佳根治性手術時機。惡性程度高、早期診斷困難是食管癌患者預后差的主要原因[5],因此,早期診斷、準確的術前分期、術后及時評估療效對調整和制訂個體化治療方案極其重要。個體基因、生理環境、生存環境等復雜因素均可以對腫瘤的生長方式、病理特征和進展方向產生不同程度的影響[6-7]。然而,目前,評估食管癌的分期和放化療的療效多采用X線鋇餐造影、食管鏡檢查、計算機斷層掃描(computed tomography,CT)、磁共振成像(magnetic resonance imaging,MRI)、正電子發射斷層掃描-計算機斷層掃描(positron emission tomography-computed tomography,PET-CT)及超聲內鏡(endoscopic ultrasonography,EUS)等檢查方法。上述方法主要對食管癌的腫瘤大小及形態變化進行描述。雖然其各有優勢和補充,但仍需對醫學影像學特征進行客觀定量分析,以進一步反映腫瘤的性質和深層次的內在特征。對于這一理論,影像組學這一研究方法的應用顯得尤為重要,其是將CT、MRI、PET-CT等醫學圖像技術相結合,從中提取和分析大量高水平的定量圖像特征,從而對腫瘤進行量化和個性化的治療[8],亦為食管癌風險評估的臨床應用提供了一種更安全、更準確、更高效的方法。本文就近年來食管癌影像組學臨床方面的應用及進展進行綜述。
2012年,Lambin等[9]首先提出了宏觀成像性能是腫瘤微環境變化的假設,并由此提出了影像組學的概念。影像組學是一種定量的醫學圖像分析方法,它使用圖像特征作為生物標志物,幫助檢測和定位腫瘤,并預測治療后的反應。與傳統臨床醫學影像單一地從視覺層面解讀相比,影像組學豐富了圖像數據的處理方法,為充分挖掘圖像大數據信息和深入利用醫學圖像數據提供了可能。
影像組學是一門綜合了多種圖像和跨學科的技術,主要包括5個步驟,具體如下。
①圖像高質量標準化的數據獲取。確保高質量的標準化圖像以診斷和評估疾病。功能的選擇和數量有很大不同。盡可能多地選擇同一臺或相同種類的掃描設備,并合理選擇每個變量,如層厚、像素、管電壓等參數[10]。
②圖像分割與感興趣區域(region of interest,ROI)劃分。目前,圖像分割分為人工分割、半自動分割和自動分割3種方式,常用的分割方法包括圖像切割法、活動輪廓法、區域生長法等[11-12]。其中,半自動分割是目前影像組學圖像分割的主要方法,首先測量出腫瘤最長直徑,然后采用自動算法勾勒出實體腫瘤區域。與半自動分割相比,自動分割可以避免人為因素的影響,但尚無統一方案和標準,自動分割仍然是一項具有挑戰性的任務。
③特征提取與量化。特征提取、量化和降維是影像組學的核心關鍵[13],從ROI中提取高維特征數據。從圖像中提取紋理特征,通過各種數學方法提供圖像不同灰度級的相對位置信息,從而量化腫瘤的異質性[14]。其中,基于統計方法的紋理分析應用于食管癌:一階特征,通過常用和基本度量來描述由掩模定義的圖像區域內的體素強度的分布,如熵、銳度、平均值、最大值、最小值、中值、一致性、標準差、范圍、均方根方差等,可反映所測體素的均勻性、對稱性及局部強度的分布變化。二階特征,描述體素空間分布強度等級的特征,如灰度共生矩陣(grey level co-occurrence matrix,GLCM)、灰度游程步長矩陣(grey-level run length matrix,GLRLM)。GLCM描述的是體素間的兩兩排列關系次數的矩陣,包括同質性(圖像局部灰度均衡性的度量)、能源/角二階矩(再次描述圖像的均勻性)、相關度(測量局部變卦)和不同度[15]。GLRLM描述了灰度在指定方向上連續出現的次數,灰度運行時在圖像中預設方向上具有相同強度連續體素的長度,包括短游程強調、長游程強調、游程長度非均勻性和灰度非均勻性。高階特征,如灰度區域大小矩陣(gray-level size zone matix,GLSZM)、鄰域灰度差值矩陣(neighborhood graytone difference matrix,NGTDM)[16]。GLSZM描述同質性區域的分布特征。NGTDM描述個體素與毗鄰體素之間的差異性,包括粗糙度、對比度、復雜度及紋理強度等。大量的圖像組學特征可以被提取出來,這增加了數據過度擬合的可能性。
④特征選擇。根據特征方法、重復性、與其他特征的相關性、穩定程度、與分期和預后的關系來選取特征。
⑤分析建模及數據庫建立。主要運用模型建立和回歸分析對新樣本進行預測。目前,多種機器學習的方法可被用于建立特征的預測和分類模型,常用的分類器包括支持向量機和神經網絡。常用方法包括線性回歸、Logistic回歸、支持向量機、人工神經網絡、Cox回歸、樸素貝葉斯和隨機森林。深度學習涉及的模型主要包括深度信念網絡、卷積神經網絡、多層反饋遞歸神經網絡和改進模型。最后,將選取的影像特征匯總到適當的預測模型中。
部分食管癌患者確診時已經錯失了手術治療機會。有調查發現,約80%的患者難以耐受手術治療,目前,基本上都是通過放療、化療等方式控制病情、延續生命[17-18]。因此,治療前進行準確的疾病分期和制訂有效的治療方案至關重要。影像組學有利于提高食管癌分期的準確性。
18氟代脫氧葡萄糖(18F-fluorodeoxyglucose,18F-FDG)/PET-CT能夠提供腫瘤原發灶及淋巴結的代謝信息,是臨床上比較常用的分期檢查方法。Choi等[19]應用18F-FDG/PET-CT和MRI紋理特征研究鱗狀細胞癌瘤內異質性與腫瘤間質比值的關系,結果發現,粗糙度與腫瘤間質比率明顯相關,這有助于判斷腫瘤復發的風險。然而,PET-CT在食管周圍組織侵犯、小淋巴結轉移和周圍淋巴結腫瘤等的檢測方面存在一定的局限性[20-21],且檢查費用昂貴,輻射較大。
淋巴結狀態是影響食管癌患者預后的重要因素,CT檢查是食管癌最常用的分期方法。Liu等[22]提取了73例食管癌患者的CT影像學特征,結果顯示,T1~2期和 T3~4期患者 CT 影像學特征的差異顯著,偏度和峰度可作為N分期的預測因子,熵有助于T期和N期的預測,曲線下面積(areas under the curve,AUC)分別為0.637和0.815。傳統的CT檢查通過觀察淋巴結的大小和CT值判斷淋巴結的性質。CT圖像的紋理分析在食管鱗狀細胞癌(esophageal squamous carcinoma,ESCC)術前不同的T、N分期及整體分期的鑒別診斷中具有很大的潛力。
Wu等[23]從154例患者的CT圖像中提取了10個特征,結果顯示,GLCM、GLRLM、GLSZM、NGTDM等特征可區分早期(Ⅰ~Ⅱ期)和晚期(Ⅲ~Ⅳ期)食管癌。訓練組受試者的AUC分別為0.795和0.694,驗證組的AUC分別為0.762和0.624。有研究使用了PET-CT圖像紋理特征,ESCC分期結果較好(AUC=0.789),CT與PET-CT圖像紋理特征基本一致[24]。然而,由于PET-CT的檢查成本高、缺乏獨立驗證和樣本量小等特點,人們傾向于分析CT圖像的紋理特征。Shen等[25]提取了197例食管癌患者的CT圖像特征,與Qu等[26]的結果大致相同,GLCM、GLRLM等特征量化為準確的系數和因子,可以預測食管癌的淋巴結轉移情況。但是,對于食管癌的淋巴結轉移,CT檢查的準確性仍然存在爭議,主要是因為CT診斷病理性淋巴結的標準是根據淋巴結大小進行預測的。
MRI在食管癌的T分期中具有比CT更高的軟組織分辨率,更具優勢[27],該模型能區分轉移性和非轉移性淋巴結。Qu等[26]對病理證實有淋巴結轉移的181例食管癌患者的臨床資料進行了回顧性分析,從核磁影像[T2-快速自旋回波-刀鋒(BLADE)序列和對比增強Star容積式內插值法屏氣檢查(volumetric interpolated breath-hold examina-tion,VIBE)序列]中共提取1578個影像組學特征。采用lasso和彈性網絡回歸模型對特征空間降維后進行選擇。采用Logistic回歸分析、Mann-WhitneyU檢驗,根據受試者操作特征和AUC評估其識別性能,結果顯示,選取9個影像組學特征所構建的模型與淋巴結轉移相關(P<0.01),訓練組和驗證組的AUC 分別為0.821(95%Cl:0.704~0.938)和0.762(95%Cl:0.713~0.812)。
因此,通過對圖像紋理的分析和模型的應用[28],影像組學在食管癌T、N分期的診斷中顯示出獨特的優勢和巨大的潛力。腫瘤分期的準確性對食管癌的治療決策和預后至關重要[29],特別是對于局部晚期食管癌患者,手術不能獲得病理分期,而影像組學可以提高腫瘤分期的準確性。
現階段,放化療是食管癌的主要治療方法[30]。Hou等[31]從68例接受放化療的食管鱗狀細胞癌患者中的T2WI和頻率衰減反轉恢復序列(spectral attenuated inversion recovery,SPAIR)T2W-MRI序列中提取了138個影像組學特征,其中,完全緩解與病情穩定、部分緩解與病情穩定、反應性與非反應性病變分別有26、17和33個特征。通過精準頻率反轉恢復T2WI序列提取的特征,使用神經網絡和支持向量機預測模型預測食管癌的治療效果具有更高的準確性,并且比T2WI序列提取的特征更好,其中,支持向量機的AUC為0.929和0.893,神經網絡的AUC為0.883和0.861,準確度高于18F-FDG/PET-CT(AUC:0.82)。隨著影像組學涉及范圍的日益廣泛,不僅MRI圖像的紋理特征有助于評價食管癌放化療的療效,18F-FDG/PET-CT影像的紋理分析結果對其也有價值。Beukinga等[32]從97例接受放化療的食管癌患者的18F-FDG/PET-CT影像中提取出GLRL等特征進行分析,病理檢查結果顯示,有19例完全反應者和78例不完全反應者;Logistic回歸分析以上變量后,得到受試者工作特征曲線AUC為0.78,而最大標準攝取值(maximum standardized uptake value,SUVmax)為 0.58,判別斜率分別為0.17和0.01;內部驗證后,AUC分別降至0.74和0.54,可見紋理分析有助于放化療療效的評價。Paul等[33]對65例食管癌患者進行了特征提取,結果顯示,所選特征在區分食管癌放療和化療療效方面的AUC為0.823,其靈敏度和特異度高度統一,預測效果與PET也展現出高度的一致性。因此,影像組學在食管癌放化療療效評估方面具有較好的應用價值。
結合診斷標準分析食管癌患者的預后具有重要意義。Larue等[34]通過對239例食管癌患者治療前的CT圖像進行分析,提取40個組分和6個臨床特征,并用隨機森林模型預測食管癌患者放化療后3年總生存率。結果顯示,訓練組的AUC為0.69(95%Cl:0.61~0.77),驗證組的AUC為0.61(95%Cl:0.47~0.75),在最終影像學特征訓練模型中,最重要的是描述腫瘤異質性的小波特征。盡管小波紋理特征的解釋可能缺乏形狀(如體積、軸長)和直方圖(如能量、平均值)的直觀性,但結果表明,過于復雜的腫瘤異質性參數可能是影響整體生存率的重要預后因素。然而,Nakajo等[35]對52例食管癌患者應用治療前18F-FDG PET圖像紋理特征預測放化療的療效和預后,認為強度變異性(intensity variability,IV)和大小區域變異性(size-zone variability,SZV)、代謝腫瘤體積(metabolic tumour volume,MTV)和總病變糖酵解(total lesion glycolysis,TLG)可以預測腫瘤的療效,但對放療和化療預后的預測價值有限。因此,影像學在食管癌預后分析中仍有進一步發展的潛力。
現階段,影像組學還是一個新興且不成熟的研究領域,是從醫學影像中提取高通量影像信息的方法,不但需要大量的數據,而且任何單個過程中的變化都可能導致結果的變化。影像組學在食管癌的應用中仍存在許多問題:①現有數據量相對較少,且多來自回顧性研究,需要更多前瞻性研究和可重復性研究,以探索其臨床應用價值;②不同標準的成像數據源、不一致的采集參數、不平衡的數據樣本以及不一致的采集協議都會影響最終結果,如CT圖像采集和圖像重建算法中的偽影[36],MRI影像采集的參數、算法、信噪比等,PET檢查時患者自身的移位、呼吸運動偽影、高密度物質偽影、尿液污染及注射示蹤劑的劑量均對影像質量有影響[37],因此,獲取一個標準化的大型圖像數據庫難度很大;③不同的ROI分割方法也會影響分割結果,因此,應盡量采用自動分割[38]、全自動食管分割、分層深度學習和全卷積網絡相結合的方法,有效地結合局部和全局信息,提高定位精度[39]。食管癌在內的高危腫瘤的標準化圖像采集、高通量特征穩定性、特征選擇和建模等關鍵科技問題有待進一步探討[40]。先進的影像學技術與蛋白質組學、轉錄組學、代謝組學及其他組學技術的結合仍有待研究和開發。
目前,影像組學在食管癌中的應用仍然是一個比較新的領域,需要大數據的分析驗證和深入的研究來指導其臨床應用,其將僅通過可視化診斷的傳統醫學影像圖像通過計算機深度挖掘出客觀圖像中反映信息化的成像特征,再通過掌握的成像技術和方法(如樣本量的采集、范圍的準確描繪、特征的提取等),結合掌握的成像手段輔助判斷病變,提高了病變檢出的準確率。這將有助于提高食管癌早期診斷的精準度,并有助于在食管癌的臨床應用(如T分期、淋巴結術前評估、個體化精準治療方案的制訂、病情進展監測、預后預測)中取得相對可靠的結果。相信隨著計算機和信息技術的發展,影像組學作為一種新型的、無創的、定量的方法具有廣闊的發展前景。