段福慧,王光明
大理大學第一附屬醫院基因檢測中心,云南 大理 671000
胃癌(gastric cancer,GC)作為消化系統發病率最高的惡性腫瘤,是全球第五大最常見的腫瘤和第四大最常見的癌癥死亡原因。截至2020年全球有超過100萬新發GC病例和近80萬GC患者死亡[1]。中國癌癥報告顯示,GC的發病率位居全國第二且呈現年輕化的特點,新發病例約為40.3萬例[2]。由于缺乏早期診斷標志物,大部分胃癌患者被確診時已處在晚期階段,其預后較差[3]。因此研究GC預后的機制,挖掘關鍵基因,尋求對GC更敏感的生物標志物,對改善GC患者的總體生存期至關重要。
腫瘤突變負荷(tumor mutation burden,TMB)是指一份腫瘤樣本中,所評估基因的外顯子編碼區每兆堿基中發生置換和插入/缺失突變的總數[4]。有研究表明,具有較高突變負荷的腫瘤能夠在腫瘤細胞表面募集到更多的新抗原,增加腫瘤的免疫原性,提高免疫治療的療效[5]。腫瘤基因突變具有高度特異性,不同患者之間存在不同的基因突變圖譜,而TMB可能是多種實體腫瘤免疫治療結局的潛在生物標志物。近年來,越來越多的研究數據表明TMB是免疫檢查點抑制劑(immune checkpoint inhibitors,ICIs)的新型生物標志物,能夠預測免疫治療的療效[6]。2020年6月17日,FDA批準TMB-H(TMB≥10 Muts/Mb)作為篩選癌癥患者的分子生物標志物。因此,本研究旨在評估TMB在GC患者中的預后價值及其與免疫細胞浸潤的關聯性。
1.1 資料獲取 利用TCGA官網推薦的下載軟件GDC-client從基因組數據共享(Genomic Data Commons,GDC)平臺下載GC患者轉錄組數據,其中胃癌樣本375例,正常樣本32例、運用Strawberry Perl 5.32.1軟件將轉錄組數據整理成基因表達矩陣文件。收集相應的臨床信息包括年齡、性別、AJCC-TNM分期、病理分期、腫瘤分級和生存狀況等將其整理成R軟件可以識別的數據格式(XML格式)。突變數據經過VarScan軟件處理,并使用“maftools”包進行可視化突變基因和突變分型。
1.2 TMB的計算 通過JAVA8平臺的Perl腳本計算每個樣本的TMB值,表達為體細胞突變總數/測序區域大小,單位為mutations/Mb。
1.3 TMB突變情況及高TMB組和低TMB組生存分析 所有腫瘤樣本的高TMB組和低TMB組由中位TMB分數定義,利用R軟件“survival”包分析兩組之間生存率的差異。并使用Wilcoxon秩和檢驗來評估TMB水平與臨床特征之間的相關性。
1.4 篩選差異表達基因 根據前文所述,GC患者分為了高TMB組和低TMB組。差異表達基因(DEGs)由“limma”包識別,采用熱圖展示分析結果。DEGs的熱圖是通過“pheatmap”包得出,“org.Hs.eg.db”包用于注釋DEGs。
1.5 基因通路富集分析 利用R語言對獲得的差異基因進行KEGG(kyoto encyclopedia of genes and genomes)和GO(gene oncology)富集分析。當P<0.05,錯誤發現率(FDR)<0.05,則認為富集的基因集有臨床意義,結果以柱狀圖的形式輸出。
1.6 篩選差異免疫基因及構建預后模型 從ImmPort數據庫(https://www.immport.org/)下載免疫相關基因的列表,再利用“Limma”包找出分組后差異表達基因,取兩者交集后將得到的差異免疫基因通過“VennDiagram”包進行可視化。采用“Survival”包對差異免疫基因進行單變量Cox回歸分析找出與預后相關的基因。多變量Cox回歸分析構建基因預后模型,并將得到Cox模型進行Kaplan-Meier生存分析,生成ROC(receiver operating characteristic)曲線以評估TMB預后風險評分的預測值。
1.7 免疫細胞浸潤及免疫相關生存分析 基于TIMER數 據 庫(https://cistrome.shinyapps.io/timer/)的“SCNA”模塊,用箱形圖比較不同免疫細胞浸潤和參與模型構建的4個基因拷貝數的變化。最后,使用“survival”模塊,分別繪制6種免疫細胞在高、低浸潤組中的Kaplan-Meier圖。并對每個圖中的兩組生存曲線通過Log Rank檢驗獲得P值,以探究免疫細胞浸潤水平與其生存的關系。
1.8 統計學方法 數據可視化和差異分析由“limma”R包執行。Cox回歸分析和Kaplan-Meier分析由“Survival”R包進行。Wilcoxon秩和檢驗是一種非參數檢驗,用于檢測兩組之間的差異。單、多因素COX回歸分析差異表達的基因進行預后分析。通過Log Rank檢驗獲得P值,分析免疫細胞浸潤水平與其生存的關系。所有統計學分析均在R軟件(版本3.6.3)上進行。以P<0.05代表差異具有統計學意義。
2.1 胃癌患者基因突變情況 本研究總共收集433例GC患者體細胞突變數據,其中387例樣本存在變異,如圖1A所示的錯義突變是最常見的突變類別,單核苷酸多態性變異所占的比例最多。將單核苷酸變異分為6類,結果顯示C>T突變在GC中的發生率最高(91 939)。每個樣本的變異數從0到5 612不等,中位數為89。瀑布圖顯示了前30個突變基因及其在突變類別方面的狀態(圖1B)。前20個突變基因如下:TTN、TP53、MUC16、ARID1A、LRP1B、SYNE1、FLG、FAT4、CSMD3、PCLO、DNAH5、KMT2D、FAT3、OBSCN、HMCN1、RYR2、ZEFX4、SPTA1、CSKMD1和PIK3CA。筆者使用交互圖來顯示前20個突變基因之間的共性和互斥性(圖1C)。綠色代表突變基因之間的共突變關系,而棕色代表基因之間的互斥關系。基因云圖(圖1D)可以突出顯示突變較多的基因。

圖1 胃癌基因突變全景圖
2.2 TMB在GC中的預后價值 通過Perl腳本計算每個GC樣本的TMB分數,根據中位TMB值將胃癌樣本分為TMB高組(n=183)和TMB低組(n=184),進行Kaplan-Meier分析,結果表明TMB高組與更好的生存結果相關(P=0.017,圖2A)。另外,筆者進一步比較了不同臨床特征之間TMB的差異。在具有以下特征的GC患者中觀察到高水平的TMB(圖2):65歲以上(P<0.001,圖2B),女性(P=0.033,圖2C),StageⅠ~Ⅱ(P=0.044,圖2E),T1~2分期(P=0.039,圖2F),N0(P=0.018,圖2G)。但是,TMB值與M分期(P=0.104,圖2H)或G1~G2分級(P=0.051,圖2D)的相關性未觀察到顯著差異。

圖2 TMB與臨床特征相關性
2.3 高TMB組和低TMB組間的DEGs比較和基因富集分析 本研究總共收獲了816個DEGs,將兩組之間的DEGs通過熱圖進行可視化(圖3A)。還進行了GO和KEGG富集分析,用柱狀圖(圖3B、3C)表示。柱狀圖的橫坐標表示富集在GO/KEGG上的基因數目,縱坐標表示GO/KEGG的名稱,其中GO富集可分為BP、CC和MF。圖3B結果顯示GO富集中以肌肉系統的形成與含膠原蛋白的細胞外基質的通路富集較顯著,圖3C結果顯示在KEGG富集中以神經活性配體-受體相互作用通路富集最為顯著。

圖3 高TMB組和低TMB組間的DEGs比較和TMB相關的富集基因集
2.4 高TMB組和低TMB組GC患者的免疫細胞浸潤比較 根據TMB水平將GC患者分為兩組,通過“CIBERSORT”R包比較高TMB和低TMB組中的22個免疫細胞。每個GC患者中22個免疫細胞的比例如圖4A所示,不同的顏色代表不同的免疫細胞類型。此外,小提琴圖(圖4B)用于可視化免疫細胞比例。Wilcoxon's rank-sum檢驗顯示,活化CD4+記憶T細胞、濾泡輔助T細胞、靜息NK細胞、M0和M1巨噬細胞和中性粒細胞等免疫細胞的高TMB組浸潤高于低TMB組。數據庫中免疫相關基因與差異基因相結合并利用“VennDiagram”包篩選出97個差異免疫基因(圖4C)。進行單因素Cox回歸分析并進一步鑒定了12個與預后相關的基因(表1)。進行多因素Cox回歸分析后篩選出APOD、FGF7、AMHR2、NPR3 4個基因來構建預后模型。將得到的預后模型行Kaplan-Meier生存分析,其結果顯示:APOD、FGF7、AMHR2和NPR3基因的生存曲線中高、低表達組患者的預后存在顯著差異,其中APOD、FGF7、AMHR2基因高表達組的生存時間更長(圖5A~5C),NPR3基因低表達組的生存時間更長(圖5D)。最后,根據Cox回歸分析構建預后算法,結果顯示低風險組患者與更好的生存預后相關(圖5E)。繪制ROC曲線,以曲線下面積(AUC)=0.642來驗證預后模型的準確性(圖5F)。

圖4 高、低TMB組與浸潤免疫細胞的相關性

圖5 胃癌預后相關基因的生存分析

表1 免疫相關的DGEs單因素Cox回歸分析
2.5 預后相關基因CNV與免疫細胞浸潤的關系 基于TIMER數據庫的“SCNA”模塊,用箱形圖(圖6A~6D)描述了GC患者中AMHR2、APOD、FGF7、NPR3這4個預后相關基因的拷貝數變異與免疫細胞浸潤之間的相關性。該模塊將樣本以基因拷貝數變化來分組,把6種免疫細胞浸潤情況展現出來,圖例中的拷貝數由5種顏色來區分。圖6A表明AMHR2基因的拷貝數缺失與B細胞、CD8+T細胞、CD4+T細胞、巨噬細胞、中性粒細胞和樹突細胞的浸潤水平相關。圖6B表明APOD基因獲得拷貝數與B細胞、CD8+T細胞、CD4+T細胞、巨噬細胞、中性粒細胞和樹突細胞的浸潤水平相關。圖6C表明FGF7基因的拷貝數缺失與B細胞、CD8+T細胞、CD4+T細胞、巨噬細胞、中性粒細胞和樹突細胞浸潤水平相關。圖6D表明NPR3基因獲得拷貝數與B細胞、CD8+T細胞、CD4+T細胞、巨噬細胞、中性粒細胞和樹突細胞的浸潤水平相關。

圖6 AMHR2、APOD、FGF7、NPR3基因拷貝數變異與免疫細胞浸潤的相關性
2.6 不同免疫細胞浸潤情況下生存分析 通過Cox回歸分析影響GC患者生存結果的免疫細胞類型。圖7展示的是6種免疫細胞在高、低浸潤組的生存分析,結果顯示GC患者較差的生存結果與高巨噬細胞浸潤相關。

圖7 6種免疫細胞高、低浸潤組與生存的關系
近年來免疫治療成為治療腫瘤疾病的一種創新方法,為腫瘤患者帶來了希望。其中ICIs發揮著舉足輕重的作用,但只有15%~20%的患者對免疫療法有反應[7]。若有更好的新型生物標志物來篩選適合免疫治療的腫瘤患者,并對這部分患者進行針對性的免疫治療,其治療效果可能會更佳。目前,在胃癌ICIs治療中用于療效預測的指標有PD-L1、EBV陽性、高度微衛星不穩定、腫瘤突變、腫瘤浸潤性淋巴細胞及基因表達譜等。其中針對程序性細胞死亡蛋白1(PD-1)及其配體(PD-L1)的ICIs已進入臨床試驗,如派姆單抗、納武單抗能夠使胃癌患者獲得有效且持久的臨床反應。但臨床研究發現,仍有部分胃癌患者存在ICIs治療不敏感或治療抵抗現象[8-9]。所以,尋找更好地預測ICIs療效的生物標志物,對提高GC患者免疫治療效果至關重要。
TMB是一種很有前景的ICIs治療標志物,已被發現在預測免疫療法的反應方面有著重要作用。YARCHOAN等[10]研究發現,在接受PD-1/PD-L1免疫檢查點抑制劑治療的腫瘤患者,TMB與ICIs治療客觀反應率呈正相關,高TMB患者客觀反應率明顯升高。RIZVI等[11]研究發現,TMB>50%的患者比TMB≤50%的患者臨床受益率更好。一項前瞻性臨床試驗對54例接受特瑞普利單抗治療的化療抵抗性胃癌患者進行TMB分析,結果發現高TMB患者的客觀反應率和總體生存期均高于低TMB患者[12]。上述研究表明,TMB可作為ICIs療效的預測指標,在預測胃癌ICIs療效上扮演著重要的角色。
本研究基于TCGA數據庫總結了GC患者的突變基因組景觀,其中前3個突變基因是TTN、TP53和MUC16。TP53是研究最廣泛的抑癌基因之一,其突變不僅消除了p53的腫瘤抑制功能,還產生某些促癌蛋白[13]。TTN是已知最長的基因,會影響心臟和骨骼肌的發育與調節,已被證實與TMB水平和實體瘤中對ICIs的反應高度相關[14]。MUC16是各種癌癥中最常見的突變基因之一,與癌細胞的生長和轉移增強有關[15]。近期,有學者提出MUC16與高TMB和GC的良好預后相關[16]。本研究還分析了GC患者TMB值與生存率之間的關系,結果表明高TMB組的GC患者具有更好的生存結果,這一發現與其他癌癥研究一致。并觀察到高TMB 組與 GC 病例中的年齡、女性、Stage Ⅰ~Ⅱ、T1~2分期以及N0相關。本研究通過“limma”包確定了816 個 DEGs,將得到的 DEGs 進行 GO 和 KEGG 富集分析,結果顯示這些DEGs主要參與神經活性配體-受體相互作用、肌肉系統形成和含膠原蛋白的細胞外基質通路。通過進一步的單變量和多變量Cox 分析篩選出與GC 患者預后相關的基因AMHR2、APOD、FGF7 和NPR3 來構建預后模型。研究結果顯示,這4個基因的高表達與不良預后相關,同時還發現這部分基因的突變與免疫細胞浸潤有關。
免疫細胞是腫瘤微環境中很大一部分的浸潤細胞,通過釋放炎癥細胞因子和趨化因子與腫瘤細胞相互作用,從而驅動癌癥的生物學行為并影響其對免疫療法的治療作用。在本研究中,筆者探討了TMB值與GC患者免疫浸潤之間的潛在關系。通過比較發現高TMB 和低TMB 組之間的22 個免疫細胞中CD4+記憶T 細胞、濾泡輔助 T 細胞、靜息 NK 細胞、M0 和 M1 巨噬細胞和中性粒細胞在兩組中的浸潤情況存在差異。高TMB 組中3 種免疫細胞(CD8+T 細胞、CD4+T細胞和Tfh 細胞)的豐度明顯高于低TMB 組。為了進一步研究兩組的差異是否會影響GC患者的生存結果,還進行了Cox 回歸分析研究,結果表明,高巨噬細胞浸潤與GC患者較差的生存結果相關。YU等[17]也得出了類似的結論,高密度的巨噬細胞浸潤與GC患者生存結果不佳顯著相關。多項研究探討了巨噬細胞和GC細胞的相互作用,發現巨噬細胞可能在促進GC細胞增殖、轉移、血管生成和免疫侵襲中發揮作用[18-21]。
本研究還存在一些局限性:首先,研究中所有樣本和臨床數據都是基于TCGA數據庫收集的,沒有采用外部數據庫如GEO 數據庫(Gene Expression Omnibus database) 或其他大樣本的隊列進行驗證研究結果;其次,分析了TMB與浸潤性免疫細胞的關系,但缺乏免疫組織化學等基礎實驗來確定四個預后相關基因與免疫細胞浸潤之間的相關性;最后,研究中繪制的 ROC 曲線,其曲線下面積AUC=0.642,AUC<0.7。因此,需要更多的臨床數據來提高預測效果。
總之,本研究基于TCGA 數據庫發現高巨噬細胞浸潤預示胃癌患者預后較差,高TMB與胃癌患者更好的生存預后相關。因此,高TMB患者接受免疫治療效果更好,能延長患者的生存期。