王 凱 費素娟
作者單位:221002 徐州醫科大學第一臨床醫學院(王 凱);221004 徐州醫科大學附屬醫院(費素娟)
根據相關資料顯示,胃癌的發病率在全球惡性腫瘤中排在第5位,死亡率排在第3位[1],在我國更為多見。雖然對治療方案進行了不斷的優化,但是患者的 5 年生存率仍然較低[1]。本文通過構建一個免疫相關基因預后風險模型來評估胃癌患者的預后情況,一定程度上有利于患者的早期診斷、病程進展、個體化治療。目前認為,免疫微環境影響腫瘤發生、發展、轉移及耐藥,腫瘤浸潤淋巴細胞可用來評估腫瘤患者復發及死亡風險。免疫治療是一種新穎的對抗腫瘤的治療方法,通過機體自身的免疫功能,控制與清除腫瘤,包括免疫檢查點抑制劑等多種免疫療法,在多種腫瘤的治療中均取得了一定療效[2]。目前研究廣泛的免疫檢查點包括細胞毒 T 淋巴細胞相關抗原4(CTLA-4)及程序性細胞死亡蛋白-1(PD-1)及其配體(PD-L1)。
從TCGA數據庫(https://portal.gdc.cancer.gov/https://portal.gdc.cancer.gov/)下載胃癌患者的基因表達數據(包括375例胃癌樣本、32例癌旁組織樣本)和相關臨床資料(共443例)。再從免疫學數據庫ImmPort下載免疫相關基因(IRGs)的數據。
以FDR<0.05,且 logFC≥2或 logFC≤-2作為篩選標準,通過運行R軟件中的“edgeR”包,篩選出差異表達的基因(differential expressed genes,DEGs)。再將DEGs、IRGs取交集,從而得到樣品中存在差異表達的IRGs。通過R軟件的“clusterprofiler”“org.Hs.eg.db”包進行GO功能富集分析及KEGG通路富集分析。
對胃癌患者臨床資料進行整理,排除了隨訪時間<30天的胃癌患者數據,并與差異表達的IRGs數據合并。按照排除標準,將胃癌樣本分為Train組(224例)、Test組(111例),χ2檢驗2組是否具有可比性。利用Train組通過LASSO回歸算法和Cox分析篩選出與胃癌患者預后相關的IRGs,并構建IRGs預后風險模型并用Test組進行檢驗。然后通過構建的預后風險模型計算每例胃癌患者的風險評分值,將所有胃癌患者分為高、低風險2組,通過“pheatmap”包、“Kaplan-Meier”生存曲線、“ROC”包、分別繪制Train組和Test組的風險曲線,預后差異圖形,ROC曲線,評估模型的預測性能。最后再進行獨立預后分析實驗,評估該模型的風險評分能否獨立于年齡、性別、分級、分期等臨床指標,作為評估胃癌患者預后的獨立因素。
將胃癌表達數據按照評估模型分為高、低風險2組,使用CIBERSORT算法進行免疫浸潤,評估2組中免疫細胞占比,繪制高、低表達組免疫細胞占比的圖形。
通過“ggpubr”包檢查常見的免疫檢查點在高低風險組表達是否有差異性。從TCIA數據庫下載胃癌的免疫表達數據,經過數據整理,通過R語言“ggpubr”包得到免疫治療結果。
通過R軟件對TCGA 數據庫的 375 例胃癌組織及 32 例癌旁組織的基因數據進行篩選,得到1218個DFGs,與 ImmPort數據庫的1793個IRGs數據取交集,得到了238個差異表達的IRGs,并繪制出差異表達的IRGs的韋恩圖(圖1A) 和熱圖(圖1B)。通過R軟件行GO功能富集分析,差異表達的IRGs主要參與免疫球蛋白生產、免疫反應分子介質的產生、免疫球蛋白復合物的形成、抗原結合等生物學過程(圖2A)。KEGG通路富集分析,差異表達的IRGs主要參與細胞因子-細胞因子受體相互作用、神經活性配體-受體相互作用等通路(圖2B)。

A:IRGs 與 DEGs 取交集后差異表達的 IRGs的韋恩圖;B:238 個差異表達的 IRGs 的表達熱圖,黑色表示基因呈高表達,灰色表示基因呈低表達。

A:差異表達的IRGs GO功能富集分析;B:差異表達的 IRGs KEGG通路富集分析。
按照排除標準,將胃癌樣本分為Train組(224例)、Test組(111例),χ2檢驗結果顯示,Train組、Test組在年齡、性別、分級、分期、腫瘤的大小及浸潤深度、淋巴結轉移情況及遠處轉移情況等方面差異均無統計學意義(均P>0.05),說明分組隨機合理。見表1。整合Train組差異表達的IRGs數據及臨床資料,LASSO回歸得到9個與胃癌預后相關的IRGs,具體為:LBP、MPO、APOH、IGHD3-16、IGHV6-1、CGB5、GHR、RXRG、PRKCG。見圖3。通過單因素、多因素COX回歸分析構建預后風險模型。單因素COX分析篩選出13個與胃癌預后相關的IRGs。見圖4。多因素COX構建預后風險模型:風險評分=(MPO表達量×0.208601965)+(APOH表達量×0.191139191)+(IGHD3-16表達量×0.201602081)+(CGB5表達量×0.185605365)+(GHR表達量×0.289559538)+(PRKCG×(-0.176078116))。其中MPO、APOH、IGHD3-16 CGB5、GHR為高風險基因。PRKCG為保護性基因。見表2。

表1 Train組、Test組胃癌患者的臨床病理特征比較(例,%)

表2 胃癌預后相關的IRGs(多因素Cox)

圖3 胃癌預后相關的IRGs(LASSO回歸)

圖4 胃癌預后相關的IRGs(單因素Cox)
按照預后風險模型計算每例胃癌患者的風險評分,根據中位值分為高、低風險2組,通過R軟件,繪制出Train組、Test組的風險評分曲線圖(圖5A)、生存分布散點圖(圖5B)、預后相關的 IRGs 的熱圖(圖5C)。Kaplan-Meier 生存分析結果顯示Train組和Test組中高風險組生存率明顯低于低風險組(P<0.05)。見圖6。繪制模型的ROC 曲線,Train組AUC為0.692,Test組AUC為0.658。見圖7。

黑色為高風險患者,灰色為低風險患者。

圖7 Train組、Test組預后風險模型的ROC曲線
將各例胃癌患者的風險評分數據和各項臨床指標,包括年齡、性別、分級、分期等合并,進行單因素和多因素Cox分析。單因素Cox分析結果顯示:年齡、臨床分期、風險評分與胃癌的預后有關(P<0.05);多因素Cox分析結果顯示,風險評分、年齡、臨床分期可以作為評估胃癌患者預后的獨立因素(P<0.05)。見圖8。

圖8 影響胃癌預后的單因素及多因素COX分析
整合患者風險評分及臨床資料,構建列線圖模型。選取一個樣本,可以獲得其各項指標在模型中的對應評分,并可以計算總分,預測胃癌患者1、3、5年生存率。見圖9。

圖9 預測胃癌患者總生存期的列線圖模型
通過CIBERSORT算法對所有樣本進行免疫細胞浸潤。根據模型風險評分的中位值將所有胃癌患者分為高、低風險2組,分析2組間22種免疫細胞表達水平的差異,結果顯示幼稚B細胞、活化的記憶CD4+T細胞、靜止肥大細胞、活化肥大細胞表達具有明顯差異(P<0.05)。見圖10。

黑色為高風險患者,灰色為低風險患者。
通過R軟件“ggpubr”包對常見的免疫檢查點進行篩選,發現PD-L1在高、低風險組表達有差異性(P<0.05)。見圖11。從TCIA數據庫下載胃癌的免疫表達數據,經過數據整理,發現高、低風險組抗PD-1治療效果有差異性(P<0.05)。見圖12。

圖11 PD-L1在高、低風險組的差異表達

圖12 高、低風險組抗PD-1治療效果
胃癌是一種高度惡性的腫瘤,具有高度的侵襲性及高復發率,預后差。只有早期篩選出預后不良的因素并進行針對性的個體化治療,才能夠改善生存率[3],因此需要更為敏感可靠的生物標志物。大多數利用公共數據庫如TCGA、GEO構建胃癌預后模型利用了全部樣本構建模型,缺乏模型驗證[4]。本研究將TCGA胃癌樣本分為Train組、Test組,2組在年齡、性別、分級、分期、腫瘤的大小及浸潤深度、淋巴結轉移情況及遠處轉移情況等方面差異均無統計學意義。在Train組中建模,在Test組中檢驗。本研究構建的模型在Train組、Test組中均能有效評估胃癌患者預后,且該模型可以作為胃癌預后的獨立危險因素。該預后風險模型由MPO、APOH、IGHD3-16、CGB5、GHR、PRKCG6個基因構成,其中MPO、APOH、IGHD3-16、CGB5、GHR高表達可能促進胃癌發生發展,PRKCG高表達可能會改善腫瘤的預后,其中4個風險基因被報道與胃癌或其他惡性腫瘤發生、發展及預后相關。髓過氧化物酶(MPO)是一種溶酶體酶,存在于嗜中性粒細胞,單核細胞和組織巨噬細胞中,MPO SNP rs2333227 C-T突變改變了轉錄因子AP-2α與rs2333227突變區的結合親和力,依次提高了MPO的表達水平,進一步激活了IL23A-MMP9軸介導的致癌信號傳導[5]。有研究指出APOH在肝細胞癌中表達上調[6],機制尚不清楚。生長激素受體(GHR)是生長激素(GH)的同源受體,屬于I類細胞因子受體超家族的膜結合受體,可以通過介導PI3K/AKT信號通路控制G1細胞周期進展來調節胃癌細胞的生長和凋亡[7]。蛋白激酶Cγ(PRKCG)作為蛋白激酶Cs(PKCs)的同工酶,介導IL-2表達和腫瘤免疫應答[8]。第20絲氨酸位點也可以在p53中磷酸化以激活結腸癌細胞的凋亡[9]。CD4+T細胞浸潤是影響結腸癌預后的獨立危險因素[10],該模型下高風險組活化的記憶CD4+T細胞浸潤比例減少,部分解釋了該組患者預后差的原因。程序性細胞死亡1(PD-1)信號傳導通常被癌細胞劫持以逃避免疫監視[11]。當PD-1和T細胞受體(TCR)與其配體結合時,PD-1的免疫受體酪氨酸抑制基序和免疫受體酪氨酸基開關基序被磷酸化[12]。隨后,Src同源區2含有磷酸酶(SHP-2)被招募和激活,逆轉TCR和CD28下游信號傳導的磷酸化[13]。目前,阻斷PD-1或其配體PD-L1的抗體已被批準用于治療各種實體惡性腫瘤和血液系統惡性腫瘤[14-16]。
綜上所述,本研究利用TCGA胃癌數據,分組構建了由6個免疫相關基因組成的預后風險模型,通過評估該模型的預測性能,發現該模型具有潛在臨床應用價值。