蔣逆立,張 蝶,劉曾晶,胡艷玲,,
1. 廣西醫(yī)科大學(xué)生命科學(xué)研究院(南寧 530022)
2. 廣西醫(yī)科大學(xué)再生醫(yī)學(xué)與醫(yī)用生物資源開發(fā)應(yīng)用省部共建協(xié)同創(chuàng)新中心(南寧 530021)
3. 廣西醫(yī)科大學(xué)信息與管理學(xué)院(南寧 530022)
癌癥是全球嚴(yán)重的公共衛(wèi)生問題,其中肺癌導(dǎo)致的死亡人數(shù)最多,約25%癌癥患者死亡歸因于肺癌,其中82%由吸煙導(dǎo)致[1-2]。兩項(xiàng)隨機(jī)對(duì)照試驗(yàn)研究顯示低劑量CT 篩查能顯著降低肺癌患者的死亡率[3-4]。結(jié)核病(tuberculosis, TB)是全球成年人傳染病的主要死因,每年患病人數(shù)達(dá)1 000 多萬[5]。呼吸道感染期間細(xì)胞炎癥和損傷與癌癥相關(guān),研究顯示,結(jié)核病感染與癌癥風(fēng)險(xiǎn)之間存在顯著的正相關(guān),根據(jù)肺癌組織學(xué)分層分析,肺結(jié)核病史與腺癌和鱗狀細(xì)胞癌之間存在顯著相關(guān)性[6];具有結(jié)核分枝桿菌感染史的患者進(jìn)展為癌癥的可能性更高[7-8]。 結(jié)核病惡化為肺癌的原因可能是肺部炎癥和纖維化導(dǎo)致的基因突變或損傷,進(jìn)而增加了肺癌患病風(fēng)險(xiǎn)[9]。既往研究證實(shí)了肺結(jié)核患者外周血細(xì)胞中的基因表達(dá)差異,已鑒定的表達(dá)譜也顯示免疫系統(tǒng)的慢性激活,同時(shí)干擾素(interferon, IFN)信號(hào)傳導(dǎo)明顯激活,通過Janus 酪氨酸蛋白激酶/信號(hào)轉(zhuǎn)導(dǎo)及轉(zhuǎn)錄激活因子(Janus kinase-sinal transducer and activator of transcription, JAK-STAT)信號(hào)通路途徑的促炎信號(hào)傳導(dǎo),以及具有下游反應(yīng)元件Fcγ 受體(Fc gamma receptors, FcγR)高表達(dá)[10-12]。在結(jié)核患者中,再刺激誘導(dǎo)的細(xì)胞死亡(restimulation-induced cell death, RICD)和T 細(xì)胞活化受自然殺傷、T 和B 細(xì)胞抗原/淋巴細(xì)胞活化分子相關(guān)蛋白信號(hào)轉(zhuǎn)導(dǎo)途徑(natural killer, T and B cell antigen/signaling lymphocyte activation molecule-associated protein,NTB-A/SAP)的調(diào)節(jié)[13]。然而,目前尚缺乏結(jié)核相關(guān)基因與肺鱗狀細(xì)胞癌(lung squamous cell carcinoma, LUSC)預(yù)后及免疫浸潤(rùn)關(guān)系方面的研究。本研究旨在基于生物信息學(xué)探討結(jié)核通路基因表達(dá)差異與LUSC 預(yù)后及腫瘤免疫微環(huán)境的相關(guān)性。
基于京都基因與基因組百科全書數(shù)據(jù)庫(kù)(Kyoto Encyclopedia of Genes and Genomes,KEGG)(www.kegg.jp/kegg/pathway.html)[14], 獲取結(jié)核病感染相關(guān)通路(map05152)的138 個(gè)基因,包括C3、JNK和TNF等基因。LUSC 患者的臨床數(shù)據(jù)和基因表達(dá)數(shù)據(jù)來自癌癥基因組圖譜數(shù)據(jù)庫(kù)(The Cancer Genome Atlas, TCGA)(www.cancer.gov/ccg/research/genome-sequencing/tcga)[15]。總樣本為502 例LUSC 患者,剔除年齡、性別、生存狀態(tài)、臨床分期等信息缺失的樣本后,最終納入374 例,對(duì)患者的表達(dá)矩陣數(shù)據(jù)進(jìn)行歸一化處理,得到原始表達(dá)數(shù)據(jù)(fragments per kilobase million, FPKM)[16]。
通過單因素COX 分析得到結(jié)核通路基因中與LUSC 預(yù)后(即生存狀態(tài))相關(guān)的關(guān)鍵基因,再將單因素分析差異有顯著意義的變量納入多因素COX 分析,篩選與LUSC 預(yù)后相關(guān)的基因,消除基因間的潛在協(xié)同效應(yīng)和偏倚誤差,得到風(fēng)險(xiǎn)評(píng)分、風(fēng)險(xiǎn)分組(風(fēng)險(xiǎn)評(píng)分高于均值的患者納入高風(fēng)險(xiǎn)組,低于均值則納入低風(fēng)險(xiǎn)組)及風(fēng)險(xiǎn)比(hazard ratio, HR),構(gòu)建獨(dú)立預(yù)后模型。通過森林圖分析該預(yù)后模型的風(fēng)險(xiǎn)評(píng)分、年齡、性別和腫瘤分期與LUSC 預(yù)后的相關(guān)性,評(píng)估預(yù)后模型的風(fēng)險(xiǎn)評(píng)分是否受其它臨床變量(性別、年齡、臨床分期等)的影響,并繪制臨床相關(guān)性熱圖。使用的R 軟件包有survival、tidyverse、glmnet 和survminer。
通過風(fēng)險(xiǎn)評(píng)分、年齡、性別、腫瘤分期分別構(gòu)建受試者工作特征(receiver operating characteristic, ROC)曲線,并評(píng)估風(fēng)險(xiǎn)評(píng)分對(duì)LSCC 患者預(yù)后(2 年、3 年和5 年生存率)的預(yù)測(cè)敏感性和特異性。基于多因素COX 回歸分析結(jié)果,采用列線圖(Nomogram)展示各變量與LUSC 預(yù)后之間的關(guān)系。使用的R 軟件包有survival、survminer、timeROC、tidyverse、regplot和myplot。
通過CIBERSORT 方法計(jì)算不同風(fēng)險(xiǎn)組結(jié)核通路基因的LUSC 樣本免疫細(xì)胞浸潤(rùn),利用線性支持向量回歸的原理對(duì)免疫細(xì)胞亞型的表達(dá)矩陣進(jìn)行去卷積,估計(jì)免疫細(xì)胞的豐度,使用的R 軟 件 包 為ggplot2、mmunedeconv、tidyverse、dplyr 和reshape2。通過不同風(fēng)險(xiǎn)分組腫瘤樣本中結(jié)核通路基因的表達(dá)評(píng)估LUSC 腫瘤微環(huán)境的組成,并進(jìn)行單樣本免疫浸潤(rùn)分析,分析每種免疫細(xì)胞富集差異,使用的R 軟件包有g(shù)enefilter、SVA、GSVA、stringr、ggpubr、ggsignif、pheatmap、ggplot2 和myplot。
本研究納入374 例LUSC 患者,患者的性別、年齡、臨床分期、生存狀態(tài)和風(fēng)險(xiǎn)分組等臨床信息見表1。

表1 374例LUSC患者的臨床信息Table 1. Clinical information of 374 LUSC patients
單因素COX 回歸分析篩選得到預(yù)后相關(guān)基因TGFB2、CASP9、FADD、CEBPB和PLK3,多因素COX 分析結(jié)果顯示FADD、PLK3基因與LUSC預(yù)后顯著相關(guān)(P<0.05),并在高風(fēng)險(xiǎn)組中均為高表達(dá),見表2。

表2 LUSC患者預(yù)后相關(guān)基因的多因素COX分析Table 2. Multivariate COX analysis of prognostic related genes in LUSC patients
森林圖結(jié)果顯示,風(fēng)險(xiǎn)評(píng)分和年齡具有獨(dú)立預(yù)測(cè)LUSC 患者預(yù)后的能力(P<0.05),進(jìn)一步對(duì)風(fēng)險(xiǎn)分組和相關(guān)臨床信息進(jìn)行相關(guān)性熱圖分析,結(jié)果見圖1。

圖1 LUSC患者預(yù)后的森林圖分析及關(guān)鍵基因熱圖Figure 1. Forest map analysis and key gene heatmap analysis of the prognosis of LUSC patients
本研究構(gòu)建不同臨床特征的ROC 曲線,探索風(fēng)險(xiǎn)評(píng)分、年齡、性別和臨床分期對(duì)LUSC 患者總生存率的預(yù)測(cè)準(zhǔn)確率,結(jié)果顯示風(fēng)險(xiǎn)評(píng)分預(yù)測(cè)模型的曲線下面積(area under the curve, AUC)為0.637,高于其他臨床因素的預(yù)測(cè)準(zhǔn)確率,并驗(yàn)證了該預(yù)測(cè)模型對(duì)LUSC 患者2 年、3 年及5 年生存率的AUC 值。根據(jù)列線圖結(jié)果可知,LSCC 患者的預(yù)后與風(fēng)險(xiǎn)得分的相關(guān)性最高,其次是性別、臨床分期和年齡,見圖2。

圖2 LUSC患者預(yù)后的ROC曲線和列線圖Figure 2. The ROC curve and nomogram of the prognosis of LUSC patients
如圖3 所示,通過分析不同風(fēng)險(xiǎn)評(píng)分組的腫瘤微環(huán)境,計(jì)算免疫細(xì)胞在各樣本中的富集得分,其中差異有統(tǒng)計(jì)學(xué)意義的免疫細(xì)胞有CD56bright natural killer、central memory CD4 T、effector memeory CD4 T、gamma delta T、myeloid-derived suppressor cell(MDSC)、memory B、natural killer、natural killer T。高風(fēng)險(xiǎn)組內(nèi)高富集的免疫細(xì)胞為CD56bright natural killer、MDSC、memory B,高風(fēng)險(xiǎn)組內(nèi)低富集的免疫細(xì)胞為central memory CD4 T、effector memeory CD4 T、gamma delta T、natural killer、natural killer T。

圖3 腫瘤免疫微環(huán)境和免疫細(xì)胞的富集得分Figure 3. Tumor immune microenvironment and enrichment score of immune cells
本研究通過COX 回歸分析結(jié)核通路基因在LUSC 中的表達(dá)情況,篩選出與LUSC 預(yù)后相關(guān)的基因,分別為CASP9、FADD、PLK3基因。一項(xiàng)薈萃分析顯示,Caspase 9(CASP9)單核苷酸多態(tài)性(single nucleotide olymorphisms, SNPs)與癌癥易感性相關(guān)[18];CASP9基因在非小細(xì)胞肺癌(non small cell lung cancer, NSCLC)中低表達(dá)[19],而在高風(fēng)險(xiǎn)組中相對(duì)高表達(dá)。FAS 相關(guān)死亡結(jié)構(gòu)域(fas-associating protein with a novel death domain, FADD)的表達(dá)和活性受到復(fù)雜網(wǎng)絡(luò)的調(diào)節(jié),如DNA 甲基化、非編碼RNA 和翻譯后修飾,其失調(diào)已被證實(shí)與多種類型癌癥的發(fā)病機(jī)制密切相關(guān),F(xiàn)ADD 已被證實(shí)參與并調(diào)節(jié)大多數(shù)信號(hào)體復(fù)合體,已成為先天免疫、炎癥和癌癥進(jìn)展的新參與者[20-21]。Polo 樣激酶(Polo-like kinase,PLK)基因家族是細(xì)胞分裂過程中的重要調(diào)節(jié)因子,其成員的異常遺傳和表觀遺傳學(xué)改變?cè)诓煌陌┌Y中起著不同作用,肺癌亞型中PLK 1/4(Polo-like kinase 1/4)基因過表達(dá)但PLK 2/3(Polo-like kinase 2/3)欠表達(dá)[22],PLK3在高風(fēng)險(xiǎn)組中相對(duì)高表達(dá),敲除PLK3可以減弱磷酸化及致癌性[23]。森林圖顯示CASP9、FADD、PLK3三個(gè)基因構(gòu)建的風(fēng)險(xiǎn)評(píng)分預(yù)后模型與年齡可以獨(dú)立預(yù)測(cè)LUSC 預(yù)后情況,同時(shí)ROC 曲線也顯示風(fēng)險(xiǎn)評(píng)分預(yù)測(cè)模型的AUC 值高于年齡、性別和臨床分期,說明該模型的敏感性最好,預(yù)測(cè)2 年和3年生存率的敏感性和特異性較好。既往研究基于TCGA 和GEO 數(shù)據(jù)庫(kù)構(gòu)建LUSC 早期患者的ROC曲線,AUC 值也僅為0.67 和0.679[24]。在臨床應(yīng)用中,臨床醫(yī)師可以依靠列線圖,將LUSC 患者的相關(guān)信息帶入列線圖,來估計(jì)患者1 年、2 年及3 年生存率。國(guó)內(nèi)學(xué)者發(fā)現(xiàn)吸煙會(huì)導(dǎo)致重要基因的甲基化水平發(fā)生變化,從而影響LUSC 患者預(yù)后[25]。本研究側(cè)重結(jié)核相關(guān)基因表達(dá)對(duì)LUSC患者預(yù)后的影響,并進(jìn)一步探索腫瘤免疫微環(huán)境的變化。
自然殺傷細(xì)胞(natural killer cell, NK)被認(rèn)為是一種相對(duì)原始的“殺手”,它們不僅被視為先天免疫的真正參與者,還被視為塑造和影響適應(yīng)性免疫反應(yīng)的重要細(xì)胞[26]。CD56 bright natural killer 細(xì)胞可通過分泌細(xì)胞因子起到免疫調(diào)節(jié)的作用,研究顯示腫瘤內(nèi)和循環(huán)NK 細(xì)胞數(shù)量的增加與抗西妥昔單抗和抗cd20 單抗治療的良好效果相關(guān)[27-28]。而通過結(jié)核通路基因顯示出CD56bright natural killer 細(xì)胞在LUSC 高風(fēng)險(xiǎn)組中高富集,這可能提示其對(duì)放化療具有敏感性。骨髓來源抑制性細(xì)胞(myeloid-derived suppressor cells, MDSCs)參與癌癥相關(guān)的炎癥反應(yīng),是腫瘤免疫微環(huán)境中的重要細(xì)胞,MDSCs 促進(jìn)Tregs 的形成,MDSCs 患者死于癌癥的風(fēng)險(xiǎn)幾乎翻了一番[29-30]。B 細(xì)胞分別分化為漿細(xì)胞或記憶B 細(xì)胞來發(fā)揮效應(yīng)或記憶功能,一些研究表明繼發(fā)性流感會(huì)觸發(fā)記憶B 細(xì)胞快速遷移和重新定位[31-33],本研究也顯示其在LUSC 高風(fēng)險(xiǎn)組高富集。CD4+T 淋巴細(xì)胞是適應(yīng)性免疫的關(guān)鍵因子,可以指導(dǎo)和增強(qiáng)B 細(xì)胞和CD8+T 細(xì)胞對(duì)各種病原體的反應(yīng)功能[34]。記憶T 細(xì)胞通常被分為中央記憶細(xì)胞(central memory CD4 T cell, TCM)和效應(yīng)記憶細(xì)胞(effector memeory CD4 T cell, TEM),前者在血液中循環(huán),后者可以從血液遷移到非淋巴組織[35]。研究表明TCM 是唯一與口腔鱗狀細(xì)胞癌預(yù)后相關(guān)的獨(dú)立免疫細(xì)胞,同時(shí)也與頭頸部鱗狀細(xì)胞癌的炎性腫瘤微環(huán)境和預(yù)后改善相關(guān)[36-37];在免疫反應(yīng)過程中T 細(xì)胞接受抗原刺激后,經(jīng)過增殖,分化形成TEM,與靶細(xì)胞接觸后釋放的穿孔素導(dǎo)致靶細(xì)胞表面形成小孔,從而介導(dǎo)殺傷作用[38]。同時(shí),效應(yīng)T 細(xì)胞還能釋放出免疫活性物質(zhì)(淋巴因子),如白細(xì)胞介素、干擾素等。γ-δT 細(xì)胞(gamma delta T cell)是一類非常規(guī)的T 淋巴細(xì)胞,在宿主防御、免疫監(jiān)視和免疫系統(tǒng)內(nèi)穩(wěn)態(tài)中發(fā)揮著不可或缺的作用,對(duì)于促進(jìn)淋巴和髓系的炎癥反應(yīng)和免疫反應(yīng)也尤為重要[39-40]。自然殺傷T 細(xì)胞(natural killer T cell, NKT)和NK 細(xì)胞都是先天細(xì)胞毒性淋巴樣細(xì)胞,產(chǎn)生炎癥因子、細(xì)胞因子和趨化因子,它們對(duì)腫瘤和微生物免疫應(yīng)答的作用已被證實(shí)[41],在腫瘤細(xì)胞的腫瘤微環(huán)境中發(fā)揮著重要作用,然而在LUSC 高風(fēng)險(xiǎn)分組中低表達(dá),說明其對(duì)腫瘤細(xì)胞的免疫應(yīng)答不足,這可能是導(dǎo)致預(yù)后不良的重要因素。
雖然本研究發(fā)現(xiàn)了結(jié)核通路相關(guān)基因與LUSC 預(yù)后的關(guān)系,并通過對(duì)LUSC 患者預(yù)后進(jìn)行風(fēng)險(xiǎn)分組,探索了高風(fēng)險(xiǎn)組有富集差異的免疫細(xì)胞,但局限于采用生信分析,其結(jié)果有待在人群中進(jìn)一步驗(yàn)證。未來有望進(jìn)一步深入研究,尋找結(jié)核和LUSC 新的治療靶點(diǎn),為結(jié)核進(jìn)展為L(zhǎng)USC 患者提供更科學(xué)合理的治療方法。