田琴琴 李昂 李佳瑩 謝俞寧 仵紅嬌 張雪梅,
華北理工大學1生命科學學院,2公共衛生學院(河北唐山063210)
食管癌是世界上最常見的胃腸道惡性腫瘤之一。根據世界衛生組織(World Health Organization,WHO)的統計,食管癌的死亡率在世界范圍內排名第六,發病率排名第七[1]。在中國,食管鱗癌(esophageal squamous cell carcinoma,ESCC)為食管癌主要的組織病理類型[2]。ESCC 在確診時多為中晚期,且好發于老年人,其5年生存率較低。篩選更有效的ESCC 預后生物標志物,有助于評價預后,并有可能為ESCC 提供新的治療靶點及理論依據。
近年來,隨著高通量測序技術的發展,產生了大量基因表達譜數據。癌癥基因組圖譜(the cancer genome atlas,TCGA)是一個大型的癌癥基因組公共數據平臺,它可為研究者提供海量的基因組變異、mRNA 表達、DNA 甲基化等數據。基因表達數據庫(gene expression omnibus,GEO)是專門用于儲存芯片和高通量測序等數據的公共平臺,使用相關生物信息學知識篩選出差異表達基因,繪制癌組織樣本與正常組織樣本差異表達基因火山圖[3]。本研究挖掘了TCGA 和GEO 數據庫中的ESCC 表達譜數據,結合生物信息分析,探索ESCC的預后影響因素,從而為ESCC 的治療提供新的思路和可能的靶點。
1.1 基因表達數據來源該研究所使用的ESCC基因表達譜數據來源于GEO(GSE17351、GSE20347 和GSE100942)[4-6]和TCGA(https://cancergenome.nih.gov/,版本號:v27.0)數據庫。
1.2 差異表達基因篩選使用R 語言limma 程序分析三個GEO 數據集中ESCC 癌組織和癌旁組織的差異表達基因(|Log2FC|>1,P<0.05),用ggplot2程序繪制火山圖。使用R語言edger程序分析TCGA數據中ESCC 癌組織和癌旁組織的差異表達基因(|Log2FC|>1,P<0.05)。使用Venny 2.1 工具繪制Venn 圖,三個數據集和TCGA 數據庫中的共同差異表達基因用于后續分析。
1.3 ESCC 預后分析使用Survival 程序對共同差異表達基因進行單因素Cox 回歸分析,得到與ESCC 總生存時間顯著相關的基因。進一步使用多因素Cox 回歸分析,獲取與ESCC 總生存時間獨立相關的基因。
1.4 基質和免疫浸潤分析使用TIMER(https://cistrome.shinyapps.io/timer/)數據庫分析食管癌中6 種免疫細胞(B 細胞,CD4+T 細胞,CD8+T 細胞,嗜中性粒細胞,巨噬細胞和樹突狀細胞)的浸潤情況,并分析它們與預后相關基因的拷貝數變異和表達水平之間的相關關系。
1.5 基因集富集分析和基因集變異分析從分子特征數據庫MsigDB 下載“c2.cp.kegg.v7.0.symbols.gmt”基因集作為參考基因集。根據差異表達基因的表達量中位數,分為高表達組和低表達組。使用Clusterprofiler 和GSVA 程序分別進行基因集富集分析(Gene Set Enrichment Analysis,GSEA)和基因集變異分析(Gene Set Variation Analysis,GSVA)。
1.6 統計學分析應用R 軟件(v3.6.0)和SPSS 21.0 軟件對數據進行統計學分析。使用配對t檢驗分析癌組織與正常組織之間的差異表達基因。所有分析均采用雙側分析。P<0.05 為差異有統計學意義。
2.1 食管鱗癌差異表達基因篩選通過對GEO 中三個ESCC 數據集的癌組織和癌旁組織進行分析,在GSE17351、GSE20347和GSE100942三個數據集中分別篩選出288 個(171 個上調,117 個下調),1 057 個(477 個上調,580 個下調)和857 個(333 個上調,524 個下調)差異表達基因(圖1A-1C)。以上三個數據集與TCGA 數據庫中ESCC 基因表達譜數據的共同差異表達基因有55 個,其中,TCGA 和GEO 數據庫共同上調基因40 個(圖1D),共同下調基因15 個(圖1E)。

圖1 食管鱗癌和正常組織樣本中基因表達譜數據分析Fig.1 Analysis of gene expression profile in ESCC and normal tissues
2.2 差異表達基因的預后評價為了尋找食管鱗癌預后相關基因,對55 個共同差異表達基因進行了單因素Cox 回歸分析。結果顯示,TTK、CHEK1、FEN1、KIF14、NUP155、KIF23 和CENPE 可顯著降低食管鱗癌患者總體生存時間(表1)。進一步多因素Cox 回歸分析,僅TTK 可作為獨立預后因素降低食管鱗癌的生存時間(coef=-1.10,HR=0.33,95%CI:0.15 ~0.69,P<0.05)。

表1 單因素Cox 比例風險回歸Tab.1 Univariate Cox proportional risk regression
2.3 TTK 表達和拷貝數變異與浸潤性免疫細胞的相關性分析腫瘤微環境由腫瘤細胞、基質細胞和免疫細胞組成。分析食管癌中TTK 的表達與免疫細胞浸潤之間的關系,發現TTK 與腫瘤純度(r= 0.24,P= 1.1e-3)呈正相關,與樹突狀細胞(r=-0.28,P= 1.14e-4)的浸潤水平呈負相關。未發現TTK 與B 細胞(r=0.09,P=0.20),CD8+T 細胞(r=-0.03,P= 0.70),CD4+T 細胞(r=-0.08,P=0.28),巨噬細胞(r= 0.01,P= 0.85)和中性粒細胞(r=-0.14,P= 0.07)等免疫細胞的浸潤存在相關關系(圖2A)。未發現TTK的拷貝數與B細胞、CD8+T 細胞、CD4+T 細胞、巨噬細胞、嗜中性粒細胞和樹突狀細胞的浸潤水平存在相關性(圖2B)。

圖2 TTK 表達和拷貝數變異與免疫浸潤水平的關系Fig.2 Correlation analysis of TTK expression and copy number variation with infiltrating immune cells
2.4 GSEA 和GSVA 分析GSEA 分析結果顯示,TTK 主要富集在細胞周期、DNA 復制、同源重組、核苷酸切除修復、堿基切除修復和錯配修復途徑(圖3A)。GSVA 分析顯示同源重組、細胞周期、核苷酸切除修復、堿基切除修復、錯配修復和DNA復制等途徑與TTK 的高表達密切相關(圖3B)。進一步表明TTK 高表達與細胞增殖過程的激活有關。

圖3 GSEA 和GSVA 分析TTK 的相關富集基因集Fig.3 GSEA and GSVA analysis of TTK related enriched gene sets
使用Pearson相關性分析分析了TTK與DNA 損傷修復途徑以及細胞周期途徑中關鍵基因表達的相關性。結果發現,在mRNA水平上,DNA損傷修復途徑中的RFC5、RAD54B、RAD51、PRIM1、GTF2H3、BLM 和細胞周期途徑中的CCNB2、BUB1B、ORC3、CDK1、CDK2、ORC1、CDC6 與TTK 顯著相關(r>0.60,P<0.001,圖4)。

圖4 TTK 與相關富集通路途徑基因相關性分析Fig.4 Correlation analysis of TTK with related enrichment pathway genes
食管癌是全球癌癥相關死亡的第六大原因,嚴重危害著人類的健康。我國是食管鱗癌的高發區,其發病率和死亡率均居于世界前列。近年來,盡管某些新型食管鱗癌標志物具有一定的特異性和靈敏度,但受制于實驗水平和模型的限制,其臨床診斷效果還存在局限性。因此,尋找食管鱗癌的差異表達基因以及預后標志物具有重大意義。本研究基于GEO 和TCGA 公共數據庫,在全基因組水平上分析了食管鱗癌樣本的遺傳學特征,以期發現在癌癥預后中的差異表達基因及潛在的標志物[7]。
在這項研究中,關注的是具有診斷和預后價值的潛在基因。基于三個數據集和TCGA 數據庫的差異基因表達譜和Cox 回歸分析,確認了TTK 作為食管鱗癌獨立的預后潛在標志物。紡錘體裝配檢查點是一個參與信號級聯過程的因子,可阻止有絲分裂直至所有染色體正確附著在有絲分裂紡錘體上,達到防止染色體錯位的目的[8]。TTK 作為紡錘體裝配檢查點(spindle assembly checkpoint,SAC)的核心成分,能夠磷酸化絲氨酸/蘇氨酸和酪氨酸殘基[9]。TTK 與細胞周期及DNA 修復途徑之間的相互作用是細胞復制阻滯的基礎,TTK 的高表達會導致中心體擴增、SAC 過度活化和染色體不穩定[10]。TTK C-末端含有蛋白激酶結構域,能夠增強染色體著絲粒定位,影響細胞正常增殖以及精確分裂,從而調控腫瘤發生[11]。
由于TTK 在維持染色體穩定性中發揮著至關重要的作用,越來越多的科研人員注意到TTK 在癌癥中的潛在價值,并研究TTK 表達與腫瘤發生之間的關系。研究[12]表明,TTK 的過表達與乳腺癌較差預后有關,可作為乳腺癌進展中的潛在生物標志物。這一觀點得到了證實,在69 例三陰性乳腺癌組織樣本和細胞系中,腫瘤組織中的TTK的表達水平顯著高于正常組織,并且與腫瘤組織大小和TNM 分期密切相關,導致患者不良預后,敲降TTK 抑制BT474 細胞的遷移和侵襲[13]。在抑制TTK 表達的細胞中,乳腺癌細胞系CC-671 識別G1/S 檢查點功能失調,加速細胞有絲分裂,促進癌細胞的增殖[14]。在正常腦組織中TTK 的表達非常低,但是,在膠質瘤中TTK 表達高于正常腦組織,TTK 的表達量與膠質瘤的WHO 分期呈現正相關關系,而且TTK 過表達可加速腫瘤細胞增殖,減少患者的生存時間[15]。CHEN 等[16]研究表明TTK 在前列腺癌組織中過表達,且與患者不良預后相關,可作為候選生物標記物和潛在治療靶點。在卵巢癌中,臨床研究[17]已經證實TTK 過表達與腫瘤較差預后密切相關,并且可能與細胞周期相關。
已知TTK 在多種人類惡性腫瘤中存在過表達現象,且與較差的生存預后存在著明顯的關聯性。但僅在少數腫瘤中對TTK 表達和腫瘤形成的潛在機制進行了研究。過表達的TTK 激活Akt/mTOR 信號通路促進細胞增殖和凋亡,從而在胃癌細胞中發揮重要的作用[18]。研究[19]發現肝癌新藥神經節苷脂的合成上調TTK 的表達,影響染色體分離和有絲分裂進程。在黑色素瘤細胞中,TTK 激活Akt,并通過B-Raf WT/ERK 信號傳導形成負反饋調控通路[10]。除此之外,活化的TTK 可以通過磷酸化Smad2 和Smad3 來促進Smad 信號傳導[20],從而抑制膀胱癌的上皮-間質轉化,促進膀胱癌細胞的增殖和遷移[21]。結腸癌細胞中,TTK 既能通過激活PKCα/ERK1/2 途徑來促進細胞增殖,又可以抑制PI3K/AKT 途徑來減少與結腸細胞分化有關的MUC2 和TFF3 的表達,從而調控結腸癌細胞分化[22]。此外,在部分腫瘤細胞中,對TTK 與腫瘤藥物的功能進行了相關研究。在結腸癌裸鼠異種移植瘤模型中,新型選擇性口服TTK 抑制劑聯合紫杉醇展示了良好的抗腫瘤療效,腫瘤生長抑制率為78%[23]。在卵巢癌中,TTK 在順鉑耐藥卵巢癌細胞系中上調,下調TTK 可激活PI3K/AKT 信號通路調控卵巢癌細胞對順鉑治療的敏感性[24]。
近年來,隨著國內外學者對腫瘤免疫學研究逐步深入,免疫療法可作為惡性腫瘤治療的最新和最有希望的支柱,具有利用和激活宿主免疫系統的潛能。因此,重要的是探索在腫瘤微環境中起關鍵作用的新型分子生物標記物和靶向生物標記物。一些臨床試驗表明[25],TTK 作為免疫抗原表位,能在不損傷正常細胞的同時誘導出強大的細胞毒性T 淋巴細胞活性,來誘導抗腫瘤免疫反應,從而對抗腫瘤細胞。雖然TTK 在許多人類惡性腫瘤中曾進行過相關基礎與臨床研究,然而在食管鱗癌中未發現有類似相關研究。進一步研究TTK 在食管鱗癌中的作用,發現TTK 的表達與腫瘤純度呈正相關,而在食管癌組織樣品中TTK 和浸潤性免疫細胞未見或弱關聯。據此提出TTK 主要在食管癌細胞而不是免疫細胞中表達,并且它們的功能可能與腫瘤微環境的免疫調節無關。
TTK 除了調控紡錘體裝配檢查點之外,它在中心粒復制、DNA 損傷反應過程中也起著重要作用[26]。為了進一步探討TTK 在食管鱗癌中的潛在機制,基于TTK 的表達數據進行了GSEA 和GSVA通路富集分析。與此前文獻報道一致,GSEA 和GSVA分析證實了TTK的高表達與增殖過程的激活有關。TTK 與細胞周期及DNA 修復相關分子之間的相互作用是細胞周期阻滯的基礎,分析TTK 與DNA 修復途徑以及細胞周期途徑中的相關基因之間的關系,發現TTK 與這些途徑中的一些核心基因高度相關。這些發現為食管鱗癌的發病機制提供了新的見解。
綜上所述,本研究綜合了TCGA 和GEO 數據庫中的食管鱗癌組織表達數據,利用生物信息學方法篩選出TTK 作為獨立預后基因,并推測高表達的TTK 可調控細胞周期和DNA 修復途徑,從而影響食管鱗癌的發生及預后。目前,放化療被推薦為治療食管鱗癌的標準方法[27]。一些研究在TTK聯合放化療方面均取得了不錯的結果,TTK 聯合放化療能夠改變細胞周期進程,影響中心體異常程度,調節癌細胞的敏感性[28]。另外,藥物聯合放化療可顯著提高晚期食管癌患者的療效、生存率及生存質量,如:多西他賽和奧沙利鉑[29]。所以,TTK 還可以嘗試聯合一些腫瘤藥物或放化療進行相關研究。越來越多的研究人員正在關注這個未知領域,對于食管鱗癌而言,TTK 或許可以成為一個有前景的治療靶點。