溫凌杜 張夏睿
1 溫德口腔醫(yī)院,廣東省深圳市 518000; 2 寶安中醫(yī)院口腔科
頭頸癌是第七大常見癌癥,其中約90%為鱗狀細胞癌(Head and neck squamous cell carcinoma,HNSCC)。僅2020一年中全球頭頸癌新發(fā)病例就高達93萬余例,且由于復發(fā)和轉(zhuǎn)移的高發(fā)生率導致患者的總體生存率依然較低[1]。可見居高不下的發(fā)病率及未見明顯改善的生存率成為目前研究亟須解決的問題,同時也凸顯了發(fā)現(xiàn)穩(wěn)定的預后生物標志物或治療靶點以改善HNSCC臨床診療的迫切需求。
本研究使用生物信息學方法篩選GEO中HNSCC和癌旁樣本間的差異表達基因(Differentially expressed genes,DEGs),富集分析和建立的蛋白質(zhì)—蛋白質(zhì)相互作用(Protein-protein interaction,PPI)網(wǎng)絡初步揭示了HNSCC中分子間的調(diào)控機制。進一步挖掘PPI網(wǎng)絡中預后相關(guān)的關(guān)鍵基因,除通過GEPIA、TCGA再次驗證外,也對既往研究尚未明確的與HNSCC預后相關(guān)的關(guān)鍵基因行臨床病理特征分析,期望可為HNSCC的診療提供新的生物標志物。
1.1 GEO中HNSCC DEGs的篩選 在GEO中以“HNSCC,series,expression profiling by array,homo sapiens”為檢索條件獲得GSE6631、GSE58911和GSE107591 微陣列數(shù)據(jù)集。GEO2R以|logFC|>1(Fold change, FC)和FDR<0.05(False discovery rate, FDR)作為具有統(tǒng)計學意義的閾值(以下簡稱閾值)逐一篩選出3個數(shù)據(jù)集中HNSCC和癌旁樣本間的DEGs。進一步鑒定出三者間交叉的DEGs待后續(xù)分析。
1.2 DAVID中DEGs的富集分析 在DAVID中以FDR<0.05為閾值分別行DEGs的分子功能(Molecular function,MF)、細胞成分(Cellular component,CC)、生物過程(Biological process,BP)和通路的生物學富集分析。
1.3 STRING中DEGs PPI網(wǎng)絡的構(gòu)建和關(guān)鍵基因的篩選 在STRING中以interaction score≥0.4為閾值構(gòu)建DEGs的PPI網(wǎng)絡,Cytoscape(v3.8.0)行可視化處理。Cytoscape MCODE(v1.6.1)插件以“degree cutoff=2,max.depth=100,k-core=2,node score cutoff=0.2”為條件對DEGs的PPI網(wǎng)絡進行聚類,篩選出中央節(jié)點作為關(guān)鍵基因待后續(xù)分析。
1.4 GEPIA中關(guān)鍵基因的初次驗證和預后分析 在GEPIA中以“HNSCC,gene name”為條件對關(guān)鍵基因在HNSCC和癌旁樣本中的差異表達行初次驗證。Kaplan-Meier生存分析明確HNSCC中關(guān)鍵基因的表達與患者總生存期(Overall survival,OS)的相關(guān)性。篩選出HNSCC中預后相關(guān)的關(guān)鍵基因待后續(xù)分析。
1.5 TCGA中PLAU的再次驗證和臨床病例特征的相關(guān)性分析 TCGA中檢索并整理HNSCC和癌旁樣本的PLAU表達數(shù)據(jù)以及HNSCC患者的臨床病理數(shù)據(jù)。R(v3.6.0)limma包行差異表達分析再次驗證PLAU的表達,R wilcox.test和kruskal.test函數(shù)對HNSCC樣本中PLAU的表達與患者的臨床病理特征行相關(guān)性分析。
1.6 統(tǒng)計學方法 應用R語言完成統(tǒng)計分析,除文中特殊說明的閾值外,其余均以P<0.05為差異具有統(tǒng)計學意義。
2.1 GEO中 HNSCC DEGs的篩選 從GSE6631、GSE58911和 GSE107591中共納入61例HNSCC和60例癌旁樣本,GEO2R分別篩選出168、599和484個DEGs(|logFC|>1和FDR<0.05),鑒定出71個三者交叉的DEGs待后續(xù)分析,其中29個上調(diào)(MMP1、TNC、SPP1、SERPINH1、SERPINE1、SEMA3C、RBP1、PTHLH、POSTN、PLAU、MMP9、MMP3、MMP13、MMP12、MMP10、LUM、LAMC2、LAMB3、IGF2BP3、FN1、FAP、DFNA5、CXCL8、COL6A3、COL5A2、COL4A2、COL4A1、COL3A1、COL1A1)和42個下調(diào)(TGM3、SPINK5、SLURP1、SERPINB1、SCNN1A、SCEL、SASH1、RRAGD、PTN、PPP1R3C、PPL、PGD、NUCB2、MGLL、MAL、LPIN1、KRT4、KRT13、HPGD、HOPX、GPD1L、EXPH5、ENDOU、EMP1、ECM1、DPT、CRYAB、CRISP3、CFD、CEACAM6、CEACAM5、CEACAM1、CD24、BLNK、BARX2、AQP3、APOD、ALOX12、ALDH3A1、ADH7、ACPP、ABLIM1)。
2.2 DAVID中DEGs的富集分析 在DAVID中對71個DEGs行富集分析。結(jié)果顯示(FDR<0.05),BP中DEGs多富集在細胞外基質(zhì)組織、細胞黏附和膠原蛋白分解過程等;CC中DEGs多富集在細胞外間隙、細胞外泌體和胞外區(qū)等;MF中DEGs多富集在絲氨酸型內(nèi)肽酶活性、金屬內(nèi)肽酶活性和細胞外基質(zhì)結(jié)構(gòu)成分等;通路中DEGs多富集在ECM-受體相互作用、PI3K-Akt和癌癥等通路。
2.3 STRING中DEGs PPI網(wǎng)絡的構(gòu)建和關(guān)鍵基因的篩選 將71個DEGs導入STRING中,去除無相互作用的DEGs后構(gòu)建的PPI網(wǎng)絡(見圖1)包括56個節(jié)點和193個連線(interaction score≥0.4)。

圖1 DEGs PPI網(wǎng)絡的構(gòu)建與關(guān)鍵基因的篩選
Cytoscape MCODE插件篩選出15個中央節(jié)點DEGs(SERPINH1、SERPINE1、SPP1、MMP1、PLAU、MMP13、LUM、MMP3、MMP9、CXCL8、COL4A1、COL4A2、MMP10、COL5A2、COL6A3)作為關(guān)鍵基因待后續(xù)分析(見圖2)。

圖2 關(guān)鍵基因的篩選
2.4 GEPIA中關(guān)鍵基因的初次驗證和預后分析 通過GEPIA在519個HNSCC和44個癌旁樣本間驗證15個關(guān)鍵基因的表達。結(jié)果顯示(圖3展示了其中5個),與癌旁樣本相比15個關(guān)鍵基因在HNSCC中均表達上調(diào)(P<0.05),驗證了GEO中數(shù)據(jù)分析的結(jié)果。15個關(guān)鍵基因的Kaplan-Meier生存分析結(jié)果顯示(見圖4),在HNSCC中僅有5個(SERPINH1、SERPINE1、SPP1、MMP1、PLAU)關(guān)鍵基因的表達與OS相關(guān)(P<0.05)。

圖3 GEPIA中關(guān)鍵基因的差異表達分析

圖4 GEPIA中5個關(guān)鍵基因的生存分析
2.5 TCGA中PLAU的再次驗證和臨床病例特征的相關(guān)性分析 通過TCGA中330個HNSCC和32個癌旁樣本驗證PLAU的表達。結(jié)果無論組間分析或成對分析PLAU均在HNSCC中表達上調(diào)(P<0.05,見圖5a~b),與GEPIA和GEO的數(shù)據(jù)分析結(jié)果一致。進一步與臨床病理特征的相關(guān)性分析顯示(見圖5c~d),HNSCC患者中PLAU的表達水平與患者的組織分化程度和頸部淋巴結(jié)轉(zhuǎn)移相關(guān)(P<0.05)。

圖5 TCGA中PLAU的表達及與臨床病理相關(guān)性分析
本研究基于生物信息學分析GEO、DAVID、STRING、GEPIA和TCGA數(shù)據(jù)庫,多次對數(shù)據(jù)分析結(jié)果驗證后鑒定出5個表達上調(diào)的DEGs(SERPINH1、SERPINE1、SPP1、MMP1、PLAU)可作為HNSCC患者預后相關(guān)的關(guān)鍵基因。
SERPINH1可調(diào)節(jié)細胞外基質(zhì)蛋白和纖維連接蛋白的表達,其發(fā)生功能障礙后可刺激細胞外基質(zhì)蛋白的異常表達從而促進上皮間充質(zhì)轉(zhuǎn)化[2]。Wang等[3]通過泛癌數(shù)據(jù)分析同樣發(fā)現(xiàn)SERPINH1的異常高表達顯著降低了包括HNSCC在內(nèi)的11種癌癥的總生存期、疾病特異性生存期和無進展間期。另有實驗研究也支持了本研究的結(jié)果,發(fā)現(xiàn)SERPINH1的表達在OSCC中顯著上調(diào),沉默其表達可抑制OSCC細胞的增殖和轉(zhuǎn)移,同時還受到miR-29c的調(diào)節(jié)[4]。SERPINE1在癌癥進展中參與增殖信號維持、血管生成和抵抗腫瘤死亡等重要過程[5]。Minemur等[6]研究表明,在HNSCC的全基因組表達譜中SERPINE1表達上調(diào)是HNSCC中的常見事件,其異常高表達可增強HNSCC細胞的遷移和侵襲以及向淋巴結(jié)和肺的轉(zhuǎn)移播散,因此導致高表達的HNSCC患者生存期較短。此研究與本文的研究結(jié)果均表明了SERPINE1具有成為對HNSCC患者進行預后風險分層的新型預測分子的可能性。SPP1被發(fā)現(xiàn)在多種癌癥中異常高表達,如SPP1可通過介導Smad4/PTEN通路參與前列腺癌的復發(fā)和轉(zhuǎn)移[7],以及抑制SPP1表達可激活ERK1/2通路來抑制食管鱗癌細胞的增殖和遷移[8]。在HNSCC中Liu等[9]研究發(fā)現(xiàn)SPP1的異常高表達與患者的生存期呈負相關(guān),這與本研究結(jié)果一致。進一步的機制研究發(fā)現(xiàn)其過表達同樣也影響HNSCC細胞的增殖、遷移、侵襲和存活并抑制凋亡,此外KRAS/MEK通路的激活有助于SPP1誘導的HNSCC惡性進展和對西妥昔單抗的耐藥性,可見其在預后預測和治療靶點中擁有重要價值。
MMP1通過降解細胞外基質(zhì)的成分來促進惡性腫瘤的侵襲和轉(zhuǎn)移[10]。Liu等[11]已研究表明MMP1可增強HNSCC細胞的轉(zhuǎn)移能力,其表達上調(diào)與預后不良相關(guān)。PLAU和MMP1在惡性腫瘤中發(fā)揮相似的作用,兩者與OSCC中的細胞外基質(zhì)、細胞間黏附和膠原分解代謝有關(guān),表現(xiàn)出高度的關(guān)聯(lián)性[12]。但在查閱國內(nèi)既往文獻中發(fā)現(xiàn)僅少數(shù)學者同樣經(jīng)數(shù)據(jù)分析發(fā)現(xiàn)PLAU在HNSCC中的差異表達[13],但未對PLAU的臨床意義進行分析。本研究結(jié)果表明,HNSCC中PLAU呈高表達,使GEO、GEPIA和TCGA分析的結(jié)果得到驗證,并且還與患者的組織分化程度和頸部淋巴結(jié)轉(zhuǎn)移相關(guān)。
綜上所述,本研究通過對多個數(shù)據(jù)庫行生物信息學分析鑒定出HNSCC中SERPINH1、SERPINE1、SPP1、MMP1和PLAU這5個表達上調(diào)且預后相關(guān)的DEGs。此分析提供了一個新的角度來鑒定HNSCC中的潛在標志物,但還需深入研究來闡明其中的分子調(diào)控機制,而本文數(shù)據(jù)可為HNSCC的潛在預后生物標志物和治療靶點的研究提供新的思路。