楊 麗,張孟賢,張 微,熊英友,陳世勇,方呈祥,*
(1.湖北民族大學附屬民大醫院腫瘤科,湖北恩施 445000;2.華中科技大學同濟醫學院附屬同濟醫院腫瘤中心,湖北 武漢 430030)
食管癌(esophagus cancer,ESCA)是我國成人消化系統常見的惡性腫瘤之一,其發病率逐年增加,已躍居我國癌癥發病率的第3位,死亡率居第4位,居全球癌癥發病率和死亡率的第7位[1-2]。食管癌惡性程度高、預后差,患者5年生存率不足30%[3]。規范化外科手術是食管癌的主要治療手段,但對于局部晚期患者單純手術往往無法達到根治效果,而成為局部復發和遠處轉移的潛在危險因素。近年來,有關食管癌放化療、靶向治療、生物治療的研究不斷展開,以手術為主的綜合治療使部分患者從中獲益。但臨床約70%的患者就診時已發展為晚期,仍有40%患者接受同步放化療后出現局部復發,對于這部分患者的治療顯得尤為棘手。積極開展臨床研究,獲取食管癌的基因譜、尋找有效的靶點、研發有效的藥物控制腫瘤細胞的浸潤和轉移是改善食管癌患者預后的關鍵所在。
生物信息分析學是目前腫瘤研究領域中比較熱門的一類研究方法,可以幫助研究者快速挖掘有效的分子靶標,為更多的實驗和臨床研究提供思路。極光激酶A(aurora kinase A,AURKA)編碼的蛋白是一種細胞周期調節酶,開始定位于有絲分裂S期,在G2晚期與M期迅速增加,直至下一周期的G1期,在染色體分離過程中參與微管的形成和/或紡錘體極的穩定,促進中心體的成熟,保證有絲分裂細胞周期的順利進行[4]。目前,有研究報道AURKA在乳腺癌、胃癌、膀胱癌、頭頸部鱗癌中的表達升高,通過激活多種信號通路,加速細胞周期的進程,促進腫瘤細胞的活化與轉移[5-7],而有關AURKA在食管癌中的表達及功能機制研究較少。AURKA一方面可通過在細胞周期內的動態定位模式,影響細胞的有絲分裂活動;同時,還可通過加速上皮-間質轉化以及調節腫瘤血管生成等多種形式促進腫瘤的發生發展[8]。結合目前食管癌的治療現狀,亟需深入研究驅動其惡性表型的關鍵基因與信號通路,探究新的治療靶點。AURKA在前期部分腫瘤中的研究成果使我們了解到其在惡性腫瘤活動中的多種作用方式,因而本文通過數據挖掘的形式,發現AURKA在食管癌中的功能學改變,有望為其在腫瘤中的機制研究奠定基礎,為臨床以AURKA基因為靶點治療食管癌提供實驗依據,具有重要的臨床指導意義。
GEPIA基因表達譜動態分析數據庫(Gene Expression Profiling Interactive Analysis,http://gepia.cancer-pku.cn/index.htm)是基于TCGA數據庫進行數據分析的可視化在線網站,其內容包含了單基因、多基因在不同癌癥類型中的表達,相關性分析,PCA主成分分析以及生存分析等[9]。在GoPIA檢索界面分析AURKA在人體多種腫瘤組織和正常組織中的表達差異,并基于TCGA中的數據分析ESCA組織與正常組織中AURKA在mRNA水平的表達差異。
Oncomine(http://www.oncomine.org)是目前腫瘤研究領域中應用較廣的數據庫之一,包含了多種基因表達譜數據,同時提供了分析工具供研究者免費使用,如:共表達分析、基因差異表達分析、臨床特征分析等。為了研究AURKA在ESCA組織同正常食管組織中的表達差異,我們按下列參數設定數據過濾條件。①Gene:AURKA;②Analysis Type:Cancer vs.Normal Analysis;③Cancer Type:Esophageal Cancer;④Data Type:mRNA;⑤Sample Type:Clinical Specimen;⑥調整臨界值為:矯正后P<1×10-4,差異倍數(fold change)為2,gene bank=top 10%。最后,選取Su Esophagus研究結果,制作箱線圖進行分析。
STRING蛋白互作網絡數據庫(Search Tool for the Retrieval of Interacting Genes STRING,http://string-db.org)存儲了包括2 000多個物種的900多萬種蛋白,其蛋白質序列和相互之間的作用關系可以快速進行檢索[10]。設連接度分值(interaction score)≥0.9、最大交互作用不超過10為篩選條件,隱藏網絡未連接節點后的數據導入Cytoscape軟件,通過CytoHubba網絡分析插件、運用BottleNeck算法計算出排名前10的核心基因(hub gene)。核心基因與AURKA關系作用密切,其編碼的蛋白可能參與了重要生理功能的調節。
在GEPIA數據庫中,通過TCGA和GTEx數據集分析AURKA與CDC20、CCNA2、CCNB1、PLK1、NEK2等核心基因在食管癌中的相關性表達。以皮爾森相關系數(r)來反映兩個基因之間的線性相關程度。參考比較標準:-1<r<1,若r>0,表明兩個基因之間呈正相關;若r<0,表明兩個基因呈負相關,且r的絕對值越大表明負相關性越顯著,但兩者之間不存在因果關系。若r=0,則兩個基因間為非線性相關。
使用DAVID 6.8網絡在線分析數據庫(https://david.ncifcrf.gov)在基因本體中注釋AURKA及其相關核心基因的功能,包括生物學過程(biological process,BP)、分子功能(molecular function,MF)以及細胞組成(cellular component,CC);同時,進行KEGG(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路富集分析。根據P<0.05,及研究內容篩選出差異顯著及有意義的功能與信號通路。
基于R2基因分析可視化平臺(hgserv-erl.amc.nl/cgi-bin/r2/main.cgi),檢索TCGA-食管癌基因芯片表達譜數據,通過Kaplan-Meier繪制生存函數曲線,分析AURKA的表達與食管癌患者總生存時間(overall survival,OS)的關系。
通過GEPIA數據庫分析顯示,AURKA mRNA在人體多種腫瘤組織樣本及對應正常組織樣本中的表達具有差異,如圖1所示,AURKA mRNA在結直腸腺癌(COAD、READ)、胃腺癌(STAD)、宮頸鱗狀細胞癌(CESC)、子宮肉瘤(USC)、肺鱗癌(LUSC)等惡性腫瘤中的表達較正常組織的表達水平升高。

圖1 人體各腫瘤組織及對應正常組織中AURKA mRNA的表達差異
在Oncomine數據庫中,根據篩選條件選取Su Esophagus數據集進行分析,106例組織樣本中分別包含了53例ESCA組織和53例正常食管組織。研究結果顯示,AURKA在mRNA水平上的表達較正常食管組織的表達顯著升高,且差異具有統計學意義(P<0.05),見圖2A。同時,在GEPIA數據庫中基于TCGA-ESCA數據集發現,AURKA基因在ESCA組織中的表達明顯高于正常食管組織(P<0.05),見圖2B。盡管AURKA在ESCA組織中的表達升高,但通過GEPIA分析發現其表達水平與患者的分期無明顯影響(P>0.05),見圖3。
利用STRING蛋白互作網絡數據庫,根據過濾條件構建有關AURKA的PPI網絡,包含了31個節點和402條邊,見圖4A。將篩選后的結果導入Cytoscape軟件,基于BottleNeck算法篩選出細胞周期分裂蛋白20(cell division cycle 20,CDC20)、Polo樣蛋白激酶1(polo like kinase 1,PLK1)、細胞周期蛋白A2(cyclin A2,CCNA2)、AURKA、細胞周期蛋白B1(cyclin B1,CCNB1)、有絲分裂阻滯缺陷2樣蛋白1(mitotic arrest deficient 2 like 1,MAD2L1)、周期蛋白依賴激酶1(cyclin dependent kinase 1,CDK1)等10個核心基因(hub gene),且基因間的相互作用連接度較高,見圖4B。

A:Oncomine數據庫分析顯示,ESCA組織中AURKA mRNA的表達較正常食管組織的表達顯著升高(P<0.05);B:GEPIA數據庫分析顯示,AURKA mRNA在ESCA組織中顯著高表達(P<0.05).圖2 ESCA組織和正常組織中AURKA在mRNA水平的表達差異

圖3 AURKA在ESCA不同分期中的表達水平
為進一步明確AURKA與CDC20、PLK1、CCNA2、CCNB1、MAD2L1等核心基因的表達相關性,通過GEPIA分析發現,AURKA在mRNA的表達水平 與CDC20、PLK1、CCNA2、CCNB1、MAD2L1、CDK1、BUB1B、NEK2、UBE2C等核心基因的mRNA表達呈顯著正相關,其相關性系數(r)分別為0.78、0.83、0.76、0.74、0.75、0.82、0.83、0.79、0.87,見圖5。
通過DAVID數據庫,對AURKA與核心基因在基因本體中進行GO功能注釋,其富集的生物學功能主要體現在細胞分裂、有絲分裂G2/M期過渡、DNA損傷檢測點、有絲分裂細胞周期檢查點、細胞增殖、負性調控細胞凋亡進程、細胞周期蛋白依賴的絲氨酸/蘇氨酸激酶活性、泛素蛋白連接酶的結合等,見表1。通過KEGG數據庫分析發現,AURKA與核心基因主要參與了細胞周期調控、細胞衰老、P53信號通路以及FoxO信號通路的調節等,見表1。
在R2基因分析可視化平臺中,基于TCGA-ESCA數據集中184例樣本,分析AURKA基因的表達水平與患者生存預后的關系,其中1例樣本缺乏生存隨訪數據未納入分析。結果顯示,AURKA高、低表達組患者2年生存率分別為28%、60%,差異具有統計學意義(P=2.9×10-3),見圖6。同時,本研究一并檢測了余下核心基因的表達與食管癌患者總生存時間的關系,其中CCNB1、BUB1B、NEK2基因高表達組食管癌患者的總生存率均顯著低于低表達組,差異具有統計學意義(P=0.027,P=0.038,P=0.048)。

A.PPI蛋白互作網絡;B.Hub genes(核心基因).根據每個基因的連接度排序,以顏色強弱表示,由紅至黃,顏色越深代表其在整個PPI網絡中的作用越顯著.圖4 AURKA的蛋白互作網絡與核心基因

A:CDC20;B:PLK1;C:CCNA2;D:CCNB1;E:MAD2L1;F:CDK1;G:BUB1B;H:NEK2;I:UBE2C.圖5 AURKA與核心基因mRNA表達的相關性

表1 AURKA與核心基因的GO功能注釋與KEGG富集分析

A:AURKA;B:CCNB1;C:BUB1B;D:NEK2.圖6 TCGA數據庫中183例食管癌AURKA及核心基因的表達與患者總生存率的關系
食管癌是我國常見的惡性腫瘤之一,作為食管癌的高發國家,其病例數約全球的一半[11]。目前,新輔助放化療聯合根治性手術治療在我國開展得還比較局限,術后輔助放化療在我國應用居多。局部晚期患者術后出現進展時,往往因為營養狀況差、放化療后骨髓抑制、食管穿孔、癌因性疲乏等多種腫瘤相關并發癥而阻礙了腫瘤的繼續治療,限制了治療手段的選擇,導致晚期食管癌患者的生活質量和生存時間明顯下降。除了臨床不斷開展的EGFR-TKI類分子靶向治療、PD-1免疫治療藥物等的研究外,還需要我們積極探索有效的新型藥物,為食管的早期篩查、早期診斷及預后判斷奠定基礎,使更多的患者能從中獲益。
本研究基于生物信息分析學技術,利用各大腫瘤相關數據庫,尋找食管癌與正常組織間差異表達的基因,并對基因參與的生物學功能和信號通路進行注釋,尋找可靠的抗腫瘤治療靶點。還可以通過高通量測序技術,研究細胞的表現與功能,獲得更多表觀遺傳學信息的改變。腫瘤往往是多基因異常表達或功能失調導致的一種基因病。因而,研究腫瘤中某些基因獨特的改變是明確其發生發展分子機制的關鍵所在。
AURKA激酶是三種高度同源的絲氨酸/蘇氨酸激酶家族之一,作為細胞周期調控激酶在調節有絲分裂的諸多環節中發揮著關鍵作用,尤其在G2向M期過渡期間,AURKA的活性顯著增加。細胞生命活動大部分時間是在細胞分裂間期完成,AURKA在整個細胞周期中顯示出亞細胞定位的動態變化,因而AURKA不僅可以參與細胞分裂間期,甚至包括了整個細胞周期中的各種分裂活動。有研究報道,AURKA與子宮內膜癌、結直腸腺癌、口腔癌、喉癌等惡性腫瘤的發生發展密切相關[12-14]。因而,我們推測AURKA在食管癌中的表達水平增加。通過GEPIA和Oncomine數據庫分析發現AURKA在mRNA水平上的表達較正常食管組織的表達明顯升高。盡管AURKA在ESCA組織中高表達,但采用GEPIA分析發現其表達水平與患者的分期無明顯相關性。目前,我們腫瘤研究中心已經通過與胸外科和病理科的合作,開展了收集食管癌患者的病理標本工作,在獲得100例標本時進行免疫組化分析,通過實驗進一步證實AURKA在食管癌組織中的表達高于正常食管組織以及AURKA在不同食管癌病理類型中的表達情況。
腫瘤的發生是多基因突變或多因素綜合作用的結果。因而,我們推測AURKA與多種細胞周期調控蛋白共同參與了食管癌的發生發展。進一步,通過PPI蛋白互作網絡發現了與AURKA作用顯著的核心基因,其中CDC20、PLK1、CCNA2等基因與AURKA的表達呈顯著正相關。AURKA及核心基因富集的生物學功能主要包括細胞分化,細胞增殖,有絲分裂G2/M期過渡,DNA損傷檢測點,有絲分裂細胞周期檢查點,負性調控細胞凋亡進程,細胞周期蛋白依賴的絲氨酸/蘇氨酸激酶活性,泛素蛋白連接酶的結合等;KEGG數據庫分析發現,AURKA及核心基因參與了細胞周期調控,細胞衰老,P53以及FoxO信號通路的調節。Yang等[15]研究發現,AURKA在喉癌中表達異常升高,通過活化FAK/PI3K/Akt信號通路激活休眠的腫瘤細胞,從而促進喉癌的侵襲與遷移。Katsha等[16]研究證實,AURKA可以通過調控上游酪氨酸激酶JAK2的表達和磷酸化水平來促進信號傳導及轉錄激活因子STAT3的活性,從而廣泛參與細胞應激、增殖、分化和凋亡等生物效應,靶向AURKA/JAK2/STAT3通路可作為抗腫瘤治療的重要方向。除了加速細胞周期,誘導細胞分化增殖外,AURKA還可以通過誘導上皮-間質轉化促進腫瘤的形成與轉移[17]。Katayama等[18]研究表明,AURKA作為P53通路的關鍵調控元件,其表達升高可調節P53蛋白的磷酸化水平,促使P53通過Mdm2泛素化和蛋白降解增加,導致檢查點反應通路下調,促進細胞的致癌轉化;沉默AURKA激酶可以降低p53在Ser315位點的磷酸化,增強p53蛋白的穩定性,并在G2-M位點實現細胞周期阻滯;在腫瘤組織中,缺乏AURKA的細胞對順鉑誘導的細胞凋亡更加敏感。同時,抑制AURKA激酶可誘導合成致死率,克服腫瘤細胞化療耐藥,改善MYC陽性淋巴瘤的預后[19]。通過R2平臺分析發現,AURKA高表達組食管癌患者的生存預后較差,可作為用于評估患者預后的生物標志。目前,已有研究顯示出AURKA小分子抑制劑,如ZM447439、VX680等可作為惡性腫瘤靶向治療的潛在藥物[20]。AURKA調節細胞周期進程、促進腫瘤血管生成、參與腫瘤復發與轉移的重要功能,為臨床進一步使用AURKA選擇性抑制劑治療食管癌提供了新的策略。
細胞周期蛋白B1(cyclin B1,CCNB1)是參與有絲分裂細胞周期的調控蛋白,與CDC2蛋白形成M期促進因子(M-phase promoting factor,MPF),完成細胞G2/M期的過渡。CCNB1的表達異常升高,一方面促進MPF的增高,逃避細胞周期檢測點的監控,加快有絲分裂的進程,導致細胞的加速增殖;還可以使受損DNA逃避檢測而繼續完成復制,從而促進惡性腫瘤的發生發展[21]。CCNB1在多種腫瘤組織中高表達,沉默CCNB1的表達可以通過激活P53信號通路,抑制細胞增殖、促進衰老等[22]。紡錘體檢測蛋白BUB1B定位于著絲粒,確保姐妹染色單體的正確分離,在多種腫瘤組織中發現BUB1B的表達升高、紡錘體檢查點的功能受損[23]。本研究發現,BUB1B高表達組食管癌患者的預后差于低表達組,因而BUB1B也可作為評估食管癌患者生存預后的分子標記。中心體相關激酶2(NIMA related kinase 2,NEK2)定位于中心體,編碼參與有絲分裂調控的絲氨酸/蘇氨酸蛋白激酶,在G2末期達到最高水平[24]。NEK2通過NDC80磷酸化調控著絲粒微管在有絲分裂中的附著穩定性;還通過參與CDC20和MAD2L1磷酸化調控有絲分裂檢查點蛋白復合物,在細胞周期調控活動中起著積極的作用[25]。有研究證實NEK2在多種癌癥類型及腫瘤細胞株中高表達,沉默NEK2可在體內、體外多種腫瘤中產生抗癌作用[26]。細胞周期蛋白的異常活動被認為與惡性腫瘤細胞的增殖失控、侵襲和耐藥密切相關,其抑制劑體現了靶向治療惡性腫瘤的優勢。
綜上,AURKA在食管癌等多種惡性腫瘤中顯著高表達,且提示患者預后不良。基于生物信息學快速篩選有意義的生物靶標,并分析其主要功能及相關的信號通路,為腫瘤發生發展的機制研究奠定理論基礎。當然,也需要我們更多的實驗數據進行佐證,從而為實現抗腫瘤治療提供更大的臨床價值。