何春梅 莫之婧
肝細胞癌(hepatocellular carcinoma,HCC)在惡性腫瘤死亡中排名居前列[1-4]。由于HCC通常發(fā)生在受損的肝臟中,因此復發(fā)率高,預后差。目前,臨床指導建議和方針都無法完全反映HCC預后的影響[2]。生物標志物對惡性腫瘤的診斷、檢測和預后具有重要的作用,通過預測與鑒定癌癥的侵襲性并評估生存率能夠預測特定癌癥對特定治療的反應程度[3]。因此,本研究綜合利用GEO數(shù)據(jù)庫、STRING、Cytoscape、DAVID和GEPIA等軟件篩選出與HCC預后相關的生物標志物,為HCC的分子機制研究和預后提供理論基礎。
本研究芯片數(shù)據(jù)下載NCBI的GEO 數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/)含有448個樣本的GSE14520數(shù)據(jù)集,包含GPL571平臺和GPL3921平臺。其中GPL571平臺有19例癌旁組織樣本和22例人肝癌細胞組織樣本;GPL3921平臺有220例正常肝臟樣本和225例人肝癌細胞組織樣本。
在GEO數(shù)據(jù)庫下載GSE14520數(shù)據(jù)集兩個平臺的基因表達矩陣。利用GEO 數(shù)據(jù)庫中的GEO2R篩選差異表達基因(differentially expressed genes,DEG),篩選條件為adj.P.Value<0.05,|logFC|>1.5。用韋恩圖求出GPL571和GPL3921兩個平臺表達量上調(diào)與下調(diào)的差異基因的交集,得出GSE14520數(shù)據(jù)集兩個平臺共有的DEG。
由韋恩圖交集得出共有的DEG上傳到STRING (http://string-db.org/)網(wǎng)絡分析,構建蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(protein-protein interaction,PPI),Cytoscape軟件中的MCODE插件從PPI中識別網(wǎng)絡模塊,排列最前的兩個蛋白互作模塊,用CytoHubba插件計算全部節(jié)點的度(degree)并排序,篩選出位于網(wǎng)絡中心區(qū)域的關鍵基因。
運用DAVID數(shù)據(jù)庫對關鍵基因進行KEGG和GO分析,以P<0.05為標準篩選條件。
利用在線網(wǎng)絡GEPIA(http://gepia2.cancer-pku.cn/#index)TCGA數(shù)據(jù)庫中的LIHC數(shù)據(jù)集,分析關鍵基因在HCC中的表達及與HCC患者總生存率/無病生存率的相關性。
從GSE14520數(shù)據(jù)集GPL571和GPL3921兩個平臺篩選到的DEG分別為706個(上調(diào)DEG 195個,下調(diào)DEG 511個)、518個(上調(diào)DEG 133個,下調(diào)DEG 385個),將兩個平臺的DEG取交集,共得到91個上調(diào)差異基因、257個下調(diào)差異基因(圖1)。
將348個DEG輸入STRING構建蛋白質(zhì)互作網(wǎng)絡,使用Cytoscape 軟件中的MCODE插件從中篩選出排列最前的兩個蛋白互作模塊:模塊1和模塊2。結果顯示模塊1由 40個節(jié)點和738條邊組成,均為上調(diào)DEG;模塊2由32個節(jié)點和202條邊組成,均為下調(diào)DEG。用CytoHubba插件分別計算模塊1和模塊2中節(jié)點的度(degree)并排序(圖2),排列越前的基因顏色越深,且位于網(wǎng)絡中心區(qū)域。結果顯示模塊1中位于網(wǎng)絡中心區(qū)域的關鍵基因有AURKA、CDK1、CCNB1、TYMS、BUB1B、EZH2、CDC20、CDKN3、TTK、TPX2、TOP2A、KPNA2、NUSAP1、RFC4、ASPM、NCAPG 、SMC4、BIRC5、MELK、ZWINT、CENPF、FEN1、RRM2、MCM2、KIAA0101、MCM3、HMMR、PRC1、DTL共29個;模塊2中位于網(wǎng)絡中心區(qū)域的關鍵基因有HRG、HGD、TAT、AGXT、CYP1A1、C8A、FTCD、SPP2、ALDH8A1、AOX1、KLKB1、F9、MBL2、NR1I2、FETUB、CY2E1、UGT2B15共17個。

注:紅色和綠色分別代表上調(diào)和下調(diào)的基因(HCC組織相對與正常對照),灰色點代表在腫瘤和癌旁組織中表達差異不顯著明顯的基因。圖1 GSE14520數(shù)據(jù)庫中的GPL571和GPL3921兩個平臺顯著DEGs的火山圖

圖2 模塊1的DEG在MCODE識別的網(wǎng)絡模塊(左)及模塊2的DEG在MCODE識別的網(wǎng)絡模塊(右)
將網(wǎng)絡模塊1中的關鍵基因進行聚類分析,前10個顯著GO和KEGG分析顯示模塊1中的DEG主要參與細胞分裂,有絲分裂、有絲分裂細胞周期的G2/M轉(zhuǎn)換、DNA復制等生物過程;細胞核、核質(zhì)、中間體、紡錘體和細胞質(zhì)等細胞組成;ATP結合和蛋白質(zhì)結合等分子功能;細胞周期信號通路(表1)。

表1 模塊1關鍵基因的GO和KEGG Pathway注釋
將網(wǎng)絡模塊2中的關鍵基因進行聚類分析,前10個顯著GO和KEGG分析顯示模塊2中的DEG主要參與環(huán)氧酶P450途徑、氧化還原和類固醇代謝等生物過程;細胞外體、細胞器膜等細胞組成;鐵離子結合、血紅素結合、氧化還原酶活性作用于成對的供體等分子功能;代謝途徑、補體和凝血級聯(lián)等信號通路(表2)。
文獻分析顯示模塊1中的關鍵基因已有相關研究在肝細胞癌中開展,而模塊2關鍵基因中的HAAO、HGD、PROZ、KLKB1、FETUB和 F9在肝細胞癌中的作用還未見報道。將篩選出的這6個基因通過GEPIA分析驗證其在TCGA數(shù)據(jù)庫中的表達情況。結果表明PROZ和F9在肝細胞癌組織的表達顯著低于正常組織(圖3)。

圖3 HAAO,HGD,PROZ,KLKB1,FETUB,F9在肝癌組織和正常組織表達差異
將上述篩選出的6個關鍵基因通過GEPIA分析其表達高低與肝細胞癌患者預后的關系。Kaplan-Meier生存分析結果顯示HGD、PROZ和F9低表達患者總生存率(P<0.05)(圖4),及無病生存率(P<0.05)均低于高表達患者(圖5)。

圖4 HGD,PROZ ,F9基因表達肝癌患者總生存率的關系

圖5 HGD,PROZ,F9基因表達與肝癌患者無病生存率的關系
本研究利用GSE14520數(shù)據(jù)集,共篩選出348個差異表達基因,其中91個上調(diào)基因,257個下調(diào)基因。從PPI中篩選出排列最前的2個重要網(wǎng)絡模塊。模塊1中的關鍵基因主要參與DNA復制與細胞周期的轉(zhuǎn)換。大量研究表明,腫瘤的發(fā)生、發(fā)展與細胞周期異常調(diào)控密切相關,模塊1中的CDK1、CCNB1、AURKA、TYMS處于蛋白互做網(wǎng)絡調(diào)控中心,GO和KEGG分析發(fā)現(xiàn),這些蛋白參與細胞周期信號通路和細胞周期轉(zhuǎn)換生物過程。相關研究表明,CDK1、CCNB1、AURKA和TYMS基因與腫瘤的發(fā)生、發(fā)展具有密切的相關性。CDK1是細胞周期關鍵調(diào)控因子[5]。CCNB1編碼的蛋白位細胞周期蛋白1,CDK1/CCNB1在LINC00346競爭吸附miR-199a-3p的作用下上調(diào),調(diào)控肝癌細胞的凋亡、侵襲和細胞周期,進而影響HCC發(fā)生發(fā)展[6]。AURKA的下調(diào)通過p-GSK-3β/β-連環(huán)蛋白途徑失活來抑制血管平滑肌細胞細胞增殖,進而抑制主動脈夾層動脈瘤(ADA)的發(fā)生發(fā)展[7]。TYMS基因的下調(diào)促進了細胞周期由G1期進入S期,進而抑制了腹膜后脂肪肉瘤(RLPS)的進展。最近研究表明,細胞周期蛋白不僅通過影響腫瘤細胞,還通過影響其微環(huán)境,在腫瘤發(fā)展中發(fā)揮額外的作用,如通過調(diào)節(jié)抗腫瘤免疫反應[8],這些結果提示,CDK1、CCNB1、AURKA、TYMS可能通過調(diào)控細胞周期進程或HCC微環(huán)境來影響HCC的發(fā)生、發(fā)展,其分子機制值得我們深入研究。
本研究網(wǎng)絡模塊2中的關鍵基因主要參與氧化還原生物過程。肝癌細胞在有氧條件下仍能進行活躍的葡萄糖攝取和糖酵解過程,同時減少Q(mào)XPHOS過程,這種特殊生化表型在HCC的生長、轉(zhuǎn)移、復發(fā)中占有重要地位,如肝癌組織內(nèi)MPC功能障礙可能與HCC糖異生功能下降及糖酵解代謝增強有關[9]。模塊2關鍵基因中的HGD和HAAO基因參與氧化還原的生物過程,KLKB1基因參與氧化還原酶活性,作用于成對的供體上,并結合或還原分子氧的生物過程,F(xiàn)9參與酶原激活和肽基谷氨酸羧化的生物過程,PROZ基因參與肽基谷氨酸羧化生物過程,F(xiàn)ETUB基因主要參與內(nèi)肽酶活性的負調(diào)節(jié)和半胱氨酸型內(nèi)肽酶抑制劑的活性的分子功能。這些結果提示HGD、HAAO、KLKB1、F9、PROZ和FETUB可能通過降低氧化還原酶活性、酶原激活和肽基谷氨酸羧化等生物過程降低檸檬酸循環(huán),需氧氧化磷酸化等氧化還原過程來促進糖酵解,進而促進肝細胞癌的進展。
通過GEPIA分析驗證發(fā)現(xiàn),關鍵基因中的PROZ和F9在肝細胞癌組織的表達顯著低于正常組織,此外,HGD、PROZ和F9低表達與肝細胞癌患者預后差異顯著相關。HGD基因突變會引起HGD酶的缺乏,進而導致組織中的同型半胱氨酸(HGA)沉積,導致嚴重的骨關節(jié)病、堿尿癥和心臟瓣膜退變等疾病[10,11]。在一種新的小鼠模型中分析證實,HGD基因僅在肝臟和腎臟皮質(zhì)中表達,且表明肝臟HGD對HGA代謝至關重要,肝臟可能是未來AKU酶/基因治療的合適靶點[12]。有文獻表明,抑制HAAO增加內(nèi)源性3-HAA水平,降低血脂水平和動脈粥樣硬化,導致肝臟SREBP-2mRNA水平降低,并改善肝臟病理評分,然而,HAAO在HCC的具體機制仍不清楚[13]。F9基因變異導致相應凝血因子完全或部分缺失,最終導致嚴重程度不一的B型血友病,剪接體成分U1snRNP錯誤地結合在F9基因的3′UTR內(nèi),導致下游PAS的抑制和F9 mRNA的強烈下降,進而導致蛋白水平降低和凝血活性降低[14]。目前,還沒有報道表明F9在HCC中的作用。Z(PROZ)基因編碼肝臟維生素K依賴性糖蛋白,該蛋白在肝臟中合成并分泌到血漿中,PROZ基因與腦梗死、細菌性腦膜炎發(fā)病機制、中國漢族女性反復自然流產(chǎn)的遺傳易感性、特應性皮炎和胰腺癌的發(fā)生密切相關[15-16]。有研究表明,轉(zhuǎn)染miR-24和miR-34a的HEPG2細胞不僅降低了肝細胞核因子4α(HNF4a),而且還降低了PROZ的轉(zhuǎn)錄水平[17],但其在HCC中的具體作用有待進一步探索。
本研究通過生物信息學分析篩選出的基因PROZ和F9在肝癌組織和正常組織表達差異有顯著性,且低表達患者總生存率及無病生存率均低于高表達患者,具備一定的肝細胞癌預后評估價值,有助于醫(yī)生對肝細胞癌患者手術后個體化治療方案的選擇提供幫助,但其在肝細胞癌中的生物學功能及作用機制有待進一步的研究。