張 依 張玉峰 牛文輝 戚亞婷 趙永華 樊亞芳
肝細胞癌(hepatocellular carcinoma,HCC)是原發性肝癌最常見的組織學亞型,每年全球約有84萬例新增HCC患者,因HCC死亡人數高達78萬[1]。并且HCC患者的5年生存率仍不盡如人意(約為12.1%),發病機制尚不明確[2]。研究顯示,中醫藥治療肝癌時,能夠降低肝癌復發和轉移,提高患者生存質量,并能夠減少肝癌細胞增殖和新生血管形成,促進其凋亡[3]。因此,研究HCC的分子機制和具有潛在治療作用的中藥或有效成分顯得尤為重要。
近年來,生物信息學方法廣泛應用于醫學領域,是探索和預測疾病發病機制的重要手段。因此,本研究選取了HCC相關基因芯片進行生物信息學分析,篩選HCC相關DEGs,并挖掘DEGs的生物學功能和通路,探討HCC潛在的分子機制。并篩選核心基因和具有潛在治療作用的中藥有效成分,旨在為診斷、治療和機制研究提供基礎。
1.材料:在GEO數據庫(https:∥www.ncbi.nil.nih.gov/geo/)中根據以下條件進行篩選基因芯片:①樣本組織為HCC和癌旁或正常肝組織;②數據類型為mRNA表達譜;③物種為智人(Homo sapiens);④平臺為GPL570[(HG-U133_Plus_2)Affymetrix人基因組U133加2.0陣列]。基于上述條件,選擇并下載4組基因芯片:GSE45436(來源于93個HCC組織和41個癌旁肝組織)、GSE84402(來源于14個HCC組織和14個癌旁肝組織)、GSE62232(來源于81個HCC組織和10個正常肝組織)、GSE101685(來源于24個HCC組織和8個正常肝組織)。
2.篩選DEGs:使用R 3.5.1軟件的Affy和Limma包對4組基因芯片進行分析,得到DEGs,其中Limma包的Benjamini-Hochberg算法對P值進行校正,得到校正后的P值[4]。若校正后的P<0.05、|log2(fold change,FC)|(|log2FC|)>1(FC為差異倍數),則為DEGs。再分別利用“Volcano plot”和“Venn diagram”包構建火山圖和韋恩圖,選取同時在4組基因芯片中的上調或下調基因為DEGs。
3.GO和KEGG分析:將DEGs輸入DAVID 6.8(https:∥david.ncifcrf.gov/),選擇物種為智人,進行KEGG和GO分析,兩者均以P<0.01為截斷標準。其中GO分析包括生物過程(biological process,BP)、細胞組分(cellular components,CC)及分子功能(molecular functions,MF)分析。
4.構建PPI網絡和篩選核心基因:在STRING 11.0數據庫(https:∥string-db.org/)中輸入DEGs,選擇最低相互作用評分為中等置信度(0.400),得到蛋白質-蛋白質互作(protein-protein interaction,PPI)數據。并使用Cytoscape 3.7.2軟件對PPI數據進行可視化展示,根據“CytoHubba”插件中MCC算法,選擇前10位DEGs作為核心基因。
5.驗證核心基因的表達和生存分析:在UALCAN(http:∥ualcan.path.uab.edu/analysis.html)中設置檢索條件為:①gene symbol:核心基因;②TCGA dataset:liver hepatocellular carcinoma;③expression;④survival。分析核心基因表達,并繪制核心基因的Kaplan-Meier生存曲線,兩者均以P<0.05為截斷標準。
6.篩選潛在治療藥物:在比較毒物遺傳學數據庫(CTD,http:∥ctdbase.org/)中輸入疾病為hepatocellular carcinoma,從化合物-基因相互作用(chemical-genes interactions)數據中篩選能夠負調節核心基因表達的中藥有效成分,作為潛在治療HCC的低分子化合物。
1.篩選DEGs:通過R 3.5.1的Affy和Limma包分析得到DEGs,使用火山圖進行展示,詳見圖1。并對4組基因芯片中DEGs取交集和繪制韋恩圖,得到173個上調基因和323個下調基因,詳見圖2。

圖1 4組微陣列數據的火山圖

圖2 上調基因(A)和下調基因(B)的韋恩圖
2.GO和KEGG分析:GO和KEGG分析發現,DEGs主要參與75個BP,主要分布于29 個CC,主要具有28種MF,主要富集在20條KEGG通路,詳見表1。

表1 GO和KEGG分析
3.構建PPI網絡和篩選核心基因:通過STRING和Cytoscape分析,得到由430個節點(節點表示DEGs,其中66個DEGs在本研究中孤立存在,未參與PPI網絡構建)和5047個邊(邊表示DEGs間相互作用關系)組成的PPI網絡圖,詳見圖3A。使用cytoHubba的MCC算法,篩選得到10個明顯上調的核心基因,包括有絲分裂阻滯缺陷蛋白2樣蛋白1(mitotic arrest deficient 2 like protein 1,MAD2L1)、有絲分裂檢查點絲氨酸/蘇氨酸蛋白激酶B(mitotic checkpoint serine/threonine kinase BUB1 beta,BUB1B)、非染色體結構維護凝縮蛋白I復合體G亞基(non-SMC condensin I complex subunit G,NCAPG)、細胞周期蛋白A2(cyclin A2,CCNA2)、細胞周期蛋白B2(cyclin B2,CCNB2)、驅動蛋白超家族11(kinesin family member 11,KIF11)、細胞周期蛋白依賴性激酶1(cyclin dependent kinase1,CDK1)、酪氨酸和蘇氨酸蛋白激酶(tyrosine and threonine protein kinase,TTK)、苯并咪唑出芽抑制解除同源物1(budding uninhibited by benzimidazoles 1,BUB1)、細胞周期蛋白B1(cyclin B1,CCNB1),詳見圖3B。
4.驗證核心基因的表達和生存分析:通過UALCAN數據庫發現,核心基因在HCC組織中均顯著高表達且差異有統計學意義(P<0.05),詳見圖4。生存分析結果顯示,核心基因高表達組生存率均低于低表達組生存率且差異有統計學意義(P<0.05),詳見圖5。

圖4 UALCAN數據庫中核心基因的表達情況

圖5 核心基因的Kaplan-Meier生存曲線
5.篩選潛在治療藥物:核心基因均為上調基因且與低生存率密切相關,因此,從CTD中篩選可降低核心基因表達的中藥有效成分。根據中藥有效成分對應的核心基因的數目進行排序,前5個中藥有效成分為槲皮苷、白藜蘆醇、姜黃素、雷公藤甲素、相思子堿,詳見表2。

表2 CTD數據庫篩選的潛在治療藥物
本研究使用生物信息學方法對基因芯片進行分析,探討HCC的分子機制,為實驗和臨床提供潛在治療靶點和治療藥物。
本研究共得到496個DEGs。GO和KEGG分析表明,DEGs主要調控細胞分裂、有絲分裂等生物學過程,主要參與代謝和細胞周期等通路。上述生物學過程和通路可能在HCC發生、發展過程中起著至關重要的作用,為探究HCC的發病機制提供基礎。
通過PPI分析發現了10個高表達且與生存率密切相關的核心基因,包括MAD2L1、BUB1B、NCAPG、CCNA2、CCNB2、KIF11、CDK1、TTK、BUB1、CCNB1。其中MAD2L1是紡錘體組裝的檢查蛋白的重要組成部分,其異常表達時,可影響紡錘絲檢查點的活性,導致染色體不穩定,促進腫瘤的產生,但在HCC中研究較少,可能為新的治療靶點[4,5]。BUB1B又稱為BUBR1,是連接紡錘體微管和染色體的有絲分裂功能蛋白,在HCC組織中高表達,與乙肝表面抗原(HBsAg)陽性率、較大腫瘤體積、低生存率密切相關[6]。NCAPG可負責染色體的穩定和凝聚,在HCC中,高表達NCAPG與較低的生存率密切相關,其表達降低時可導致肝癌細胞在體內形成的異體移植瘤減小[7]。
CCNA2為DNA復制的調控因子,在HCC中精氨酸琥珀酸裂解酶(ASL)與CCNA2相互作用,并通過非酶途徑促進HCC的發生[8]。CCNB2與細胞分裂周期蛋白20(Cdc20)結合能夠引起細胞從G2期轉換至M期,在HCC中顯著高表達,下調CCNB2可引起細胞增殖和遷移的減少、凋亡增加和S期阻滯[9]。KIF11為調控依賴性運動蛋白,在有絲分裂紡錘體形成和維持紡錘體動力中發揮重要作用,其在口腔鱗狀細胞癌和非小細胞肺癌中顯著高表達,但在HCC中研究較少,可能為新的靶點基因[10,11]。CDK1與CCNB1結合后具有激酶功能,在HCC細胞中,CDK1能夠通過調節凋亡素的腫瘤特異性殺傷功能和分布在細胞核、細胞質中比例,調控凋亡素引起的細胞凋亡[12]。
TTK是紡錘體檢測點的一部分,在HCC組織中高表達,并與腫瘤直徑、門靜脈癌栓(PVTT)的形成密切相關,也可促進細胞增殖和遷移[13]。BUB1是編碼染色體分離調控的蛋白激酶,在HCC中高表達,下調BUB1的表達可導致細胞增殖減少,凋亡增多和S期阻滯[14]。CCNB1為有絲分裂的關鍵啟動因子,在HCC中高表達的CCNB1與血管侵犯、病理分期和較低的無病生存率、總生存率密切相關[15]。結合上述分析發現,核心基因與細胞周期密切相關,可能為HCC的致癌基因和治療靶點。
本研究在CTD數據庫中篩選出槲皮素、白藜蘆醇、姜黃素、雷公藤甲素、相思子堿5個中藥有效成分,其中槲皮素是廣泛存在于三七、絞股藍等中藥的天然黃酮類化合物,白藜蘆醇是來源于虎杖等中藥的非黃酮類多酚化合物,兩者均能降低肝癌細胞增殖活性并促進凋亡,引起細胞周期阻滯[16,17]。姜黃素是姜黃中的天然酚類化合物,雷公藤甲素是從雷公藤中提取的環氧化二萜內酯化合物,兩者均可抑制肝癌細胞增殖,而雷公藤甲素也能降低肝癌細胞侵襲和轉移能力[18~20]。相思子堿是從相思子或雞骨草中提取的生物堿,從雞骨草中提取的相思子堿能夠減少四氧化碳(CCl4)和異硫氰酸萘酯引起的肝損傷小鼠模型中總膽紅素和丙氨酸氨基轉移酶的含量,具有降酶退黃護肝的藥理作用[21]。但相思子堿對HCC細胞的研究較少,可能為新的治療HCC藥物。上述5種中藥有效成分能夠影響肝癌細胞的增殖和凋亡,具有抗肝癌的作用。
綜上所述,本研究使用生物信息學方法對HCC相關DEGs和潛在治療藥物進行分析,發現DEGs主要調控DNA復制和氧化還原過程,參與細胞周期和代謝信號通路。篩選得到10個顯著上調且與低生存率密切相關的核心基因,可能為HCC的致癌基因和潛在治療靶點。并且發現槲皮素、白藜蘆醇、姜黃素、雷公藤甲素、相思子堿具有潛在的治療作用。因此本研究有助于分析HCC的潛在分子機制和發現具有治療作用的中藥有效成分,為后續臨床和實驗研究提供潛在的靶標和治療藥物。