陳傲寒綜述, 黎銀潮, 陳樹達, 劉賢岳, 許曉偉, 趙 軻, 王誠蔗, 周列民審校,2
癲癇是最常見的慢性神經元性疾病之一,以神經元持續性的異常放電導致中樞神經系統功能失常為特征。任何年齡均會發病,全世界約7000萬患者,其反復發作影響患者的身體健康,對患者及其家人的生活、心理及經濟等方面造成負擔[1]。使用抗癲癇藥物(antiepileptic drugs,AEDs)是控制癲癇發作最基礎、最有效的治療方式,但是臨床上仍有30%的患者在足量、足療程治療后復發[2]。丙戊酸是一種非選擇性鈉離子通道阻滯劑,是治療癲癇的一線藥物,對控制癲癇全身發作和局部發作具有較好的效果,但是這種效果受基因變異的影響較大。Feng[3]等發現CYP3A4、SCN1A和UGT2B7基因多態性對丙戊酸治療癲癇的療效具有重大影響。為了從基因角度更深入的分析丙戊酸治療癲癇存在差異性的可能,本研究使用來自基因芯片公共數據庫GEO的一組癲癇患者與正常人的芯片,分析探討基因表達的差異性對丙戊酸治療癲癇療效的影響。
1.1 數據來源 本研究選取數據來自GEO數據庫的芯片,系列號GSE143272,采用商業化的離子通道芯片平臺GPL10558[4]。數據集包含16個癲癇患者丙戊酸單藥治療反應好、9個癲癇患者丙戊酸單藥治療無效和50個正常人的外周血標本。從這些外周血標本中分離得到總RNA,再利用Illumina芯片技術和HumanHT-12_v.4 芯片進行基因表達譜分析。
1.2 預處理數據與篩選差異表達基因 基于GPL10558平臺構建的信息,將探針識別號轉化為正式基因名稱(保留mRNA探針,放棄其他非mRNA探針)。利用limma軟件包分析基因表達矩陣,經affy、affyPLM軟件包進一步處理,得到DEGs。采用Benjamini & Hochberg錯誤發現率的方法降低假陽性率[5~7],取P值≤0.05,|logFC|>0作為截斷值的標準,logFC>0和logFC<0分別對應上調和下調的差異表達基因。用火山圖表示篩選出的DEGs,并作Venny圖取非交集進一步選取DEGs。
1.3 信號通路富集和差異表達基因本體論(Gene ontology)分析 目前,基因本體論分析(GO)作為一種對基因產物及其功能特征進行注釋的常用方法,已經在分子生物學等領域得到廣泛應用,在有效地鑒定高通量相關的遺傳數據的生物學屬性方面,GO分析包括細胞組分(cellular components,CC)、生物學過程(biological processes,BP)和分子功能(molecular function,MF)[8]。KEGG數據庫是來自日本的一個開放性信息源數據庫,其數據的來源是基于RNA-seq實驗和微陣列,常用于注釋所涉及的信號通路網絡和基因列表,而且是處理細胞、基因組、信號轉導通路和疾病等的常用數據庫[9]。利用DAVID數據庫對DEGs進行KEGG/生物途徑富集和GO分析,該網站是功能注釋生物信息學微陣列分析的相關網站,本研究通過使用ggplot2包將療效好與差的DEGs的功能分析(細胞組分、生物學過程、分子功能和以及信號通路)可視化,其中錯誤發現率(false discovery rate,FDR)<0.05說明統計學具有顯著的差異性[10]。
1.4 蛋白質-蛋白質相互作用(Protein-Protein interaction,PPI)網絡分析 通過數據庫STRING(The Search Tool for the Retrieval of Interacting Genes,STRING,version 11.0)可以評估蛋白質之間的相互作用,該數據庫覆蓋了約2460萬個蛋白質,其顯示各種蛋白質之間相互作用,可用于發現蛋白質之間的直接(物理)和間接(功能)關聯[11]。將界值標準設定為最大相互作用數=0且置信度得分≥0.4,進而評估DEGs的潛在蛋白質-蛋白質相互作用。隨后,用Cytoscape的插件Cytohubba分析PPI網絡,使用MCC算法,從PPI網絡中挑選出與周圍基因具有高度連通性前5個基因,作為核心基因[12]。
1.5 差異表達基因功能模塊分析 使用Cytoscape中的分子復合物檢測(MCODE)插件,其根據拓撲關系對給定網絡進行聚類,找到密集連接的區域。本研究分析基于DEGs的PPI網絡以篩選出基因功能模塊,node score cutoff=0.2,degree cutoff=2,max depth=100以及k-core=2。另外將篩選出的功能模塊映射到STRING數據庫中,進行KEGG和GO分析以注釋信號傳導途徑和功能模塊組分的基因。
1.6 統計學方法 采用t檢驗進行DEGs的篩選以及采用Fisher精確檢驗分析GO和KEGG注釋富集。所有統計分析在R版本4.0.3軟件中執行。
2.1 差異表達基因 通過對GEO數據集GSE157797進行差異基因篩選,以調整P值≤0.05,|logFC|>0為標準得出DEGs,其中在丙戊酸單藥治療有效組與正常人組對比的1836個差異表達基因中,分別包括972下調基因和864個上調基因(見圖1A)。在丙戊酸單藥治療無效組與正常人組對比的751個差異表達基因中,分別包括486下調基因和265個上調基因(見圖1B)。用火山圖表示如圖1A、圖1B,紅色表示上調的DEGs,藍色表示下調的DEGs。然后做Venny圖取非交集進一步篩選出療效差異的相關基因。

圖1 GSE157797數據集基因表達水平

圖2 差異表達基因Venny圖
2.2 差異表達基因的功能分析 為了進一步了解丙戊酸單藥治療有效和無效的DEGs的生物學功能,分別將對VPA治療反應好的1508個基因和對VPA治療反應差的423個基因進行GO和KEGG/生物途徑富集分析。
GO分析結果顯示,癲癇患者VPA單藥治療效果反應好的1508個DEGs的細胞組分在細胞質、細胞核和細胞膜中均有富集;生物過程主要是參與蛋白翻譯,T細胞受體信號通路和核轉錄的mRNA分解過程;分子功能富集在蛋白質以及RNA結合過程中。KEGG/生物途徑分析顯示,主要參與RNA轉運和核糖體相關信號通路。423下調基因DEGs的細胞組分在細胞核中富集;生物過程主要是高爾基囊泡介導的轉運和以DNA為模板的轉錄調控過程中;分子功能富集在DNA、蛋白質的結合以及泛素蛋白連接酶活性。KEGG/生物途徑分析顯示,主要參與mRNA監測途徑和溶酶體相關信號通路(見圖3、圖4)。

圖4 DEGs的GO分析
2.3 核心基因的功能模塊及表達水平分析
2.3.1 PPI 網絡的構建及10個核心基因的篩選 為了篩選出對丙戊酸反應存在差異的基因,首先構建PPI網絡,再使用Cytoscape計算PPI網絡,最后分別參照MCC方法各選取前5個基因,并把這些基因命名為核心基因(見圖5)。

圖5 前5個核心基因
2.3.2 功能模塊分析 使用Cytoscape中的MCODE插件和DVAID網站分析DEGs功能模塊,其按照基因計數對結果進行降序排序,P值<0.05(見表1)。顯示核心功能模塊中對VPA治療反應好的102個DEGs(見圖6)主要富集在UBC13-MMS2 復合物和U6小核核糖核蛋白中,其涉及的生物學過程集中在多聚體結合的調節和蛋白質去甲基化的負調控,生物分子功能分析顯示集中在泛素連接酶抑制劑活性,組蛋白前mRNA DCP結合和蛋白翻譯激活劑活性,KEGG信號通路分析核心模塊的DEGs主要參與核糖體和剪接體的相關信號通路。對VPA治療反應差102個DEGs主要富集在UBC13-MMS2復合物和U6小核核糖核蛋白中,其涉及的生物學過程集中在多聚體結合的調節和蛋白質去甲基化的負調控,生物分子功能分析顯示集中在泛素連接酶抑制劑活性,組蛋白前mRNA DCP結合和蛋白翻譯激活劑活性,KEGG信號通路分析核心模塊的DEGs主要參與核糖體和剪接體的相關信號通路,而在與平行對照的腦組織相比,這些基因的表達改變,顯示了探究差異表達基因的相關生物學功能及信號通路對研究VPA療效具有重要價值。

表1 DEGs的功能模塊相關分析

圖6 DEGs的功能模塊
丙戊酸是一種廣譜抗癲癇藥物,廣泛應用于全身性和部分性癲癇的治療。其療效有顯著的個體差異性,臨床和分子因素是丙戊酸療效個體差異的基礎。臨床因素包括性別、年齡、發病機制、肝腎功能、藥物相互作用等。除去這些臨床因素,對丙戊酸的反應在患者間也存在顯著的差異。潛在的分子因素,例如丙戊酸影響受體、轉運體和藥物代謝酶的基因表達,單獨或結合編碼這些基因的多態性。既往的研究報道關于丙戊酸反應差異的分子因素主要集中在藥物轉運與代謝的差異基因上,例如UDP糖基轉移酶(UDP glycosyltransferase,UGT)和細胞色素(Cytochrome P450,CYP)等[13]。在本項研究中,發現了與以往關注點不同的影響基因,如KLHL21、FBOX30、LRR1、FBXL15、KCTD6、SKP1、MEX3C、UBR4、UBE2C、FBXW7,這些基因編碼蛋白參與人體內泛素化過程。蛋白質泛素化是一種由泛素激活酶(E1s)、泛素結合酶(E2s)和泛素連接酶(E3s)催化的高度有序多步酶級聯反應。由Clu(Cullin)蛋白作為支架蛋白與SKP1和F-box蛋白構成的SCF(Skp1-Cullin1-F-box)復合體也稱為CRL復合體,占人類E3s的絕大部分。F-box可特異性識別底物,FBOX30通過對RARγ(RA exerts its functions through RA receptors,RARs)的干預拮抗BMP(bone morphogenic protein,BMP)通路[14,15],與此同時FBXL15亦可負向調控Smurf1穩定性來正向調控BMP[16],二者共同影響了胚胎神經系統發育;FBXW7是一種腫瘤抑制因子,參與多種信號通路轉導,影響腫瘤發生[17]。SKP1(S-phase kinase-associated protein1,SKP1)連接Clu和F-box,其表達降低破壞SCF結構穩定性。在神經退行性疾病如帕金森患者的神經元中發現SKP1下降,推測損害神經遞質傳遞相關蛋白功能,加劇神經元內聚集物形成[18,19]。MEX3C作為一種RNA結合型E3s與某些mRNA后阻止其翻譯,并用泛素化的方式誘導其降解[20,21]。UBE2C(Ubiquitin-conjugating enzyme E2C)編碼另一類E3s蛋白成員,引導多聚泛素化到底物中的賴氨酸,在調控細胞周期中發揮重要作用[22]。UBR4(Ubiquitin protein ligase E3 component N-recognin 4)在人腦與脊髓組織中高度表達,尤其在海馬錐體神經元富集,表明該蛋白在建立影響學習和記憶過程的神經元網絡中起著關鍵作用[23]。KLHL21為Kelch-like基因家族的一員,特異性結合IKK復合物中的IKKβ亞基,促炎刺激時在巨噬細胞中表達下調,減少促炎因子表達[24]。此外,KLHL21和Clu3相互作用[25],介導體外aurora B激酶的泛素化。KCTD6是鉀離子通道蛋白四聚體家族成員,其BTB(Bric-a-brack,Tram-track,Broad complex)可以高親和力的結合Clu3[26]。LRR1蛋白則與CRL2構成CRL2LRR1復合物[27]參與泛素化的下一個過程。蛋白泛素化影響中樞神經系統離子通道蛋白如鈉通道(Navs),已證實E3s作用于Nav1相似的PY模序來修飾蛋白,而丙戊酸正是通過阻滯Navs來發揮抗癲癇作用。本研究篩選出的10個基因影響了大腦內尤其是Navs蛋白泛素化修飾過程,故我們推測人群中蛋白泛素化相關基因差異是丙戊酸療效差異性的分子因素之一。我們分析癲癇患者與正常人外周血基因表達情況,利用生物信息學分析的方法,提示丙戊酸療效差異性大的另一種可能,為指導用藥及精準治療提供新思路。