黃繼康,劉斌
(暨南大學附屬順德醫院 感染科,廣東 佛山 528000)
肺結核是一種具有高度傳染性的疾病,其病原菌為結核分枝桿菌。據WHO報道,2018年全球范圍內約有1000萬結核新增病例,超過120萬人死于結核及其并發癥[1]。早期診斷率低和傳染性強是肺結核高死亡率的首要原因[2],因此肺結核的生物標志物和分子機制尚需開展進一步研究。miRNA是一類單鏈非編碼RNA,長度約等于22個核苷酸,分子量較小。它能結合靶基因mRNA的3'非翻譯區,其調節蛋白的表達水平的作用機制主要為降解mRNA或者抑制mRNA的翻譯[3]。此外,miRNA在細胞生長發育的諸多過程,如凋亡、代謝、免疫中均發揮著不可或缺的作用[4]。近年來,不同的循環miRNA參與并調控肺結核的發生和發展過程這一觀點已被多項研究證實,其中有望成為診斷肺結核的生物標志物的是has-miR-29a、has-miR-144和hsa-miR-768-3p等[5-7]。
本研究利用GEO公共數據庫中肺結核患者外周血中miRNA表達譜芯片數據GSE34608[8],比較肺結核患者血液與健康者血液的miRNA并篩選出差異表達miRNA(differentially expressed miRNAs,DE-miRNAs),對其靶基因進行預測,并富集分析靶基因功能,利用Cytoscape軟件構建蛋白相互作用(protein-protein interaction,PPI)網絡,篩選Hub基因,并構建miRNA-Hub gene 網絡,為肺結核篩選分子標志物及進一步研究其發病的分子機制提供理論依據。
通過對GEO數據庫中肺結核miRNA表達譜數據進行篩選,選取GSE34608 miRNA表達譜芯片數據為研究對象。該芯片數據集包括8例肺結核患者外周血樣本和8例正常人外周血樣本。
應用R軟件中的“Limma”包對GSE34608數據集進行分析,對比兩組實驗條件相同的樣本,篩選出差異表達的miRNA,并對其進行聚類分析,并繪制熱圖,閾值為log2(fold change)的絕對值>2和偽發現率(false discovery rate,FDR)<0.05。
通過TargetScanHuman網站[9]分別預測上調幅度和下調幅度最顯著的兩個miRNA的靶基因。
應用FunRich軟件對篩選所得的2個DE-miRNAs預測的靶基因數據進行功能注釋和包括GO分析和KEGG通路分析在內的通路富集分析,P<0.05差異具有統計學意義。
分別構建PPI網絡和miRNA-Hub gene網絡。首先將所有靶基因輸入到STRING網站[10],以評估靶基因之間的功能關聯,選擇評分大于0.9的交互作用進行下一步研究。利用Cytoscape軟件分析PPI網絡的連通性,獲取Hub基因,建立miRNA-Hub gene網絡。
使用上述諸多數據分析軟件,對所得的各種數據信息進行統計學分析。
使用R軟件分析GSE34608數據集,結果顯示共篩查出253個DE-miRNAs,其中上調的201個,下調的52個,并繪制火山圖和熱圖(圖1),其中上調幅度最大的10個miRNA和下調幅度最大的10個miRNA均已列出(表1、表2)。根據fold change的值,has-miR-144上調幅度最大,而hsa-miR-768-3p下調幅度最大。通過TargetScanHuman網站預測出has-miR-144和hsa-miR-768-3p潛在的靶基因1450個。

圖1 A為火山圖,藍色代表下調的miRNA,紅色代表上調的miRNA,黑色為表達無差異的miRNA,B為差異基因表達的熱圖
將上述靶基因數據依次導入FUNRICH軟件,對其生物學過程(BP)、細胞組成(CC)和分子功能(MF)共三類GO功能進行功能富集分析。如圖2所示,hasmiR-144的靶基因主要參與核苷酸代謝,表觀遺傳,信號轉導等生物學過程;細胞核、細胞質 是其主要參與的細胞組成;而調控轉錄因子的活性、核糖核酸的綁定則是其主要分子功能。圖3展示了hsa-miR-768-3p靶基因主要參與調節細胞的生長周期,代謝等生物學過程;參與合成核仁,肌動蛋白骨架的細胞成分組成;參與的分子功能為結合DNA、RNA等。為進一步分析這些靶基因的富集途徑,我們進行了KEGG通路富集分析。has-miR-144的靶基因富集到KEGG通路有雌激素受體相關通路,磷脂酰肌醇聚糖通路,內皮素通路等;hsa-miR-768-3p靶基因富集到KEGG通路有白介素6信號通路,TGF-β信號通路等,見圖4。

表1 正常人外周血和肺結核患者外周血中差異表達miRNA上調前10位

表2 正常人外周血和肺結核患者外周血中差異表達miRNA下調前10位

圖2 has-miR-144的靶基因富集分析圖

圖3 hsa-miR-768-3p的靶基因富集分析圖

圖4 has-miR-144(A)和hsa-miR-768-3p(B)的KEGG通路圖
將has-miR-144和hsa-miR-768-3p的靶基因輸入STRING網站,構建PPI網絡。進一步應用Cytoscape軟件分析靶基因之間的連通度,并篩選出前十名為Hub基因。has-miR-144的Hub基因為STAT6,MAPK1,TCEB1,FBXW11,FBXW7,H2AFV,CUL3,VHL,FBXL3,FBXO30,hsa-miR-768-3p的Hub基因為STAT6,TP53,HSP90AA1,VEGF,ESR1,RHOA,CDC42,IL2,TP53BP1,UBE2D1。STAT6在上述基因中節點度最高,表明STAT6可能是肺結核的關鍵靶點。隨后,利用Cytoscape軟件構建miRNA-Hub gene網絡,如圖5所示。這些數據支持has-miR-144和hsa-miR-768-3p可能是肺結核的兩個潛在調控因子。

圖5 has-miR-144和hsa-miR-768-3p及Hub基因的調控網絡
隨著生物科學技術的進步,越來越多的新技術被應用到了醫學領域,尤其是在基因芯片和NGS測序技術。通過生物信息學方法分析肺結核相關的大數據,可以為結核病防治提供幫助。本研究通過GEO數據庫下載的肺結核miRNA表達譜芯片數據集GSE34608,分析差異表達miRNAs,篩選出差異最大的2個與肺結核相關的miRNA,預測其靶基因,并對靶基因進行GO和KEGG富集分析。結果顯示,hasmiR-144的靶基因主要參與核苷酸代謝,表觀遺傳,信號轉導等生物學過程;細胞核、細胞質是其主要參與的細胞組成;調控轉錄因子的活性、核糖核酸的綁定等則是其主要的分子功能。hsa-miR-768-3p靶基因主要參與調節細胞的生長周期,代謝等;并參與組成核仁,肌動蛋白骨架等;其參與的分子功能主要為結合DNA、RNA等。為進一步分析這些靶基因的富集途徑,我們進行了KEGG通路富集分析。has-miR-144的靶基因富集到KEGG通路有雌激素受體相關通路,磷脂酰肌醇聚糖通路,內皮素通路等;hsa-miR-768-3p靶基因富集到有白介素6信號通路,TGF-β信號通路等KEGG通路。由此推測得出,細胞的免疫機制、炎癥反應、趨化因子、細胞自身的生長周期及凋亡等均與肺結核的發生發展密切相關。
差異表達最顯著的miRNA分別是has-miR-144和hsa-miR-768-3p。研究表明has-miR-144在肺結核患者外周血中表達上調,起著保護機體的作用,其作用機制為轉錄后利用調控機制抑制如CXCL2,和IL-2等中性粒細胞趨化因子的表達,大量中性粒細胞趨化至肺組織過程受阻而避免繼發的病理性損傷的產生[11-12]。但陳再旺等研究則認為肺結核患者中高表達量的has-miR-144抑制了機體產生TNF-α、INF-γ以及阻礙了T細胞進一步增殖,說明hasmiR-144抵抗結核感染過程中機體的免疫力是通過調節T細胞的增殖和細胞因子的產生而引起的[13]。M K研究證明hsa-miR-768-3p可以削弱機體的抗結核免疫,主要機制為抑制巨噬細胞內核因子kB的活性,降低促炎癥因子的表達,以及抑制巨噬細胞凋亡等[14]。
在has-miR-144和hsa-miR-768-3p的靶基因中,本研究選擇了10個重要的靶基因,這些基因在肺結核中起到了關鍵作用。其中STAT6分別受到上述兩個miRNA的調控,STAT6作為Th2細胞分化過程中的特異性轉錄因子之一,除了可以促進Th2細胞增殖分化以外,其自身還可分泌細胞因子如IL-4,IL-10等[15]。實驗發現,敲除特異性STAT6基因后,IL-4作為炎癥因子,不能抑制γ-干擾素誘導的分枝桿菌自噬體形成,即IL-4等細胞因子不能發揮正常的生物學功能[16]。以上證據表明,在結核分枝桿菌感染免疫調節過程中,STAT6基因發揮重要作用。
本研究選取的數據集為單一研究所提交的,該研究包含了肺結核患者和健康對照人群,重點在于探討外周血中miRNA和肺結核的相關性,并篩選、預測出特異性miRNA的主要靶基因,對靶基因進行生物信息學功能分析。該結果可能有助于理解肺結核發生發展中涉及的調控機制。同時這些靶基因也可能作為未來治療肺結核的潛在靶點,為日后進一步的研究提供理論依據。