牛小偉 張晶晶 彭瑜 白明 張鉦
[摘要] 目的 通過生物信息學分析探討急性心肌梗死后心室重構的相關基因及功能。 方法 分析基因表達數據庫中與心梗后心室重構有關的數據集。 結果 在GSE47495數據集中共篩選出611個差異表達基因(DEG)。在基因本體論分析中對DEG按照生物途徑、分子功能、細胞定位注釋。對DEG涉及的信號通路進行Pathway分析。蛋白與蛋白互相作用網絡確定的核心基因有:酰基輔酶A氧化酶1(Acox1)、膜聯蛋白A1(Anxa1)、凝血因子XⅢ A1鏈(F13a1)。藥物篩選結果表明棕櫚油、姜黃素可能調節這些基因。 結論 在心肌梗死后心室重構的發生過程中,出現表達變化的基因功能主要集中在代謝、細胞外基質、炎癥、凝血方面,其中Acox1、Anxa1、F13a1可能發揮著重要作用,棕櫚油、姜黃素可能調節這些基因,發揮改善心室重構的作用。
[關鍵詞] 急性心肌梗死;心室重構;基因;生物信息學
[中圖分類號] R54 [文獻標識碼] A [文章編號] 1673-7210(2017)10(c)-0030-04
Analyzing gene expression profiles in ventricular remodeling after myocardial infarction via bioinformatics methods
NIU Xiaowei1,2 ZHANG Jingjing3 PENG Yu2,4 BAI Ming2,4 ZHANG Zheng2,4
1.The First Clinical Medical College, Lanzhou University, Gansu Province, Lanzhou 730000, China; 2.Gansu Key Laboratory of cardiovascular disease, Gansu Province, Lanzhou 730000, China; 3.Baiyin Second People′s Hospital, Gansu Province, Baiyin 730900, China; 4.The Heart Center, the First Hospital of Lanzhou University, Gansu Province, Lanzhou 730000, China
[Abstract] Objective To identify the molecular mechanisms underlying ventricular remodeling after myocardial infarction using bioinformatics methods. Methods Microarray data about ventricular remodeling after myocardial infarction were searched from GEO database. Results The array data of GSE47495 were obtained. A total of 611 DEG were identified. Gene ontology analysis showed that the DEG significantly enriched in biological processes, molecular function, and cell component. Pathway analysis showed the DEGs were involved in signaling pathways. The top 3 hub genes, Acox1, Anxa1, and F13a1 were identified from protein-protein interaction network. Results from drug screening indicated that palm oil and curcumin may regulate the above genes. Conclusion During post infarction ventricular remodeling, the identified DEG are mainly enriched in metabolism, extracellular matrix, inflammation, and coagulation. The hub genes, Acox1, Anxa1, and F13a1 provid potential targets for treatment of ventricular remodeling. Palm oil and curcumin may improve the ventricular remodeling through the regulation of these genes.
[Key words] Acute myocardial infarction; Ventricular remodeling; Gene; Bioinformatics
有研究表明,急性心肌梗死(簡稱“心梗”)患者在住院期間的病死率已有所下降[1]。然而,大量患者出院后卻因心力衰竭反復住院,導致長期病死率仍處于較高水平[1-2]。心梗后繼發的心室重構是心衰發生的主要機制[3-5],表現為梗死區心肌壞死產生膨出,非梗死區心肌肥大、間質纖維化、心室壁增厚擴張[3-5]。既往研究表明,細胞凋亡、代謝障礙、神經激素系統紊亂、氧化應激、炎性反應、細胞外基質異常是心室重構發生過程中的重要機制[3-5]。盡管針對上述機制的血管緊張素轉化酶抑制劑、β受體阻滯劑等藥物,已在一定程度上改善了心室重構,但仍有相當比例的患者并發心力衰竭[2]。因此,繼續深入認識心梗后心室重構的發生機制具有重要意義。生物信息學分析能系統了解不同組織在不同時間、不同生命狀態的基因表達差異,并全面理解基因間的相互關系,從中找出關鍵治療靶點[6]。本次研究擬從基因表達數據庫(gene expression omnibus,GEO)[7]中獲取與心梗后心室重構相關的基因表達譜,篩選出重要差異表達基因(differentially-expressed genes,DEG),并進行功能分析,以期為心室重構的防治提供新思路。endprint
1 材料與方法
1.1 基因芯片表達譜數據
從GEO數據庫中下載GSE47495數據集。采用結扎大鼠冠狀動脈的方法制作急性心梗的心室重構模型[8],術后2個月根據纖維瘢痕面積≥40%分組,超聲心動圖檢查證實與無心室重構組(n=12)相比,心室重構組(n=5)的左室舒張末壓增高[(21.0±0.5) mmHg](1 mmHg=0.133 kPa)、射血分數降低(23±3)%。按照Affymetrix公司的檢測方法對左心室組織進行轉錄表達譜分析。基因芯片的探針注釋信息來自GPL6247 [RaGene-1_0-st] Affymetrix Rat Gene 1.0 ST Array平臺。
1.2 數據預處理及DEG篩選
首先通過R 3.3.1軟件中的Bioconductor程序包對基因芯片數據使用robust multiarray average法進行背景校正、標準化和匯總,然后繪制箱線圖評估芯片數據質量,最后對合格數據采用limma包進行差異表達值計算,并根據貝葉斯檢驗以及Benjamini-Hochberg算法進行顯著性分析[8]。以變化倍數(fold change,FC)>1.3且錯誤發現率(false discovery rate,FDR)< 0.05為閾值選取DEG[9]。
1.3 基因本體論和通路分析
在注釋、可視化和整合發現數據庫(DAVID)中[10],根據基因本體論(gene ontology,GO)分析,按照生物途徑(biology process,BP)、分子功能(molecular function,MF)和細胞定位(cellularcomponent,CC)對基因進行注釋和分類[11]。同時根據京都基因與基因組百科全書數據庫(KEGG)進行通路(Pathway)分析[12]。所有富集分析根據FDR值依次排序,分別列出前5名的基因注釋信息。FDR值越小,越有理由相信該差異基因顯著性地富集到某個注釋中[8]。
1.4 蛋白相互作用分析
運用相互作用基因搜索工具數據庫(STRING)構建DEG的蛋白與蛋白互作網絡(protein-protein interaction,PPI)[13]。選取可信度分數高于0.4的互作對導入Cytoscape 3.4.0軟件[14],使用MCODE插件對PPI進行基因簇劃分[參數:節點度(degree cutoff)>5,鄰節點個數(K-core)>2],依據每個基因簇的評分篩選核心基因,并采用Pathway分析基因簇的功能[15]。
1.5 作用于分子靶點的藥物篩選
在比較毒物遺傳學數據庫(CTD)中篩選能影響基因簇的藥物,FDR值越小,表明藥物對基因影響的可信度越高。
2 結果
2.1 DEG的篩選
對GSE47495數據預處理后,箱線圖顯示各樣本中值基本保持在同一條直線上,說明數據已標準化。根據預先制定的閾值共篩選出611個DEG,其中上調448個,下調163個,聚類分析熱圖提示兩組間的基因整體表達模式存在明顯差異,同組之間各樣本間的重復性較好(圖1,封四)。
2.2 GO分析
GO數據庫分別從分子功能、參與的生物途徑及細胞中的定位對基因產物進行了標準化描述,即對基因產物進行了功能分類注釋。DEG在BP中,主要富集在細胞外基質組織結構(GO_BP:0030198)、創傷反應(GO_BP:0009611)、脂肪酸代謝過程(GO_BP:00066 31)、藥物反應(GO_BP:0042493)、細胞黏附(GO_BP:0007155);在MF中,主要富集在結合模式(GO_MF:0001871)、多糖結合(GO_MF:0030247)、碳水化合物結合(GO_MF:0030246)、黏多糖結合(GO_MF:0005539)、鈣離子結合(GO_MF:0005509);在CC中,主要富集在細胞外區域(GO_CC:0005576)、細胞外基質蛋白(GO_CC:0005578)、細胞外基質(GO_CC:0031012)、胞外區組分(GO_CC:0044421)、胞外基質組分(GO_CC:0044420)。
2.3 Pathway分析
Pathway分析能明確顯著改變的代謝通路。DEG涉及代謝通路主要有:細胞外基質受體相互作用(KEGG_ pathway: rno04512)、脂肪酸代謝(KEGG_pathway:rno00071)、黏著斑(KEGG_pathway:rno04510)、補體和凝血級聯反應(KEGG_pathway:rno04610)、不飽和脂肪酸生物合成(KEGG_pathway:rno01040)。
2.4 PPI分析
PPI分析發現3個基因簇(圖2),包括40個節點,連接度為185,核心基因分別為酰基輔酶A氧化酶1(acyl-CoA oxidase 1,Acox1)、膜聯蛋白A1(annexin A1,Anxa1)、凝血因子ⅩⅢ A1鏈(coagulation factor ⅩⅢ A1 chain,F13a1)。對基因簇的功能富集顯示:3個基因簇分別主要參與脂肪酸代謝、補體和凝血級聯反應、細胞外基質受體相互作用等通路。
2.5 針對基因簇的藥物篩選
對上述3個基因簇采用CTD篩選,結果表明棕櫚油和姜黃素對ACADM、ACADVL、ADCY7、ANXA1、F13A1、CYBB、DECR1、APLN、C1QC、C3AR1、TGFB2、EHHADH、CD68、HADHA、ECHDC2、TYROBP、VWF、FN1、ACOX1、CTSS、C1QA、C1QB、TIMP1具有調控作用(FDR < 0.05)(圖3)。endprint
3 討論
心梗后心室重構是近年越來越受關注的學術熱點問題[3-5]。既往已有研究收集了心衰與非心衰患者的心臟組織標本,采用基因芯片方法進行表達譜分析,結果提示與心衰相關的基因主要集中在線粒體功能、氧化磷酸化、細胞外基質方面[16-18]。然而這些研究結果大多來源于已進展至終末期心衰階段的擴張型心肌病患者,采用的心臟標本也經過了長期大量的藥物干預,難以準確反映心室重構自然發生過程中的基因表達譜變化。大鼠心梗模型具有良好的可重復性以及與人類疾病相似的變化過程,已被廣泛應用于心血管疾病的研究[19]。在本次研究中,按照是否發生心室重構將急性心梗大鼠重新分組,有利于在較為自然的狀態下,探索心室重構發生的相關基因表達譜,從而為早期防治提供參考。此外,通過R軟件調用了標準limma包進行DEG篩選[8],隨后對DEG繪制熱圖,結果提示DEG能夠將樣本按照是否發生心室重構進行聚類,這些均說明本次研究對DEG的篩選過程可靠。綜合GO分析和Pathway分析結果,本次研究發現DEG功能主要富集在代謝、細胞外基質、炎癥、凝血方面。
STRING是目前使用最廣泛的蛋白-蛋白互作關系數據庫,可基于已有的研究知識與信息進行模型構建,展示數據的分子相互作用網絡與機制。MCODE通過利用網絡中蛋白之間固有的關系尋找基因簇,進而確定網絡中的核心基因。在PPI分析中,本次研究通過共發現3個核心基因,即Acox1、Anxa1、F13a1。ACOX1是脂肪酸氧化的重要限速酶[20]。ANXA1是一種磷脂酶A2抑制蛋白[21]。F13A1是凝血因子ⅩⅢ的功能亞單位[22]。鑒于這些PPI分析中的基因簇可能成為改善心室重構的治療靶點,本次研究繼續使用CTD篩選治療藥物,結果提示棕櫚油、姜黃素與這些基因簇的聯系最密切。其中姜黃素對心室重構的保護作用已被較多研究支持[23],但其機制仍未闡明,本項研究結果發現的相互作用基因,可能為其提供了新的機制思路。棕櫚油是一種具有調節脂肪酸代謝紊亂的食用植物油[24],其與心室重構的關系研究尚少,有待于未來研究證實,從而為心室重構的防治提供更多措施。
本次研究還存在以下局限性:首先,在GO分析和Pathway分析中,僅列出排在前5名的基因注釋信息。雖然對其它FDR < 0.05的結果未能詳細說明,但由于FDR值大小本身能反映出基因功能的重要性程度,對富集程度越高的生物學過程進行研究,可能會起到更好地效果[6]。其次,本次研究結果主要基于生物信息學分析,未進行實驗驗證。由于生命系統的復雜性以及各數據庫的局限性,使得某些數據的解釋可能會存在一定不足。
綜上所述,本次研究運用生物信息學方法,從系統水平揭示了在心梗后心室重構的發生過程中,出現表達變化的基因功能主要集中在代謝、細胞外基質、炎癥、凝血方面,其中Acox1、Anxa1、F13a1可能發揮著重要作用,棕櫚油、姜黃素可能通過調節這些基因,成為改善心室重構的治療藥物。
[參考文獻]
[1] 陳偉偉,高潤霖,劉力生,等.《中國心血管病報告2015》概要[J]. 中國循環雜志,2016,31(6):617-622.
[2] 鄧伏雪,王小娟,胡云鳳,等.急性心肌梗死并發首次心力衰竭患者在院死亡率及臨床預后分析[J].西安交通大學學報:醫學版,2015,36(1):135-140.
[3] Sutton MG,Sharpe N. Left ventricular remodeling after myocardial infarction:pathophysiology and therapy [J]. Circulation,2000,101(25):2981-2988.
[4] 蔡仁慧,趙新湘,孫林.心臟磁共振技術在心肌梗死后心室重構中的應用[J].中國循環雜志,2015,30(9):926-928.
[5] 張健,王運紅.心力衰竭藥物治療的新進展[J].中國循環雜志,2016,31(2):105-107.
[6] Beckmann JS,Lew D. Reconciling evidence-based medicine and precision medicine in the era of big data:challenges and opportunities [J]. Genome Med,2016,8(1):134.
[7] Barth AS,Kuner R,Buness A,et al. Identification of a common gene expression signature in dilated cardiomyopathy across independent microarray studies [J]. J Am Coll Cardiol,2006,48(8):1610-1617.
[8] Smyth GK. Limma:linear models for microarray data in bioi?鄄nformatics and computational biology solutions using R and bioconductor [J]. Springer New York,2005,397-420.
[9] Tulacz D,Mackiewicz U,Maczewski M,et al. Transcriptional profiling of left ventricle and peripheral blood mononuclear cells in a rat model of postinfarction heart failure [J]. BMC Med Genomics,2013,6(1):49.endprint
[10] Huang da W,Sherman BT,Lempicki RA. Bioinformatics enrichment tools:paths toward the comprehensive functional analysis of large gene lists [J]. Nucleic Acids Res,2009,37(1):1-13.
[11] Ashburner M,Ball CA,Blake JA,et al. Gene ontology:tool for the unification of biology [J]. Nat Genet,2000,25(1):25-29.
[12] Kanehisa M,Sato Y,Kawashima M,et al. KEGG as a reference resource for gene and protein annotation [J]. Nucleic Acids Res,2016,44(D1):D457-D462.
[13] Szklarczyk D,Franceschini A,Wyder S,et al. STRING v10:protein-protein interaction networks,integrated over the tree of life [J]. Nucleic Acids Res,2015,43(Database issue):D447-D452.
[14] Kohl M,Wiese S,Warscheid B. Cytoscape:software for visualization and analysis of biological networks [J]. Methods Mol Biol,2011,696(696):291-303.
[15] Bader GD,Hogue CW. An automated method for finding molecular complexes in large protein interaction networks [J]. BMC Bioinformatics,2003,4(2):1-27.
[16] Min KD,Asakura M,Liao Y,et al. Identification of genes related to heart failure using global gene expression profiling of human failing myocardium [J]. Biochem Biophys Res Commun,2010,393(1):55-60.
[17] Tan FL,Moravec CS,Li J,et al. The gene expression fin?鄄gerprint of human heart failure [J]. Proc Natl Acad Sci USA,2002,99(17):11 387-11 392.
[18] Asakura M,Kitakaze M. Global gene expression profiling in the failing myocardium [J]. Circ J,2009,73(9):1568-1576.
[19] 李金軼,鐘國強,韋卓,等.大鼠心肌梗死模型的建立及梗死后心電生理和左室功能的變化[J].中國實驗動物學報,2009,17(6):419-423.
[20] Cabrero A,Merlos M,Laguna JC,et al. Down-regulation of acyl-CoA oxidase gene expression and increased NF-kap?鄄paB activity in etomoxir-induced cardiac hypertrophy [J]. J Lipid Res,2003,44(2):388-398.
[21] de Jong R,Leoni G,Drechsler M,et al. The advantageous role of annexin A1 in cardiovascular disease [J]. Cell Adh Migr,2017,11(3):261-274.
[22] Dickneite G,Herwald H,Korte W,et al. Coagulation factor ⅩⅢ:a multifunctional transglutaminase with clinical pot?鄄ential in a range of conditions [J]. Thromb Haemost,2015, 113(4):686-697.
[23] 羅嵐,劉蒸,廖端芳.姜黃素與慢性心力衰竭的關系研究進展[J].醫學綜述,2013,19(6):1096-1099.
[24] 馬舒舒,彭景,孫桂菊.棕櫚油對人體血脂影響的研究進展[J].糧食與食品工業,2015,22(2):31-34.
(收稿日期:2017-07-17 本文編輯:李岳澤)endprint