陳鴻儒, 陳 聰, 曾懷才
(南華大學 公共衛生學院預防醫學系,湖南 衡陽,421001)
miRNA(microRNA)是一類廣泛存在于動植物和某些病毒內,長度為19-25 nt的內源性單鏈非編碼小RNA,序列具有高度保守性[1]。miRNA主要通過與靶基因mRNA的3’端非翻譯區(3’UTR)結合,導致翻譯抑制或者降解,進而調控靶基因的表達[2]。
has-miR-10a-5p是近年來新發現的miRNA,屬于miR-10基因家族,其聚集在染色體17長度為22 bp的位置中,具體基因位點在chr17:48 579 838-48 579 947處。近年國內外研究表明,通過與靶基因相互作用,has-miR-10a-5p作為癌基因在多種腫瘤的發生發展中發揮作用[3-7]。目前研究miR-10a-5p與腫瘤抑制和發展的相關問題越來越多,所以對miR-10a-5p進行靶基因相關生物信息學分析對今后探索miR-10a-5p功能和作用十分必要。相較于實驗驗證,生物信息學能對靶基因及相關通路進行大量多樣高速的預測。本研究運用生物信息學方法預測miR-10a-5p的靶基因,并對其靶基因集合進行功能注釋(Gene Ontology, GO )和信號通路富集分析(Kyoto Encyclopedia of Genes and Genome Pathway, KEGG Pathway),為后續對miR-10a-5p 的靶基因鑒定及生物學功能研究提供理論基礎和思路。
使用在線工具miRbase(http://www.mirbase.org/)查找miR-10a-5p的染色體定位、堿基序列及不同動物的成熟序列。并使用clustalx 2.1軟件分析物種保守性。
使用Pubmed(http://www.ncbi.nlm.nih.gov/pubmed/)查找已有文獻報道miR-10a-5p靶基因的相關信息。采用Targetscan7.1(http://www.targetscan.org/vert_71/)、miRDB(http://www. http://mirdb.org/)、 mirDIP(http://ophid.utoronto.ca/mirDIP/index_ confirm.jsp)和DIANA TOOLS(http://diana.imis.athena-innovation.gr/DianaTools/index.php)4個在線靶基因預測工具預測miR-10a-5p的靶基因,并用Venny 2.1 (http://bioinfogp. cnb. csic.es/tools/venny/index.html)繪制4個數據庫預測靶基因的韋恩圖,取交集用于后續分析。
使用在線工具DAVID(http://david.abcc.ncifcrf.gov/)對交集靶基因進行Gene Ontology功能富集分析(GO分析),細胞組分(cellular component,CC)、分子功能(molecular function,MF)、生物學過程(biological process,BP),用超幾何分布檢驗,以P<0.05為顯著性閾值,得到具有統計意義前10個GO注釋分析。
用DAVID數據庫中KEGG Pathway分析對交集靶基因進行信號通路富集分析,具有統計意義前10個信號通路。
使用miRBase數據庫檢索miR-10a-5p的成熟序列,miR-10a-5p在已知的31個物種中存在成熟序列,并且使用數據庫下載了人(hsa)、小鼠(mmu)、大鼠(rno)、斑馬魚(dre)等15個物種的成熟序列(見圖1)。利用clustalx 2.1軟件,對其序列保守性進行分析,結果表明miR-10a-5p在各物種之間具有高度的保守性的成熟序列為“uacccuguagauccgaauuugug”(見表1)。

表1 不同物種miR-10a-5p的成熟序列Table 1 Mature sequence of miR-10a-5p in different species

圖1 不同物種miR-10a-5p的成熟序列Fig.1 Mature sequence of miR-10a-5p in different species
Pubmed檢索文獻表明,miR-10a-5p通過在轉錄后水平調控其靶基因參與了多種疾病的發生發展及預后(見表2)。選用TargetScan、miRDB、mirDIP和DIANA TOOLS 4個在線數據庫預測的靶基因個數分別為341、233、660和472,用Venny 2.1對上述結果繪制韋恩圖取交集,得到79個預測靶基因的數據集(見表3)。作為后續分析的基因總集合(見圖2)。

表2 miR-10a-5p調控的靶基因參與人類疾病Table 2 miR-10a-5p target genes involved in human disease

表3 miR-10a-5p調控的靶基因數據集Table 3 Target gene data sets regulated by miR-10a-5p

圖2 miR-10a-5p的預測靶基因個數Fig.2 Predicted number of target genes of miR-10a-5p
將4個數據庫均能預測到的79個靶基因進行GO分析,發現miR-10a-5p的靶基因主要富集于核質、突觸、細胞間粘附鏈接、核基質、組蛋白甲基轉移酶復合物等10個細胞組分(P<0.05,見圖3);參與肝臟發育、脂肪組織發育、神經細胞凋亡負調控、RNA聚合酶Ⅱ啟動子轉錄的起始、RNA聚合酶啟動子轉錄的正調控、DNA模板轉錄等10個生物學過程(P<0.05,見圖4);顯著富集于染色質結合、轉錄活性激活、RNA聚合酶Ⅱ遠端增強子序列特異性DNA結合、RNA聚合酶Ⅱ轉錄因子活性配體激活的序列特異性DNA結合等9個分子功能(P<0.05,見圖5)。

圖3 miR-10a-5p靶基因細胞組分的GO功能分析Fig.3 GO function analysis of cell components of miR-10a-5p target gene

圖4 miR-10a-5p靶基因生物學過程的GO功能分析Fig.4 GO function analysis of the biological process of miR-10a-5p target gene

圖5 miR-10a-5p靶基因分子功能的GO功能分析Fig.5 GO function analysis of molecular function of miR-10a-5p target gene
利用DAVID數據庫中的工具Functional Annotation對靶基因集合進行生物通路富集分析,其中79個靶基因具有相關的生物通路。以人類全基因組為背景,發現miR-10a-5p的靶基因在cAMP信號通路、TNF信號通路及AMPK信號通路中顯著富集(見圖6)。

圖6 miR-10a-5p靶基因KEGG通路富集分析Fig.6 KEGG pathway enrichment analysis of predicted target of miR-10a-5p
近年來,與miRNA相關的內容已成為研究的熱點之一。越來越多的證據表明,miRNA能夠通過調控下游靶基因的表達從而發揮其功能,包括重要的生命活動,如細胞分化、增殖、細胞凋亡以及新陳代謝[9],并在腫瘤的發生發展、侵襲與轉移[10],以及治療、預后[11]等方面都有重要作用。而生物信息學在miRNA靶基因的預測等研究中發揮了重要作用,本研究預測靶基因使用了四種計算方法不同的miRNA靶基因預測軟件進行,考慮到miRNA與靶基因結合位點的序列保守性、序列匹配、miRNA 與mRNA 雙鏈結合的熱穩定性等因素來預測靶基因,具有高特異性和低假陽性率,將預測的靶基因取交集后作為靶基因集合,因此它作為分析的靶基因集合具有很好的代表性。
本研究中預測得到總共79個miR-10a-5p的靶基因, 靶基因存在細胞的各個組分中,具有染色質結合、轉錄活性激活、RNA 聚合酶Ⅱ遠端增強子序列特異性DNA結合和其它分子功能,并顯著富集于肝臟發育、脂肪組織發育、神經細胞凋亡負調控等生物學過程;顯著富集于cAMP信號通路、TNF信號通路及AMPK信號通路。大量研究發現,miR-10a-5p在細胞增殖和分化[11-12]過程中起著重要的調控作用,有研究發現,阿茲海默癥(AD)中淀粉樣蛋白-β或TAU病理誘導的神經元miR-10a-5p的升高[13],推測miR-10a-5p能調控神經元及突觸的轉錄[14]。研究還表明滑膜細胞中miR-10a-5p的下調有助于TBX5控制的關節炎癥[15],并起到抑制各種炎性細胞因子的產生的作用。
大量研究表明,miR-10a-5p在多種惡性腫瘤中異常表達。例如,miR-10a-5p在宮頸癌和人胰腺導管腺癌中呈現高表達[3,5]。然而,一些研究發現miR-10a-5p在多種癌細胞中低表達,如膽管癌、腎細胞癌[4,7]。近年來,一些研究證實miR-10a-5p通過調節其靶基因在抑制腫瘤細胞的增殖和轉移中起重要作用,例如miR-10a-5p可通過抑制MAPK8IP1的表達,進而促進胃癌轉移[6]。在細胞凋亡和其他腫瘤過程中,已經鑒定了miRNA表達的雙相模式(上調和下調),因此miR-10a-5p未來或許可以考慮作為腫瘤的早期診斷[16]和預后[17]的分子生物標志物及治療腫瘤的潛在靶標[18-19]。
本研究采用生物信息學方法對miR-10a-5p的GO功能富集分析和Pathway通路富集分析等數據進行系統的挖掘,結果顯示miR-10a-5p在生長發育及腫瘤發生發展過程中的作用不容忽視,且本研究結果與現有對miR-10a-5p調控作用的研究報道基本一致,說明生物信息學分析具有可靠性。這些分析為有關miR-10a-5p在各生物學過程中的作用機制后續研究提供了一定的數據支持和探索思路。但由于預測靶基因過程中仍存在不可避免的假陽性率,因此,由本次實驗結果篩選出的靶基因還需進行實驗驗證,其功能和相關信號通路也有待進一步研究。