張 蕊
蘭州大學公共衛生學院,甘肅省蘭州市 730000
MicroRNA(miRNA)是由17~22個核苷酸組成且具有高度保守性的小單鏈RNA[1]。miRNAs不翻譯成蛋白質,主要通過堿基互補配對的方式與靶基因結合來抑制其進一步的翻譯表達,或通過RNA誘導直接降解靶標mRNA分子來調控靶基因mRNA的轉錄等方式起調控作用[2-3]。研究表明miRNAs在腫瘤、免疫性疾病、代謝性疾病、內分泌疾病等發病機制中起重要作用[4]。研究顯示,hsa-miR-20a-3p在皮膚癌、胃癌等多種癌癥的發生發展過程起重要作用[5-6]。目前對miR-20a-3p的致病分子機制仍有待研究,因此,本研究擬通過對hsa-miR-20a-3p進行生物信息學分析,為其靶點及相關疾病的致病機理的后續研究提供參考。
1.1 hsa-miR-20a-3p保守性分析 在miRbase(http://www.mirbase.org)和UCSC(http://genome.ucsc.ed)等在線數據庫查找miR-20a-3p的染色體定位信息及堿基序列,并采用MEGA 7.0軟件對比分析各物種miR-20a-3p序列間的保守性。
1.2 hsa-miR-20a-3p靶基因預測 利用Targetscan(http://www.Targetscan.org)、TarBase(http://microrna.gr/tarbase)、miRDB(http://www.mirdb.org)、miRTarBase(http://www.mirtarbase.mbc.nctu.edu.tw)四大數據庫預測hsa-miR-20a-3p的靶基因。用Venny圖法先對miRDB、Targetscan和TarBase 3者預測的靶基因求交集,此外合并miRTarBase數據庫中經實驗證實的hsa-miR-20a-3p靶基因形成靶基因集合用于后續分析[7]。
1.3 hsa-miR-20a-3p靶基因的GO功能注釋和KEGG信號通路分析 應用數據庫DAVID 6.8(http://david.abcc.ncifcrf.gov)對hsa-miR-20a-3p的靶基因集合進行GO功能(Gene ontology)注釋分析和KEGG信號通路富集分析。GO功能注釋包括細胞組分、分子功能、生物功能3大應用部分[8]。用Fisher確切概率法檢驗,P<0.05為差異有統計學意義。
2.1 各物種成熟miR-20a-3p序列的保守性分析 結果顯示hsa-miR-20a-3p基因序列號為MIMAT0004493,聚集于13q31.3染色體區域中的一個簇內,其基因位點在染色體的具體位置為chr13:91351108-91351129。利用數據庫miRbase下載Homo sapiens(人)、Capra hircus(山羊)、pteropus alecto(狐蝠)、Cavia porcellus(豚鼠)等10個物種的miR-20a-3p的成熟序列。對比分析發現miR-20a-3p成熟堿基序列中“acugcauuaugagcacuuaaag”22個堿基在各物種間高度保守,結果見表1。

表1 不同物種miR-20a-3p成熟序列
2.2 hsa-miR-20a-3p的靶基因預測結果 利用Targetscan、miRDB和TarBase 3個在線數據庫得到靶基因個數分別為4 387、716和699,通過取交集得到66個靶基因,結果見圖1a。另外,在miRTarBase數據庫中查找經實驗證實的靶基因共92個,其中有ADSS和YWHAQ兩個靶基因與上述交集重合,因此得到156個無重復的靶基因集合作為后續生物分析,結果見圖1b。

圖1 hsa-miR-20a-3p的預測靶基因個數
2.3 hsa-miR-20a-3p預測靶基因的GO功能注釋描述 GO功能注釋發現hsa-miR-20a-3p靶基因集合富集在核漿、細胞質、細胞核等9個細胞組分(P<0.05);富集在蛋白質結合、染色質結合、DNA結合等11個分子功能(P<0.05);富集在前腦形態發生、學習或記憶、器官誘導、基因表達調控等15個生物學過程(P<0.05),結果分別見表2~4。

表2 hsa-miR-20a-3p預測靶基因的細胞組分

表3 hsa-miR-20a-3p預測靶基因分子功能

表4 hsa-miR-20a-3p預測靶基因生物學功能
2.4 hsa-miR-20-3p預測靶基因的KEGG信號通路富集分析 KEGG富集分析結果顯示hsa-miR-20a-3p的靶基因顯著富集在病毒致癌、乙型肝炎、HTLV-Ⅰ(人類T細胞白血病病毒)感染等信號通路中(P<0.05),結果見表5。

表5 hsa-miR-20-3p靶基因KEGG信號通路富集分析
近年來,hsa-miR-20a-3p在癌癥等多種疾病中的差異表達已得到廣泛研究,miRNA已成為一種多效的致癌或抑癌調節因子,作用尚未完全被了解[5-6]。目前也缺乏其潛在靶點和相關功能通路的全面分析,生物信息學能快速預測miRNA靶基因集合和相關的生物功能,具有一定的可靠性。本研究通過生物信息學分析方法發現miR-20a-3p已知的成熟序列在人、獼猴、野豬、錦龜和豚鼠等多個物種間高度保守,表明其可能編碼了與生命活動密切相關的蛋白質,且可利用在豚鼠等其物種間的保守性序列,將常見的模式生物作為研究miR-20a-3p生物學作用的實驗支持工具;采用目前常用的miRNA靶基因預測方法為使用多種靶基因預測軟件進行預測,為了提高預測結果的可靠性,利用數據庫靶基因交并集來獲取所需研究的靶基因集合,本研究所得無重復hsa-miR-20a-3p靶基因共156個,GO功能分析結果顯示靶基因主要富集在核漿、細胞質和細胞核等9個細胞組分,富集在蛋白質結合、染色質結合、轉錄調控區DNA結合和損傷DNA結合等11個分子功能,富集在前腦形態發生、學習或記憶、器官誘導、代謝過程調節和基因表達調控等15個生物學過程,KEGG分析結果顯示hsa-miR-20a-3p的靶基因顯著富集在病毒致癌信號通路、乙型肝炎信號通路和HTLV-Ⅰ感染信號通路中。
已有研究表明miR-20-3p與癌癥具有密切關系,如miR-20-3p的過表達可調控靶基因CSNK2A1來促進結腸癌細胞增殖誘發結腸癌[9],通過調控CADM1來抑制部分抑癌基因的正常表達來誘發肺腺癌[10]等來發揮致癌作用,已成為多種癌癥早期篩查及預后的標志物,并成為癌癥的治療靶點。研究發現T2DM患者的促血管生成和抗血管生成hsa-miR-20a-3p豐度存在差異,這些患者血管生成受損導致血管并發癥發生的潛在機制與其靶向調控血管生成和脈管系統發育有關,且與其他miRNA產生協同調節T2DM病患者中與血管生成有關的MTDH和PDCD10的兩個基因,參與促血管生成和抗血管生成等不同的生理過程[11]。肝臟中miR-20a-3p表達顯著下調,可能因為其與c-Myc基因的激活有關,使其參與了急性缺氧應激調節[12]。研究表明miR-20a-3p在胃癌患者機體通常下調,可與β-連環蛋白信號通路之間相互作用,Wnt/β-連環蛋白信號通路的異常激活在許多惡性腫瘤尤其是胃癌的發生和發展中起著重要作用[13]。miR-20a-3p、miR-21等在研究中被報道與健康長壽相關,細胞衰老是體內固有的腫瘤抑制機制,同時也是與年齡相關的組織退化和功能障礙的主要驅動力,相關的miRNA可能會成為衰老的標志物[14]。還有研究發現在結核分枝桿菌感染期間,miR-20a-3p呈劑量和時間依賴性增加,其上調促進了細菌的胞內生長,并抑制了結核分枝桿菌感染的RAW264.7和BMDM細胞中促炎細胞因子的釋放,而miR-20a-3p的下調具有相反的效果。此外,miR-20a-3p通過直接靶向IKKβ抑制NF-κB通路的活性,從而抑制促炎細胞因子和減弱機體免疫反應,促進結核分枝桿菌的存活致病[15]。
綜上所述,研究顯示hsa-miR-20-3p所調控的部分靶基因在生命過程及疾病中的作用是值得進一步的研究和探索,本文預測與其他相關文獻報道是基本相符的,尤其是病毒致癌過程是值得進一步研究的方向,對臨床治療的新靶點提供理論基礎,靶基因預測結果有待后續實驗驗證。