王 寧 范志朋
miRNA 是一種小的非編碼RNA,長度約22 個堿基,主要的生物學功能是通過結合目的mRNA來沉默靶基因。大多數miRNA 首先在細胞核內通過RNA 聚合酶II 轉錄,形成具有發卡樣結構的初級轉錄本,即pri-miRNA,它包含有miRNA 的序列。Pri-miRNA 通過Exportin-5(EXP-5)出核,這時稱為pre-miRNA,含有約70 個堿基的莖環結構。之后經過RNase 內切酶III-Dicer 的作用,產生miRNA 雙鏈。miRNA 雙鏈和AGO 蛋白結合進入RISC 復合體,其中一條鏈被選作成熟的miRNA[1]。miRNA 的生物學過程可以在很多層面被調控,包括miRNA 的轉錄水平,在細胞核和細胞質中分別被Drosha 和Dicer 處理,包括RNA的編輯,甲基化,尿苷化和腺苷化,以及AGO 蛋白的負載等等。miRNA 能夠在細胞質內發揮作用,也能夠被運輸到細胞核內,結合到目的基因的啟動子區域,導致目的基因的沉默或增強目的基因的表達。miRNA 還能夠結合外泌體被分泌到細胞外,作用于其他細胞發揮其生物學功能。
miRNA 是最為豐富的基因家族之一,廣泛分布在動物,植物和病毒中。一般認為,miRNA 在堿基序列2-8 識別序列相同的屬于同一個miRNA家族。多數miRNA 首先發生在細胞核內,經過RNA 聚合酶II 轉錄形成發卡樣結構的pri-miRNA,其中包含有miRNA 序列,之后經過RNase III核酸內切酶-Drosha 修剪等作用后出核。在細胞質內,經過RNase 內切酶III-Dicer 修剪作用后形成成熟miRNA。
1.1 在細胞核內的過程 Pri-miRNA 通過RNA 聚合酶II 從DNA 上轉錄形成的,包含有局部的莖-環結構,有成熟的miRNA 嵌入其中。典型的pri-miRNA 由33-35 個bp 組成,環的尾端和單鏈部分分別為5'和3'區,5'端含有7-甲基鳥苷區,3'端有poly 尾。RNase III-Drosha 通過剪切pri-miRNA 的莖環結構釋放一個長度約70個堿基的發卡樣結構的RNA(pre-miRNA)來啟動miRNA 成熟的過程。Drosha 是一種分子量約160kDa 核蛋白,和Dicer 一樣是屬于作用于特定的RNA 雙鏈的RNase III 的內切酶[2]。Drosha 的羧基端有兩個RNase III 域(RIIIDs)和雙鏈RNA 結合域,兩個RIIIDs 內二聚形成一個處理中心,兩個RNase III 域分別為RIIIDa 和RIIIDb,分別同時作用于pri-miRNA 的3'和5'端。Drosha 和共作用因子DGCR8 形成一個復合體,DGCR8 提供了RNA 結合的部位,它的C 末端能夠和Drosha相互作用,N 末端區域包含有細胞核定位的信號,它能夠通過Drosha 的中間區域來募集RNA[3]。
1.2 出核的過程 經過Drosha 的作用過程之后,pre-miRNA 被運輸到細胞質中,之后完成miRNA 的成熟過程。蛋白質exportin5(EXP5;XPO5)結合到Ran-GTP 形成轉運復合物,EXP5用一個類似于棒球手套樣的結構包裹pre-miRNA的莖的區域,并且伸出隧道樣結構識別pre-miRNA的3'過長端的2 個堿基,形成轉運復合物出核后,GTP 水解,導致復合物解體并將pre-miRNA 釋放到胞質中[4]。
1.3 在細胞質內的過程 Pre-miRNA 被輸出到細胞質中,被Dicer 內切酶在近末端環處進行剪切,釋放出一個小的雙鏈RNA。Dicer 是一種多結構域蛋白,約218kDa,屬于RNase III 家族,它可以處理各種pre-miRNA 釋放出約22 個堿基的miRNA,在小RNA 的生物學功能方面具有重要的作用[5]。Dicer 包含有六個重要的區域:螺旋酶區域,未知功能的區域(DUF283),平臺-PAZ 連接體(PPC)區域,兩個RNase III 區域和雙鏈RNA結合區域(dsRBD)。Dicer 的PPC 區域是RNA 結合區域,能夠識別dsRNA 的尾端[6]。Dicer 的C端有RNase III 結構域形成分子內二聚體的催化中心,這類似于Drosha。Dicer 的N 端解旋酶域通過與末端環的相互作用促進pre-miRNA 識別[7],并增加了某些pre-miRNA 的處理。有研究證實PPC 區域和RNase III 區域能夠作為一種“分子標尺”來控制剪切dsRNA 的大小。相比于AGO 蛋白相同的區域,Dicer 的PAZ 區域是保守的,能夠錨定在雙鏈RNA 底物3'末端過長的2 個堿基內[8]。這大概能夠剪切21-25 個堿基的長度,主要取決于Dicer 的種類和類型。
有研究發現,Dicer 剪切的核酸序列的位點會影響miRNA 的特性。對于剪切的機制,研究證實Dicer 的RNase IIIa 區域相比于RNase IIIb 區對于剪切pre-miRNA 的3'端更為敏感。pre-miRNA在RNase IIIa 區域剪切后的miRNA 的5'端避免釋放帶G 的核苷酸,更能夠釋放帶U 的miRNA。并且,Dicer 的剪切序列可能是導致miRNA 雙鏈3'端過長堿基的原因[9]。
miRNA 發揮的生物學功能可以在細胞質內沉默目標mRNA,抑制靶基因的表達,也可以在細胞核內作用,結合到目的基因的啟動子區域,導致目的基因的沉默或過表達,甚至可以結合外分泌體分泌到細胞外作用于其他細胞來發揮生物學作用。
2.1 在細胞質內miRNA 的作用 miRNA 在細胞質中作用的基石是形成了RISC 復合物-由AGO蛋白和一個單鏈miRNA 組成。miRNA 作用主要依賴于以下兩個條件:①miRNA 能夠通過Watson-Crick 互補原則特異性識別靶向mRNA。同時,可以輕易地分離和重新附著在不同的靶標上,從而對廣泛的目標分子進行連續的控制;②AGO 蛋白提供了一個非常有效的平臺,調節輔因子可以在上面結合它們的靶標。miRNA 負責識別被調控的mRNA 靶點,而AGO 蛋白的任務是確定RISC 介導的基因調控的作用模式[10]。miRNA 沉默靶標mRNA 主要通過mRNA 衰變和翻譯抑制來調節互補mRNA 的。
miRNA 介導mRNA 衰變的機制是AGO 蛋白招募182kDa(GW182)蛋白家族的甘氨酸色氨酸蛋白成員(在人類中,是TNRC6A、TNRC6B 和TNRC6C 蛋白的三核苷酸重復序列)。GW182 與聚腺苷酸結合蛋白(PABPC)相互作用,從而通過招募PAN2-PAN3 和CCR4-NOT 復合物來促進mRNA 去烯基化,導致mRNA 的不穩定[11],使mRNA 易受5'-3'外核糖核酸酶1(XRN1)的快速降解。TNRC6A-C 蛋白是一種中樞蛋白,它向靶mRNA 募集多種因子,包括PABP、CCR4-NOT和PAN2-PAN3 復合物。研究表明,導致miRNA介導的去烯基化和mRNA 衰變的主要觸發因素是CCR4-NOT 復合物,而不是PAN2-PAN3 復合物。在去烯基化后,靶mRNA 在5'-3'mRNA 衰變途徑中降解[12]。
miRNA 對mRNA 的翻譯抑制是通過抑制翻譯的起始步驟。雖然目前還不清楚miRNA 是如何抑制翻譯的,但是在過去的幾年里,有三種主要的機制被提出,包括:①GW182 介導的PABP 移位;②通過GW182 招募翻譯抑制因子;③真核生物翻譯的起始因子eIF4A 與cap 結合復合體eIF4F的分離,干擾了真核生物的翻譯過程。這些機制并非互斥的,它們可能重疊,同時發生,或以不同的動力學發生,以增強翻譯抑制的效果[13]。
2.2 在細胞核內的作用 有研究報道miRISC復合物也存在于哺乳動物的細胞核中,細胞核組分分離分析發現存在AGO 蛋白、Dicer、TRBP 和GW182/ TNRC6,在那里它們結合形成多蛋白復合物[14]。盡管Dicer 和TRBP 同時存在于細胞核內,但是加載過程似乎發生在細胞質中。目前的假設是miRNA-AGO2 的組裝發生在細胞核外,那里存在一些關鍵的負載因子。一旦建立,最小的RISC可能隨后被導入細胞核中,核RISC 似乎比細胞質RISC 小。介導miRISC 的細胞質核穿梭的機制尚未明確,有研究報道稱AGO-miRNA 復合物是通過與importin 8(IPO8)結合而導入細胞核的[15],IPO8 的沉默減少了核AGO2 的數量。AGO2 缺乏核定位信號,然而,AGO2 通過與TNRC6A 結合克服了這一缺陷。TNRC6 具有核定位信號而不是核輸出信號,并作為核-細胞質穿梭蛋白將最小的miRNA 重新定位到細胞核[16]。miRISC 可以通過一條以上的路徑到達細胞核。研究表明,miRNA的3'末端序列在確定成熟miRNA 細胞定位中有重要作用。在miRNA 的3'末端含有ASUS 元素(其中S 可能是胞嘧啶或鳥嘌呤)或者3'末端鳥嘌呤核苷酸,能夠以非模板的方式添加,優先在細胞核內定位[17]。因此,可能存在涉及基序的miRNA 核易位的機制能夠賦予特定miRNA 的核通路。這些數據表明,外源的小干擾RNA 能夠優先定位到細胞質或細胞核,其方式取決于其靶點的捕獲能力[18]。它們在細胞核和細胞質之間來回移動,直到識別目標分子。
研究證實,細胞質加工的miRNA 可以被導入細胞核內調節目的基因的表達。現有一部分miRNA已經證實能夠在細胞核內結合到靶基因的啟動子區域調節目的基因的表達[18]。研究發現,靶向基因啟動子的合成雙鏈RNA,通過RNA 活化過程激活基因表達。突變分析表明,靶向基因啟動子的雙鏈RNA 與靶向啟動子不匹配也能誘導基因的表達[19]。這說明靶向基因啟動子的RNA 不要求與靶向RNA之間具有完全互補性。這一觀察結果可以得到假設,內源性表達的miRNA 也能夠觸發靶向mRNA 的激活。有實驗證實miR-373 能夠結合靶向mRNA的啟動子,激活基因的表達[20]。
研究表明,為了使miRNA 在細胞核中發揮作用,Ago-miRNA 復合物通過與Imp8 結合導入細胞核。與啟動子序列互補的靶向miRNA 與Ago 蛋白結合,結合到染色體DNA 序列或從啟動子衍生的新生同源轉錄物上。比如,Kim 等報道了靶向miRNA 的啟動子miR-320,它是從POLR3D 基因的啟動子上轉錄的,它與基因啟動子具有良好的序列互補性。miR-320 水平與POLR3D 在不同組織中的表達成負相關,miR-320 的轉染誘導POLR3D 基因沉默,提示miR-320 靶向POLR3D的啟動子,并在細胞中指導POLR3D 的轉錄基因沉默。轉染miR-320 后,在POLR3D 啟動子處觀察到Ago1 和H3K27me3 的富集。miR-320 還誘導了組蛋白甲基轉移酶EZH2 的富集,最終導致POLR3D 的基因沉默[21]。Huang 等研究發現miRNA 能夠與小鼠細胞周期蛋白B1(Ccnb1)基因啟動子中的位點高度互補,在啟動子處募集H3K4me,激活Ccnb1 基因的表達。證明miRNA具有核功能,能夠積極影響基因的轉錄[22]。
隨著高通量測序技術的發展,越來越多的miRNA 被發現。然而,我們對miRNA 在生物體生長發育以及疾病中的調控機制認識仍然有限,miRNA 調控的機制有極大的豐富性和復雜性,總結現有miRNA 的作用機制有以下幾種:
3.1 miRNA 與蛋白的相互作用 miRNA 在成熟的過程中與多種蛋白相互作用,miRNA 的生物發生首先發生在細胞核內,RNase III 復合物DROSHA 將pri-miRNA 切割成pre-miRNA,一旦pre-miRNA 被Expotin5 輸出到細胞質,RNase III 復合物DICER/ TARBP2,識別它們發夾樣結構并加工它們以產生成熟的,約22 個核苷酸長的miRNA。隨后將成熟的miRNA 雙工體裝載到AGO2 上,促進了mRNA 誘導沉默復合物(RISC)的形成。AGO2 及其家族蛋白被認為是唯一與成熟miRNA 相互作用的RNA 結合蛋白。最近研究表明,除了AGO 蛋白還存在其他蛋白與成熟miRNA 相互作用。
人體幾乎每個細胞都包含了一系列可編程的基因沉默蛋白稱為AGO 蛋白。Argonaute 蛋白是由四個球狀和兩個連接域組成的兩個葉組成,它們共同形成一個中心的RNA 結合間隙。AGO 蛋白的N 端葉包含了N 和PAZ 區域,然而C 端葉包含了MID (middle) 和PIWI (p-body-induced wimpy testes)區域[23]。現有證據表明,miRNA 導向的種子區(g2-g7 或者g2-g8)是發現靶標的主要決定因素,結合AGO 蛋白的PIWI/ MID 區域時能夠快速識別并作用于靶標[24]。Ago 蛋白有Ago1-4 種類型的蛋白,有研究證實Ago2 通過miRNA 的種子區和補充區域(g13-g16)區域共同作用識別靶標RNA[25]。
RISC 的功能核心是由miRNA 加載到Ago 蛋白家族上形成的,Ago 蛋白是用有編碼信息的miRNA 作為引導去識別互補的mRNA 沉默靶標。RISC 復合體以接近于極限的速度和精準的方式識別靶標,避免了細胞環境中的大量脫靶[26]。
除了Ago 蛋白,成熟的miRNA 可以與包括AUF1、HuR 以及其他的蛋白相互作用,使其在miRNA 介導的基因沉默中發揮作用。
3.2 miRNA 與miRNA 的相互作用 在發現自然存在的miRNA 海綿之前,有研究小組將人工miRNA 海綿作為miRNA 抑制劑,從而抑制miRNA 下游的作用。研究表明,miRNA 能夠靶向多個基因,一個基因可以被多個miRNA 調控,這表明miRNA 與miRNA 之間存在協同調節[27]。比如,Chen 等發現miR-124 和miR-203 協同抑制透明細胞腎癌中的ZEB2 的EMT 通路[28]。Liep J 等發現miR-141-3p 和miR-145-5p 在透明細胞腎細胞癌靶基因調控中的協同作用[29]。越來越多的證據有力地表明,miRNA 的新療法可能是未來疾病治療最有前景的方法,盡管調節一些關鍵的miRNA 就可以成功地逆轉病理過程,但有研究認為miRNA 調節的內在協同作用可能會對疾病的治療有更好的療效[30]。
3.3 miRNA 與LncRNA 的相互作用 非編碼RNA 轉錄物如miRNA 和LncRNA 是重要的遺傳調控因子,但是這些轉錄本的許多功能尚未完全明了。近來研究發現,miRNA 和LncRNA 之間存在明顯的串擾,導致miRNA、LncRNA 和其他監管目標之間存在著綁定競爭。LncRNA 是通過隔離miRNAs 起作用,這導致了miRNA 沉默或者衰減靶標mRNA 的作用下調,類似于海綿的作用能夠吸收miRNA 從而下調miRNA 的表達。LncRNA作為miRNA 的功能靶點的第一個證據就是被Hansen 等提出的,細胞增殖相關蛋白CDR1 的反轉錄物CDR1as 是一種circRNA,能夠與miR-671 完美地互補。miR-671 能夠影響CDR1 的表達,提出非編碼RNA 的反義轉錄物可以直接作為miRNA 的靶點,這是提出海綿現象研究的重要的起點[31]。比如,Lang Chen 等發現LncRNAKCNQ1OT1 通過調節miR-701-3p/ FGFR3 軸促進骨折的愈合。LncRNA-KCNQ1OT1 作為競爭性內源性非編碼RNA 能夠抑制miR-701-3p 的表達,而升高FGFR3 mRNA 的水平,從而促進成骨細胞MC3T3-E1 的增殖、遷移和存活[32]。總之,LncRNA 和miRNA 在細胞的生物學活動和病毒感染、腫瘤發生等病理過程中都發揮著重要作用。
3.4 miRNA 與circRNA 的相互作用 近年來研究發現,大量的環狀RNA 是內源性的、保守的、穩定的和特異的。新的研究表明,最常見的功能是通過結合位點充當miRNA 海綿,CircRNA豐度的變化可以相應地調節miRNA 對靶基因的活性。CircRNA 海綿富含大量的miRNA 結合位點,當circRNA 過表達時,會導致miRNA 的表達量降低,從而導致miRNA 對于下游靶向mRNA 抑制作用降低,降低了下游靶基因的表達[33]。比如,Circ-MALAT1 同時作為mRNA 翻譯制動器和microRNA 海綿促進肝癌干細胞的自我更新。Yu等發現CircRNA 0003645 通過海綿作用清除肝癌細胞中的microRNA-1299 而顯示出致癌作用[34]。Circ-ABCB10 在乳腺癌組織中高表達,沉默此基因可抑制乳腺癌細胞的增殖和凋亡。Circ-ABCB10可吸附miR-1271。circRNA 對乳腺癌細胞的作用可以被miR-1271 所拯救[35]。總之,circRNA 通過海綿miRNA,在調節細胞的生物學功能方面發揮重要的作用。CircRNA 與miRNA 的相互作用在生物體的生長發育等生物學過程以及病理學過程中都發揮了重要功能。
miRNA 被認為是決定轉錄后基因沉默特異性和敏感性的關鍵因素,在調控表觀遺傳方面有重要的作用。現有研究發現miRNA 在細胞質、細胞核、甚至在細胞外發揮重要的生物學作用。因此,能夠從基因組中識別miRNA 及其靶基因,進一步推斷miRNA 的功能和調控機制,對理解生物體的生物學過程和疾病的病理過程具有重要的意義。雖然現在已經對miRNA 及其靶基因已有所研究,如miRecords[36]和Tarbase[37],但都不能反映miRNA的多樣性和豐富性。因此,對miRNA 的功能和精確的調節機制仍需進一步探索。