甘海麗,洪嶺,楊鳳蓮,柳定鳳,金莉萍,鄭青亮
同濟大學附屬第一婦嬰保健院臨床轉化研究中心,上海 201204
以往認為中心法則中DNA主要發揮模板的作用而mRNA則扮演著信息傳遞的角色。mRNA表觀修飾的發現超越了mRNA僅作為信息傳遞者這一觀點。近期發現前體mRNA在外顯子剪接、5′-加帽和3′-加尾等加工過程中堿基也會發生m6A、m1A、假尿嘧啶、5′-胞嘧啶甲基化等多種化學修飾[1-3]。這些修飾將影響mRNA的剪接、出核、穩定和翻譯等mRNA代謝過程從而調控基因的表達。隨后也發現mRNA表觀修飾是動態可逆的,m6A修飾的可逆調控以及發揮生物學功能都需要特異的修飾酶 (Writer)、去修飾酶(Eraser) 以及特異性的識別修飾位點的蛋白(Reader) 的參與,這些發現為在真核生物中研究轉錄后基因表達調控機制開辟了一個新領域。在這些修飾類型中,m6A修飾是目前研究最為深入的表觀修飾,研究發現mRNA的Writer蛋白和Eraser蛋白將決定標靶mRNA的m6A修飾水平,而Reader蛋白將決定m6A修飾mRNA的翻譯[4]或影響mRNA的穩定性。由于許多mRNA在穩定性和翻譯效率方面存在顯著差異,m6A甲基化修飾可以促使其同步表達從而在短時間內產生大量效應蛋白來應對自身和外界的調控,通過加速整個mRNA的代謝過程進而快速調控細胞增殖和分化。
N6-腺嘌呤 (m6A) 是真核生物中最豐富的一種化學修飾。m6A修飾廣泛存在于各種細胞中,運用m6A特異性抗體的免疫沉淀結合高通量測序技術,發現在人類25%的轉錄子中存在約7 000個m6A修飾位點,并且主要在RRm6ACH([G/A/U][G>A]m6AC[U>A>C])保守序列上進行修飾。m6A修飾主要位于外顯子的終止密碼子附近和3′-UTRs (3′-untranslated region) 區域[5-6]。研究顯示,m6A修飾參與mRNA代謝、mRNA與蛋白相互作用等各種生理學過程。
N5-胞嘧啶甲基化 (m5C) 是一種DNA的表觀遺傳修飾方式。后來發現mRNA上也存在這種修飾方式,但mRNA上的m5C修飾比m6A要少。通過對人細胞的mRNA測序發現在線粒體中富含m5C修飾,有別于m6A的是,m5C存在于mRNA的翻譯起始點下游區域。m5C修飾后的mRNA由一種特定的m5C識別蛋白識別并在其協助下出核,因此m5C在某種程度上可以調節mRNA的出核并促進mRNA的表達[7]。線粒體中的mRNA的甲基化水平明顯高于核基因轉錄組的RNA甲基化水平,因此m5C可能在調控線粒體生理功能方面扮演著重要角色[8]。然而m5C修飾的更多生理功能及其機制還有待進一步研究。
最初發現N1-腺苷酸甲基化 (m1A) 是一種廣泛存在于tRNA、rRNA上的化學修飾,對RNA的生物學功能具有重要的調控作用。運用特異性m1A抗體免疫共沉淀結合高通量測序發現人細胞mRNA上存在1 000多個m1A的修飾位點[3]。有別于m6A的是,m1A在mRNA上特異分布于翻譯區域的起始位點附近以及第一個剪切拼接位點附近。m1A甲基化修飾能改變mRNA的二級結構,例如位于5′-UTRs (5′-untranslated region) 處的m1A能夠通過降低mRNA的二級結構的穩定性來增加翻譯效率[9]。目前m1A具體的生理功能尚不明確,需要進一步研究。
假尿嘧啶修飾 (Pseudouridine) 廣泛存在于非編碼RNA,其可穩定tRNA和rRNA的結構。通過假尿嘧啶測序發現在酵母菌和人類的非編碼RNA中存在數百個假尿嘧啶修飾位點。進一步分析發現mRNA中也存在高度保守的假尿嘧啶修飾位點,并且饑餓等環境因素可以調控mRNA上的假尿嘧啶修飾[10]。假尿嘧啶修飾可改變密碼子與反密碼子堿基配對的相互作用,因此假尿嘧啶不僅影響RNA的結構而且影響mRNA的編碼能力[11]。綜上,假尿嘧啶修飾和其他甲基化修飾一樣能調控mRNA的表達,但其具體功能仍需進一步研究。
m6A功能的調節需要相關蛋白的參與,其中主要包括甲基化酶、去甲基化酶以及m6A閱讀蛋白。
首先m6A的一個重要相關蛋白就是甲基化酶,其對應的編碼基因稱為Writers,主要包括甲基轉移酶3 (Methyltransferase-like 3,METTL3)、甲基轉移酶 14 (Methyltransferase-like 14,METTL14)、Wilms’瘤相關蛋白 (Wilms’ tumor1-associating protein,WTAP)、甲基轉移酶 16(Methyltransferase-like 16,METTL16)、RNA結合模體蛋白15 (RNA binding motif protein 15,RBM15)、鋅指結構域包含蛋白13 (Zinc finger CCCH domain-containing protein 13,ZC3H13)等,實際上甲基化酶主要是由METTL3和METTL14組成的異源二聚體結構并且與WTAP、ZC3H13等調節因子附著在二聚體上構成甲基化酶復合體。其中METTL3具有一個SAM結合區域[12]并且能夠識別特定潛在的m6A修飾位點并將SAM的甲基轉移該位點上。METTL14與METTL3結合后,在一定程度上能夠促進METTL3識別m6A。WTAP是一種剪切體相關蛋白,通過與METTL3-METTL14二聚體結合能夠使甲基化酶復合體迅速識別m6A潛在修飾位點并且活化METTL3/METTL14甲基化酶復合體[13]。此外,最近研究發現,鋅指結構 (ZC3H13) 能夠結合WTAP從而使WTAP固定存在于核內而不轉運到核外,實現強化甲基化酶復合體的目的[14],以保證足夠的甲基化酶復合體在核內對轉錄合成的mRNA進行甲基化。
其次,去甲基化酶主要包括肥胖相關基因Fat mass and obesity-associated (FTO) 和 AlkB homolog 5 (ALKBH5),其對應的編碼基因稱為Erasers。FTO起初是作為一種與肥胖相關的基因出現在人們的視線中,FTO是第一個被發現的m6A去甲基化酶,該發現證實了m6A是一個可逆的mRNA修飾過程。FTO和ALKBH5分布具有差異性,FTO廣泛存在于成人和胚胎的組織中,在大腦中表達尤其高,而ALKBH5存在于大部分組織的細胞核中。FTO能夠有效地去除mRNA上的m6A修飾并且FTO受抑制能夠增高整體mRNA的m6A修飾水平[15]。ALKBH5主要作用是使已經m6A修飾的mRNA發生去甲基化,通過參與調控mRNA的出核等代謝過程發揮其功能,其與精子的發育密切相關。
最后,m6A相關蛋白是m6A結合蛋白,其編碼基因被稱為Readers,主要包括YTH同源結構域蛋白家族:YTH結構域家族1 (YTH domain family 1,YTHDF1)、YTH結構域家族2 (YTH domain family 2,YTHDF2)、YTH結構域家族3(YTH domain family 3,YTHDF3)、YTH結構域包含蛋白1 (YTH domain-containing proteins 1,YTHDC1)、YTH結構域包含蛋白2 (YTH domain-containing proteins 2,YTHDC2) 和核不均一核糖核蛋白 (Heterogeneous nuclear ribonucleoproteins C,HNRNPC) 等,YTHDC1主要能夠通過結構域與特定的m6A位點結合或者與剪接調控因子結合影響m6A修飾的mRNA的出核和剪接[16]。HNPNPC家族的蛋白同樣也可以直接或間接地調控mRNA的選擇性剪接和mRNA結構的改變[17]。YTHDF1與mRNA上的m6A結合提高相應的mRNA翻譯效率[18]。YTHDF2主要作用則是促進mRNA的降解[19]。有趣的是,YTHDF3與YTHDF1結合時能夠增強其翻譯能力,而YTHDF3與YTHDF2結合時又能促進其促降解能力。YTHDC2是一種具有螺旋酶結構域和蛋白重復結構域的reader,由于這種特殊的結構使其具有調節RNA結合效率、調控RNA結構以及同時結合多種蛋白的特點,其能夠促進mRNA的翻譯[20]。
這些m6A相關蛋白以及影響因子相互作用影響m6A水平,進而影響mRNA的剪接、出核、翻譯、降解和表達等各個方面,從而影響細胞的分化、凋亡等生命過程。
m6A廣泛存在于各種細胞中,m6A相關蛋白和甲基化調節因子以及m6A的識別蛋白相互作用構建了一個調節m6A基因表達的網絡,m6A在mRNA的剪接、出核、翻譯、降解和結構變化等方面發揮著重要的調控作用 (圖1)。

圖1 m6A修飾參與調控mRNA代謝的模式圖Fig.1 Function of m6A in mRNA metabolism.
前體mRNA成熟為mRNA的過程主要包括5′端加帽、3′端加尾以及內含子剪接3個部分。研究表明m6A主要集中存在于前體mRNA的內含子并且m6A的甲基化酶和Reader蛋白主要存在于核內[16],因此可以推測甲基化過程主要發生在核內并且在核內調控mRNA的選擇性剪接。研究發現敲除METTL3后,m6A水平下降,精子來源的相關基因發生錯誤剪接進而表達下調,說明經METTL3修飾的m6A能夠調控多功能基因的選擇性剪接和睪丸中基因的表達從而調控精原細胞分化和精母細胞形成[21]。WTAP作為甲基化酶復合體的一部分,敲除后的甲基化酶復合體對mRNA的甲基化效率降低,m6A水平下降也會導致mRNA的選擇性剪接異常。m6A去甲基化酶FTO通過去除RNA上的m6A以及阻止SR蛋白與mRNA結合來調控RNA的選擇性剪接,SR蛋白是一種參與調控可變剪接的重要調控因子,例如FTO能夠阻止SRSF2與mRNA結合從而調控mRNA的剪接以及轉錄。FTO傾向于結合靠近外顯子選擇性剪接區域的內含子區域,結合了FTO的內含子處m6A水平下降并且抑制了SRSF2與mRNA的結合,因此該處內含子后面的外顯子不能進行選擇性的剪接以及轉錄表達,這一過程稱之為外顯子跳躍[22]。
此外一些閱讀蛋白也可以通過抑制或促進SR蛋白家族的成員與mRNA結合來調控mRNA的剪接。例如YTHDC1促進SRSF3和抑制SRSF10與mRNA結合來影響mRNA的剪接,通過識別XIST (X染色體失活基因) 上的m6A來使X染色體沉默[23]。m6A不僅僅通過Reader蛋白等來影響mRNA的選擇性剪接,還能夠直接調控mRNA選擇性剪接。
總之,m6A是一個動態的調控系統,通過快速改變m6A修飾位點甲基化水平,影響其與甲基化酶、去甲基化酶和Reader蛋白等相互作用來影響mRNA的剪接。
mRNA的出核是連接mRNA轉錄和翻譯的關鍵步驟同時能選擇性地調控基因表達。據報道m6A甲基化能加快mRNA的出核,YTHDC1結合SRF3和NXF1 (核ENA輸出因子) 會促進m6A修飾mRNA的出核。敲除METTL3,m6A水平下調,mRNA的出核受阻,表達受抑制,而敲除ALKBH5對m6A去甲基化作用減弱,m6A的水平提高,mRNA結合readers和調控出核的影響因子促進mRNA的出核[24]。本課題組發現過表達ALKBH5后能引起抗病毒轉錄子mRNA的核滯留,從而抑制抗病毒轉錄子的表達[25]。綜上表明m6A促進mRNA的出核可能是其調控基因表達的重要方式,但其具體機制仍有待研究。
據報道YTHDF1結合m6A修飾的mRNA并且招募翻譯起始因子復合體eIF3促進mRNA的翻譯。該過程是依賴METTLE3甲基化酶活性以及YTHDF1-eIF3通路[26]。研究發現YTHDC2的YTH和R3H結構域能夠促進其與細胞的RNA的結合并且與小核糖體相互作用從而促進mRNA的翻譯[27],表明m6A可以通過不同的分子機制來調控mRNA的翻譯。
降解是mRNA代謝調控的重要步驟,m6A能夠降低mRNA的穩定性,mRNA經過m6A修飾后可能被迅速降解。METTL3或METTLE14敲除后m6A水平下降,mRNA降解效率降低,表達水平增高[13]。研究表明,METTL3缺失的幼稚T細胞中的細胞因子誘導性SH2結構域包含蛋白(Cytokine inducible SH2 containing protein,SOCS或CISH) 家族基因的mRNA降解速度較慢,從而使mRNA和蛋白表達水平升高,SOCS基因家族主要負責編碼STAT信號抑制蛋白,敲除METTL3后SOCS高表達,STAT信號抑制蛋白增加從而抑制IL-7介導的STAT5活化以及T細胞的穩態增殖和分化[28]。
另外YTHDF2的羧基末端YTH結構域能選擇性地結合甲基化mRNA,而YTHDF2的氨基末端的結構域能將結合的mRNA轉運到RNA降解器中進一步降解[29]。RNA降解器是由細胞內許多因子組成且能夠降解mRNA的復合體,在RNA降解器上存在一些降解mRNA的酶,能夠對已經翻譯或錯誤翻譯、不能翻譯的mRNA進行不同途徑的降解。敲除YTHDF2后,mRNA的穩定性提高并且標靶mRNA表達水平提高,提示m6A能夠影響mRNA的降解。總之,m6A可以降低mRNA的穩定性并且促進含有m6A的mRNA的降解從而調控基因的表達。
m6A可以改變mRNA的結構使其更易與核不均一核糖核蛋白C (HNRNPC) 和核不均一核糖核蛋白G (HNRNPG) 結合,例如肺腺癌轉移相關轉錄子1 (Metastasis associated lung adenocarcinoma transcript 1,MALAT1) 和CDP二酰基甘油合成酶2 (CDP-diacylglycerol synthase 2,CDS2),這些mRNA發生m6A修飾后雙鏈結構容易被打開并暴露單鏈的U核苷酸位點,該位點被HNRNPC識別后調控這些基因的剪接[17]。這種由于m6A修飾所引起的結構重塑而影響mRNA與蛋白結合的現象稱為m6A開關 (m6A switch)。m6A開關廣泛存在于轉錄組中,通過調控mRNA與結合蛋白之間的結合從而發揮相應的生物學功能。
干細胞是一種具有向不同類型細胞分化能力的多能細胞,正常細胞分化是生物體發育的重要環節,分化障礙會導致各種嚴重疾病的發生。多種編碼發育調控因子轉錄本的穩定性和表達水平與m6A的水平呈負相關。METTL3或METTL14下調后,m6A水平下降,維持細胞多能性的轉錄因子高表達,胚胎干細胞的自我更新能力顯著降低[30-31]。據報道小鼠胚胎干細胞NANOG (細胞多能性編碼因子) mRNA上存在多個METTL3的結合位點,敲除METTL3,多能性細胞多能性編碼因子的m6A修飾水平下降,胚胎干細胞自我更新以及分化能力受到抑制,胚胎干細胞還保留著一部分原始細胞的狀態,在種植后由于外界狀態的改變以及部分基因程序的啟動,導致胚胎死亡[32]。
另外,低氧環境下乳腺癌腫瘤細胞中高表達ALKBH5,使得關鍵因子NANOG發生去甲基化,m6A水平下降,從而提高mRNA的穩定性以及表達水平,進一步促進了癌細胞的增殖,調控乳腺癌腫瘤細胞的分化[33]。另一種RNA去甲基化酶FTO在急性白血病患者中呈高表達,實驗證明FTO通過降低m6A水平增強了白血病細胞的增殖和分化,抑制了細胞的凋亡,顯著增強了白血病致癌基因介導的正常造血干細胞向病態細胞的轉化[34]。脂肪細胞中FTO能通過調控m6A的水平進而影響可變剪接調控因子SRSF2與FTO的結合,影響脂肪形成關鍵基因的選擇性剪接從而調控前脂肪細胞的分化[35]。綜上表明m6A表觀相關酶在調控干細胞或腫瘤細胞的分化發育方面發揮重要的作用。
在低氧、營養不良等極端環境中,機體需要快速應對外界環境變化而需在mRNA轉錄后水平上進行調控,而不是重新合成新的mRNA。在熱休克狀態下,YTHDF2定位于核內并且可以抑制FTO與mRNA的結合,阻止mRNA的去甲基化,從而確保5′-UTRs端有足夠的m6A,5′-UTRs端的m6A能推動帽子端的獨立翻譯過程,提高相關蛋白的形成。
除此之外,YTHDF1能使應激顆粒局限于核內,應激顆粒是由一些蛋白包裹mRNA和蛋白顆粒形成的,在YTHDF1的作用下,應激顆粒向胞內聚集導致蛋白不釋放和mRNA不表達,等應激源消失后,應激顆粒重新解聚釋放,被包裹的mRNA重新表達[36],這種機制可以避免應激源誘發的炎癥反應的發生并且對損傷后的修復有一定的幫助。此外,在遺傳上定義的永生化和致癌轉化的人乳腺上皮細胞中,過表達MTTLL3和METTL14或敲除ALKBH5能增加m6A的水平并促進細胞增殖和遷移。永生化和致癌轉化細胞中的m6A水平隨著缺氧而增加,提示在應激狀態下細胞可以調節m6A水平從而應對應激源的攻擊[37]。本課題組在機體應對病原體入侵這一應激環境中作了一些工作,發現ALKBH5在巨噬細胞的固有免疫反應中發揮重要作用,在病毒感染后,核蛋白DDX46可以招募ALKBH5,使得抗病毒轉錄子發生去m6A甲基化修飾而被滯留在核內并抑制其表達,從而抑制巨噬細胞的抗病毒天然反應。我們目前在m6A修飾如何參與胚胎滋養細胞應對病原體入侵方面也進行了深入研究,并取得了一些重要進展。另有研究發現,在感染KHSV病毒的細胞中,細胞的整體m6A水平下調而病毒本身轉錄子的m6A水平卻上調,而當m6A修飾酶被敲除之后KSHV病毒裂解的催化因子ORF50表達會受到抑制,而YTHDF2和METTL3敲除后會增加ORF50的水平而起到抗病毒的作用[37]。綜上所述,m6A參與調控在熱刺激或低氧等環境下細胞的生理功能狀態。
據報道在哺乳動物生理節律的研究中首次發現了m6A對細胞功能的影響。生理節律的維持涉及到基因表達的負反饋環路,然而研究表明只有五分之一的節律基因是需要重新轉錄合成[38],表明轉錄后水平的基因調控在生物節律調控中發揮重要作用。節律基因和時鐘輸出基因的轉錄本均可以發生m6A甲基化修飾,METTL3敲除后導致兩個關鍵時鐘基因 (PER3和芳基烴類受體核易位體樣蛋白1,ARNTL) mRNA的m6A水平下降使出核受阻,導致周期蛋白表達減少、細胞生理周期延長,細胞凋亡能力下降。這表明mRNA的m6A修飾改變將對細胞的生命周期產生深遠的影響[39]。以上報道表明m6A在調控細胞節律方面發揮重要作用,但其具體機制還有待進一步的研究。
mRNA上的m6A修飾主要特征是其廣泛存在性、分布獨特以及動態可逆性,研究發現m6A修飾通過調控mRNA代謝過程的各個方面,影響mRNA的蛋白表達,參與調控細胞分化、應激反應、生物節律等細胞生物學過程,調控失常將導致各種疾病的發生。因此研究清楚m6A的動態修飾規律及其如何影響細胞生物學功能的具體分子機制尤為重要。
我們認為以下幾方面可能是未來研究的重要方向:1) 隨著研究的深入,發現人類基因中盡管有超過7 000個m6A修飾位點,但是還有很多符合保守序列 (RRACH motifs) 的潛在m6A位點并沒有被修飾,表明m6A甲基化修飾作為轉錄后調控機制還存在著更大的潛力。m6A在轉錄本上的分布是呈不均勻以及具有組織特異性。這些特征意味著轉錄本上每一個m6A修飾位點均處于甲基化和未甲基化的動態平衡狀態,從而使機體對外界的刺激能夠作出迅速的反應,那么機體是如何特異性地維持這種甲基化的動態修飾狀態呢?是依賴于修飾位點附近特異的堿基序列還是特異性的Reader蛋白呢?2) mRNA的m6A甲基化修飾能選擇性地調控特異mRNA的代謝以及調控在細胞分化過程中細胞狀態的改變。那么如何實現選擇性地與特異mRNA結合,以及甲基化酶、去甲基化酶和Reader蛋白在應對不同的信號通路調控時是如何協調的機制仍然不清楚,需要深入研究,因為任何一個環節的缺失都可能會誘發疾病的發生。3) m6A僅是mRNA轉錄后修飾的一種方式。除了m6A外,還有m1A、m5C、假尿苷pseudouridine等。每一種化學修飾均可能擁有相關的特異修飾酶、去修飾酶和Reader蛋白,或許這些蛋白能共同作用于多種修飾。mRNA經過化學修飾后,也需要通過相關蛋白共同作用來調控基因的表達,那么尋找這些特異的修飾相關蛋白將是一個非常重要的方面。4) 隨著mRNA的化學修飾領域不斷的擴展,如何能夠直接、及時地檢測到這些化學修飾是否存在及其作用位點并及時進行干預,對于生物的發育、疾病的控制有重要的意義。mRNA測序技術的進一步發展將會是認識各種動態修飾的關鍵一步。