陳映宏 劉 超
中國科學院動物研究所干細胞與生殖生物學國家重點實驗室,北京 100101
DNA甲基化是被研究得最多的表觀遺傳修飾之一,組成DNA的4種堿基均可發生甲基化修飾。哺乳動物中胞嘧啶甲基化主要發生在一些基因5'區域的CpG島上,由S-腺苷甲硫氨酸提供甲基基團,由DNA甲基轉移酶(DNA methyltransferases, DNMTs)催化,在胞嘧啶第5位碳原子上加上一個甲基基團,形成 5-甲基胞嘧啶(5mC)[1-2]。DNMT1、DNMT3A/B和DNMT3L負責生成和維持5mC:DNMT1以半甲基化的DNA為模板維持DNA全甲基化狀態;DNMT3A/B和DNMT3L作為從頭甲基化酶可以催化DNA發生從頭甲基化[3-4]。5mC機制是研究得最成熟和理解得最透徹的表觀遺傳修飾之一,在哺乳動物基因組中,大約60%~80%的CpG二核苷酸的胞嘧啶被甲基化[2,5-6]。5mC在基因的表達調控、染色質的結構變化、基因印跡、X染色體失活和基因組穩定性等生命過程中起著極為重要的作用[7]。近期發現的5mC通過TET家族蛋白氧化形成的5-羥甲基胞嘧啶(5-hydroxymethylcytosine,5hmC)及其進一步氧化產生的代謝衍生物5-甲酰基胞嘧啶(5-formylcytosine, 5fC)和5-羧基胞嘧啶(5-carboxylcytosine, 5caC)也參與眾多的生命過程[8-12]。
6mA于1968年在細菌中被鑒定[13]出來,是原核生物中最普遍的DNA修飾。早期的研究發現6mA存在于原核生物中參與調節DNA復制的起始:以大腸桿菌為例,大腸桿菌復制起始位點oriC包含11個GATC/CTAG重復序列,腺嘌呤被DNA腺嘌呤甲基轉移酶(DNA adenine methyltransferase, Dam)催化形成6mA,起始DNA的復制。復制后半甲基化oriC位點無法再次起始復制,直到Dam將oriC位點恢復成全甲基化狀態,進而起始下一輪DNA復制[14-15]。6mA參與堿基錯配修復:在細菌DAN復制中存在堿基錯配,例如A-C錯配,6mA允許DNA錯配識別機制(MutHLS mismatch repair complex)區分模板鏈和新合成的子鏈,然后堿基錯配修復系統以甲基化的母鏈為模板去替換未甲基化子鏈上的錯配堿基[16]。由Dam介導的對于基因表達調控序列中GATC基序的腺嘌呤的不同甲基化修飾狀態均參與基因的表達調控,如位于大腸桿菌agn43基因上游的操縱子的全甲基化GATC基序可以調控該結構基因的表達,位于大腸桿菌dnaA基因啟動子的全甲基化GATC基序可以調控該基因的表達,位于IS10轉座子的啟動子區的半甲基化GATC基序有利于IS10轉座子表達轉座酶,位于pap基因上游激活序列(upstream activating sequence, UAS)的全甲基化或未甲基化GATC基序可以調控該基因處于不同狀態[17]。在細菌和古生菌中,6mA還作為限制性修飾(restriction-modification systems)系統(Types I、II、III)的一部分參與防止噬菌體和質粒等外源DNA的入侵。具體而言,宿主細胞DNA中存在的6mA可以阻止DNA甲基化敏感的限制性內切酶對其基因組的消化。相比之下,外源的非6mA甲基化DNA在進入宿主細胞時會被限制性內切酶降解。此外6mA在調節細菌類核分離、細菌毒素的分泌、細菌接合、細菌細胞周期等多種生命活動過程中扮演了重要的角色[18-20]。
在過去的幾十年中,6mA逐漸被報道存在于多種低等[21]和高等真核生物[4]中。通常,原核生物中6mA含量(6mA/dA)高于真核生物。
低等真核生物如衣藻(Chlamydomonas reinhardi)[22]、團藻(Stylonichiamytilius)[23]、雙小核草履蟲(Paramecium Aurelia)[24]、梨狀四膜蟲(Tetrahymena pyriformis)[25]、 嗜熱四膜蟲(Tetrahymena thermophila)[26]等綠藻類和原生動物的基因組都有6mA存在。以嗜熱四膜蟲等具纖毛原生動物為例,其顯著特征是在同一細胞內存在一大一小兩種不同的細胞核:二倍體生殖核和多倍體營養核。6mA僅在營養核中被發現,而生殖核中未檢測到6mA存在;6mA主要分布于ApT回文序列中,6mA含量為0.8%,還發現6mA存在于相鄰兩個核小體之間的連接DNA中[27-29]。由于研究技術的限制,6mA在真核生物基因組中的精確含量和分布模式一直鮮有報道。直到2015年Fu等使用特異性抗體與限制性內切酶結合高通量測序技術,即6mA-IP-seq(6mA-immunoprecipitation sequencing)、6mACLIP-exo(6mAchromatin immunoprecipitation followed by exonuclease digestion)、6mA-RE-seq(restriction enzyme-based 6mA sequencing),發現衣藻84%的基因中存在6mA,并且他們發現6mA主要位于轉錄起始位點(transcription start site, TSS)周圍的ApT回文序列中,6mA主要位于TSS位點并在TSS位點上下游呈現雙峰分布,這種分布模式與基因的轉錄激活相關[30]。這些結論與先前在嗜熱四膜蟲的研究中得出的結論具有相似性[28]
在真菌界中也發現了6mA的存在。1986年Rogers等采用高效液相色譜法分析產黃青霉菌(Penicillium chrysogenum)的堿基成分,發現產黃青霉菌基因組中存在6mA,但不存在5mC[31]。2017年Mondo等采用單分子實時測序技術(single-molecule real-time sequencing,SMRT-seq)對16種不同真菌的基因組進行單分子長讀長測序,從單堿基分辨率水平上分析全基因組范圍內6mA的含量與分布模式,發現在雙核菌亞界[子囊菌門(Ascomycota)和擔子菌門(Basidiomycota)]中6mA含量較低,為0.048%~0.210%,而在早期分化系真菌基因組中6mA含量高達2.8%。同時該研究發現在早期分化系真菌基因組中,幾乎所有的6mA都對稱分布于ApT回文序列中,這與嗜熱四膜蟲和衣藻中的發現類似。其中80.0%~99.6%的6mA密集地分布在進化保守基因與活躍表達基因的TSS位點周圍并形成甲基化腺嘌呤簇(methylated adenine clusters, MACs)。對比分析發現6mA與5mC的分布呈現負相關關系,6mA主要富集于TSS位點,5mC更多的分布于重復元件(repetitive elements, REs)[32]。
對于高等真核生物而言,也早已有證據表明在蚊子[33]和水蠟蟲[34-35]中存在6mA。之前對于秀麗隱桿線蟲DNA甲基化的研究中,由于有關5mC存在的實驗缺乏可重復性[36]以及未檢測到胞嘧啶DNA甲基轉移酶的線蟲同源物,因此秀麗隱桿線蟲中可能不存在DNA甲基化[37]。Greer和Shi等人使用SMRT-seq和超高效液相色譜—三重四極桿串聯質譜技 術(ultra-high performance liquid chromatographytriplequadrupole mass spectrometry, UHPLC-MS/MS)等多種方法,發現秀麗隱桿線蟲基因組DNA中比較均勻地分布著6mA,未發現明顯的富集區域,6mA的含量在0.01%~0.40%之間,分析發現6mA顯著定位在AGAA和GAGG基序[38]。
前期研究發現果蠅基因組中5mC的含量極低[39]。Zhang等用6mA特異抗體和斑點印跡實驗在果蠅胚胎發育的早期階段發現了強烈的6mA信號。隨后他們使用UHPLC-MRM-MS/MS檢測果蠅胚胎發育不同階段的6mA含量變化,發現在0.75hr階段DNA中6mA的含量達到峰值為0.07%,到4~16hr階段DNA中6mA的含量達到極低值為0.001%[40]。
早在1983年就有間接的證據表明6mA可能存在于哺乳動物中[34,41-42]。2006年Ratel等檢測小鼠多種組織發現小鼠中幾乎不存在6mA修飾[43]。但在2016年Wu等利用SMRT-ChIP研究哺乳動物小鼠胚胎干細胞組蛋白變體H2A.X的沉積區域[44]時發現了小鼠胚胎干細胞基因組中存在6mA,并且6mA主要位于組蛋白變體H2A.X的沉積區域的基因間區,存在于多種基序中[45]。2017年Schiffers等利用UHPLC-MS檢測了目前報道的多種具有表觀遺傳相關性的DNA甲基化修飾,高靈敏度的質譜分析表明6mA極有可能不存在于小鼠基因組中[46]。對斑馬魚和豬基因組中的6mA的研究表明,兩者卵細胞基因組中的6mA含量顯著高于精子基因組中的6mA,兩者早期胚胎發育過程中6mA的含量能夠積累到較高水平0.10%~0.17%,當胚胎發育到囊胚期的時候6mA的含量下降到極低水平0.006%~0.050%,這說明6mA在脊椎動物胚胎發育過程中是一種動態的表觀遺傳修飾。隨后對6mA在斑馬魚基因組中的分布進行研究發現6mA在斑馬魚基因組中普遍存在,富集于外顯子和基因間區,并且80%左右的6mA分布于重復元件,尤其分布在簡單重復序列中[47]。2016年Koziol等報道6mA以非常低的水平(0.00009%)存在于非洲爪蟾中,并且在轉錄起始位點缺失[48]。
2018年Xiao等利用“華夏一號”的測序數據[49],分析鑒定出6mA廣泛存在于人類基因組中,6mA總含量約為0.051%,其中X染色體(0.023%)和Y染色體 (0.024%)的含量最低,線粒體(0.184%)中含量最高,6mA富集于外顯子并與基因的激活表達相關,富集基序為[G/C]AGG[C/T][50]。Xie等應用UHPLC-MS/MS等技術發現惡性膠質瘤干細胞中6mA的水平相比于正常的人類星形膠質細胞升高了100多倍,6mA富集于基因間區并與H3K9me3和H3K27me3共定位在異染色質區域[51]。
在高等植物中也發現了6mA的存在。Vanyushin等在1988年報道了6mA存在于黃化小麥幼苗的線粒體DNA中[52]。2018年Zhou等采用質譜,6mA-IP-seq和SMRT-seq等技術發現在水稻基因組中6mA含量達0.2%,6mA主要分布于水稻基因組約20%的基因中和14%的轉座子元件并富集在GAGG基序,并且6mA的分布與基因體區域中CG位點的5mC和轉座子的CHH位點的5mC密切相關[53]。
在2002年Ashapkin等利用限制性內切酶消化的方法發現6mA存在于擬南芥Drm2基因的一些GATC基序中[54],但他們并未闡明6mA在全基因組范圍的分布特征。隨后在2018年發現6mA廣泛存在于擬南芥基因組中并富集于著絲粒周圍的異染色質區域,6mA在外顯子的富集程度高于基因間區,此外6mA在TSS位點附近也呈現出類似于衣藻中的雙峰分布模式,6mA在擬南芥的不同組織器官中的含量具有異質性,6mA含量最高達0.138%,最低為0.006%,并且在擬南芥的發育過程中6mA的含量是動態變化的[55]。表1總結了6mA在部分原核生物和真核生物中的含量與富集基序。

表1 6mA在部分原核生物和真核生物中的含量與富集基序

續表
這些文章所報道的極低含量的6mA,是進化的殘余,或是細胞內的異常修飾,還是實驗樣本中有細菌污染或者支原體污染,仍然有探究的余地。
在真核生物中6mA富集的基序具有一定的進化保守性,如AGG基序相對高頻率地存在于擬南芥、水稻、線蟲、非洲爪蟾和人類基因組中,這提示我們真核生物保守的AGG基序可能具有類似的生物功能,或者有類似的識別AGG基序的機制存在。6mA富集的基序和相關的生物學功能之間的精確的關系還有待確定。但是6mA富集的基序在同一物種內或不同物種間仍然存在很大的異質性,這啟示我們在進化的過程中可能出現了多種添加、去除和識別6mA的酶類并且可能存在多種調控6mA動態變化的機制。
真核生物中6mA甲基轉移酶方面的研究長期以來都是空白。有研究分析了真核生物中DNA甲基化的酶系,預測了多種可能參與6mA修飾的結構域[19][56]。
有報道稱植物蛋白Wadmtase參與小麥線粒體6mA修飾[57],而Wadmtase是一種Mg2+- Ca2+依賴的酶,屬于tRNA甲基轉移酶TRM11家族,該家族蛋白甲基化tRNA上的鳥嘌呤形成m2G[56],因此Wadmtase是否真正參與6mA修飾還需更多證據進行證明。
在線蟲中敲除Damt-1基因能降低6mA的水平,而過表達該基因能增加6mA的水平。DAMT-1是在真核生物中保守的MT-A70家族蛋白的同源物[38],METTL3和METTL14是MT-A70家族蛋白的兩個同源物,二者作為甲基轉移酶形成異二聚體介導mRNA產生m6A,而METTL3和METTL14也能在體外修飾DNA產生微弱的6mA[58];而且哺乳動物METTL4也與線蟲DAMT-1是同源物[19],并且Kweon等最近也鑒定了小鼠METTL4也可以催化6mA的形成,在小鼠中敲除METTL4基因后導致新生小鼠整體發育不良和面部畸形(包括下頜畸形和無眼畸形),也會導致成年小鼠在10~12周就表現出垂死狀態和造血功能異常[59];可見MT-A70家族蛋白在6mA的甲基化中扮演了重要的角色,因而研究人員推測該家族蛋白也許還包含其他未被鑒定的6mA甲基轉移酶。
在胃癌和肝癌組織中鑒定了N6AMT1是6mA的甲基轉移酶[50],相反的是在惡性膠質瘤干細胞中敲除N6amt1基因和體外實驗均未發現6mA的水平變化[51],結合先前發現的N6AMT1作為哺乳動物翻譯終止因子eRF1的谷氨酰胺特異的甲基轉移酶[60],N6AMT1是否普遍作為哺乳動物6mA的甲基轉移酶還存在爭議,需要更多的實驗證據闡明其功能。
表觀遺傳修飾往往是受到動態調控的可逆過程,DNA甲基化也不例外。在真核生物中存在6mA甲基轉移酶,則必定存在6mA去甲基酶。AlkB家族是進化保守的、Fe(Ⅱ)和α-酮戊二酸依賴的雙加氧酶家族。AlkB家族蛋白具有廣泛的底物和多種功能,在大腸桿菌中AlkB雙加氧酶通過對腺嘌呤1號和6號氮原子進行氧化脫烷基作用逆轉DNA的烷基化損傷發揮DNA損傷修復的作用,6mA也是AlkB雙加氧酶的底物,在氧化作用下經過中間產物HO-6mA生成腺嘌呤[61-62]。哺乳動物AlkB雙氧酶家族共有9個成員,ALKBH1-8和FTO,其中ALKBH5和FTO是mRNAm6A的去甲基酶,ALKBH2和ALKBH3均參與DNA 1mA和3mC的去甲基化[63-64]。ALKBH1及其同源物在多種真核生物中被發現具有6mA去甲基酶的作用。在線蟲中發現AlkB家族蛋白同源物NMAD-1參與6mA的去甲基化,敲除Nmad-1基因或體外實驗發現6mA的水平顯著變化[38]。
在果蠅中發現DMAD參與調節6mA的去甲基化,并證明了DMAD促進果蠅早期生殖細胞分化,是果蠅發育所必需的蛋白,DMAD是果蠅CG2083基因編碼的一種含有多個功能結構域并且進化高度保守的蛋白,DMAD類似于哺乳動物TET家族蛋白,但在果蠅體內卻并不參與催化5mC形成5hmC;更值得注意的是DMAD含有與細菌6mA去甲基化酶AlkB家族蛋白具有相似的DSBH(double-strand α-helix)結構域。在果蠅胚胎發育的早期DMAD低表達,而在后期高表達,此外胚胎發育過程中DMAD介導的6mA去甲基化還與轉座子表達抑制相關[40]。
在小鼠中Alkbh1基因缺失導致胚胎致死和產仔率下降80%,在Alkbh1基因純合缺失的小鼠胚胎干細胞系中發現6mA的含量增加,體外實驗發現重組ALKBH1蛋白能有效降低6mA的含量,因此在小鼠中ALKBH1作為去甲基酶調節6mA的動態變化[45]。此外Kweon等通過斑點雜交實驗發現小鼠ALKBH4能有效地使雙鏈DNA上的6mA發生去甲基化,但對單鏈上的6mA去甲基化效果不顯著[59]。
人類ALKBH1蛋白與小鼠ALKBH1蛋白的序列同源性很高,在胃癌和肝癌組織發現6mA含量降低的同時ALKBH1表達上調,因而研究人員推測ALKBH1是6mA的去甲基酶;敲降和異位表達ALKBH1均能使6mA含量降低,結合體外實驗進一步證明ALKBH1是人類6mA的去甲基酶[50]。Xie等也用多種方法鑒定了ALKBH1是6mA的去甲基酶作為轉錄激活因子識別6mA富集位點移除6mA從而解除6mA對基因表達的抑制作用,敲降ALKBH1導致6mA含量增加從而抑制抑癌基因的表達,進而促進惡性膠質瘤干細胞的存活,因此ALKBH1可以作為潛在的癌癥治療靶點[51]。
Zhou等利用CRISPR/Cas9等技術鑒定了ALKBH1在水稻中的同源基因OsALKBH1(LOC_Os03g60190—)是水稻6mA的去甲基酶[53]。以上發現的哺乳動物ALKBH1及其在果蠅和水稻中的同源物蛋白都具有相似的DSBH結構域作為核心催化結構域,提示我們更多具有6mA去甲基化作用的含有DSBH結構域的雙加氧酶在真核生物中還有待被發現。此外,果蠅去甲基酶DMAD是TET家族蛋白的類似物這一事實也提示我們,在基因組5mC含量極低或者缺失的真核生物中TET家族蛋白及其同源物或類似物可能不參與5mC動態調節,而參與6mA的代謝調節。
目前已經在小鼠中發現了2種6mA閱讀蛋白ASXL1和MPND,兩者都是哺乳動物中與原核生物6mA閱讀蛋白具有同源結構域的蛋白。體外Pull-down實驗證明ASXL1和MPND能結合含有6mA的雙鏈DNA[59]。當ASXL1和MPND與6mA結合時,E3泛素連接酶TRIP12會識別這兩種蛋白并促進它們通過泛素化途徑降解,從而維持6mA抑制基因表達的狀態。
RNA m6A的相關調節酶:包括編碼器(writers)—m6A甲基轉移酶METTL3、METTL14、WTAP、KIAA1429,消碼器(erasers)—m6A去甲基酶FTO、ALKBH5和閱讀器(readers)—m6A 閱 讀 蛋 白 YTHDF1、YTHDF2、YTHDC1、HNRNPA2B1、HNRNPC等已經有大量相關研究報道[65]。對于真核生物中6mA的甲基轉移酶、去甲基酶和閱讀蛋白已經有一些報道。不同生物中的6mA調節酶如表2所示。

表2 6mA的甲基轉移酶、去甲基酶和閱讀蛋白表
目前對于6mA修飾在真核生物中的功能的報道較少。已有的研究表明6mA參與基因和轉座子表達的激活或抑制、跨代遺傳與胚胎發育、組蛋白修飾與核小體定位、癌癥與精神類疾病等生理病理過程。
嗜熱四膜蟲在營養生長、分化和增殖過程中生殖核的DNA處于轉錄失活狀態,營養核的DNA處于轉錄激活狀態,而6mA只存在于營養核中,因此研究人員推測6mA是營養核基因轉錄激活所需要的[26]。隨后的研究也發現在四膜蟲中6mA與RNA聚合酶II(Pol II)轉錄的基因高度相關,但6mA并不是四膜蟲活躍轉錄基因的一個明確標記[87]。早期分化譜系的真菌中6mA的分布并不是隨機的而是與基因的功能相關的,主要體現在6mA的分布位點與5mC的分布位點呈現明顯的負相關性以及6mA在TSS位點富集與基因的激活具有正相關性[32]。對于衣藻[30]、線蟲[38]和果蠅[40]的研究也表明6mA的積累與基因或轉座子的表達成正相關。
對于小鼠胚胎干細胞的研究發現6mA的含量與LINE-1(Long Interspersed Nuclear Element-1) 轉 座 子的進化年齡負相關,6mA在年輕的全長LINE1(young full-length LINE-1 <1.5 million years old)轉座子上富集并與LINE1轉座子及其鄰近的增強子和基因的沉默直接相關,結合先前在人類ES細胞中的研究表明年輕的全長LINE1轉座子被5mC所沉默[81],由此猜測6mA與5mC可能在ES細胞中共同調節某些基因的沉默,并且6mA在哺乳動物中的表觀遺傳效應可能與5mC有一定的相似之處。通過分析6mA去甲基化酶基因Alkbh1基因敲除的ES細胞的轉錄組數據并結合RT-qPCR實驗,結果表明Alkbh1基因敲除導致的6mA積累抑制了X染色體上基因的轉錄;由于LINE1在X染色體上富集,這也為闡明LINE1轉座子在X染色體失活過程中的功能提供了新的線索[45]。在小鼠大腦皮層中,壓力誘導的6mA的動態變化與神經元功能和發育相關基因以及LINE轉座子表達水平呈負相關[69]。最新的研究表明小鼠基因組中6mA的富集可以維持Polycomb基因沉默[59]。在人類中6mA含量增加可以抑制抑癌基因的表達從而促進惡性膠質瘤干細胞的存活[51]。以上研究均表明6mA的積累與基因或轉座子的表達成正相關或者負相關,但在水稻中發現位于啟動子區的6mA使基因沉默,而位于基因體的6mA則與基因的活化相關[53]。在擬南芥中,6mA的含量與基因的表達水平以及營養生長向再生生長的轉變成正相關[55]。因此,研究人員推測6mA在真核生物中的轉錄調控效應可能具有物種、時間和空間多樣性。
6mA的含量在果蠅、斑馬魚和豬的胚胎發育的不同階段是高度動態變化的,6mA在胚胎發育的早期含量較高,當胚胎發育到囊胚期時6mA下降到極低水平,這種動態變化可能在促進早期胚胎的發育中發揮重要作用[40][47]。而與此相反的是,5mC在受精后的早期胚胎中大規模的被擦除,在隨后的發育過程中胚胎基因組DNA重新甲基化并逐漸恢復到高水平[66-68]。早期胚胎發育過程中,5mC缺失的時候6mA可能作為替代性的表觀修飾標記起到一定的補充作用或者發揮特殊的作用,6mA是否作為5mC的一個互補的表觀遺傳標記而發揮作用還需要進一步探究。
值得注意的是6mA主要對稱地分布在嗜熱四膜蟲、衣藻和真菌的ApT回文序列中,這種對稱分布也許與DNA的復制相關,而在其他真核生物中還沒有關于6mA分布于類似回文序列的報道;更進一步的研究在線蟲中發現6mA具有隔代遺傳的表型,因而推測6mA可能是一種可跨代攜帶和傳遞的表觀遺傳標記[38]。
在人類基因組中6mA與組蛋白甲基化修飾H3K9me3和H3K27me3共定位在異染色質區域[51]。6mA與組蛋白甲基化修飾的相互關系及兩者是否共同作用于異染色質的形成過程等問題具有較大的研究價值。衣藻基因組中發現單個6mA位點專一地標記相鄰兩個核小體之間的連接DNA,6mA修飾位點的位置有助于核小體的精確定位,首次揭示了6mA在真核生物核小體定位中具有功能意義[30]。隨后研究人員在四膜蟲中發現含有6mA的連接DNA的兩側通常是包含H2A.Z變體的核小體[87]。
在環境壓力下小鼠大腦中6mA含量受到動態調控,慢性壓力可誘導6mA在小鼠前額葉皮質(prefrontal cortex, PFC)中積累,腦中總的6mA水平在響應壓力時顯著升高,并發現6mA與自閉癥和精神分裂癥相關,第一次證明了哺乳動物腦中6mA的含量變化與神經精神類疾病存在聯系[69]。
與鄰近正常組織相比,胃癌和肝癌組織中6mA的含量更低,并伴隨著甲基轉移酶N6AMT1的下調和去甲基酶ALKBH1的上調,這說明6mA含量降低可以促進腫瘤發生[50]。ATAC-seq和H3K9me3、ChIP-seq等方法獲得的實驗數據表明高水平的6mA能夠降低染色質的可接近性并促進異染色質區域的形成,抑制多個抑癌基因的表達從而促進惡性膠質瘤干細胞的存活,這說明在癌癥的進展中6mA作為一種抑制性的表觀遺傳標記發揮作用[51]。因此,6mA的含量降低與上升可能在不同類型的癌癥中發揮促癌作用。
與真核生物中高度豐富的5mC相比,6mA水平在真核基因組中占比極低,因此只能通過高度靈敏的技術檢測[19]。自1971年以來報道的在一些高等植物的質體、線粒體或細胞核中存在的6mA,主要是通過限制性內切酶消化的方法被間接的檢測得出的,早期的檢測方法無法對6mA含量進行精確測定也無法確定6mA在基因組中的分布模式[33-35,52],因此限制了6mA的研究進程。近些年來幾項新技術的出現使6mA的研究有復蘇的趨勢,以下對這些方法進行簡單的總結。
早在1983年Chhaya等使用特異性的抗體結合其實驗室所開發的高靈敏度的免疫化學方法[70]在人類胎盤、大鼠精子、2種雌性的處于妊娠期的水蠟蟲和黑腹果蠅的DNA中檢測到了6mA的存在[34]。現今使用商業化的抗6mA的特異性抗體結合斑點雜交實驗對實驗材料中DNA是否含有6mA進行定性和半定量分析,果蠅、線蟲、小鼠等基因組中6mA的發現使用了這種方法。6mA特異性抗體結合免疫熒光染色可以對DNA中的6mA進行半定量分析,Liu等用這種方法檢測了斑馬魚和豬的胚胎基因組6mA的動態變化[47]。這種方法的缺點是目前的6mA抗體無法區分6mA與mRNAm6A,需要用RNase消化掉mRNAm6A;此外,6mA抗體對DNA 1mA也有一定的識別作用,隨后需要結合更加靈敏的檢測技術進一步檢測6mA的具體含量和動態變化。
在表觀遺傳學研究中,高通量測序技術被廣泛用于探究表觀遺傳學修飾的含量與分布[71]。Weber等人將免疫共沉淀(immunoprecipitation)技術和下一代測序(next generation sequencing, NGS)技術相結合,已經用于在哺乳動物基因組中檢測5mC[72]。6mA特異性抗體用于6mA-DNA免疫沉淀再結合高通量測序手段(6mAIP-Seq)已經是研究6mA的基本方法。6mA-IP-seq利用抗6mA的抗體富集測序文庫中的含有6mA修飾DNA片段[85],然后利用下一代測序技術對富集得到的DNA片段進行測序,然后通過分析測序數據繪制6mA在全基因組內的修飾圖譜,6mA-IP-seq的缺點是無法達到單堿基的分辨率[19]。6mA-IP-Seq結合核酸外切酶消化的方法(6mA-CLIP-exo-seq)能夠提高分辨率,6mACLIP-exo-seq雖然能夠在6mA-IP-Seq的基礎上提高識別6mA的分辨率,但這兩種基于抗體的檢測方法從原理上限制了它們,使其都無法做到完全從單堿基的水平上以高分辨率識別6mA。
基于限制性內切酶的6mA測序(6mA-RE-seq)能夠達到單堿基分辨率,但這種方法依賴于限制性內切酶的序列識別特異性,只能檢測到有限的6mA修飾基序(motif sites),而無法得到全基因組范圍內的6mA甲基化修飾圖譜。Fu等使用6mA-IP-seq和6mA-CLIP-exo-seq在衣藻基因組中確定了6mA富集基序是CATG和GATC,隨后用對6mA修飾不敏感的限制性內切酶CviAII(25℃,識別CATG)和DpnII(37℃,識別GATC)處理衣藻的基因組DNA,并加以超聲處理,非甲基化CATG或GATC基序的DNA片段將被消化,分別生成帶有CATG或GATC末端的約300bp的片段,甲基化CATG或GATC基序能夠抵抗限制性內切酶的消化因而存留于超聲處理后產生的DNA片段的內部,隨后將消化后的片段的末端連上接頭序列,然后經PCR擴增構建DNA文庫用于高通量測序。CATG或GATC基序在DNA片段內部和外部的比例就代表了6mA甲基化和未甲基化的相對比例[30]。
單分子實時測序技術(SMRT-seq)是由Pacific Biosciences公司開發的第三代高通量測序技術,其原理是基于邊合成邊測序的思想,不經過PCR,以SMRT芯片為載體進行測序反應,SMRT芯片上包含多個孔狀納米光電結構,DNA聚合酶與DNA模板和測序引物結合在一起形成復合物并被固定在每個納米孔的玻璃底板上,加入四色熒光基團標記的dNTPs后進行互補DNA鏈的合成,參加反應的單個dNTP上與其焦磷酸基團相連的特定的熒光基團被從測序小孔底部入射的激光激發產生相應的熒光脈沖,同時熒光信號被檢測系統記錄,隨后熒光基團標記的焦磷酸基團被DNA聚合酶切割脫落使熒光信號淬滅,再進入下一輪反應;若DNA模板鏈存在甲基化修飾,根據DNA聚合酶的動力學特征,當合成反應進行到修飾位點時子鏈上的堿基加入所需時間相比于未修飾位點會出現延長;熒光檢測系統根據熒光脈沖的類型和出現兩次熒光脈沖的間隔時間判斷新加入的dNTP的種類以及記錄模板DNA上的修飾位點[73-74,84]。利用單分子實時測序技術在大腸桿菌基因組中獲得了單堿基分辨率的全基因組甲基化腺嘌呤圖譜[75-76]。實際上,目前所報道的有關高等真核生物6mA的研究中基本都會用到SMRT-seq。SMRT-seq的優點是能對提取并處理好的基因組DNA直接進行測序,無須PCR的擴增步驟,能夠產生長讀長的讀段(reads)并且能夠檢測基因組序列高度重復區域的甲基化修飾。其缺點是不能很好地區分1mA和6mA,所以一般需要結合LC-MS/MS排除1mA的干擾。
超高效液相色譜—三重四極質譜(ultra-high performance liquid chromatography-triple-stage quadrupole mass spectrometry, UHPLC-MS/MS)將高效液相色譜技術與質譜技術相結合,可以檢測含量很低的6mA靈敏核苷酸修飾[10],具有高靈敏度和高精確度的優點,一般用來進一步確定SMRT測序所得結果的可靠性。簡而言之,其原理就是超高效液相色譜(UHPLC)分離消化的DNA與質譜檢測相結合,通過使用串聯質譜儀(MS / MS)在檢測到特定的核苷酸修飾之后,使用在目的樣品中同時分析的標準曲線實現定量分析[19]。由于6mA特異性抗體檢測和單分子實時測序等技術無法區分6mA、1mA,而UHPLC-MS/MS法能夠通過色譜和分子質量差異區分6mA、1mA從而排除1mA的干擾。因此目前6mA在真核生物的發現過程中大多數都使用了UHPLC-MS/MS法。值得注意的是,運用UHPLC-MS/MS法檢測真核生物6mA時,需要排除任何來自支原體或細菌DNA的潛在污染。
實際上,所有的檢測方法都應該注意樣本的細菌污染程度,細菌污染造成6mA的假陽性結果應當被排除。但是很多文獻都沒有提到這一點,僅有極少數文獻中提到他們排除了細菌污染對于所測得的6mA數據的影響[53]。
6mA是一種在細菌中發揮重要作用的DNA修飾,它參與細菌DNA復制起始,堿基錯配修復,轉錄與轉座,保護細菌基因組免于外源DNA的侵入和細菌毒素的分泌等生命活動。近年來對于真核生物的6mA修飾的研究逐漸增多,特別是哺乳動物6mA修飾已經吸引了眾多研究人員的關注但仍然方興未艾。已報道的真核生物6mA能夠跨代傳遞并與基因表達、轉座子表達、核小體定位和組蛋白修飾等眾多生物功能相關,也與癌癥和精神疾病等病理過程相關;多個研究證據表明6mA可以被動態調節,6mA也具有調節功能,因此闡明與6mA功能相關的上游和下游調控機制很有研究價值。
目前發現6mA在不同物種中的含量、分布和功能具有較大的異質性和一定的相似性, 我們還需要在更多的真核生物中去探索6mA的含量和分布,尋找更為普遍的規律。6mA的功能是否具有保守性也尚未闡明,如果6mA的功能是保守的,那么理論上應該存在具有保守結構域的甲基化酶、去甲基化酶和閱讀蛋白;就目前已經鑒定存在的6mA的甲基化酶和去甲基化酶而言,仍然需要進一步研究它們調節6mA的催化機制;真核生物中存在6mA的甲基化酶和去甲基化酶說明6mA是可以被動態調控的,這也從側面證明了6mA在真核生物中具有重要的生物學作用。6mA的閱讀蛋白已經在小鼠中被發現, 6mA的閱讀蛋白是否在其他哺乳動物中也存在,以及這些蛋白的6mA識別位點與下游通路仍然有待研究;6mA的調節蛋白在真核生物中的鑒定和功能闡釋將使人們對6mA修飾的調控機制產生新的理解。現已報道的6mA與癌癥和精神疾病相關,6mA與眾多人類疾病的關聯未來將得到更進一步的研究。