楊華, 樊紅
(東南大學 醫學院,江蘇 南京 210009)
非編碼RNA(non-coding RNA, ncRNA)是指不編碼蛋白質,但在生物體生命活動中具有功能的RNA分子。ncRNA按其長度可分為短鏈非編碼RNA和長鏈非編碼RNA(long non-coding RNA,lncRNA)[1-2]。短鏈非編碼RNA是一類大小約22個核苷酸的RNA分子,一般來源于染色體的非編碼區;lncRNA長度一般超過200個核苷酸,大多數由RNA聚合酶Ⅱ轉錄,缺乏有意開放閱讀框架。最初lncRNA被認為是基因轉錄的“噪音”,近年越來越多的證據表明,這種“暗物質”能夠廣泛地參與基因組調節,調控個體的生長發育以及細胞凋亡、增殖、分化等生命活動[3-4]。lncRNA的異常表達與包括腫瘤在內的多種疾病相關[5-7]。lncRNA的研究目前尚處于初期階段,如何對lncRNA進行基因鑒定、功能分析、靶標研究成為基因組研究的關鍵問題。
RNA作為輸出與輸入信號促使其成為一個調控路徑之間和信號內部轉換的標準媒介,組成了復雜的、多層的并模塊化的調控網絡系統。除了4個核心核苷酸外,RNA序列可能包括100種以上化學修飾的核苷酸,它們調節并穩定著RNA的結構。lncRNAs傾向于折疊成熱力學穩定的二級或更高級結構而行使其功能。例如,lncRNA MEG3二級結構維持了其腫瘤抑制作用[8]。
lncRNAs的RNA結構域因能與其他的RNAs形成堿基互補,成為mRNA、微小RNA及其他lncRNA表達的高特異性傳感器[9];反義lncRNAs與核苷酸不完全的互補性允許不同解離常量的多樣性RNA競爭性結合,從而識別細胞內不同RNA的表達,例如,UCHL1的翻譯是由一種lncRNA所調控的[10]。lncRNAs中的Alu元件和編碼mRNAs的3′UTR不完全堿基配對引起Staufen1識別并限制dsRNA結構,隨后達到靶向降解。lncRNA MALAT1的3′末端裂解可產生小的tRNA樣序列,從細胞核向細胞質移動[11]。延伸的RNA雙鏈在Dicer酶的作用下產生多樣且小的調控RNAs,這些RNAs具有級聯調節下游表觀遺傳學改變的能力[12]。
RNA結合蛋白是人類蛋白種類最豐富的蛋白之一,由幾個相關的RNA連接模塊組裝,這些結構域與連接區域的模塊組合調節RNA結構的多樣性[13]。蛋白質傾向于與形成復雜二級結構的RNA相互作用,使蛋白結構定位在RNA莖環螺旋的凹槽或為不成對的RNA核苷酸在β面處提供結合袋[14]。
RNA-DNA直接相互作用可能會有效并選擇性地將RNA信號靶定在基因座上,而此作用會讓基因組處于去氨基及損傷中[15]。盡管lncRNAs與DNA有直接相互作用的證據尚少,但研究發現與啟動子相關的lncRNA pRNA可以阻止轉錄終止因子1(TTF1)的結合,同時募集DNMT3b抑制rRNA基因的表達。體外實驗中發現lncRNA與TTF1結合形成三重子,支持了基因組中基因座間的直接相互作用。RNA折疊形成與DNA結合域類似的DNA結合袋。例如,Xist并不直接與DNA相互作用,而是借助于YY1轉錄因子的特定序列將其綁定在X染色體上的位點[16]。
lncRNAs可以通過變構和異位結合結構域激活或抑制連接的功能域。當一個分子結構域特異改變蛋白相互作用時,lncRNA可以為許多不同的蛋白做支架形成單個核糖核蛋白。到目前為止至少12個核染色質修飾蛋白與lncRNAs相關。VEGF 3′UTR的一個蛋白依賴的核糖開關被GAIT或多相核核糖蛋白L(hnRNPL)蛋白復合物限制[17]。lncRNA CDKN2B-AS1(ANRIL)使Suz12、 CBX7與 H3K27結合,抑制CDKN2A/CDKN2B(IFNK4a/IFNK4b)[18]。小鼠中lncRNA Kcnq1ot1可以招募PRC2和G9a,使H3K4三甲基化和H3K9甲基化[19]。
轉座子的傳動可能會導致一個穩定功能結構域插入靶定的lncRNAs。轉座子重復,如SINEs元件和Alu元件,也可以整合到lncRNAs中,作為識別結構域翻譯或降解互補的mRNA。與蛋白結構域相似,對lncRNAs相似重復序列的確定可能會反映lncRNAs中的潛在功能結構域。Xist結構包括超過9個重復元件組成的A-區域和C-重復區域,這9個重復元素折疊成兩個莖環結構為H3K27甲基化而招募PRC1。C-重復區域同時結合了hnRNP U和YY1,負責將Xist定位于X染色體上[20]。A-和C-重復區域結構也出現在有同樣功能的lncRNA Rsx,調節有袋哺乳動物中X染色體的失活[21]。
長鏈非編碼RNA引起關注應歸功于基因組和基因芯片[22]的研究。基因芯片可以高密度檢測所有的RNA,發現更多被遺漏的非編碼RNA,包括長鏈非編碼RNA。除了基因芯片可以高通量檢測非編碼RNA的差異表達水平,Northern 雜交、實時定量PCR、RNA熒光原位雜交等方法均能檢測非編碼RNA的表達。基于lncRNA結構特征及其作用方式,相應發展了新的研究手段,包括RNA結合蛋白免疫沉淀技術(RNA binding protein immunoprecipitation,RIP)、非編碼RNA沉默和定位分析(combined knockdown and localization analysis of noncoding RNAs,c-KLAN)、環狀染色質構象捕獲(circular chromosome conformation capture,4C)、三維DNA的篩選和交聯(three-dimensional DNA selection and ligation,3D-DSL)、RNA反義純化(RNA antisense purification,RAP)、捕獲雜交分析RNA靶點(capture hybridization analysis of RNA targets,CHART)、全局持續測序(global run-on sequencing,GRO-seq)等。本文集中描述新近常用lncRNA分子研究的方法。
染色體構象捕獲(chromosome conformation capture,3C)技術原本應用于酵母中研究基因表達,染色質的空間構象分析,繼而發展為在動物中研究細胞內染色質間的相互作用。基于染色質構象捕獲而衍生的環狀染色質構象捕獲(circular chromosome conformation capture,4C)、3C碳拷貝(3C-carbon copy,5C)和ChIP-loop assay等技術,為研究染色質間長距離相互作用提供了可能。為了證實ncRNAs與Mediator蛋白質復合物共同形成了DNA環這一觀點,Lai等[23]利用3C技術,深入分析了染色體的三維結構,結果顯示,Meditor定位在編碼ncRNA-a的DNA區域上,扭曲DNA成環。
HI-C是一種3C衍生技術,基于交聯DNA與生物素的鄰近鏈接能夠拉下片段,進行高通量測序。為了研究染色質3D排列是如何發揮作用的,Pennisi[24]采用HI-C的方法建立一個X染色卷曲和轉角的三維圖譜,然后與XIST沉淀的結合位點圖譜進行比較,發現二者之間緊密的相關性,即XIST基因與卷曲和轉角共定位。
三維DNA的篩選和交聯(three-dimensional DNA selection and ligation,3D-DSL)是一種類似于5C的技術,主要用來研究基因組的空間組織。Harismendy等[25]開發并完善了這個研究全基因組范圍內短程和長程基因組交互作用的的低噪音高分辨率的新方法。應用這一項新技術成功發現了與人類疾病密切相關的基因增強子,遠距離地與多個基因位點相互作用并對其起調節作用。這一發現給遺傳毒性激活的SIRT1基因的表達調控及其與心肌梗死的預防、治療研究提供了方案。
研究人員[26]在檢測人類乳腺癌細胞中的雌激素受體結合,以及它對增強子轉錄的影響過程中,采用3D-DSL證實雌激素能夠誘導啟動子及增強子成環。雌激素受體通過結合增強子來激活基因表達;雌激素受體結合被證實與雌激素誘導基因附近的增強子控制 eRNAs 增高相關,并且雌激素受體結合發揮了激活編碼靶基因的作用。研究人員表示,許多廣泛表達的基因在基本細胞功能中起著重要作用,由于它們都處于細胞特異性增強子的控制下,通過抑制eRNAs來影響增強子功能,有可能成為體內以細胞特異性方式改變基因表達的一種新策略。
RNA反義純化(RNA antisense purification,RAP)主要用于繪制lncRNA在基因組中的位置。采用120個單核苷酸的反義RNA探針與目標RNA形成穩定的雜交,從而避免非特異性RNA與蛋白質的相互作用以及非特異性與RNAs及基因組DNA雜交的干擾;采用脫氧核糖核苷酸酶降解基因組DNA至150個堿基對的片段,提供高分辨率的繪制結合位點;采用覆蓋靶RNA全長的生物素標記的探針,以保證即使存在RNA二級結構、RNA部分降解以及RNA與蛋白質相互作用的情況下,仍能通過高通量DNA測序,高分辨率描繪lncRNA結合位點,來繪制不同lncRNAs的確切位置。
關于Xist沉默的生物學意義,研究人員仍不清楚在分子水平上Xist是如何找到它的靶標并影響整體X染色體的。為了了解這一過程,Engreitz等[27]采用RAP的新方法研究Xist在X染色體失活(X-chromosome inactivation,XCI)的啟動和維持過程中的位置,發現lncRNA并沒有到處去尋找它的靶標,而是利用它的位置信息,找到遠距離的基因。過去已知Xist的A重復結構域對lncRNA沉默X染色體基因至關重要,這一區域是拉動所有沉默基因的必要條件。去除這一結構域,X染色體不會失活。
隨著高通量檢測技術的成熟和應用以及生物信息學的迅猛發展,lncRNA具有的基因表達調控功能相繼被發現。盡管如此,lncRNA 研究仍處于起步階段,其功能和調控機制有待進一步闡明。識別RNA結構對研究其調控和功能很重要,但目前用于研究RNA結構的方法相對較少,而且也沒有對RNA結構進行高通量測量的實驗方法。Kertesz等[28]利用一種平行分析RNA結構(parallel analysis of RNA structure,PARS)的新技術,對經過結構特異性酶處理過的RNA片段進行深度測序,確定酵母RNA的二級結構。他們獲得的結果為二級結構在翻譯中的作用提供了有趣的提示,也許這項新技術經過改進后可以在高等真核生物中進行類似的分析。
lncRNA在轉錄水平以及轉錄后水平廣泛參與調節基因的表達,從而形成極其復雜的調控網絡,為進一步研究其調控機制打下基礎。通過研究lncRNA的生物學功能及其在疾病中的調控機制,能夠更全面地理解疾病的發生機制,尋找新的疾病診斷標志物以及治療靶點,為維護人類健康和治療疾病提供新的思路和方法。我們期望面向研究lncRNA的創新技術不斷涌現,以支持該領域的迅速發展。
[1] KROL J,LOEDIGE I,FILIPOWICZ W.The widespread regulation of micro-RNA biogenesis,functionand decay[J].Nat Rev Genet,2010,9(11):597-610.
[2] YANG F,YIN Y,WANG Y,et al.miR-17-5p promotes migration of human hepatocellular carcinoma cells through th p38 mitogen-activated protein kinase-heat shock protein 27 pathway[J].Hepatology,2010,51(5):1614-1623.
[3] van BAKET H,NISLOW C,BIENCOWE B J,et al.Most ”dark matter”transcripts are associated with known genes[J].PLoS Biol,2010,8(5):e1000371.
[4] MERCER T R,OINGER M E,MATTICK J S.Long non-coding RNAs:insights into functions[J].Nat Rev Genet,2009,10(3):155-159.
[5] TAFT R J,PANG K C,MERCER T R.Non-coding RNAs:regulators of disease [J].Pathol,2010,220(2):126-139.
[6] MARUYAMA R,SHIPITSIN M,CHOUDHUY S,et al.Breast cancer special feature:altered antisense-to-sense transcript ratios in breast cancer[J].Proc Natl Acad Sci USA,2012,109(8):2820-2824.
[7] SILVA J M,PEREZ D S,PRITCHETT J R,et al.Identification of long stress induced non-coding transcripts that have altered expression in cancer[J].Genomics,2010,95(6):355-362.
[8] ZHANG X,RICE K,WANG Y,et al.Maternally expressed gene 3(MEG3) noncoding ribonucleic acid:isoform structure,expression,and functions[J].Endocrinology,2010,151(3):939-947.
[9] LIANG J C,BLOOM R J,SMOLKE C D.Engineering biological systems with synthetic RNA molecules[J].Mol Cell,2011,43(6):915-926.
[10] CARRIERI C,CIMATTI L,BIAGIOLI M,et al.Long non-coding antisense RNA controls Uchl1 translation through an embedded SINEB2 repeat[J].Nature,2012,491(7424):454-457.
[11] WILUSZ J E,FREIER S M,SPECTOR D L.3’end processing of a long nuclear-retained noncoding RNA yields a tRNA-like cytoplasmic RNA [J].Cell,2008,135(5):919-932.
[12] DJUPEDAL I,EKWALL K.Epigenetics:heterochromatin meets RNAi[J].Cell Res,2009,19(3):282-295.
[13] LUNDEM B M,MOORE C,VARANI G.RNA-binding proteins:modular design for efficient function[J].Nat Rev Mol Cell Biol,2007,8(6):479-490.
[14] REITER N J,CHAN C W,MONDRAGON A.Emerging structural themes in large RNA molecules[J].Curr Opin Struct Biol,2011,21(3):319-326.
[15] BUSKE F A,MATTICK J S,BAILEY T L.Potential in vivo roles of nucleic acid triple-helices[J].RNA Biol,2011,8(3):427-439.
[16] JEON Y,LEE J T.YY1 tethers Xist RNA to the inactive X nucleation center[J].Cell,2011,146(1):119-133.
[17] RAY P S,JIA J,YAO P,et al.A stress-responsive RNA switch regulates VEGFA expression[J].Nature,2009,457(7231):915-919.
[18] YAP K L,LI S,MUNOZ-CABELLO A M,et al.Molecular interplay of the noncoding RNA ANRIL and methylated histone H3 lysine 27 by polycomb CBX7 in transcriptional silencing of INK4a[J].Mol Cell,2010,38(5):662-674.
[19] PANDEY R R,MONDAL T,MOHAMMAD F,et al.Kcnq1ot1 antisense noncoding RNA mediates lineage-specific transcriptional silencing through chromatin-level regulation[J].Mol Cell,2008,32(2):232-246.
[20] HASEGAWA Y,BROCKDORFF N,KAWANO S,et al.The matrix protein hnRNP U is required for chromosomal localization of Xist RNA[J].Dev Cell,2010,19(3):469-476.
[21] GRANT J,MAHADEVAIAH S K,KHIL P,et al.Rsx is a metatherian RNA with Xist-like properties in X-chromosome inactivation[J].Nature,2012,487(7406):254-258.
[22] 王立偉,周東蕊,房汝敬,等.乳腺癌中NDRG-1基因甲基化狀態研究[J].現代醫學,2008,36(2):79-83.
[23] LAI F,OROM U A,CESARONI M,et al.Activating RNAs associate with Mediator to enhance chromatin architecture and transcription[J].Nature,2013,494(7438):497-501.
[24] PENNISI E.Long noncoidng RNAs may alter chromosome’s 3D structure [J].Science,2013,340(6135):910.
[25] HARISMENDY O,NOTANI D,SONG X,et al.9p21 DNA variants associated with coronary artery disease impair interferon-γsignalling response[J].Nature,2011,470(7333):264-268.
[26] LI W,NOTANI D,MA Q,et al.Functinal roles of enhancer RNAs for oestrogen-dependent transcriptional activation[J].Nature,2013,498(7455):516-520.
[27] ENGREITZ J M,PANDYAJONES A,MCDONEL P,et al.The Xist lncRNA exploits three-dimensional genome architecture to spread across the X chromosome[J].Science,2013,341(6147):12379-12373.
[28] KERTESZ M,WAN Y,MAZOR E,et al.Genome-wide measurement of RNA secondary structure in yeast[J].Nature,2010,467(7311):103-107.