賀應(yīng)蛟,丁 明
(中國(guó)藥科大學(xué) 生命科學(xué)與技術(shù)學(xué)院,江蘇 南京211198)
在中心法則中,RNA作為連接DNA 與蛋白質(zhì)的“橋梁”,參與遺傳信息的傳遞與表達(dá),在生物活動(dòng)中發(fā)揮著必不可少的作用。根據(jù)其結(jié)構(gòu)與功能的差異,將RNA 分為信使RNA(mRNA)、轉(zhuǎn)運(yùn)RNA(tRNA)、核糖體RNA(rRNA)等,現(xiàn)階段研究最為關(guān)注的就是mRNA。來(lái)源于細(xì)胞核內(nèi)mRNA前體的處理決定了mRNA 運(yùn)送到胞質(zhì)后的命運(yùn),通過對(duì)RNA 的定位來(lái)控制基因的表達(dá)[1]。mRNA 前體修飾包括5′端加帽、3′端加poly(A)尾、外顯子連接復(fù)合蛋白的沉積和剪接過程中內(nèi)含子的去除等[2]。對(duì)mRNA 前體修飾的過程中,RBPs 在細(xì)胞核內(nèi)沉積到轉(zhuǎn)錄本上決定其最終目的地。RBPs 是一種多功能調(diào)節(jié)因子,它們負(fù)責(zé)處理、定位和控制許多mRNA 的翻譯,改變反式作用RBPs 的表達(dá)(如敲低、敲除或過表達(dá))或改變mRNA 靶標(biāo)中順式作用調(diào)控元件會(huì)導(dǎo)致發(fā)育或認(rèn)知缺陷等許多疾病狀態(tài),RNA-蛋白質(zhì)相互作用是調(diào)節(jié)RNA 水平基因表達(dá)的重要檢查點(diǎn)[3]。基因表達(dá)的翻譯調(diào)控和轉(zhuǎn)錄水平上的調(diào)控一樣重要。mRNA 自身也存在調(diào)控區(qū)域[4],如5′-UTR 與3′-UTR 中序列的改變都會(huì)導(dǎo)致疾病的發(fā)生[5],3′-UTR 通常在細(xì)胞質(zhì)中發(fā)揮作用,但RBP 的結(jié)合卻是發(fā)生在細(xì)胞核中。RBP 可以與不同的效應(yīng)蛋白相互作用,另一方面,由于細(xì)胞類型和細(xì)胞狀態(tài)的不同,使得每個(gè)3′-UTR 調(diào)控元件都可能執(zhí)行不同的功能,且細(xì)胞狀態(tài)也決定了RBP 能否在特定的時(shí)間段與mRNA 3′-UTR 結(jié)合。除了上面提到的因素,影響RBP 與3′-UTR 結(jié)合的原因還包括細(xì)胞類型、周圍所處的局部環(huán)境與RNA 的二級(jí)或三級(jí)結(jié)構(gòu)等[6]。
RBPs 和核糖核蛋白(ribonucleoprotein,RNP)復(fù)合物是RNA-蛋白質(zhì)相互作用的典型功能形式,在轉(zhuǎn)錄后水平上廣泛控制真核生物中基因的表達(dá)[7]。RNA-蛋白質(zhì)相互作用的研究在多種應(yīng)用中顯示出實(shí)用性,包括評(píng)估與人類遺傳疾病中突變RNA 基序的蛋白質(zhì)結(jié)合[8]:急性髓系白血病(Acute Myelocytic Leukemia,AML)的RNA 結(jié)合蛋白網(wǎng)絡(luò)與磺胺類藥物治療效果評(píng)估,以及發(fā)現(xiàn)與寨卡病毒RNA 相互作用的必需宿主蛋白。然而,由于實(shí)驗(yàn)數(shù)據(jù)的有限性,迄今為止,只有少數(shù)代表性物種的部分RBP 得到了較好的研究[9]。
RBP 基因的異常表達(dá)和突變會(huì)影響RNA 加工的各個(gè)步驟,從而改變靶基因的功能。RBP 與多種疾病相關(guān),包括神經(jīng)系統(tǒng)疾病。如導(dǎo)致智力低下最常見的脆性X 綜合征(fragile-X syndrome,F(xiàn)XS)中致病基因FMR1 產(chǎn)生的蛋白FMRP 在其5′UTR 區(qū)發(fā)生突變,從而使CGG 序列重復(fù)次數(shù)增加,導(dǎo)致基因啟動(dòng)子的高甲基化,從而引起轉(zhuǎn)錄沉默[10]。而在患有共濟(jì)失調(diào)綜合癥(fragile X tremor ataxia syndrome,F(xiàn)XTAS)的個(gè)體中,F(xiàn)MR1 基因并沒有完全沉默。在FXTAS中,延長(zhǎng)的CGG 重復(fù)被轉(zhuǎn)錄為FMR1 mRNA 的一部分,此時(shí)與CCG重復(fù)的RNA相互作用的幾個(gè)RBP,包括hnRNPA2/B1 和MBNL,在空間上被隔離在正常位置之外,無(wú)法執(zhí)行其正常功能。這些RBPs 功能的喪失導(dǎo)致了FXTAS 的發(fā)生發(fā)展[11]。
在疾病機(jī)制的研究方面,WANG等人利用CRISPR/Cas9技術(shù)對(duì)490 個(gè)RBPs 的2 900 個(gè)sgRNA 來(lái)篩選,發(fā)現(xiàn)CRISPR介導(dǎo)的RBM39 的缺失或藥物降解會(huì)導(dǎo)致HOXA9 靶基因的剪接改變,這是AML 必需的轉(zhuǎn)錄網(wǎng)絡(luò)。因此,與其他癌癥相比,導(dǎo)致了AML 細(xì)胞的優(yōu)先靶向性。在這過程中,同時(shí)發(fā)現(xiàn)了幾個(gè)過去從未被描述為與AML維持相關(guān)的RBP 不受調(diào)控[12]。RNA 結(jié)合蛋白R(shí)BM39 作為剪切體突變AML 的潛在靶點(diǎn)可被現(xiàn)有磺胺類藥物靶向[13]。鑒于RBM39 在剪接中的機(jī)械作用以及DCAF15 銜接蛋白對(duì)磺胺類藥物活性的需求,確定了剪接體基因突變的存在和DCAF15 表達(dá)水平都是對(duì)磺胺類藥物反應(yīng)的重要預(yù)測(cè)因子[12]。
此外,在眾多以RNA 為主要遺傳物質(zhì)的生物中,絕大部分是病毒,如煙草花葉病毒、艾滋病病毒(HIV)、流感病毒等,而RBP 在其生命活動(dòng)周期中發(fā)揮著舉足輕重的作用。如寨卡病毒(ZIKV),其遺傳物質(zhì)是單股正鏈RNA(+ssRNA)的有包膜病毒,主要通過節(jié)肢動(dòng)物伊蚊(Aedes)傳播(蟲媒病毒)[14-15]。病毒顆粒中的遺傳物質(zhì)侵入宿主細(xì)胞后,正鏈RNA 發(fā)揮類似于mRNA 功能的作用,利用宿主提供的原料合成自身編碼的蛋白質(zhì),其中包括RNA 復(fù)制酶、衣殼蛋白等,并在新合成的RNA 復(fù)制酶作用下以正鏈RNA為模板合成雙鏈RNA,隨后雙鏈RNA 在解旋酶的作用下,正鏈脫離負(fù)鏈,與之前合成的衣殼蛋白等裝配并釋放,負(fù)鏈則基序作為模板不斷合成正鏈。即便是了解了病毒的復(fù)制過程,但其免疫和發(fā)病機(jī)理還是未知。
研究mRNA 與特定RBP 相互作用的生物化學(xué)方法過去通常依賴于SELEX 法、凝膠阻滯實(shí)驗(yàn)(EMSA)、紫外交聯(lián)(UV cross-linking)、免疫沉淀(IP)或/和親和純化技術(shù)(Affinity purification)[2-3]。目前用于研究RNA 與其相互作用蛋白的主流方法有APEX、BioID 等,已經(jīng)有研究者對(duì)這些方法進(jìn)行過歸納與總結(jié)[16]。
用于研究胞內(nèi)RNA 追蹤方法如下:①原位雜交。即RNA-FISH,反義寡核苷酸帶有放射自顯影標(biāo)記,如3H 或32P,可以靶向其特異的DNA 或RNA 序列。②分子信標(biāo)(molecular beacons)。與FISH 原理相同,可檢測(cè)固定的和活細(xì)胞中的RNA。③MS2 標(biāo)記。將帶有MS2 噬菌體莖環(huán)標(biāo)記的待研究RNA 與融合有熒光報(bào)告蛋白的MS2 衣殼蛋白共同表達(dá),檢測(cè)細(xì)胞內(nèi)熒光信號(hào)。④Cas-derived systems。基于CRISPR/Cas 技術(shù),熒光探針標(biāo)記的dCas 蛋白靶向與sgRNA 序列結(jié)合的目標(biāo)RNA,通過檢測(cè)活胞內(nèi)熒光信號(hào)追蹤目標(biāo)RNA。
2.1.1 BioID
BioID ( proximity-dependent biotin identification)由DamID 發(fā)展而來(lái),在原核細(xì)胞中Dam 甲基化酶與潛在的DNA 結(jié)合蛋白融合,當(dāng)融合蛋白在真核細(xì)胞中表達(dá)時(shí),它將與之接觸的DNA 序列特異性的甲基化留下相互作用的化學(xué)痕跡[17]。BioID 是基于一個(gè)突變的BirA 產(chǎn)生的混雜的生物素化[18]。BirA*是一個(gè)35KD 大小來(lái)源于大腸桿菌的DNA結(jié)合生物素蛋白連接酶,可調(diào)節(jié)乙酰輔酶A 羧化酶亞基的生物素化,并作為生物素生物合成操縱子的轉(zhuǎn)錄抑制子。在這個(gè)系統(tǒng)中,生物素受體標(biāo)簽(BAT)與感興趣的蛋白融合,并與BirA 共表達(dá),使BAT 序列被生物素化[17]。體內(nèi)鄰近標(biāo)記可成功識(shí)別已知的蛋白質(zhì)-蛋白質(zhì)和蛋白質(zhì)-RNA 相互作用。在DamID 基礎(chǔ)上,人們又對(duì)此方法進(jìn)行改進(jìn),將鏈霉親和素單體突變?nèi)诤系礁信d趣的蛋白質(zhì)上,在其附近招募一個(gè)包含生物素和光活化基團(tuán)的小的化學(xué)探針。NHS 活化的生物素可以標(biāo)記多肽鏈N 端和側(cè)鏈上賴氨酸殘基中含有的氨基(-NH2)。通過365 nm 波長(zhǎng)的紫外激活光化學(xué)基團(tuán)與附近分子迅速且不可逆地發(fā)生反應(yīng),使細(xì)胞內(nèi)的蛋白質(zhì)和RNA 生物素化[19]。對(duì)于大的蛋白質(zhì),標(biāo)記幾個(gè)賴氨酸殘基和N 端通常不會(huì)影響蛋白功能或其結(jié)合特性;但對(duì)于短肽來(lái)說(shuō),隨機(jī)的生物素化可能會(huì)阻塞生物素化蛋白下游活動(dòng)所必須的結(jié)合位點(diǎn),改變其功能特性。
2.1.2 工程化抗壞血酸過氧化物酶
工程化抗壞血酸過氧化物酶(engineered ascorbate peroxidase,APEX)的原理與方法是用過氧化氫(H2O2)將活細(xì)胞處理1 min,APEX 催化生物素-苯酚的單電子氧化,生成壽命非常短的生物素苯氧基自由基[20]。該自由基共價(jià)標(biāo)記APEX 附近的內(nèi)源蛋白質(zhì),從而允許其隨后使用鏈霉親和素磁珠進(jìn)行富集并通過質(zhì)譜鑒定[21]。由于APEX 缺乏二硫鍵和鈣結(jié)合位點(diǎn),因此可以在還原性細(xì)胞質(zhì)環(huán)境中表達(dá)而不會(huì)喪失活性。通過對(duì)APEX 的改進(jìn),在生物素-苯酚存在的情況下,APEX2 中的A134P 突變可改善動(dòng)力學(xué)、熱穩(wěn)定性,且對(duì)高H2O2濃度具有抗性[22],相對(duì)減少對(duì)細(xì)胞的損傷。
2.1.3 RNA-蛋白質(zhì)相互作用檢測(cè)
RNA-蛋白質(zhì)相互作用檢測(cè)(RNA-protein interaction detection,RaPID)是通過改造枯草芽孢桿菌中的BirA,稱為BASU,可用于直接研究完整活細(xì)胞中特定RNA 與蛋白質(zhì)的相互作用,且更適合研究長(zhǎng)度小于132 nt 的基序[23],所以在研究短RNA 序列時(shí)可能特別有用[8,24]。
2.2.1 MS2 標(biāo)記
MS2 標(biāo)記是一種體內(nèi)RNA 標(biāo)記方法,用于跟蹤活細(xì)胞內(nèi)RNA 的原始技術(shù)。來(lái)源于噬菌體ssRNA,它與原核生物和真核生物中內(nèi)源性的RNA-蛋白復(fù)合物正交[25],最初被稱為MAPS。MS2 標(biāo)簽被噬菌體MS2 衣殼蛋白(MS2 coat protein,MCP)特異性識(shí)別,該蛋白再與MS2 結(jié)合蛋白(MS2 binding protein,MBP)融合,因?yàn)镸BP 本身能與直鏈淀粉樹脂結(jié)合,可以特異性保留含有修飾的MS2-sRNA 復(fù)合物[26]。而Robert Singer 使用GFP 作為熒光報(bào)告分子將GFP與MS2 衣殼蛋白結(jié)合,即融合了熒光蛋白的MS2 外殼蛋白(MCP-FP)能與攜帶有RNA 序列的MS2 結(jié)合位點(diǎn)(MS2 binding site,MBS)結(jié)合,作為捕獲RNA 和RNA 結(jié)合蛋白的一種方式[27]。通過將GFP 與這種MS2 蛋白融合,通過熒光顯微鏡觀察可以在細(xì)胞內(nèi)遷移時(shí)跟蹤RNA[28]。MS2 可插入mRNA 的3′-UTR 或5′-UTR,但MCP 與5′-UTR 的MBS結(jié)合會(huì)降低標(biāo)記mRNA 的翻譯效率[25,29-31],且3′UTR 含有更少的進(jìn)化保守區(qū)域,更適合位點(diǎn)的插入[25]。MCP 二聚化是與MBS 結(jié)合的先決條件[32-33]。
2.2.2 PUP-IT
PUP-IT(Pupylation-based interaction tagging)是一種新的近似標(biāo)記系統(tǒng),利用細(xì)菌Pup 蛋白偶聯(lián)系統(tǒng),將編碼Pup連接酶的pafA 基因與誘餌蛋白進(jìn)行融合。Pup 是一種小型細(xì)菌蛋白,包含了C 端為Gly-Gly-Gln 的共計(jì)64 個(gè)氨基酸。在細(xì)菌中,C 端的Gln 首先脫氨基為Glu,這種形式的Pup被稱為Pup(E)。在ATP 存在下,Pup 連接酶PafA 催化Pup(E)上C 端的Glu 磷酸化,然后將C 端的Glu 連接到目標(biāo)蛋白賴氨酸殘基側(cè)鏈上。這個(gè)過程與真核生物泛素化過程相似,賴氨酸的ε-氨基是反應(yīng)所必須的。PafA 介導(dǎo)底物上的Pup 修飾。Pup(E)與底物賴氨酸的連接與主序列無(wú)關(guān)。
與BioID 和APEX 不同,BioID 和APEX 都依賴于活化的底物和標(biāo)簽蛋白在相對(duì)半徑內(nèi)的自由擴(kuò)散,PUP-IT 使被激活的Pup 與酶結(jié)合,并以更有限的標(biāo)記半徑運(yùn)行。在體外和細(xì)胞中,PUP-IT 比BioID 更活躍,沒有APEX 那么活躍(APEX 標(biāo)記約1 min),因此可能不適用于研究快速信號(hào)轉(zhuǎn)換中的蛋白質(zhì)與蛋白質(zhì)相互作用。但PUP-IT 和APEX 都可以用于細(xì)胞外標(biāo)記。但因?yàn)镻up 不能在細(xì)胞膜上擴(kuò)散,因此PUP-IT 不適用于研究細(xì)胞器內(nèi)部的相互作用。PUP-IT 與其他近似標(biāo)記系統(tǒng)互補(bǔ)[34]。
2.2.3 XRNAX
蛋白質(zhì)交聯(lián)RNA 的通用純化方法提取的樣品中包含所有主要生物類型的RNA,主要是通過紫外交聯(lián)細(xì)胞,用TRIZOL 法提取并收集TRIZOL 中間相,將其洗滌以去除游離的未交聯(lián)的蛋白質(zhì)和RNA,并經(jīng)DNA 酶消化以去除DNA,從而得到高濃度RNA 和蛋白質(zhì),再通過測(cè)序與質(zhì)譜進(jìn)行后續(xù)檢測(cè)[35]。除了UV cross-linking,與紫外交聯(lián)不同,甲醛作為一種可逆交聯(lián)劑,經(jīng)常作為固定劑以保持細(xì)胞結(jié)構(gòu)的完整性。以甲醛作為交聯(lián)劑,利用核糖核蛋白免疫沉淀反應(yīng)(RNP immunoprecipitation,RIP)的方法研究體內(nèi)RNA-蛋白質(zhì)的相互作用,利用特異性抗體通過免疫沉淀從細(xì)胞中分離RNA-蛋白質(zhì)復(fù)合物[36]。
2.2.4 點(diǎn)擊化學(xué)輔助RNA 內(nèi)酯捕捉技術(shù)
點(diǎn)擊化學(xué)輔助RNA 內(nèi)酯捕捉技術(shù)(click-chemistryassisted RNA interactome capture,CARIC)使用炔基尿苷類似物對(duì)RNA 進(jìn)行代謝標(biāo)記,使RNA 的捕獲不依賴于poly(A)[23]。
縱觀目前的研究現(xiàn)狀,已經(jīng)有越來(lái)越多的RNA 相互作用蛋白的功能被發(fā)現(xiàn),也有更多的研究人員著眼于這一關(guān)鍵方向。雖然蛋白質(zhì)-蛋白質(zhì)相互作用的研究方法已經(jīng)趨于成熟,也有許多新的技術(shù)出現(xiàn)并用于研究RNA 與蛋白質(zhì)的相互作用,但這些方法與目前的研究現(xiàn)狀仍不能滿足對(duì)于未知領(lǐng)域與方向的開發(fā)需求,上述每一種研究RNA 與蛋白質(zhì)相互作用的方法都需要和其他方法聯(lián)合使用來(lái)達(dá)到最佳的效果。也只有在方法優(yōu)化的基礎(chǔ)上,才能發(fā)現(xiàn)更深層的RNA與蛋白的互作關(guān)系網(wǎng)絡(luò),并不能僅從單一的方面來(lái)決定某一種研究方法的優(yōu)劣。
對(duì)于標(biāo)記方法的靈敏度而言,APEX 明顯優(yōu)于PUP-IT,而PUP-IT 又優(yōu)于BioID,但APEX 由于苯酚與過氧化氫的加入而使得其細(xì)胞毒性增加,即使改進(jìn)后的APEX2 已經(jīng)對(duì)這一點(diǎn)作出優(yōu)化,但該問題仍無(wú)法避免。而PUP-IT 目前的研究顯示并不適用于細(xì)胞器內(nèi)部相互作用研究,BioID/BioID2 雖然用途廣泛,但對(duì)于短肽卻仍然存在缺陷。對(duì)于RNA-蛋白質(zhì)交聯(lián)來(lái)達(dá)到純化RNA-蛋白質(zhì)復(fù)合物的方法,即使是可逆的甲醛,仍然會(huì)對(duì)細(xì)胞膜產(chǎn)生損傷。因此如何發(fā)揮各方法的優(yōu)點(diǎn)或開發(fā)更多的方法對(duì)RBP 的研究尤為重要。隨著多組學(xué)與質(zhì)譜技術(shù)的發(fā)展與聯(lián)合應(yīng)用,過去由點(diǎn)至面的研究方法逐漸向更深入和精細(xì)的方向發(fā)展,并推動(dòng)人們對(duì)RBP 蛋白在體內(nèi)的功能以及分子機(jī)制的理解。