俞珺瑤,杜華平
浙江大學醫學院附屬邵逸夫醫院 血液科,浙江 杭州 310016
CRISPR-Cas(clustered regularly interspaced short palindromic repeats/CRISPR associated pro?teins,CRISPR/Cas)系統是細菌和古細菌在生物進化過程中形成的一種適應性免疫防御系統,用來對抗入侵的噬菌體及其他外源質粒核酸(包括DNA和RNA)。CRISPR-Cas系統先將外源核酸片段整合到CRISPR回文重復序列中,當外源核酸再次入侵時,細胞表達的CRISPRRNA(crRNA)引導Cas核酸內切酶迅速切割外源核酸,從而起到免疫防御的作用[1-3]。該過程主要包括以下幾個步驟[4-5]:①CRISPR間隔區的獲得:將外源核酸序列整合到CRISPR基因組5′端2個重復序列之間得到間隔區(interspacer),對應的外源核酸序列稱為protospacer;②CRIPSR基因座的表達(包括轉錄和轉錄后的成熟加工):以間隔區核酸序列為模板轉錄的前體crRNA(pre-RNA)在Cas蛋白和tracrRNA幫助下剪切成小的RNA,即成熟的crRNA;③CRISPR/Cas系統對外源入侵核酸的切割:成熟的crRNA與具有核酸內切酶活性的Cas蛋白(如Cas9、Cas12、Cas13等)形成核酸核蛋白復合物,crRNA能與外源核酸的protospacer互補配對,引導Cas蛋白在特定位置對外源核酸進行切割。CRISPR-Cas系統主要分為ClassⅠ和Ⅱ兩大類,每個大類又分為不同型(type)和亞型(sub?type)。ClassⅠ CRISPR-Cas系統在細菌和古細菌中較多見,但因成分相對復雜不適合作為工具使用而較少被研究[6]。ClassⅡ CRISPR-Cas系統(包括typeⅡ、typeⅤ、typeⅥ等)雖然少見,但其識別和切割外源核酸的靶序列只需一種Cas蛋白,因此被改造成基因編輯工具而受到越來越多的關注[7-8]。CRISPR-Cas系統又可根據功能分為靶向DNA和RNA等2種。以下對各種類型的CRISPRCas系統做具體闡述。
發現于釀膿鏈球菌(Streptococcus pyogenes)和嗜熱鏈球菌(S.thermophilus)的CRISPR-Cas9系統屬于ClassⅡtypeⅡ CRISPR-Cas系統,其組成包括crRNA、tracrRNA和Cas9,由于成分簡單,最早被用于基因編輯的工具而被廣泛研究。研究者將tracrRNA和crRNA連接形成一個guideRNA(gRNA),使得CRISPR-Cas9系統進一步簡化為只有gRNA和Cas9這2種組分的系統。gRNA利用一段約20個核苷酸的RNA序列通過堿基互補配對原則與靶DNA結合,Cas9在gRNA的引導下在靶DNA的特定位置對其進行切割。同時發現,外源 DNA5′-PAM(protospaceradjacentmotifs)結構的存在對Cas9作用的發揮是必要的[9-10]。
CRISPR-Cas系統對基因組特定的DNA片段進行切割,形成DNA雙鏈切口(double-strand breaks,DSBs)。在真核細胞內,對DSBs的修復機制有2種:非同源末端連接(non-homologous endjoining,NHEJ)和同源重組(homologous recombina?tion,HR)。NHEJ是不依賴于模板的切口修復,通過對斷端的單純連接來實現,會導致核苷酸插入與缺失[11]。HR以同源DNA為模板,通過同源重組的方式修復DSBs,這種修復方式更精確。通過設計同源DNA模板,可以人為地將外源DNA片段插入基因組特定位點中[12-13]。
Cas9有2個發揮切割作用的結構域——HNH和RuvC,分別切割靶序列的非互補鏈和互補鏈。有研究報道[14],突變RuvC或HNH可以產生切口酶,切口酶只有單鏈切割活性,可以降低Cas9的脫靶效應。另外,同時突變HNH和RuvC結構域,可以得到沒有切割活性的dCas9[7]。dCas9保留了特異性結合DNA的功能,可以通過聯合轉錄調控因子,如轉錄抑制因子(KRAB、Mxi1等)[15-16]或轉錄激活因子(VP64、p65等)[17-18]來調控DNA的轉錄過程。
Cas12a(之前被命名為Cpf1)是CRISPR-Cas ClassⅡtypeⅤ-A系統的一種核酸內切酶。與Cas9不同,Cas12a對DNA的切割不需要tracrRNA的協助[19],同時它參與前體crRNA的成熟過程[20]。因此,CRISPR-Cas12a系統對DNA進行靶向切割只需要crRNA和Cas12a這2種組分。
RuvC和Nuc是Cas12a蛋白對DNA進行切割的2個結構域[21-22]。與Cas9的RuvC結構域不同,Cas12aRuvC直接切割DNA雙鏈,Nuc在這個過程中起輔助作用[22-23]。因此,Cas12a蛋白RuvC結構域的突變直接導致其DNA切割作用的喪失。CRISPR-Cas12a系統對靶DNA的切割依賴于對非互補鏈上富含T的PAM序列的識別[19,24],Cas12a蛋白在遠離PAM端對DNA雙鏈進行切割[19,25]。
與CRISPR-Cas9系統相比,CRISPR-Cas12a更適于編輯富含AT的DNA序列,因其切割作用的發揮依賴于富含T的PAM的存在。同時,Cas12a蛋白切割DNA雙鏈形成互補的粘性末端,能增加同源重組修復的幾率,從而提高外源基因導入效率[19]。在特異性方面,也有研究報道,Cas12a的脫靶效應比Cas9更低[26-27],這些優勢讓CRISPRCas12a系統有望成為比Cas9更適于靶向基因編輯的工具。
2014 年,O′Connell等[28]通過體外實驗發現釀膿鏈球菌Cas9(SpCas9)可以對ssRNA進行切割。我們知道,SpCas9識別和切割DNA作用的發揮依賴于非互補配對鏈上5′-NGG-3′PAM的存在。O′Connell等通過外源提供一段含有PAM序列的ssDNA寡聚核苷酸鏈(稱為PAMmers),這段序列能與靶ssRNA互補配對,SpCas9就能在crRNA的協同作用下識別PAM結構,在靶ssRNA的特定位點進行切割。
RCas9系統對靶RNA的切割需要SpCas9、gRNA和PAMmer這3種組分。如何有效地將3種組分轉入細胞并發揮作用,是該系統實際應用的難題之一。其次,PAMmer是一段寡聚核苷酸單鏈,在細胞內容易被RNaseH降解[28-29]。另外,該系統也會對含有PAM結構的細胞核DNA進行攻擊,造成基因突變。這些缺點限制了RCas9在科學研究中的使用。
CRISPR-FnCas9是CRISPR-CastypeⅡ的一種亞型。FnCas9的作用方式與SpCas9相似,在crRNA和tracrRNA的協同作用下,通過識別5′-NGG-3′PAM結構對dsDNA進行切割[30]。但與CRISPR-SpCas9不同的是,CRISPR-FnCas9中存在一種被稱為 scaRNA(smallCRISPR/Casassociat?edRNA)的小RNA,能與tracrRNA形成雜合雙鏈RNA,scaRNA:tracrRNA雜合雙鏈引導FnCas9對真核細胞中的病毒RNA進行切割[31]。CRISPR-Fn?Cas9對靶RNA的識別不依賴PAM結構[32]。Price等[32]對CRISPR-FnCas9系統進行改造,將tracrRNA和scaRNA整合形成rgRNA(RNA-targetingguide RNA),利用FnCas9:rgRNA復合物對人肝癌細胞中的丙肝病毒(HCV)基因進行失活,檢測結果顯示病毒蛋白的表達下降約60%。然而,FnCas9靶向切割RNA的機制并不清楚[30],Price等發現Fn?Cas9對HCV的表達抑制似乎是通過抑制病毒本身的復制和翻譯過程實現的,而不是直接降解病毒RNA。另外和CRISPR-RCas9一樣,CRISPRFnCas9同樣可以對細胞核的DNA發生作用,這種脫靶效應的存在限制了它的使用。
CRISPR-Cas13a系統屬于CRISPR-CasClassⅡ typeⅥ-A,最早由Abudayyeh等在纖毛菌Lepto?trichiashahii中發現[33]。Abudayyeh 等[33]發現L.sha?hiiCas13a(LshCas13a)蛋白能在一段含28個核苷酸的特異性RNA序列的協同作用下,幫助大腸桿菌抵御噬菌體MS2(一種ssRNA病毒)的入侵。同時他們發現在Cas13a的切割過程中存在其他旁系ssRNA的非特異性切割,這種作用機制可能與病毒入侵過程中誘導宿主細胞程序性死亡有關。之后該系統的作用機制逐漸被闡明。該系統主要包括crRNA和Cas13a(之前被命名為C2c2)蛋白2種組分。成熟的crRNA由含有28個核苷酸的靶RNA結合序列和骨架結構組成。Cas13a蛋白是具有雙重作用的RNA酶[34],不僅參與crRNA的成熟過程,同時能特異性地對靶RNA進行切割。Cas13a切割活性的發揮主要依賴2個HEPN結構域,對HEPN結構域的組氨酸和精氨酸殘基進行突變可造成Cas13a的失活,形成dCas13a。dCas13a保留ssRNA的結合能力,但不能對其進行切割。同時,Liu等發現靶RNA3′端的Non-GPSF(protospacerflankingsite)結構的存在對crRNA和Cas13a作用的發揮至關重要[35]。
2017年,Abudayyeh等[36]進一步發現纖毛菌L.wadei來源的Cas13a(LwaCas13a)蛋白的切割活性和特異性比包括之前發現的LshCas13a在內的其他Cas13a蛋白都高,并且第一次利用多個crRNA在真核細胞中實現對ssRNA的多位點打靶,另外并沒有觀察到因Cas13a的非特異性切割而造成真核細胞的死亡。CRISPR-Cas13a系統展現出與RNA干擾相同的作用效果,但較后者有更高的特異性,同時該系統組分簡單,易于作為RNA編輯工具使用,目前已越來越受到研究者的關注。
Cas13b是屬于CRISPR-CasClassⅡ typeⅥ-B的Cas蛋白。Smargon等[37]研究發現,Cas13b的作用機制基本與Cas13a相同,例如靶向切割ssRNA而不能切割dsRNA,參與前體RNA的成熟過程,存在對旁系ssRNA的非特異性切割等。但與Cas13a不同的是,Cas13b發揮作用需要靶RNA的兩端均存在PFS結構,增加了該系統對ssRNA打靶的限制。Smargon等[37]同時也發現2種小的功能蛋白Csx27和Csx28,Csx27能抑制Cas13b對靶RNA序列的識別和切割作用,而Csx28則正好相反,能加強Cas13b的這種作用。
3.1.1 尋找新的功能基因或致病基因 已有研究者[38-39]利用多個gRNA組成的gRNAlibrary聯合Cas9對不同基因中編碼外顯子的序列進行打靶,造成相應基因表達蛋白功能的喪失,再經后續的陰性和陽性篩選過程,幫助找到影響細胞正常功能或導致疾病的關鍵基因。雖然用傳統的RNA干擾技術也能實現全基因組功能基因篩選,但CRISPR-Cas9系統特異性更高,適用范圍更廣。
3.1.2 構建疾病動物/細胞模型 將Cas9和gRNA注入實驗動物的受精卵中修飾特定的基因,獲得可以遺傳的基因型,從而得到轉基因動物模型。這種方法的優勢在于明顯縮短了建模時間,編輯特異性高,適用于大規模操作等。已有利用CRISPR-Cas9系統建立靈長類動物模型來研究神經精神疾病的研究[40]。目前,該方法建立動物模型最大的挑戰在于存在遺傳學嵌合現象(genetic mosaicism),產生該現象部分受到CRISPR-Ca9s系統基因打靶效率的影響。
也有研究[41]利用CRISPR-Cas9系統在人誘導多能干細胞(hiPSC)中插入2種與產生阿爾茲海默癥β淀粉樣蛋白有關的遺傳突變,隨后誘導這些干細胞轉化為神經元細胞并產生大量β淀粉樣蛋白,從而模擬阿爾茲海默癥的疾病表現。
3.1.3 用于轉錄調控 dCas9可以通過直接與DNA作用元件結合,或聯合轉錄激活因子或抑制因子,來調節DNA轉錄過程,但目前認為dCas9的這種調節作用相對較弱。有研究[18,42-43]利用多個gRNA引導攜有不同轉錄因子的dCas9結合同一個DNA作用元件(如轉錄啟動子),不同轉錄因子之間發揮協同作用,從而大大增強了dCas9對轉錄過程的調節效應。
3.1.4 用于活細胞的基因/蛋白顯像 帶有熒光蛋白標簽的dCas9能結合特定的DNA序列,通過熒光蛋白顯示活細胞內某個基因的空間位置。傳統用于標記DNA的熒光原位雜交(FISH)技術需要固定細胞,無法用于活細胞的基因追蹤。CRISPR-dCas9系統這種顯像的功能不僅可以用于檢測某種特定基因,還可用于研究基因組中各功能和結構元件之間的空間位置關系。
Yasuda等[44]利用CRISPR-Cas9介導同源重組修復對內源性蛋白進行單細胞標記(single-cell labeling of endogenous proteins by CRISPR-Cas9-mediated homology-directed repair,SLENDR)精確標記發育大腦中的內源性蛋白。更實際的一項研究[45]利用CRISPR-Cas9輔助的基于紙片的診斷模塊來檢測血液、尿液或唾液樣品的寨卡病毒(Zikavirus,ZIKV)
3.1.5 在基因治療上的潛在應用 CRISPR-Cas9能在特定位點切割DNA形成DSB,再通過NHEJ或HR方式引起異常基因失活及正常基因重建,從而修復特定的基因功能,為人類遺傳性疾病提供了新的治療手段。近年,利用CRISPR-Cas9系統治療鐮刀形貧血[46]、杜氏肌營養不良癥[47]等遺傳性疾病及清除受感染細胞中的人免疫缺陷病毒(HIV)治療艾滋病[48-49]的研究取得了較大進展。
CRISPR-RCas9、CRISPR-FnCas9、CRISPRCas13系統均能靶向作用于ssRNA,被認為是對mRNA轉錄組水平進行調控的重要工具,mRNA轉錄組水平的調控相較于DNA基因組水平的調控更加靈活、直接。自2014年O′Connell等發現RCas9可以靶向切割ssRNA以來,研究者就開始關注靶向結合RNA的CRISPR-Cas系統在mRNA轉錄調控、mRNA顯像、mRNA定向定位、RNA病毒干擾等方面的潛在應用價值,并做了初步探索。而最新發現的CRISPR-Cas13系統,由于其組分簡單、特異性高、作用機制相對明確等優點,成為研究者關注的焦點。以下以CRISPR-Cas13系統為例做進一步闡述。
3.2.1 利用CRISPR-Cas13系統對RNA的直接切割作用 Cas13可以通過直接切割特定mRNA來下調基因的表達,與傳統的RNA干擾技術相比,其適用范圍更廣。crRNA可以設計成gRNA庫,同時針對mRNA的多個位點進行打靶,實現對多個基因表達的下調。另外,先前有研究[50]將一段RNA剪切結構域和RNA結合結構域Pumilio/fem-3整合成一個人工RNA核酸內切酶,利用該酶對細菌和人的多種RNA實現表達沉默。Cas13的出現使上述過程的實現變得更加容易,可以用于沉默人體細胞中致病mRNA的表達[51]。
3.2.2 利用CRISPR-dCas13系統對RNA的特異性識別作用 通過對dCas13的切割結構域進行突變,可以得到沒有切割活性的dCas13蛋白。dCas13保留了特異性結合ssRNA的功能,可以作為一種gRNA引導的RNA結合蛋白應用于轉錄及轉錄后水平的編輯。
①轉錄后水平的mRNA編輯 利用dCas13能靶向結合但不能切割RNA的這一特性,聯合GFP等熒光顯示蛋白,可以用于顯示細胞內mRNA的活動軌跡。2016年Nelles等[29]最先利用沒有切割活性的RCas9-GFP、sgRNA和PAMmer追蹤ACTB mRNA從細胞核內轉移到細胞質中的過程,同時通過FISH觀察到ACTB、CCNA2和TFRC等3種mRNA的聚集現象。同樣我們可將dCas13蛋白與GFP等熒光顯示蛋白結合,用于顯示特定mRNA在細胞內的位置及轉移軌跡,從而監測細胞在不同環境狀態(如應激、損傷、疾病及藥物干預等)下mRNA轉錄組的行為學變化。更實際的應用價值在于利用dCas9的這種追蹤定位功能來富集某些表面標志不明確的成體干細胞,利用這些成體干細胞表達某種特定的mRNA,通過CRISPRCas13系統進行顯示來達到分離純化這些細胞的目的[52]。
其次,CRISPR-dCas13系統可以在轉錄后水平增強或抑制基因的表達。通過與調控轉錄后翻譯的增強子或沉默子結合,dCas13可以在沒有改變mRNA數量的情況下增強或抑制某個特定基因的蛋白表達,這種調控基因表達的方式不會對基因組本身造成影響。
另外,dCas13可以幫助mRNA定位到細胞的特定位置從而發揮其功能。例如,在神經元細胞中維持突觸結構和活性的PSD-95(postsynaptic densityprotein95)蛋白,其mRNA需要通過樹突到達特定作用部位后再翻譯成PSD-95蛋白[53],發揮相應的功能。dCas13可以通過與轉運因子結合幫助mRNA運輸到特定部位,如突觸前或突觸后末端,從而維持突觸的生長和功能,這對神經元損傷后再生修復有重要意義[52]。
②pre-mRNA水平的編輯 dCas13可以引導剪接因子至pre-mRNA的特定位置,從而調控mRNA的剪接過程。之前有研究[54-55]利用RNA結合蛋白(如PUF、MS2等)聯合剪接增強因子(如富含精氨酸/絲氨酸的結構域)或剪接抑制因子(如富含甘氨酸的結構域)來改變特定mRNA的剪接模式。Cas13能使靶向pre-mRNA的過程更容易實現,并且能對多個位點同時進行操作,可用于干預mRNA的異常剪接過程,從而逆轉因mRNA的異常剪接而導致的細胞功能異常等后果。
另外,dCas13可用于REPAIR的編輯過程,REPAIR的全稱為RNA Editing for Programmable adenosine-to-inosine(A-to-I) Replacement。已有研究[56]利用dCas13b-ADARDD實現了這一編輯過程。其意義在于,許多疾病如局灶性癲癇、杜氏肌營養不良癥及帕金森病等都與G-to-A的基因突變有關,REPAIR過程可以在mRNA水平逆轉A突變,從而達到治療疾病的目的。
3.2.3 對RNA病毒的干擾 發現于細菌體內的CRISPR-Cas13系統不僅能直接對侵入細菌的噬菌體RNA進行切割,同時能激活細菌的免疫系統來抵御外來的噬菌體RNA[33]。利用CRISPRCas13系統的這一特性,可以干擾RNA病毒在真核細胞中的表達。早前也有研究[32]利用FnCas9來抑制真核細胞中人HCV的表達。相較于Fn?Cas9,Cas13的作用機制更加明確,不僅可以直接或通過細胞自身的免疫系統抑制RNA病毒的活性,而且可以用于干擾需要轉錄成RNA發揮作用的DNA病毒。
3.2.4 腫瘤等疾病的治療 目前腫瘤的治療注重于靶向殺傷腫瘤細胞而不對正常細胞造成影響。理論上,CRISPR-Cas13系統能特異性結合腫瘤細胞的mRNA,能夠直接影響某一特定mRNA功能的發揮,同時可以激活細胞程序性死亡過程,直接殺死腫瘤細胞[57-58]。目前尚須進一步的研究來驗證和完善這一推論,但Cas13用于腫瘤靶向治療的前景不容忽視。
參考文獻