劉肖靜,王旭靜,王志興
中國農業科學院生物技術研究所, 農業農村部農業轉基因生物安全評價(分子)重點實驗室, 北京 100081
CRISPR-Cas9技術的原理是在sgRNA的引導下,Cas9蛋白可以對特定的雙鏈DNA進行切割,利用細胞的天然修復機制可以發生堿基的插入、替換和缺失,從而造成移碼突變,實現功能基因的鑒定,獲得和培育優良性狀的農作物。由于該技術操作簡單、高效,因而成為科學研究不可或缺的工具。本文簡單地回顧了CRISPR-Cas9的作用原理,詳細介紹了最新開發的一系列CRISPR變體,歸納總結了CRISPR-Cas系統在植物中的應用、現階段面臨的挑戰、基因編輯植物檢測方法與各國的監管政策,以期為CRISPR-Cas系統在植物中的應用研究及監管研究提供參考。
在細菌的天然免疫系統內首次發現了CRISPR-Cas家族,它的主要功能是對抗外來入侵的病毒及DNA,包括CRISPR基因座和Cas基因兩部分。根據Cas的數目和功能將其分為兩個大類共6種類型(Ⅰ~Ⅵ)[1],其中第一大類包含有Ⅰ、Ⅲ和Ⅳ型,它們在靶向切割目標序列時需要多個Cas蛋白協同工作;Ⅱ、Ⅴ、Ⅵ型屬于第二大類,區別于第一大類,它們只需要單一的Cas蛋白就能夠靶向目標序列。在這兩類系統中第二類中的Ⅱ型系統因其組成較為簡單,僅以一個Cas9蛋白及向導RNA(gRNA)為核心組成,所以是目前使用最廣泛的基因編輯工具[2],工作原理如圖1所示。

圖1 CRISPR-Cas系統的工作原理[3]Fig.1 Natural mechanisms of CRISPR-Cas system[3]
Cas12a也被稱為Cpf1,是與Cas9最為相似的一個系統。它識別的PAM序列是5′-TTTV-3′,作用原理為利用RuvC-like結構域在crRNA引導下即可切割雙鏈DNA,不需tracrRNA的參與且切割后產生黏性末端,有利于提高基因定點插入的效率;與Cas9相比,Cas12a只需要一個長度為42 nt的crRNA,且它的蛋白也比Cas9的蛋白更小,更加有利于多靶點編輯和小載體系統。CRISPR-Cas12a目前主要用于水稻、煙草、玉米的研究[4-7];該系統和單堿基編輯器成為繼Cas9之后被廣泛應用的新型基因編輯系統。
單堿基編輯器包含胞嘧啶編輯器(cytosine BE,CBE)和腺嘌呤編輯器(adenine BE,ABE)兩種,它是指在不需要供體DNA模板或不產生DSB,甚至不依賴于HDR和NHEJ修復途徑的情況下,在靶位點上引起精確且可預測的核苷酸替換;其中CBE編輯器是由大鼠胞苷脫氨酶APOBEC1與Cas9切口酶[nCas9(D10A)]和尿嘧啶糖基酶抑制劑(UGI)融合而成的,在sgRNA的引導下實現了胞嘧啶(C)到尿嘧啶(U)的轉換;ABE編輯器是由腺苷脫氨酶與Cas9切口酶融合而成,通過類似于CBE的作用機理實現了腺嘌呤(A)到鳥嘌呤(G)的替換[8]。
目前已在水稻、小麥、玉米、擬南芥等植物中應用了單堿基編輯系統,且在穩定的轉基因株系中評估了ABE和CBE的編輯效率和脫靶活性。研究表明,同一個編輯系統在不同靶點位置的編輯效率不同,CBE系統在靶位點處容易發生非特異性的插入和缺失,而在ABE編輯的植物中并未發現非特異性的突變。這表明CBE編輯器比ABE編輯器更加容易產生脫靶,研究發現脫靶現象與Cas蛋白的活性及sgRNA的特異性無關,這可能是由于胞嘧啶脫氨酶的活性造成的[9]。
xCas9和Cas9-NG兩者都是SpCas9的變體,都在一定程度上擴展了編輯的PAM位點。xCas9可以識別以NG、GAA和GAT為特征的PAM位點,具有較高的DNA特異性和編輯效率;使用xCas9替換Cas9與胞苷脫氨酶或腺苷脫氨酶相融合構建成xCas9單堿基編輯器,對于實現精準編輯目的基因更是意義非凡。Cas9-NG可以識別NG、NAC、NTG、NTT和NCG的PAM位點,并成功用于單基因敲除、多基因敲除、單堿基編輯以及靶基因轉錄激活調控[10-11]。
CRISPR-Cas13與前面幾個CRISPR-Cas變體不同的是Cas13為RNA引導的RNA編輯器,可以特異性靶向切割病毒RNA和真核細胞中的內源RNA。最近研究人員利用失活的Cas13將RESCUE引導到RNA轉錄本中的目標胞嘧啶堿基上,實現了C到U的轉化[12-13],證明了Cas13作為RNA編輯器的潛在廣闊應用前景。
Cas14a能夠結合并切割單鏈DNA(ssDNA),它的蛋白大小約是其他Cas蛋白的一半,且不需要識別PAM序列,是理想的抗植物ssDNA病毒的工具[14]。
引導編輯是目前最新開發的一種基因編輯方法,該方法可以在不引入雙鏈斷裂和供體DNA模板的前提下,實現靶位點的插入、替換、缺失和所有12種類型的點突變。它的組成包括兩部分:第一部分為pegRNA,即在我們熟知的sgRNA 3′端加上一段引物結合序列(primer binding site,PBS)和轉錄模板序列(RT template);第二部分為引導編輯蛋白,由Cas9切口酶(Cas9 nickase僅有切割單鏈的功能,H840A)和逆轉錄酶(M-MLV RT)兩者融合組成。它的工作原理是Cas9切口酶在pegRNA上的sgRNA序列指導下,切割DNA單鏈識別位點NGG,pegRNA的引物結合序列(PBS)可以與切割位點前的互補序列識別配對,逆轉錄酶(M-MLV RT)以pegRNA上的人工設計的模板序列為模板進行逆轉錄,從而將目標序列直接聚合到切割位點處的DNA鏈上。通過這個工作原理,可以在無需引入雙鏈斷裂和外源DNA供體模板的情況下,有效地產生精確的堿基替換、插入和缺失等突變。
最近該系統已經成功運用在植物領域中,但是它在植物中的編輯效率是極低和不穩定的,因此還需要進一步優化植物載體元件、pegRNA設計的參數、非編輯鏈切口形成的時間和位置等[15-17]。
3.1.1構建植物全基因組突變體庫 植物細胞中DSB主要是通過NHEJ途徑進行修復,在修復的過程中出現小片段、大片段的缺失或者個別堿基的插入、替換等,從而發生移碼突變導致基因的沉默,對基因的功能進行研究。如利用CRISPR-Cas9技術在水稻全基因組范圍內構建sgRNA文庫創制水稻突變體庫對功能基因進行研究,該方法為植物遺傳育種提供了新的思路[18]。
3.1.2基因的定點插入和替換 基因的定點插入和替換是通過植物細胞的另一個修復途徑HDR實現的,當雙鏈DNA斷裂時同時引入一段供體模板,該模板序列兩端都攜帶有與斷裂處相同的堿基序列,這時細胞中有可能會發生HDR途徑即通過同源重組實現供體序列的精確插入和替換;這種編輯方式有利于研究多基因控制的優良性狀,但是由于HDR途徑在細胞中發生的概率太低,因此限制了該方式在植物上的應用[19]。
目前提高HDR途徑的發生有以下幾種方法:①通過抑制NHEJ途徑來提高HDR介導的基因靶向效率;②將大量的修復模板供體DNA遞送至植物細胞核,粒子轟擊可以提供多個供體DNA拷貝。如結合雙粒病毒載體構建CRISPR-Cas9系統,通過雙粒病毒載體將豐富的供體 DNA 輸送到植物細胞中,可獲得高達19.4%的靶向堿基替換或插入頻率;還有一種方法是使用RNA作為修復模板在植物中實現CRISPR-Cpf1介導的同源重組修復[20],利用轉錄本RNA作為修復模板,借助于核酶(ribozyme)自切割和 CRISPR-Cpf1系統既切割DNA又切割RNA的特性,通過同源重組修復方式,實現了水稻乙酰乳酸合成酶(OsALS)等位基因的替換,建立了RNA轉錄本作為修復模板介導的DNA同源重組修復體系。除此以外,有研究報道通過在基因相鄰的兩個內含子中分別設計一個靶位點,利用NHEJ途徑實現基因的定點插入和替換,這個方法的優勢在于內含子中雙鏈斷裂位點的堿基變異不會影響所在基因的功能。
新開發的單堿基編輯器成為植物中HDR介導堿基精確替換和插入的替代方法[21]。由于這種方法既避免了NHEJ途徑修復的隨機性,同時也避免了HDR途徑修復的低效率性,因而目前已較為廣泛地應用在水稻、小麥、擬南芥、玉米等植物中[22-27]。
利用CRISPR-Cas系統可以調控基因的表達,從而獲得高產、抗病、抗逆等農作物的優良品質。第一種思路是研究者通過對靶基因的啟動子活性區域進行編輯,既而改變基因的表達水平與調控模式。例如破壞水稻OsSWEET14啟動子中的細菌衍生蛋白結合序列導致對細菌枯萎病的抗性增加;靶向修飾宿主疾病易感基因CsLOB1啟動子獲得了抗潰瘍柑橘品種[28-29];編輯內源基因EPSPS和ALS產生了抗除草劑的水稻;對番茄中多個基因的啟動子區順式調控元件(CRE)的編輯實現了果實大小等重要農藝性狀的精準調控[30]。第二種思路為通過dCas9和特定的轉錄調控結構域結合,形成融合蛋白,從而調控基因的表達。dCas9是Cas9蛋白的一種突變體,即Cas9蛋白的RuvC1和HNA兩個核酸酶活性結構域同時發生突變失活,dCas9蛋白失去了內切酶活性,只保留由sgRNA引導進入基因組的能力,這種方法已經在水稻、煙草和擬南芥中得到應用[31-32]。還有一種思路即基因編輯與表觀遺傳修飾的結合,利用dCas9融合各種表觀調控效應器,由sgRNA引導進入目標基因組位點進行特異性的表觀調控。如dCas9融合轉錄因子或轉錄原件,通過招募轉錄因子或修飾因子起到調控作用[33-38];或者dCas9和表觀遺傳修飾酶形成融合蛋白,可以高效地催化DNA和組蛋白的表觀修飾,達到了基因的表達調控,目前這種思路在植物中報道很少。
值得注意的是,單堿基編輯器也是利用了缺陷型的Cas9蛋白,但使用單堿基編輯器只產生nick而不產生DSB的nCas9,且它融合的是堿基編輯蛋白胞苷脫氨酶和腺苷脫氨酶;CRISPR介導的表觀遺傳調控則是使用完全失去內切酶活性的dCas9,它融合的是激活因子和抑制因子等。
同時設計多個不同的sgRNA分別靶向多個基因或者在保守序列區域設計一個sgRNA靶向多個同源基因,這種多靶點編輯方法適用于功能冗余基因和基因家族的研究;例如同時敲除水稻GW2、GW5和TGW6基因,明顯提高了水稻的籽粒重量[39];對六倍體普通小麥TaMLO基因的3個同源等位基因同時進行敲除獲得了廣譜抗白粉病小麥新品種[40]。
盡管CRISPR-Cas系統是一種強大的基因編輯工具,但依然存在很多局限。如:編輯效率的高低、脫靶問題和未知的非預期效應、PAM識別位點的限制、同源重組途徑效率低下,以及不同植物的轉化問題等。
脫靶效應是指在基因編輯過程中,當sgRNA序列識別出特定序列之外的部分錯配而不是靶位點時,就會發生非特異性切割從而產生脫靶效應。脫靶可以導致染色體重排,干擾染色體的穩定性發生未知的非預期效應;還可能導致非靶基因功能活性的喪失,從而導致各種生理或信號異常,影響植物的生長發育。在植物中,CRISPR-Cas系統已在超過30種植物和數百個基因中實現成功編輯[41],脫靶現象的出現對于基因編輯技術的應用帶來了很大的不確定性。因此非常有必要對基因組編輯中存在的脫靶問題進行系統分析,進一步提高基因編輯的特異性。
研究表明脫靶情況的出現與靶序列的特異性有關[42~43]。目前,提高基因編輯特異性的方法有三種,第一種方法是提供兩個Cas9蛋白,例如兩個DNA單鏈可以被一對Cas9切口酶[nCas9(D10A)]切割。但該方法在編輯位點的選擇上存在局限性,且重組載體中含有兩個Cas蛋白降低了植物轉化的效率。第二種方法是優化改造更多的Cas蛋白變體,如前面所列舉的單堿基編輯器(BE)、xCas9等系列Cas蛋白變體,它們擴展了PAM序列的識別位點,擴大了基因組的編輯范圍,提高了編輯效率。第三種方法是直接截短sgRNA的長度或者改造sgRNA的結構,已有實驗證明截短sgRNA長度可以降低脫靶活性,但是相應的編輯效率也會降低[44-51];研究者通過改造sgRNA二級結構在它的5’末端延伸出1個hairpin發卡結構(hp-sgRNA)將該結構引入到間隔序列(the spacer)上,阻礙脫靶位點R-loop的形成,可有效抑制Cas9在脫靶位點的活性,從而實現CRISPR系統特異性的提高。除此以外,可以利用全基因組測序(WGS)的方法檢測脫靶情況,目前已經在水稻和棉花中進行了報道,證實有個別脫靶情況的存在。同時研究人員開發了一系列的脫靶預測工具分析脫靶情況,如:CRISPR-P和CRISPR-GE等,設計sgRNA時應該選擇靶點得分高的進行編輯,并在獲得編輯的植株后對其潛在預測的脫靶位點進行測序分析。
利用CRISPR-Cas系統在植物中進行基因編輯后,獲得的植株將產生不同的突變。目前基因編輯位點檢測方法最常用的有3種:Sanger測序的靶點檢測方法、T7E1(T7 endonuclease I)法和高通量二代測序NGS(next generation sequencing)。
5.1.1Sanger測序的靶點檢測方法 該方法通過特異性引物擴增編輯位點序列進行測序,測序結果顯示正常的通過與野生型靶序列比對得到基因純合突變類型的植株,如果測序結果顯示雙峰,首先觀察雙峰位點是否從切割位點附近開始,然后構建克隆T載體,并挑取多個克隆進行Sanger測序,從而獲得多種突變類型的植株;這種方法雖然簡便但是只適合少量基因編輯植株的檢測,耗時長花費也比較高。
5.1.2T7E1法 該方法是通過特異切割錯配分子從而檢測突變情況,它可以識別和裂解不匹配的異雙鏈DNA,可以檢測到長達12 nt的插入和缺失[52],被認為適用于任何目標序列,但是它的檢測靈敏度較低。
5.1.3高通量二代測序NGS 利用該技術可以對編輯的植株進行全基因組測序,獲得該植株所有的基因序列信息;目前在分析CRISPR-Cas系統的脫靶情況都是采用這種方法,通過全基因組測序分別檢測編輯植株、經過農桿菌轉化的野生型植株和野生型植株的基因序列信息,比較獲得的SNP、Indel、SNV,從而評估它的編輯和脫靶情況[9]。
CRISPR-Cas系統的優勢顯而易見,且用途和適用性廣泛,在市場商業化方面有廣闊的應用前景。由于操作簡單、沒有外源DNA序列的插入,在監管方面就基因編輯是否以轉基因態度來對待,我國尚未出臺任何相關規定[39-41];目前不同國家和地區對它的監管持不同態度,還沒有形成統一的規定。
5.2.1美國對基因編輯的監管政策 2018年3月28日,美國農業部已經出臺政策指出對基因編輯產品不會進行監管。2020年6月,美國農業部給出了支持性的指南,可通過監管獲免和未來獲免決定監管狀況程序來監管基因編輯產品。監管獲免是指,植物性狀與通過傳統育種性狀一樣或者植物性狀已經獲得農業部的審批的,不用上市前審批。獲得監管獲免的植物品種包括3種類型:單堿基的刪除、單堿基對的替換、來源于有性親和的近緣植物的插入——對植物的改變僅包括從有性親和的近緣植物引入。如果產品沒有獲得獲免,可以寫信給APHIS上訴請求審批,如果通過可獲得獲免,不需要上市前審批,這就是未來獲免。后續美國農業部會逐步實施審批指南,以草案形式發布,征求意見[56-58]。
5.2.2日本對基因編輯的監管政策 日本處于一個不歡迎轉基因產品的大環境下,日本對基因編輯這種新技術保持謹慎的態度?;蚓庉嫳O管的核心問題是基因編輯產品有沒有核酸模板的插入,是否會產生除自然或性親和細胞外的核酸,如果這些插入的DNA來源于自然狀態下或者性親和即為非轉基因,反之,最終產品中是否體現該核酸,如沒有體現則為非轉基因,層層分析,個案分析。
5.2.3澳大利亞對基因編輯的監管政策 澳大利亞基因編輯監管的核心問題也在于基因編輯產品有沒有核酸模板的插入,目前已經落實的審議結果是:確定了幾種定點核酸技術,SDN1屬于自然修復沒有核酸模板的插入,屬于非轉基因;SDN2和ODM有核酸模板的提供,利用同源重組進行修復;SDN3定點插入了一個長片段,有核酸模板的插入;SDN2和SDN3以轉基因態度來對待。
5.2.4歐盟對基因編輯的監管政策 歐盟對于轉基因有很清晰的定義與立法。歐盟基因編輯監管的關鍵問題在于是否以轉基因的態度來對待基因編輯產品。2018年7月歐洲法院進行了法律解釋,即通過誘變獲得的生物體屬于轉基因生物,并且在原則上受到轉基因生物法規所規定義務的約束。然而,對于常規在多種應用上使用、且有長期的安全記錄的誘變技術,通過其獲得的生物體可以免除相關的義務,成員國可與歐盟法規一致,無須遵守指令所規定的義務或其他義務[59-61]。
CRISPR-Cas系統因其操作簡單、高效、成本相對較低,因而成為植物分子生物學中應用最為廣泛的技術之一,也是近幾年植物中研究的熱點方向?;蚓庉嫾夹g在作物遺傳育種、優良性狀改良、功能基因研究中都顯現了強大的優勢,雖然現在開發出了很多新型的CRISPR-Cas變體,進一步提高了基因編輯的特異性和高效性,擴展了PAM序列的識別位點,提高了同源重組修復途徑的編輯效率,優化了植物組培技術,但是脫靶情況仍然不能完全避免,這對于科學研究始終是一個不確定的未知因素,因此在應用基因編輯技術的時候必須考慮分析潛在的脫靶位點,研發編輯范圍廣、特異性高的CRISPR系統,進一步開發和優化編輯位點檢測方法仍然是科研工作者面臨的重大挑戰和今后突破的方向。