王亦學,郝曜山,張歡歡,孫 毅
(山西省農業科學院生物技術研究中心,山西太原030031)
高產、穩產、優質一直以來都是育種家不斷努力追求的目標。常規的雜交育種方法是將作物種內的優異基因聚合在一起,從而培育出高產、優質、抗逆性強的作物新品種,但是其選育時間長,可選擇的范圍有限,極大地限制了育種的進程。作物內源基因定向改造的實現為作物的遺傳改良提供了新的思路與途徑。近年來,在生命科學領域中不斷發展和完善的基因編輯(genome editing)技術,可以對目標基因進行精準修飾,為作物基因工程育種提供了新的技術手段。
本文介紹了基因編輯技術的發展歷程以及CRISPR/Cas9 系統的結構組成、工作機制和技術優勢,綜述了CRISPR/Cas9 系統在作物基因工程育種上的應用進展,探討了CRISPR/Cas9 系統一些亟待解決的問題和未來的發展方向,以期為開展這一領域工作的研究提供參考,推動該項技術得到更加廣泛的應用。
伴隨著DNA 重組技術和植物組織培養技術的發展,植物基因工程技術應運而生。作為傳統的植物基因工程育種技術轉基因技術,可以將特定遺傳屬性的目標基因轉移到植物體內,通過目標基因的重組,從而培育出具有特定遺傳屬性的作物新品種[1]。其克服了傳統育種周期長、打破了物種間生殖隔離及不良基因連鎖等一系列問題。目前,轉基因技術已經在近200 種植物中得到廣泛應用,轉化的目標性狀也從抗病蟲害、抗除草劑拓展到抗逆、品質改良等各個方面[2-5]。
雖然轉基因技術可以通過調控相關基因的表達獲得理想的目標性狀,但是也存在自身的技術缺陷和潛在的風險因素。一是外源基因表達量不確定。在超表達過程中,外源基因整合到植物基因組中之后,容易發生基因沉默[6];由于外源基因在整合到植物基因組時,其插入位置具有隨機性,這很可能導致某些決定植物重要性狀的基因遭到破壞,從而造成不良性狀的產生。二是無法對基因進行精準敲除。T-DNA 插入技術和轉座子技術對基因的敲除是隨機的;反義技術和RNAi 技術只能在轉錄水平上對目標基因進行表達干擾,其抑制效果不完全,而且遺傳不穩定[7]。三是轉基因技術存在安全性問題。轉基因技術可以使得來自不同遺傳背景的基因在不同的種、屬間進行轉移,這些基因在新的遺傳背景中是否會脫離控制,至今仍然沒有明確的定論[8]。另外,轉基因技術在操作過程中不可避免地插入報告基因、篩選標記基因等,使得獲得的品種存在一定的爭議性。總之,作為傳統基因工程技術的核心轉基因技術,雖然可以對目標基因的表達進行調控,但是其無法對目標基因進行精準修飾,在基因工程育種中受到了一定的限制。
序列特異性核酸酶(Sequence specific nucleases,SSNs)的出現使得基因的精準修飾成為可能。基因編輯技術就是利用序列特異性核酸酶在基因組特定位點產生DNA 雙鏈斷裂(Double strand breaks,DSBs),隨后通過非同源末端連接(Non-homologous end joining,NHEJ)和同源重組(Homology directed repair,HDR)2 種自我修復途徑,實現基因的敲除、定點插入或替換。其中,NHEJ 往往能夠使斷裂位置發生不精確的重新連接,包括堿基的缺失或插入,實現基因敲除的目的;而HDR 主要是通過同源重組來實現精確的定點替換[9]。通常情況下,DNA 雙鏈斷裂的修復方式以NHEJ 為主,HDR 發生的概率很低。
20 世紀90 年代,利用不同鋅指蛋白可特異性識別DNA 序列上的堿基三聯體以及核酸酶Fok I二聚化后可以切割DNA 序列的特點,人們將序列特異性識別的鋅指蛋白DNA 結合域偶聯Fok I,形成了第一代基因編輯技術即鋅指核酸酶技術(Zinc finger nucleases,ZFNs)[10-12]。但由于鋅指蛋白的種類有限,使其可識別并切割的DNA 序列不多,而且其操作復雜、成本高,極大地限制了ZFNs 的應用。
之后人們發現,植物病原體黃單胞菌分泌的TALE 蛋白能夠特異性識別DNA 序列中的一個堿基,于是TALE 蛋白替代鋅指蛋白,形成了第二代基因編輯技術即轉錄激活因子樣效應核酸酶技術(Transcription activator-like effector nucleases,TALENs),并且在2010 年首次應用于植物中[13]。雖然TALENs 比ZFNs 操作簡單,但是TALENs 仍然需要在TALE 蛋白中構建復雜的串聯重復表達單元,這也在一定程度上限制了TALENs 的應用。
最近,一種新型基因編輯系統成簇的規律間隔短回文重復序列(Clustered regularly interspaced short palindromic repeats/CRISPR)相關核酸酶系統(CRISPR/Cas),以其實驗操作簡單、高效切割靶位點等優勢,迅速取代了前2 代基因編輯技術,成為第三代基因編輯技術[14]。該技術利用一段向導RNA和配套的核酸酶,對特定的基因組DNA 序列進行精準修飾,已經在動、植物基因組編輯中得到廣泛應用。
CRISPR/Cas 基因編輯系統是真細菌和古細菌為了抵御外界病毒或噬菌體的侵入,通過切割外源DNA 來保護其不受病毒或噬菌體等核酸的侵襲而形成的自身免疫系統[15],其是由前導序列(Leader sequence)、CRISPR 序列和一組Cas 基因家族共同組成。其中,前導序列負責啟動轉錄形成CRISPRRNA(crRNA);CRISPR 序列則是由一些高度保守的正向重復序列(repeat)和非重復間隔序列(spacer)交替排列組成(spacer 是病毒、噬菌體等核酸侵入后的痕跡,賦予細菌對相應病毒、噬菌體的免疫防御能力);Cas 基因家族編碼多種Cas 蛋白形成復合體,起著核酸酶切割修飾作用,防御入侵的外源遺傳物質[16-17]。CRISPR/Cas 系統基于CRISPR 序列和Cas 蛋白種類的不同,可以分為3 種類型:I 型、II 型和III 型。其中,I 型和III 型系統較為復雜,需要多個Cas 蛋白參與才能完成切割活性;而II 型系統較為簡單,只需一個Cas9 蛋白即可完成對特定外源DNA 的切割[18]。
目前,應用最為廣泛的CRISPR/Cas9 基因編輯系統就是在II 型系統基礎上經過遺傳工程改造獲得的。改造后的CRISPR/Cas9 系統由sgRNA(single guided RNA)與Cas9 蛋白2 個部分組成,通過人工設計特異的sgRNA,識別靶標DNA 序列,引導Cas9蛋白對其進行切割,Cas9 蛋白的HNH 結構域特異性識別與crRNA 互補的模板鏈并進行切割;RuvC結構域切割另一條非互補鏈,最終導致雙鏈斷裂。切割過程還需要在靶標DNA 序列上有一段保守的前間隔序列鄰近基序(Protospacer adjacent motif,PAM),sgRNA 與PAM 序列共同決定CRISPR/Cas9對靶位點結合的特異性[19]。通常在進行植物基因組編輯時,一般將sgRNA、Cas9 基因和篩選標記基因這3 個表達框同時構建到雙元載體的T-DNA 區。如果在雙元載體的T-DNA 區中構建多個sgRNA表達框,就可以同時對基因組上的多個靶位點進行編輯[20]。
CRISPR/Cas9 基因編輯系統作為一項新興技術,與傳統轉基因技術相比,具有幾個方面的優勢:一是CRISPR/Cas9 系統能夠在基因組DNA 水平上實現對靶標基因的定點敲除,從而徹底抑制靶標基因的轉錄與表達,并且可以穩定遺傳。二是CRISPR/Cas9 系統不僅可以同時對多個靶位點進行編輯,而且還可以實現對靶位點的精確修飾。三是CRISPR/Cas9 系統可以實現基因編輯位點和篩選基因、報告基因的分離,通過后代篩選去除這些外源基因[21]。四是經過CRISPR/Cas9 系統改良的作物新品種,與自然突變材料一樣,在生產應用上更為安全,因而人們更容易接受[22-23]。
目前,許多科研團隊相繼開發了多種高效的CRISPR/Cas9 載體系統,為推動該系統在作物育種中的應用提供了堅實的理論依據和技術保障。CRISPR/Cas9 基因編輯系統現已在擬南芥[24-25]、小麥[26]、玉米[27]、水稻[28-29]、煙草[30-31]等多種植物中實現了定點基因組編輯,用于改善作物的多種性狀,包括抗病、抗逆、抗除草劑、產量水平以及營養價值等。
由于雙鏈斷裂修復方式中同源重組的發生概率很低,所以CRISPR/Cas9 基因編輯系統目前應用最為廣泛的就是目標基因的敲除,并且可以同時對多個目標基因進行敲除。2013 年8 月,在《Nature Biotechnology》期刊報道了2 篇有關CRISPR/Cas9系統在模式植物擬南芥和煙草上獲得成功應用的研究[32-33];2014 年10 月,在《Nature Protocols》期刊又報道了1 篇CRISPR/Cas9 系統在水稻和小麥上實現目標基因的敲除的研究[34]。LI 等[32]定點敲除了模式植物擬南芥中的3 個基因AtPDS、AtFLS 以及AtRACK,并且植株的突變效率達到26%~84%。NEKRASOV等[33]定點敲除了本生煙中的基因NbPDS。SHAN 等[34]定點敲除了水稻中的4 個基因OsPDS、OsMPK2、OsBADH2 和Os02g23823,其中,敲除水稻OsPDS 基因后的突變體呈現矮小白化的表型性狀。此后,CRISPR/Cas9 系統在其他植物中也得到了廣泛應用。WANG 等[35]同時敲除小麥3 個同源基因TaMLO 后獲得的突變體對白粉病表現出較強的抗性。WANG 等[36]在水稻中靶向OsERF922 基因誘導突變,提高了水稻對稻瘟病的抵抗能力。LI 等[37]通過靶向敲除玉米ZmTMS5 基因,獲得具有熱敏雄性不育性狀的玉米新材料。SHI 等[38]對玉米乙烯反應的負調控因子ZmARGOS8 基因的啟動子區域進行基因編輯,提高了玉米的抗旱性。
利用測序技術和關聯分析對一些作物基因組中的優異變異位點進行鑒定之后,CRISPR/Cas9 基因編輯系統通過定點替換為利用這些優異變異位點提供了可能。SVITASHEV 等[39]利用CRISPR/Cas9系統對玉米ZmALS2 基因進行精確替換,使編輯后的玉米材料具有了除草劑抗性。SUN 等[40]對水稻中淀粉分支酶OsSBEIIb 基因進行了精確替換,使得水稻的直鏈淀粉含量增加。LI 等[41]在水稻中對內源基因OsEPSPS 實現了基因替換,效率為2.0%。利用CRISPR/Cas9 系統還可以在植物基因組中定點高效地敲入目標基因。WANG 等[42]利用CRISPR/Cas9系統和雙生病毒載體系統,對水稻進行了外源基因的定向敲入,其效率達到19%,這是一種簡單而且高效的外源片段定點敲入方法,為基因功能研究和作物精細育種提供了新的研究手段。
盡管CRSPR/Cas9 基因編輯系統在作物基因工程育種中取得了一定的理論和實踐成果,但其仍存在一些亟待解決的問題。一是在切割過程中,與靶位點序列高度相似的其他位點也有可能被切割,引起非靶位點的突變,造成脫靶效應。二是Cas9 蛋白能夠識別的PAM序列主要是經典的NGG,使得基因編輯的范圍有限。三是雙鏈斷裂的修復方式中同源重組效率較低,難以實現高效率的大片段插入或精準的堿基替換。四是許多植物仍然沒有成熟高效的遺傳轉化體系,限制了該系統在該種植物上的研究與應用。五是雖然目前許多植物的基因組測序工作已經完成,但是許多決定重要農藝性狀的主效基因以及與重要農藝性狀相關聯的優異變異位點仍然沒有被完全挖掘與鑒定,這也在一定程度上限制了該系統的應用。針對上述問題,科學家們也在不斷發展與完善這項技術,如提高sgRNA 序列特異性,有效降低脫靶效應,提高編輯效率;通過對Cas9蛋白進行改造,使其識別不同的PAM序列,擴大編輯范圍;另外,選擇適合于目標生物的啟動子,保證高效驅動Cas9 蛋白和sgRNA 的轉錄。
基因編輯技術是繼轉基因技術之后在生物遺傳操作領域的又一項新技術。伴隨著測序技術的不斷發展以及測序成本的不斷降低,許多作物的基因組測序工作已經完成,這為基因組編輯改良作物提供了便利。CRISPR/Cas9 基因編輯系統具有成本低廉、周期短、載體構建簡單、編輯效率高等特點,為作物的遺傳改良提供了新的思路。利用CRISPR/Cas9 基因編輯系統定點敲除不良基因,從而對作物的目標性狀進行精準改良,將會大大提高定向遺傳改良的效率。CRISPR/Cas9 基因編輯系統將會在植物基因工程育種研究領域發揮更為廣泛而重要的作用。