





摘 要: 基因編輯技術是修飾特定基因的新型分子工具,可在基因序列中有效引入新的突變,為分析基因功能和與表型相關的DNA序列提供了有效的手段。自發現以來,基因編輯技術已經成功應用在各種動物、植物及其他生物中,為基因治療及精準作物育種等領域提供了重要技術支撐。本文旨在回顧近年來基因編輯工具的發展,闡述了經典編輯工具、堿基編輯工具和其他新編輯工具的進展,以期為相關領域科研人員進一步了解、優化編輯系統提供參考。
關鍵詞: 基因編輯;ZFN編輯;TALENs編輯;CRISPR-Cas;堿基編輯
中文關鍵詞
中圖分類號:S813.1"""" 文獻標志碼:A"""" 文章編號: 0366-6964(2025)01-0001-14
收稿日期:2024-06-27
基金項目:科技創新2030—重大項目(2023ZD04048;2023ZD0404801)
作者簡介:包斌武(1998-),男,甘肅天水人,博士生,主要從事動物遺傳育種與繁殖研究,E-mail: b013019@126.com
*通信作者:李俊雅,主要從事肉牛育種技術研究和新品種培育,E-mail: lijunya@caas.cn;高 雪,主要從事肉牛分子育種及基因組學研究,E-mail: gaoxue@caas.cn
BAO" Binwu 又稱基因組編輯(genome edting)或基因組工程(genome engineering),是一種能對目標基因進行定點“編輯”,實現特定DNA片段修飾的基因工程技術[1]。基因編輯技術的核心是利用一種特殊的核酸酶,也稱“上帝的手術刀”,在基因組特定位置產生位點特異性雙鏈斷裂(double strand break, DSB)。這種斷裂會激活細胞內的兩種主要修復機制:非同源末端連接(non-homologous end joining, NHEJ)和同源重組(homology directed repair, HDR)。NHEJ是一種不依賴模板的修復方式,它直接連接斷裂的兩端,但可能會引入一些插入或缺失的突變,導致基因失活或改變。HDR是一種依賴模板的修復方式,它利用一個同源的DNA片段作為參照,來修復或替換斷裂的區域,實現精確的基因編輯。
1979年,Scherer和Davis[2]通過同源重組的方法首次實現了外源基因的插入,標志著基因組編輯技術的正式形成。隨后,研究人員開發出工程核酸酶,如鋅指核酸酶(zinc finger nuclease, ZFN)和轉錄激活因子樣效應核酸酶(transcription activator like effector nucleases, TALENs)來提高基因編輯的特異性。2012年,Jinek等[3]在體外重現了基因剪刀CRISPR-Cas9,證明CRISPR-Cas能夠在指定位點切割DNA。2013年,Mali等[4]率先證實CRISPR-Cas系統同樣能夠在真核細胞中起作用,這標志著基因編輯技術進入了新時代。由于其易編程性、高特異性和多功能性,CRISPR-Cas系統發現后迅速成為主導的基因編輯工具。在此基礎上,研究人員于2016和2019年先后開發出堿基編輯(base editing, BE)[5]與先導編輯工具(prime editing, PE)[6],實現了基因精準編輯。而Profluent公司在近期推出的第一個完全由AI生成的基因編輯器-OpenCRISPR- 則預示著基因編輯工具的發展進入人工智能新時代[7](圖1)。
隨著科研不斷深入,需要更精準、更高效、更全面和更智能的編輯工具來實現基因編輯。現有編輯工具的優化和新工具的開發是當下研究的熱點,本文旨在回顧幾種傳統的基因編輯工具以及新型基因編輯工具的最新發展技術,以期對基因編輯工具的開發優化提供參考。
1 經典基因編輯工具
1.1 ZFN基因編輯技術
ZFN基因編輯技術誕生于1996年,是第一代基因組編輯技術,主要利用鋅指蛋白(zinc finger protein, ZFP)特異性識別特定堿基序列來實現基因編輯,由ZFP和Fok Ⅰ核酸內切酶兩個關鍵部分組成[8]。其中,由ZFP構成的DNA識別域能識別特異位點并與之結合,而由Fok Ⅰ構成的切割域能執行剪切功能,兩者結合可使靶位點的雙鏈DNA斷裂(DSB)。ZFN技術功能的實現主要是基于ZFP發展起來的。1986年Diakun等[9]首先在真核生物轉錄因子家族的DNA結合區域發現了Cys2-His2鋅指模塊,到1996年,Kim等[10]首次人工連接了鋅指蛋白與核酸內切酶。隨后,2002年Bibikova等[11]首次在果蠅中設計了第一個序列特異性核酸酶,稱為鋅指核酸酶(ZFN)。2005年,Urnov等[12]發現一對由4個鋅指連接而成的ZFN可識別24 bp的特異性序列,由此揭開了ZFN在基因組編輯中的應用。近年來研究人員使用蛋白質工程將Fok Ⅰ切割結構域與鋅指蛋白的氨基和羧基末端融合,擴大了ZFN的靶向能力[13]并通過減弱Fok Ⅰ切割結構域的切割活性改善了其特異性[14]。2024年Katayama等[15]通過生物分子建模工具(如AlphaFold)對鋅指核酸酶進行工程改造,將基因組編輯的效率提高5%。
ZFN編輯技術雖開啟了基因編輯的先河,但仍存在一些技術上的局限性,例如Fok Ⅰ核酸內切酶必須以二聚體的形式出現才能具備核酸酶活性,因此需要成對的鋅指蛋白將其引導到靶位點,從而實現DSB的形成[16]。此外,并非所有序列都可用于ZFP結合,因此位點選擇范圍具有局限性。除了技術上的問題,ZFN發展面臨更大的問題是專利上的封鎖。
1.2 TALEN基因編輯技術
繼ZFN之后,出現了另一種較為靈活和高效的基因靶向編輯技術,即TALEN技術。該技術發明于2011年,由AvrBs3蛋白衍生而來,其工作原理與ZFN類似,核心元件的結構也類似,由DNA識別域轉錄激活因子樣效應蛋白(transcription activator like effectors,TALEs)和DNA剪切域(Fok Ⅰ核酸內切酶)組成。TALEs是研究人員在植物病原菌黃單胞菌屬中發現的一類新天然DNA結合蛋白[17],其包含33~35個氨基酸重復序列,位于中央DNA結合區(氨基酸12和13)的兩側。這種DNA結合區域,稱之為重復變量二殘基(repeat variable diresidue, RVD),能識別特異性DNA堿基位點。TALEs通過RVD識別域結合到特定的DNA序列上,再由Fok Ⅰ核酸內切酶構成的DNA剪切域對靶基因進行剪切,最后利用細胞自帶的DNA修復系統完成基因編輯[18]。近年來,Jain等[19]發現TALE在異染色質區域的識別效率比Cas9高5倍,TALENs比Cas9更有效地修飾了50%的異染色質位點,表明在異染色質區域TALENs是一種比Cas9更有效的基因編輯工具。
TALENs與ZFN的區別在于DNA識別域對DNA序列的識別模式。在ZFN中,每個鋅指蛋白識別一個DNA三堿基序列;在TALENs中,每兩個氨基酸組合對應著一個特定的堿基。因此,通過人為的刪減、添加和自由組合不同的氨基酸組合,可以輕而易舉地構造出結合特定DNA序列的蛋白,從而實現轉錄激活因子樣效應物核酸酶在基因組DNA上的精確定位。與ZFN技術相比,TALENs具有獨特的優勢,設計更加簡單,特異性更高,但其缺點主要是具有一定的細胞毒性[20],并且TALEN比ZFN大得多,一個TALEN需要3 kb的cDNA編碼,而單個ZFN只需要1 kb。此外,由于TALENs序列的高度重復,限制了一些病毒載體中的包裝和遞送。
1.3 CRISPR基因編輯技術
盡管ZFN、TALENs編輯技術已成為實現靶向基因組修飾的關鍵,但由于其設計/篩選過程復雜,脫靶率高,包裝遞送困難等限制,仍需發展易設計、脫靶率低且包裝遞送容易的新技術[4]。CRISPR(clustered regularly interspaced short palindromic repeats, CRISPR)技術的出現,開辟了基因編輯的新紀元,也為未來的生物醫藥研究和應用提供了無限可能。CRISPR技術是一種利用RNA引導的DNA內切酶在特定位置切割DNA,從而實現基因編輯的技術。它最早的研究始于20世紀90年代,當時研究人員在一些細菌和古菌的基因組中發現了一些重復序列,這些序列之間由非重復的間隔序列分隔[21]。這些重復序列和間隔序列的結構特征,后來被稱為CRISPR。2005年,研究人員發現這些間隔序列與細菌感染的病毒DNA相匹配,揭示了CRISPR序列與細菌抵抗病毒感染之間的關系[22-23]。2007年,Barrangou等[24]首次演示了CRISPR系統可以作為細菌的一種獲得性免疫機制,防御外來遺傳物質的侵入。經過不懈努力,科研人員逐步揭示了其作用機制,并成功將其轉化為一種高編輯精度和高靈活性的編輯工具。
CRISPR-Cas系統的全稱為規律成簇間隔短回文重復序列以及CRISPR相關蛋白(CRISPR-associated protein, Cas)[25]。該系統是在細菌和古細菌中廣泛存在的一種獲得性免疫系統,由Cas核酸酶和兩個單獨的RNA組分組成,一個是可編程的crRNA(CRISPR RNA)和一個固定的tracrRNA(反式激活crRNA)。Cas1-Cas2蛋白能夠將入侵的噬菌體DNA切割成小片段,然后將其作為間隔物整合到CRISPR陣列中。隨后,轉錄CRISPR陣列以產生crRNA和互補的tracrRNA,它們形成雙鏈RNA結構,招募Cas蛋白進行切割[3,26]。在入侵DNA上的crRNA靶向序列附近,一個名為原間隔區鄰近基序(protospacer adjacent motif, PAM)的短序列在適應和干擾階段起著至關重要的作用,CRISPR-Cas復合物在靶標DNA結合過程中識別這些序列。PAM序列的缺失可能會改變Cas和靶DNA之間的親和力,因為特定的PAM序列識別有助于區分非自身靶序列和非靶序列[27]。
CRISPR-Cas系統主要分為兩大類:一類是包括Ⅰ型、Ⅲ型、Ⅳ型的多蛋白效應復合物,另一類是包括Ⅱ型、Ⅴ型、Ⅵ型的單個Cas蛋白復合物。與前者相比,二類系統(Ⅱ型Cas9、Ⅴ型Cas12a、Ⅵ型Cas13a和Cas13b系統)在基因組編輯應用中具有更大的潛力。其中,與其他需要多種Cas蛋白的系統相比,Ⅱ型系統只有Cas9一種Cas蛋白。Cas9蛋白依賴于crRNA和tracrRNA融合和切割形成的sgRNA(單向導RNA),在RNA引導的DNA識別中發揮作用,使其用于基因組工程[28-29]。Cas9包含與HNH和RuvC核酸內切酶同源的結構域,其中HNH結構域切割互補DNA鏈,而RuvC樣結構域切割非互補DNA鏈。2012年,Jinek等[3]首次報道了CRISPR-Cas9系統可改造為可編程的RNA引導的DNA核酸內切酶。隨后,Cong等[28]利用改造后的CRISPR-Cas9系統首次在哺乳動物細胞中實現了靶向基因編輯[30]。此后,CRISPR-Cas9技術因其簡單、高效的特點迅速成為植物、動物、微生物基因敲除、基因敲入、大片段刪除等遺傳操作的首選技術。隨著研究深入,研究者們通過挖掘其他類型CRISPR系統,開發出一大批新的編輯工具(表1),使得CRISPR-Cas系統成為主導的基因編輯工具。
2 堿基編輯系統的發展
2.1 單堿基編輯系統
雖然CRISPR-Cas系統是目前使用最廣泛的基因編輯工具,但其仍存在一些不可忽視的問題,如效率低下,且存在非靶向切割,安全性較低等。因此,研究人員提出如何通過某種化學反應,精準實現DNA單鏈上的C/T間相互轉化,或者G/C之間的相互轉化,從而實現非DSB途徑的基因編輯。2016年4月,Komor等[50]首次報道了一種單堿基編輯技術,該技術將spCas9與胞嘧啶脫氨酶融合,利用spCas9對DNA的精確定位能力將胞嘧啶脫氨酶導向靶序列,然后在胞嘧啶脫氨酶的催化下,將突變窗口內的胞嘧啶C轉化為胸腺嘧啶T,后來也被稱為胞嘧啶堿基編輯器(cytosine base editor, CBE)。此后多個實驗室也陸續發表了類似的工具,并在這些工具的基礎上進行了深入的挖掘和優化(表2)。2017年,Matsoukas[51]和Landrum等[52]又開發了新的單堿基編輯系統——腺嘌呤堿基編輯器(adenine base editor, ABE),實現A-G的轉換。通過對DNA正義鏈和反義鏈的編輯,這兩種DNA堿基編輯器可實現四種堿基轉換方式,分別為C-T、A-G、T-C以及G-A。2021年,中國科學院張學麗和畢昌浩構建胞嘧啶脫氨酶-nCas9-Ung蛋白復合物,創造了一種新的糖基化酶堿基編輯器(guanine base editor, GBE),實現了C-A和C-G堿基間的轉換[55]。下面分別對CBE、ABE和GBE進行介紹。
2.1.1 CBE編輯系統
CBE系統主要由nCas9或dCas9和胞苷脫氨酶1(APOBEC1)組成,其中胞嘧啶的自發脫氨是C-G到T-A轉變的主要來源(圖2)。2016年,Komor等[50]報道了BE1(rAPOBEC1-XTEN-dCas9),其原理是讓dCas9 N末端與APOBEC1形成融合蛋白,隨后gRNA將融合蛋白引導到靶位點,APOBEC1會使R環中單鏈DNA的C脫氨形成U,后續經DNA復制完成C到T的轉換。該系統在不引入DNA雙鏈斷裂,也不需要重組修復模板的情況下,可實現更加安全、高效、精準的單堿基編輯,而且其效率遠遠高于DSB引起的HDR修復方式。
此外,進一步研究發現雖然BE1系統的體外平均表觀編輯效率為44%,但在哺乳動物細胞中編輯效率僅有0.8%到7.7%[50]。據推測,堿基編輯效率降低是由于尿嘧啶DNA糖基化酶(uracil DNA glycosylase, UDG)切除U形成缺失位點,以互補鏈上的G為模板補上C,使C到T的編輯效率降低。為提高編輯效率,將尿嘧啶DNA糖基化酶抑制劑(uracil DNA glycosylase inhibitor, UGI)融合到BE1的C末端,構建了第二代堿基編輯器BE2(APOBEC-XTEN-dCas9-UGI),與BE1相比,增加
UGI使編輯效率提高大約3倍[50]。隨后,將BE2系統中的dCas9用nCas9取代,使得非編輯鏈產生缺口,刺激細胞發生堿基錯配修復(mismatch repair, MMR),從而構建出第三代堿基編輯器BE3(APOBEC-XTEN-dCas9(A840H)-UGI),相比于BE BE3的編輯效率提升2~6倍,并且在哺乳動物細胞中平均編輯效率可以達到37%[50]。為了進一步提升編輯效率,Koblan等[53]于2018年通過增加核定位信號(nuclear localization signal, NLS),以及優化密碼子的方法構建了BE4max,將編輯效率在BE4的基礎上提高了3倍(表2)。
2.1.2 ABE編輯系統
繼CBE之后,Gaudelli等[5]于2017年進一步開發出腺嘌呤編輯器(ABE),與CBE類似,ABE的融合蛋白由nCas9(D10A)和人為改造的腺嘌呤脫氨酶組成,可以實現A-T到G-C堿基的轉換(圖3)。其工作原理是在sgRNA的引導下,融合蛋白結合到靶序列區,并將一定區域的腺嘌呤(A)脫氨形成肌苷(I),DNA修復或復制后,原來的A-T堿基對在靶位點被G-C堿基對取代,從而實現A到G的轉換[5]。
2017年,Gaudelli等[5]通過構建TadA*-XTEN-nCas9-NLS構建體,成功提出了第一代編輯效率很低的ABE堿基編輯器,即ABE1.2。隨后,經過七輪進化后成功構建出ABE7.10,使得編輯效率平均為(53±3.7)%[5]。為了進一步提高ABE的編輯效率,研究者通過對ABE7.10進行密碼子優化以及增加NLS個數,構建出ABEmax系統,編輯效率比ABE7.10提高1.5~2倍[53]。隨后Gaudelli等[54]又在ABE7.10的TadA中引入額外的突變,構建了ABE8s,使得編輯效率比ABE7.10提高約4.2倍。
2.1.3 GBE編輯系統
GBE技術是在CBE的基礎上發展而來的。CBE在將C轉變為U后,體內的UNG酶能將U堿基切除,形成無嘌呤無嘧啶的AP狀態(apurinic/apyrimidinic)。在AP狀態時,能夠觸發堿基切除修復機制,將U重新變回為C,但是也能被修復為其他3種堿基。于是,Zhao等[55]在2021年通過將UNG與nCas9融合構建出胞嘧啶脫氨酶-nCas9-UNG蛋白復合物,創造了一種新的糖基化酶堿基編輯器(GBE),實現C-A和C-G堿基更改。這一進展導致了單個堿基基因可誘導嘧啶和嘌呤之間相互轉化的編輯系統[55]。然而,研究發現GBE系統在不同編輯對象中的編輯方向不同。例如,在大腸桿菌中C變換成A是主要的編輯結果,而在HEK293T細胞中則是以C轉換成G為主要的編輯結果[51]。可以看出在AP狀態下,細胞中存在著一種未知的修復機制使得AP態往不同的堿基進行修復。因此這項技術仍需繼續完善。
2.1.4 先導編輯(PE)系統
雖然CBE和ABE能實現C到T和A到G的轉換,但是其他不同堿基之間的轉換仍然受限,于是2019年Anzalone等[6]繼續開發出能適應所有堿基轉換的技術-(prime editing, PE)。不同于單堿基編輯技術只能實現有限類型的堿基轉換,PE技術可以實現所有12種堿基的互換,而且無需供體DNA即可實現短序列的精確插入和刪除。PE系統的基本原理是nCas9(H840A)與野生型Moloney鼠白血病病毒(M-MLV)逆轉錄酶(M-MLV RT)形成融合蛋白,在pegRNA引導下融合蛋白結合到基因組特定序列,nCas9切開與pegRNA非互補鏈。pegRNA攜帶的單鏈DNA結合序列與被切開的非互補鏈按照堿基匹配規律結合,單鏈DNA暴露一個3′-OH,逆轉錄酶與之結合,按照堿基互補配對以RNA為模版合成DNA。隨后,合成后的DNA整合到基因組中,實現了靶向位點高效產生DNA的插入、刪除和單堿基替換完成基因編輯的過程[6,56](圖4)。PE是一種可以進行活細胞基因組編輯的基因編輯器,可以糾正絕大多數致病的基因突變,自PE系統開發以來一直在不斷地改進(表2),目前研究人員已通過優化pegRNA、完善先導編輯器結構、改進細胞對PE編輯的反應來提高編輯效率。
研究人員將Cas9(H840A)變體C端與M-MLV RT融合的系統命名為PE1。研究發現PE1系統對點突變的編輯效率最高可達到5.5%,小片段插入刪除編輯效率在4%~17%之間。為提高編輯效率,在PE1的基礎上修改了M-MLV RT (D200N+L603W+T330P+T306K+W313F),改善了熱穩定性、逆轉錄連續性以及DNA、RNA結合緊密性,將編輯效率提高了約3倍[6]。隨后在PE2基礎上,研究人員在pegRNA下游50 bp附近,引入另一條與pegRNA方向相反的sgRNA,達到分別切割非互補鏈的目的,建立PE3系統,在PE2基礎上提高了編輯效率[6]。2021年,Chen等[57]在PE2/PE3系統中分別插入MMR抑制蛋白(MLH1dn),分別構建出PE4/PE5系統,并通過改變RT密碼子使用、SpCas9突變、NLS序列以及nCas9和RT之間肽連接子的長度和組成優化PE2蛋白,構建出PEmax系統,進一步提高了編輯效率。隨后,Yan等[58]發現La(一種小的RNA結合蛋白)是先導編輯的強促進因子。他們將La蛋白的N端結構域融合到現有PEmax C端(PEmax-C),構建出PE7系統,與PEmax相比,PE7顯著增強了編輯效率,并減少了脫靶效應。Liang等[59]在2024年將PE編輯技術進行了優化,利用較小的Cas12a蛋白開發出4種環狀RNA介導的先導編輯器(CPE)系統,包括切口酶依賴性CPE(niCPE)、雙鏈核酸酶依賴性CPE(nuCPE)、可拆分切口酶依賴性CPE(sniCPE)和可拆分雙鏈核酸酶-依賴CPE(snuCPE)。與其他系統相比,CPE系統優先識別富含T的基因組區域,并具有潛在的多重能力。
2.2 雙堿基編輯系統
單一堿基編輯器只能催化單一類型的堿基編輯,限制了其廣泛的應用。因此,開發新的編輯器技術,可以同時有效地產生兩種不同的堿基突變,將大大豐富堿基編輯工具。2019年,Kaplanis等[60]構建出融合活化誘導的人胞嘧啶脫氨酶(稱為hAID)、腺嘌呤脫氨酶和nCas9的高活性編輯工具(Aamp;C-Bemax)。Aamp;C-BEmax可以有效地轉換同一等位基因內靶序列上的Cgt;T和Agt;G。并且在HEK293T細胞中測試了28個內源性靶標,結果顯示編輯Aamp;C-BEmax的窗口從C3-C10擴展到C2-C17,編輯活動在C7-C17是AID-BE4max的1.9~14倍。
2.3 線粒體堿基編輯
線粒體作為細胞的“能量中心”在細胞生命活動過程中扮演著重要角色,它還是細胞核外存儲遺傳信息的另一細胞器。2020年,Mok等[61]利用一種能夠作用于雙鏈DNA的脫氨酶DddA開發出了線粒體單堿基編輯器,首次實現了線粒體基因C-T的堿基編輯。隨后,2022年Cho等[62]使用DddA和TadA8e組合,進一步實現了線粒體基因組A-G的堿基編輯。然而發現DddA系統存在比較嚴重的脫靶效應,特別是DddA與CTCF存在相互作用,會產生細胞核基因組的非特異性編輯。隨后,Yi等[63]在2023年報道了一種名為mitoBEs的全新線粒體單堿基編輯工具,該工具不依賴于DddA系統,不僅能夠高效地實現A-G或C-T的單堿基編輯,還具有選擇性地編輯特定鏈的能力。適用于細胞核基因組的堿基編輯,對相關疾病治療提供了潛力巨大的新工具。
3 轉座子類編輯工具
作為天然存在的移動遺傳元件,轉座子利用CRISPR效應復合物與轉座酶蛋白結合進行RNA引導的轉座,將長DNA序列插入特定的基因組位點而無需引起DSB,極大地提高了編輯的精確度,減少了脫靶效應。
3.1 INTEGRATE
2019年6月,研究人員在霍亂弧菌中發現一種獨特的轉座元件后,開發了一種名為引導RNA輔助靶向的轉座元件插入(insertion of transposable elements by guide RNA-assisted targeting, INTEGRATE)的基因編輯工具。INTEGRATE將轉座酶的高效、無縫整合與CRISPR介導的靶向的可編程性相結合。此外,由于INTEGRATE不依賴于每個靶位點特異性的同源臂,因此可以使用具有多個靶向間隔區的CRISPR陣列快速生成多個同時插入同一細胞的基因組,實現多基因編輯。在這項技術中,序列特異性完全由向導RNA控制,表達載體以100%的效率有效地引導高精度插入,無需引入DNA斷裂,無需選擇標記片段就可以插入到基因組中[75-77]。
3.2 CRISPR相關轉座酶(CAST)
2019年6月,Strecker等[78]從藍藻(Scytonema hofmanni CRISPR associated transposons,ShCAST)中獲得了一種CRISPR相關轉座酶,該酶由Tn7樣轉座酶亞基和V-K CRISPR效應子(Cas12k)組成。ShCAST通過單向插入原間隔區下游60至66個堿基對的DNA片段來催化RNA引導的DNA轉座。該系統被稱為CAST,或CRISPR相關轉座酶,其優點是可以將基因片段直接插入靶位點[78]。其中Cas12k沒有核酸內切酶活性,僅結合脫氧核糖核酸用于搜索特定的基因組中的序列位點。
3.3 TnpB
2021年,Karvelis等[79]表明耐輻射奇球菌ISDra2(Deinococcus radioduran ISDra2)中的TnpB是一種RNA定向核酸酶。TnpB來自IS607轉座子家族,由源自轉座子右端元件的RNA引導,以切割5′-TTGAT轉座子相關基序旁邊的DNA,并證實TnpB是來自V型CRISPR系統的多種Cas12效應蛋白的祖先內切酶,將TnpB確立為基因組編輯新系統的原型。隨后,Wang等[80]在2024年通過縮短TnpB的C端結構域(CTD)對TnpB進行優化(lt;400 aa),并在哺乳動物細胞和小鼠中實現有效的基因編輯。與傳統的CRISPR-Cas系統相比,TnpB的大小僅為408個氨基酸殘基,遠小于Cas12蛋白質,而且在安全性和精確性方面也顯示出了優勢[81]。
4 其他類型的基因編輯工具
除了上述介紹到的基因編輯工具外,隨著研究的不斷深入,一些特殊的編輯工具也逐漸被發現。如利用內源性ADAR對RNA進行可編程編輯(leveraging endogenous ADAR for programmable editing of RNA,LEAPER)、水解型內切核酶(hydrolytic endonucleolytic riozyme,HYER)、Fanzor蛋白等。特別是人工智能(AI),伴隨第一個完全由AI生成的基因編輯器-OpenCRISPR-1的出現,預示著基因編輯技術進入了人工智能新時代。
4.1 LEAPER
2019年,Qu等[82]報導了一種新型RNA編輯技術-LEAPER。與以CRISPR為基礎的DNA或者RNA編輯技術不同,LEAPER僅需要在細胞中表達特殊設計的RNA(ADAR-recruiting RNA,arRNA)即可招募細胞中內源脫氨酶ADAR,實現靶向目標RNA中腺苷A→肌苷I(鳥苷G)的編輯。隨后,團隊對LEAPER進行升級,LEAPER 2.0提供了一種新的共價閉合的環狀arRNA,稱為circ-arRNA,可實現更精確、更高效的RNA編輯,并具有廣泛的治療和基礎研究適用性[82]。
4.2 Fanzor蛋白
2023年,Saito等[83]在真核生物中發現了第一個可編程的RNA引導系統-Fanzor。他們從真菌、藻類和變形蟲物種以及北圓蛤中均分離出Fanzor蛋白,通過對Fanzor的生化特征分析發現其是一種切割DNA的核酸內切酶,主要通過使用附近的非編碼RNA(即ωRNA)來靶向基因組中的特定位置[83]。進一步研究發現,Fanzor蛋白可對人類細胞基因組的特定位點進行靶向的插入與缺失編輯。因此表明,Fanzor蛋白有作為基因組編輯工具的潛力[82]。此外,Fanzor RNA引導內切酶切割DNA時,會同時降解鄰近的DNA或RNA,與CRISPR-Cas系統相比,Fanzor蛋白系統是一種更精準,更高效的編輯工具[83]。2024年,Xu等[84]揭示了Fanzor結構上的多樣性,并闡明了它通過構象變化調控DNA切割的精確機制。
4.3 HYER
近期研究報道了一種具有精確操縱DNA的新型基因編輯工具——水解型內切核酶(HYER)。HYER1是一種TRS引導的序列特異性DNA內切酶,以一段暴露的單鏈RNA區域即目標識別位點(TRS)來捕獲DNA底物靶標,將DNA錨定在結構域V所形成的催化核心中,同時以雙鎂離子機制催化DNA水解[85]。HYER可特異性切割RNA和DNA底物,獨立于蛋白質運行,可以編輯細菌和人類細胞中的基因,有望成為繼CRISPR之后,新一代的基因編輯底盤工具[85]。
4.4 AI蛋白語言模型
蛋白質語言模型(protein language models,PLM)是一種由人工智能驅動的系統,其通過分析大量的蛋白質序列數據,學習預測蛋白質序列中被掩蓋的氨基酸,判定出周圍氨基酸,從而預測蛋白質的行為和功能并優化蛋白質功能。2023年,研究人員利用AI輔助的大規模蛋白結構預測鑒定出45個單鏈胞嘧啶脫氨酶(Sdd)和13個雙鏈胞嘧啶脫氨酶(Ddd)全新脫氨酶,并開發了新的可被單個腺相關病毒(AAV)遞送的Sdd6-CBE堿基編輯器,在小鼠細胞系中的編輯效率高達43.1%,以及Sdd7-CBE堿基編輯器,在大豆中的編輯效率高達22.1%[86]。隨后,He等[87]利用蛋白質語言模型(PLMs)設計了一種針對胸腺嘧啶的增強UNG變體eTDG,并準確預測超過80%的高適應度變異。這使得TSBE3的開發成為可能,TSBE3是一種在細胞系、T細胞和小鼠胚胎中高效替換Tgt;G或C的工具。Profluent公司在2024年推出了第一個完全由AI生成的CRISPR-Cas基因編輯器-OpenCRISPR- 并且表現出與SpCas9相當的靶向編輯效率和更高的特異性[7],由此基因編輯工具的發展進入人工智能新時代。
5 展 望
展望未來,開發更具特異性、免疫原性更低的遞送載體,減少脫靶效應,提高編輯準確性和精確度將成為基因編輯技術的研究重點。與純粹基于蛋白質的編輯技術相比,核酸引導系統由于其簡單的可編程性和適應性,可能仍將是基因組編輯的核心。此外,人工智能的興起使人們能夠準確地模擬復雜的基因組編輯環境,預測靶向和脫靶編輯結果,從而加快實施安全治療方法的步伐。因此,基于AI人工智能的編輯系統有著廣泛的應用場景和極高的可提升空間,是未來基因組編輯工具的重點研發對象。
參考文獻(References):
[1] VERMA P J,SUMER H,LIU J.Applications of genome modulation and editing[M].New York:Humana,2022.
[2] SCHERER S,DAVIS R W.Replacement of chromosome segments with altered DNA sequences constructed in vitro[J].Proc Natl Acad Sci U S A,1979,76(10):4951-4955.
[3] JINEK M,CHYLINSKI K,FONFARA I,et al.A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity[J].Science,2012,337(6096):816-821.
[4] MALI P,YANG L H,ESVELT K M,et al.RNA-guided human genome engineering via Cas9[J].Science,2013,339(6121): 823-826.
[5] GAUDELLI N M,KOMOR A C,REES H A,et al.Programmable base editing of A·T to G·C in genomic DNA without DNA cleavage[J].Nature,2017,551(7681):464-471.
[6] ANZALONE A V,RANDOLPH P B,DAVIS J R,et al.Search-and-replace genome editing without double-strand breaks or donor DNA[J].Nature,2019,576(7785):149-157.
[7] RUFFOLO J A,NAYFACH S,GALLAGHER J,et al.Design of highly functional genome editors by modeling the universe of CRISPR-Cas sequences[J].bioRxiv,2024,04,22,590591.
[8] MILLER J,MCLACHLAN A D,KLUG A.Repetitive zinc-binding domains in the protein transcription factor IIIA from Xenopus oocytes[J].EMBO J,1985,4(6):1609-1614.
[9] DIAKUN G P,FAIRALL L,KLUG A.EXAFS study of the zinc-binding sites in the protein transcription factor IIIA[J].Nature,1986,324(6098):698-699.
[10] KIM Y G,CHA J,CHANDRASEGARAN S.Hybrid restriction enzymes:zinc finger fusions to Fok I cleavage domain[J].Proc Natl Acad Sci U S A,1996,93(3):1156-1160.
[11] BIBIKOVA M,GOLIC M,GOLIC K G,et al.Targeted chromosomal cleavage and mutagenesis in Drosophila using zinc-finger nucleases[J].Genetics,2002,161(3):1169-1175.
[12] URNOV F D,MILLER J C,LEE Y L,et al.Highly efficient endogenous human gene correction using designed zinc-finger nucleases[J].Nature,2005,435(7042):646-651.
[13] PASCHON D E,LUSSIER S,WANGZOR T,et al.Diversifying the structure of zinc finger nucleases for high-precision genome editing[J].Nat Commun,2019,10(1):1133.
[14] MILLER J C,PATIL D P,XIA D F,et al.Enhancing gene editing specificity by attenuating DNA cleavage kinetics[J].Nat Biotechnol,2019,37(8):945-952.
[15] KATAYAMA S,WATANABE M,KATO Y,et al.Engineering of zinc finger nucleases through structural modeling improves genome editing efficiency in cells[J].Adv Sci (Weinh),2024,11(23):2310255.
[16] DOYON Y,VO T D,MENDEL M C,et al.Enhancing zinc-finger-nuclease activity with improved obligate heterodimeric architectures[J].Nat Methods,201 8(1):74-79.
[17] ZHANG Z X,ZHANG S L,HUANG X,et al.Rapid assembly of customized TALENs into multiple delivery systems[J].PLoS One,2013,8(11):e80281.
[18] CERMAK T,DOYLE E L,CHRISTIAN M,et al.Efficient design and assembly of custom TALEN and other TAL effector-based constructs for DNA targeting[J].Nucleic Acids Res,201 39(12):e82.
[19] JAIN S,SHUKLA S,YANG C,et al.TALEN outperforms Cas9 in editing heterochromatin target sites[J].Nat Commun,202 12(1):606.
[20] MUSSOLINO C,ALZUBI J,FINE E J,et al.TALENs facilitate targeted genome editing in human cells with high specificity and low cytotoxicity[J].Nucleic Acids Res,2014,42(10):6762-6773.
[21] ISHINO Y,SHINAGAWA H,MAKINO K,et al.Nucleotide sequence of the iap gene,responsible for alkaline phosphatase isozyme conversion in Escherichia coli,and identification of the gene product[J].J Bacteriol,1987,169(12):5429-5433.
[22] POURCEL C,SALVIGNOL G,VERGNAUD G.CRISPR elements in Yersinia pestis acquire new repeats by preferential uptake of bacteriophage DNA,and provide additional tools for evolutionary studies[J].Microbiology,2005,151(3):653-663.
[23] MOJICA F J M,DEZ-VILLASEOR C,GARCA-MARTNEZ J,et al.Intervening sequences of regularly spaced prokaryotic repeats derive from foreign genetic elements[J].J Mol Evol,2005,60(2):174-182.
[24] BARRANGOU R,FREMAUX C,DEVEAU H,et al.CRISPR provides acquired resistance against viruses in prokaryotes[J].Science,2007,315(5819):1709-1712.
[25] 劉志國.CRISPR/Cas9系統介導基因組編輯的研究進展[J].畜牧獸醫學報,2014,45(10):1567-1583.LIU Z G.Research progress on CRISPR/Cas9 mediated genome editing[J].Acta Veterinaria et Zootechnica Sinica,2014,45(10): 1567-1583.(in Chinese)
[26] DATSENKO K A,POUGACH K,TIKHONOV A,et al.Molecular memory of prior infections activates the CRISPR/Cas adaptive bacterial immunity system[J].Nat Commun,2012,3:945.
[27] WESTRA E R,SEMENOVA E,DATSENKO K A,et al.Type I-E CRISPR-Cas systems discriminate target from non-Target DNA through base pairing-independent PAM recognition[J].PLoS Genet,2013,9(9):e1003742.
[28] CONG L,RAN F A,COX D,et al.Multiplex genome engineering using CRISPR/Cas Systems[J].Science,2013, 339(6121): 819-823.
[29] WU X B,SCOTT D A,KRIZ A J,et al.Genome-wide binding of the CRISPR endonuclease Cas9 in mammalian cells[J].Nat Biotechnol,2014,32(7):670-676.
[30] JAVAID D,GANIE S Y,HAJAM Y A,et al.CRISPR/Cas9 system:a reliable and facile genome editing tool in modern biology[J].Mol Biol Rep,2022,49(12):12133-12150.
[31] RAN F A,CONG L,YAN W X,et al.In vivo genome editing using Staphylococcus aureus Cas9[J].Nature,2015, 520(7546): 186-191.
[32] ZETSCHE B,GOOTENBERG J S,ABUDAYYEH O O,et al.Cpf1 is a single RNA-guided endonuclease of a class 2 CRISPR-Cas system[J].Cell,2015,163(3):759-771.
[33] HU J H,MILLER S M,GEURTS M H,et al.Evolved Cas9 variants with broad PAM compatibility and high DNA specificity[J].Nature,2018,556(7699):57-63.
[34] ABUDAYYEH O O,GOOTENBERG J S,KONERMANN S,et al.C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector[J].Science,2016,353(6299):aaf5573.
[35] KIM E,KOO T,PARK S W,et al.In vivo genome editing with a small Cas9 orthologue derived from Campylobacter jejuni[J].Nat Commun,2017,8:14500.
[36] NISHIMASU H,SHI X,ISHIGURO S,et al.Engineered CRISPR-Cas9 nuclease with expanded targeting space[J].Science,2018, 361(6408): 1259-1262.
[37] ZHONG Z H,ZHANG Y X,YOU Q,et al.Plant genome editing using FnCpf1 and LbCpf1 nucleases at redefined and altered PAM sites[J].Mol Plant,2018,11(7):999-1002.
[38] TENG F,CUI T T,FENG G H,et al.Repurposing CRISPR-Cas12b for mammalian genome engineering[J].Cell Discov,2018, 4:63.
[39] LIU J J,ORLOVA N,OAKES B L,et al.CasX enzymes comprise a distinct family of RNA-guided genome editors[J].Nature, 2019, 566(7743):218-223.
[40] STRECKER J,JONES S,KOOPAL B,et al.Engineering of CRISPR-Cas12b for human genome editing[J].Nat Commun,2019, 10(1):212.
[41] WALTON R T,CHRISTIE K A,WHITTAKER M N,et al.Unconstrained genome targeting with near-PAMless engineered CRISPR-Cas9 variants[J].Science,2020,368(6488):290-296.
[42] PAUSCH P,AL-SHAYEB B,BISOM-RAPP E,et al.CRISPR-CasΦ from huge phages is a hypercompact genome editor[J].Science,2020,369(6501):333-337.
[43] JARCZYNSKA Z D,RENDSVIG J K H,PAGELS N,et al.DIVERSIFY:a fungal multispecies gene expression platform[J].ACS Synth Biol,202 10(3):579-588.
[44] LIU Z Y,SCHIEL J A,MAKSIMOVA E,et al.ErCas12a CRISPR-MAD7 for model generation in human cells,mice,and rats[J].CRISPR J,2020,3(2):97-108.
[45] PRICE M A,CRUZ R,BRYSON J,et al.Expanding and understanding the CRISPR toolbox for Bacillus subtilis with MAD7 and dMAD7[J].Biotechnol Bioeng,2020,117(6):1805-1816.
[46] SHI Y J,DUAN M,DING J M,et al.DNA topology regulates PAM-Cas9 interaction and DNA unwinding to enable near-PAMless cleavage by thermophilic Cas9[J].Mol Cell,2022,82(21):4160-4175.e6.
[47] SUN A,LI C P,CHEN Z H,et al.The compact Casπ (Cas12l) ‘bracelet’ provides a unique structural platform for DNA manipulation[J].Cell Res,2023,33(3):229-244.
[48] ALTAE-TRAN H,KANNAN S,SUBERSKI A J,et al.Uncovering the functional diversity of rare CRISPR-Cas systems with deep terascale clustering[J].Science,2023,382(6673):eadi1910.
[49] HUA H M,XU J F,HUANG X S,et al.Low-Toxicity and high-efficiency Streptomyces genome editing tool based on the miniature type V-F CRISPR/Cas nuclease AsCas12f1[J].J Agric Food Chem,2024,72(10):5358-5367.
[50] KOMOR A C,KIM Y B,PACKER M S,et al.Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage[J].Nature,2016,533(7603):420-424.
[51] MATSOUKAS I G.Commentary:programmable base editing of A·T to G·C in genomic DNA without DNA cleavage[J].Front Genet,2018,9:21.
[52] LANDRUM M J,LEE J M,BENSON M,et al.ClinVar:public archive of interpretations of clinically relevant variants[J].Nucleic Acids Res,2016,44(D1):D862-D868.
[53] KOBLAN L W,DOMAN J L,WILSON C,et al.Improving cytidine and adenine base editors by expression optimization and ancestral reconstruction[J].Nat Biotechnol,2018,36(9):843-846.
[54] GAUDELLI N M,LAM D K,REES H A,et al.Directed evolution of adenine base editors with increased activity and therapeutic application[J].Nat Biotechnol,2020,38(7):892-900.
[55] ZHAO D D,LI J,LI S W,et al.Publisher correction:glycosylase base editors enable C-to-A and C-to-G base changes[J].Nat Biotechnol,202 39(1):115.
[56] YAN J,CIRINCIONE A,ADAMSON B.Prime editing:precision genome editing by reverse transcription[J].Mol Cell,2020, 77(2): 210-212.
[57] CHEN P J,HUSSMANN J A,YAN J,et al.Enhanced prime editing systems by manipulating cellular determinants of editing outcomes[J].Cell,202 184(22):5635-5652.e29.
[58] YAN J,OYLER-CASTRILLO P,RAVISANKAR P,et al.Improving prime editing with an endogenous small RNA-binding protein[J].Nature,2024,628(8008):639-647.
[59] LIANG R H,HE Z X,ZHAO K T,et al.Prime editing using CRISPR-Cas12a and circular RNAs in human cells[J].Nat Biotechnol,2024,42(12):1867-1875.
[60] KAPLANIS J,AKAWI N,GALLONE G,et al.Exome-wide assessment of the functional impact and pathogenicity of multinucleotide mutations[J].Genome Res,2019,29(7):1047-1056.
[61] MOK B Y,DE MORAES M H,ZENG J,et al.A bacterial cytidine deaminase toxin enables CRISPR-free mitochondrial base editing[J].Nature,2020,583(7817):631-637.
[62] CHO S I,LEE S,MOK Y G,et al.Targeted A-to-G base editing in human mitochondrial DNA with programmable deaminases[J].Cell,2022,185(10):1764-1776.e12.
[63] YI Z Y,ZHANG X X,TANG W,et al.Strand-selective base editing of human mitochondrial DNA using mitoBEs[J].Nat Biotechnol,2024,42(3):498-509.
[64] REES H A,KOMOR A C,YEH W H,et al.Improving the DNA specificity and applicability of base editing through protein engineering and protein delivery[J].Nat Commun,2017,8:15790.
[65] KOMOR A C,ZHAO K T,PACKER M S,et al.Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:a base editors with higher efficiency and product purity[J].Sci Adv,2017,3(8):eaao4774.
[66] CHEN L,ZHANG S,XUE N N,et al.Engineering a precise adenine base editor with minimal bystander editing[J].Nat Chem Biol,2023,19(1):101-110.
[67] XUE N N,LIU X,ZHANG D,et al.Improving adenine and dual base editors through introduction of TadA-8e and Rad51DBD[J].Nat Commun,2023,14(1):1224.
[68] WANG G Y,WANG F Q,XU Z P,et al.Precise fine-turning of GhTFL1 by base editing tools defines ideal cotton plant architecture[J].Genome Biol,2024,25(1):59.
[69] YE L J,ZHAO D D,LI J,et al.Glycosylase-based base editors for efficient T-to-G and C-to-G editing in mammalian cells[J].Nat Biotechnol,2024,42(10):1538-1547.
[70] ZHAO D D,LI J,LI S W,et al.Glycosylase base editors enable C-to-A and C-to-G base changes[J].Nat Biotechnol,202 39(1):35-40.
[71] DOMAN J L,PANDEY S,NEUGEBAUER M E,et al.Phage-assisted evolution and protein engineering yield compact,efficient prime editors[J].Cell,2023,186(18):3983-4002.e26.
[72] MOK B Y,KOTRYS A V,RAGURAM A,et al.CRISPR-free base editors with enhanced activity and expanded targeting scope in mitochondrial and nuclear DNA[J].Nat Biotechnol,2022,40(9):1378-1387.
[73] CHO S I,LEE S,MOK Y G,et al.Targeted A-to-G base editing in human mitochondrial DNA with programmable deaminases[J].Cell,2022,185(10):1764-1776.e12.
[74] HU J C,SUN Y,LI B S,et al.Strand-preferred base editing of organellar and nuclear genomes using CyDENT[J].Nat Biotechnol,2024,42(6):936-945.
[75] VO P L H,RONDA C,KLOMPE S E,et al.CRISPR RNA-guided integrases for high-efficiency,multiplexed bacterial genome engineering[J].Nat Biotechnol,202 39(4):480-489.
[76] KLOMPE S E,VO P L H,HALPIN-HEALY T S,et al.Transposon-encoded CRISPR-Cas systems direct RNA-guided DNA integration[J].Nature,2019,571(7764):219-225.
[77] SCHNEIDER A,JEGL P,HAUER B.Stereoselective directed cationic cascades enabled by molecular anchoring in terpene cyclases[J].Angew Chem Int Ed,202 60(24):13251-13256.
[78] STRECKER J,LADHA A,GARDNER Z,et al.RNA-guided DNA insertion with CRISPR-associated transposases[J].Science, 2019, 365(6448):48-53.
[79] KARVELIS T,DRUTEIKA G,BIGELYTE G,et al.Transposon-associated TnpB is a programmable RNA-guided DNA endonuclease[J].Nature,202 599(7886):692-696.
[80] WANG M,SUN Z L,LIU Y,et al.Hypercompact TnpB and truncated TnpB systems enable efficient genome editing in vitro and in vivo[J].Cell Discov,2024,10(1):31.
[81] LI Z F,GUO R C,SUN X Z,et al.Engineering a transposon-associated TnpB-ωRNA system for efficient gene editing and phenotypic correction of a tyrosinaemia mouse model[J].Nat Commun,2024,15(1):831.
[82] QU L,YI Z Y,ZHU S Y,et al.Programmable RNA editing by recruiting endogenous ADAR using engineered RNAs[J].Nat Biotechnol,2019,37(9):1059-1069.
[83] SAITO M,XU P Y,FAURE G,et al.Fanzor is a eukaryotic programmable RNA-guided endonuclease[J].Nature,2023, 620(7974):660-668.
[84] XU P Y,SAITO M,FAURE G,et al.Structural insights into the diversity and DNA cleavage mechanism of Fanzor[J].Cell,2024, 187(19):5238-5252.e20.
[85] LIU Z X,ZHANG S Y,ZHU H Z,et al.Hydrolytic endonucleolytic ribozyme (HYER) is programmable for sequence-specific DNA cleavage[J].Science,2024,383(6682):eadh4859.
[86] HUANG J Y,LIN Q P,FEI H Y,et al.Discovery of deaminase functions by structure-based protein clustering[J].Cell,2024, 187(16):4426-4428.
[87] HE Y,ZHOU X B,CHANG C,et al.Protein language models-assisted optimization of a uracil-N-glycosylase variant enables programmable T-to-G and T-to-C base editing[J].Mol Cell,2024,84(7):1257-1270.e6.
(編輯 郭云雁)