王 霞汪興澤
(1 泰興市西城中學教育集團 江蘇泰州 225400 2 泰興市教師發展中心 江蘇泰州 225400)
2020年,諾貝爾化學獎授予法國科學家沙爾龐捷(Charpentier)和美國科學家道德納(Doudna),以表彰她們發明了CRISPR/Cas9 介導的基因編輯技術。本文從該技術的發現、原理等方面作一簡要概述。
原核生物無論古細菌還是真細菌,都可能因噬菌體的侵染而死亡。顯然,擁有防御噬菌體侵染能力的原核生物能獲得更好的生存機會。原核生物如何防御噬菌體的侵染?DNA 是有機大分子,復雜而脆弱,易受損傷。損傷類型有多種,例如,胞嘧啶的脫氨基、鳥嘌呤氧化等。其中,DNA 雙鏈斷裂在所有類型的損傷中危害最大,易導致DNA 的復制受阻,進而遏制子代的形成[1]。古細菌或真細菌如果能識別并切斷外源DNA(或RNA),就具有一定防御噬菌體侵染的能力。
廣泛應用的“分子手術刀”——限制性核酸內切酶(簡稱限制酶),已發現數千種。大多數限制酶的識別序列由6 個核苷酸組成,少數限制酶的識別序列由4、5 或8 個核苷酸組成,能在特定的位點上剪切雙鏈DNA 分子并使之斷裂,從而抑制外源DNA 的復制,阻斷子代噬菌體形成。限制酶的識別序列相對固定,對新型病毒缺乏適應性防御能力。可見,原核生物利用限制酶對噬菌體的防御類似于高等動物的固有免疫。
1987年,日本學者石野良純團隊偶然發現大腸埃希氏菌(Escherichia coli)堿性磷酸酶基因編碼區附近存在一段特殊的DNA 序列:在簡單重復序列(repeated sequences)之間插有間隔序列(spacer DNA)[2]。隨后發現這種序列在古細菌或真細菌中廣泛存在。2002年,這種特殊序列被正式命名為成簇的規律間隔的短回文重復序列(clustered regularly inter-spaced short palindromic repeats,CRISPR),并對Cas(CRISPR associated sequence)基因作出定義[3]。CRISPR 序列中重復序列與間隔序列交錯相連,末端通常是一條長約500 bp 的前導序列。重復序列高度保守,長度為21~48 bp;間隔序列長度26~72 bp,堿基排列順序差異顯著。大量的間隔序列與已知的噬菌體或質粒的序列完全一致。據此推測,這些間隔序列可能與原核生物抵御外源核酸進入細胞的特異性防御機制有關。2005年,Bolotin 等[4]利用特定的噬菌體侵染細菌,發現抗性細菌細胞的CRISPR 中的間隔序列有來自噬菌體DNA 的序列。隨后,研究通過增加或去除序列可控制噬菌體獲得或失去抗性。此外,利用特定的噬菌體侵染細菌,隨著從噬菌體中獲得了越來越多的間隔序列,細菌的抗性譜系越來越強。有力地證明了CRISPR 在獲得性免疫中發揮作用[1]。
2008年,馬拉菲妮(Marraffini)等[5]研究發現Cas 核酸酶(CRISPR-associated nuclease)的DNA 靶點活性,并通過實驗驗證了CRISPR/Cas 系統的功能,由此揭開了CRISPR/Cas 系統作用機制及應用的研究序幕。2010年,首次確定Cas9 核酸酶在CRISPR/Cas9 系統中是唯一參與切割靶DNA 的酶[6]。2011年,馬卡洛夫(Makarova)等[7]根據Cas基因的差異及CRISPR 基因簇中重復序列的差異,將CRISPR/Cas 系統分為3 種類型:Ⅰ型系統分布于真細菌和古細菌中,Ⅱ型系統主要分布于真細菌中,Ⅲ型系統主要分布于古細菌中。Ⅰ、Ⅲ型系統運行復雜,需要Cas3、Cas6、Cas10 等蛋白質復合物才能行使功能。CRISPR/Cas9 屬于Ⅱ型系統,僅需唯一的Cas9 核酸酶,構成簡單,適用于基因編輯。同年,沙爾龐捷在釀膿鏈球菌(Streptococcus pyogenes)CRISPR/Cas 中發現反式激活crRNA(trans actvating crRNA,tracrRNA)分子。2012年,沙爾龐捷和道德納組成團隊,純化了Cas9 蛋白,發現它是RNA 異二聚體引導下的DNA內切酶,并首次在體外證明CRISPR/Cas9 系統可切割DNA[8]。RNA 異二聚體由成熟的crRNA(由長的前體crRNA 逐步剪切、加工而成,含保守序列和間隔序列)和tracrRNA 通過堿基配對聚合而成。通過增加一個合適長度的接頭,可將RNA 異二聚體融合成單一的向導RNA(single guide RNA,sgRNA),從而便于使用。
CRISPR/Cas9 基因編輯技術的大致流程如下:人工合成編碼crRNA 和tracrRNA 的DNA 序列,該序列能在細胞內經轉錄、加工后得到的成熟crRNA,其5′端與待剪切的特定DNA 靶序列互補,3′端與tracrRNA 互補。或設計出增加合適接頭的、編碼sgRNA 序列的DNA,與Cas9基因置于適當的表達元件控制下并導入靶細胞中。由靶細胞成功表達出的sgRNA 識別并結合特定的互補DNA 序列,并與互補鏈雜交,非互補鏈保持游離的單鏈狀態。Cas9 核酸酶含有RuvC 和HNH 2 個核酸酶催化結構域,其中的HNH 活性位點剪切互補DNA 鏈,RuvC 活性位點剪切非互補鏈,最終導致DNA 雙鏈斷裂。
“基因打靶”或“基因敲除”技術的創始人卡佩奇形象地比喻,要想了解某個基因的功能,先人為地讓該基因缺失,失去功能。猶如某一天沒有人掃地了,大家才會想到清潔工的存在[9]。如何才能讓某個基因人為缺失?
自然界存在的電離輻射、DNA 復制時模板鏈上的損傷等都可能導致DNA 雙鏈的斷裂。生命的進化使得細胞擁有多種修復機制(例如,直接逆轉、堿基切除修復等)可將多數損傷修復,并恢復到原始的DNA 序列,維護DNA 的相對穩定。非同源性末端連接和同源重組修復是DNA 雙鏈斷裂修復的2 種主要途徑。細胞內有2 套遺傳物質時,細胞可能利用1 份DNA 為模板修復受損傷的DNA。這種使損傷的DNA 恢復到原始序列的機制稱為同源重組修復。
非同源性末端連接修復的大致過程是通過斷裂末端突出的單鏈之間錯排配對,將斷裂DNA 的2 個末端直接相互連接。錯排配對通過不同片段的堿基互補完成,單鏈尾巴由核酸酶去除,缺口依賴DNA 聚合酶填補。如此,斷裂末端的部分序列將會丟失,因而常導致DNA 片段的缺失,甚至出現倒位而致突變[1]。如果能高度特異性地切割目的DNA,利用細胞自帶的非同源性末端連接修復系統,就能高效率使目的基因缺失,從而為研究目的基因的功能提供了可能。
傳統的卡佩奇“基因敲除”技術采取的策略,是用含有一定已知序列的DNA 片段與受體細胞基因組中序列相同或相近的基因發生同源重組,從而代替受體細胞基因組中的相關序列,可產生精確的基因突變。但由于高等動物細胞內同源重組的頻率極低,需要構建復雜的打靶載體、篩選ES 細胞、選育嵌合體小鼠等一系列步驟,使得該技術流程繁瑣,費用大,耗時長。通過人工設計sgRNA,足以引導Cas9 對雙鏈DNA 進行定點切割,導致特定位點基因的突變。因易于操作,CRISPR/Cas9 基因編輯技術逐漸成為一種可靠、高效、快速的構建“基因敲除”生物模型的新方法,得到了廣泛的應用。
Cas9 核酸酶含有的2 個核酸酶催化結構域分別剪切雙鏈DNA 的一條單鏈,并產生平末端的DNA 雙鏈斷裂。非同源性末端連接的修復可能導致靶基因突變,但同源重組修復又可能使得雙鏈斷裂的DNA 恢復原始序列而導致脫靶。如何降低脫靶效應?如果在基因水平上將其中一個催化結構域滅活,可形成使DNA 單鏈斷裂的缺口酶版本nCas9。2 種nCas9 與帶有合適序列的sgRNA 串聯體配合使用,能在DNA 分子上產生單鏈交錯缺口的裂解形式,增加靶點識別的序列長度,從而降低突變的脫靶率。
既然CRISPR/Cas9 系統能依靠sgRNA 特異性識別DNA,將Cas9 中的2個核酸酶功能域全部刪除,形成滅活型版本dCas9,并將之與其他功能蛋白相融合,可進一步擴展CRISPR/Cas 系統的功能。例如,dCas9 與轉錄阻遏因子相融合,依靠sgRNA 的靶向作用選擇性關閉特定基因譜的轉錄啟動。相反,將dCas9 與合適的轉錄激活因子(例如,VP64 或KRAB)相融合,能以基因功能獲得型方式了解基因的功能。此外,dCas9 與各種熒光蛋白相融合,可實現活細胞或組織中特定DNA 區域附近的動態染色質表觀修飾過程可視化等[10]。
CRISPR/Cas9 技術在基因編輯方面不斷展現出巨大潛力。與ZEN 和TALEN 等編輯工具相比,CRISPR/Cas9 系統具有簡單、高效、安全、精確等優點。此外,CRISPR/Cas9 系統還可同時編輯同一細胞中的多個基因位點,在構建疾病動物模型及基因表達調控機制的研究中發揮重要作用。作為一種革命性的技術,CRISPR/Cas9 基因編輯技術仍存在著不足,例如,脫靶效應。進一步降低脫靶效應,實現高度特異性基因編輯的臨床應用仍任重道遠。
由于CRISPR/Cas9 技術的門檻較低,倫理學家始終擔心快速涌現的基因編輯研究是否會被應用于人類基因的編輯,改變人類的遺傳特性。禁止在人類生殖細胞水平濫用基因編輯技術是對生命和科學的敬畏,但利用基因編輯技術治療人類疾病也是醫學研究領域的重要方向,如何保障二者平衡是人類面臨的挑戰[11]。