吳天弋,黨靖宇,王添禎,張路培,高 雪,李俊雅,徐凌洋*
(1.中國農業科學院北京畜牧獸醫研究所,北京 100091;2.富平縣畜牧發展中心,陜西渭南 711700)
基因編輯技術是指使用分子生物學手段對目標基因進行刪除、插入和替換等操作的生物工程技術[1,2]。在其發展過程中,最重要的成果就是各種基因組編輯器的發現和開發。其中又以鋅指核酸酶(Zinc-Finger Nucleases,ZFN)、類轉錄激活因子效應物核酸酶(Transcription Activator-Like Endonucleases,TALEN)和成簇而規律的間隔短回文重復序列(Clustered Regularly Interspaced Short Palindromic Repeats,CRISPR)[3]三個系統最為成熟。但是,與基于蛋白-核酸結合的ZFN和TALEN 基因組編輯器不同,CRISPR 是最新被發現、開發的一種基于堿基互補規則的基因組編輯器,這使得CRISPR 系統相比前兩者具有更簡便的設計和使用步驟,這一系統的發現極大的促進了基因編輯技術的發展。
如今CRISPR 已經在疾病治療[4]與動植物育種領域取得較大突破,本文簡單回顧CRISPR 技術的開發現狀,并就CRISPR 技術在肉牛育種、生產過程中的應用現狀與挑戰進行闡述。
成簇而規律間隔的短回文重復序列(CRISPR)系統是在細菌和古生菌內天然存在的免疫系統,能夠保護其免受外源DNA 的入侵[5]。早在1987年,Nakata 和他的團隊就在E.coli 基因組中發現了這種特別的重復結構[6],每2 個重復序列間被獨特的間隔序列所分隔,因此將這種結構命名為成簇而規律間隔的短回文重復序列(CRISPR)。2007 年,人們在嗜熱葡萄球菌中發現CRISPR 中間獨特的間隔序列來自于噬菌體的攻擊,細菌可以通過將噬菌體基因組DNA 添加到CRISPR 序列中,再配合 CRISPR 相關核酸內切酶(CRISPR-Associated Endonuclease,Cas)蛋白形成對特定噬菌體的抗性[7]。如今我們常用的CRISPR/Cas9 系統,來自于對一種II 型CRISPR系統的改造,該系統來自化膿鏈球菌(Streptococcus pyogenes),由CRISPR 特異性決定RNA(crRNA)、輔助反式激活crRNA(tracrRNA)和核酸酶Cas9 組成[8]。crRNA/tracrRNA 復合物引導核酸酶Cas9 在crRNA 配對的DNA 序列靶位點觸發雙鏈斷裂(Double-Strand Break,DSB),進一步的研究通過將crRNA 和tracrRNA 連接融合,形成單引導RNA(Single guide RNA,sgRNA)介導的CRISPR/Cas9 酶切體系,進一步簡化了該工具的使用步驟[9]。
成簇而規律間隔的短回文重復序列/ 相關核酸內切酶9(CRISPR/Cas9)系統要求的靶位點都有一個重要的共同特征,即原間隔物相鄰序列(Protospacer Adjacent Motif,PAM),而其原本作用是細菌的自我識別,由于細菌CRISPR 陣列中不含有PAM,從而避免了CRISPR/Cas9 系統對自身的剪切,一個典型的PAM 是5’-NGG-3’[9]。通過設計sgRNA,CRISPR/Cas9 系統可以靶向任意緊鄰PAM 的一段20 個核苷酸序列,并且允許同時靶向多個基因組位點[8],研究人員甚至可以快速設計大量sgRNA 進行高通量敲除和基因篩選[10]。目前,CRISPR/Cas9 載體可以通過商業市場簡單獲取,通過設計特異性引導RNA(gRNA)序列并導入能生產sgRNA 的質粒后即可使用。對于合子階段的基因組編輯,CRISPR/Cas9 展現了與TALEN 一樣高有效性[11],這讓CRISPR/Cas9載體的細胞質顯微注射(Cytoplasmic Microinjection,CMI)得到了廣泛的運用,研究顯示通過在合子階段進行CMI 足以導致大多數(約2/3)出生的后代具有靶基因座的雙等位基因修飾[12],這使得研究者可以繞過培養、篩選編輯成功的細胞,以及體細胞核移植(Somatic Cell Nuclear Transfer,SCNT)的步驟,極大的簡化了生產基因編輯動物的實驗流程。
成簇而規律間隔的短回文重復序列/ 相關核酸內切酶9(CRISPR/Cas9)系統自首次發布至今已有近10 年的時間了,人們也在開發應用過程中發現了其存在的不足之處,包括原始的Cas9蛋白介導的基因切割效率低、堿基失配導致的非靶標位置切割、sgRNA 設計時需要尋找特定PAM 序列等,并通過各種技術策略做出相應的改進。
核酸酶對細胞基因組的編輯需要進入細胞核發揮作用,因此為Cas9 蛋白添加核定位序列(NLS)可以優化其工作效率[8],這在如今的商業化質粒中非常常見。又因包括CRISPR/Cas9 在內的基因編輯工具本身只能產生DSB,后續都需要借助細胞自生的DNA 修復機制產生非同源末端接 合(Non-Homologous End Junctions,NHEJ)和同源定向修復(Homologous Directed Repair,HDR/HR)[2],其中HDR 能為細胞引入受控的突變,因而價值更大[13]。但是受限于HDR 的效率問題,實際試驗的成功率并不是很高。目前,已有研究證明添加NHEJ 抑制劑SCR7[14],能有效提高了HDR 效率。另外,由于HDR 發生在細胞周期的S 期和G2 期,在另一項研究中,通過多種藥物控制細胞周期[15],顯著提高了HDR 比例,其中諾考達唑(nocodazole)效果最佳。也有研究通過siRNA 或shRNA 介導基因沉默下調NHEJ,從而間接提高HDR 效率[16]。此外,使用包含單鏈DNA 的特殊不對稱模板[17]、化學修飾的sgRNA[18]和一些小分子化合物也可以刺激HDR[19]。
由于染色質開放程度的不同,基因編輯效率也有顯著差異,Liu 等[20]的研究發現HDACI/II/III抑制劑恩替諾他(entinostat)使基因編輯頻率增加了3.7 倍,而泛HDAC 抑制劑帕比諾他(panobinostat)使效率增加了10.5 倍。
成簇而規律間隔的短回文重復序列/ 相關核酸內切酶9(CRISPR/Cas9)的另一個常見缺點是它的gRNA 設計總是需要緊貼著PAM,這極大的限制了其應用范圍。后來通過對Cas9 蛋白進行修飾,分別開發出了5′-NNG-3′[21]和幾乎無特定PAM 需求[22]的Cas9 蛋白,并證明修飾過的Cas9蛋白與原版有著相似的編輯效率,很好的解決了這一缺點。當然,在實際應用過程中,由于CRISPR/Cas9 目前仍然沒有完全解決脫靶問題,因此選擇適當的PAM 序列也能夠提高編輯的精確性,減少堿基錯配導致的脫靶事件。
脫靶,也即在非目標位置引入了計劃外的基因編輯,是CRISPR 系統最被關注的問題,因此研究人員通過很多辦法來提高這個工具的靶向特異性[23]。比如通過對Cas9 蛋白結構進行合理設計,他們開發了eSpCas 9(1.1)[24]、SpCas 9-HF 1[25]、HeFSpCas 9[26]和HypaCas 9[27]等多種具有更高靶向特異性的酶。
另外,配對酶切是增加靶向特異性的方法。Shen 等[28]設計了一種Nickase Cas9(nCas9),這使得每個gRNA 只能產生一個對應的DNA 單鏈斷 裂(Single-Strand Break,SSB),每次完成DSB 需要一對臨近的gRNA 共同引導,有效避免了脫靶編輯,后發現使用nCas9 可提高6 倍HDR插入效率[29]。也有研究將FokI 內切酶連接到酶切活性失活的Cas9(dCas9)上,由于該酶在切割前必須二聚,相比普通Cas9,其靶向特異性提高了140 倍[30,31]。另有研究發現,使用截短的gRNA(16~19nt)也能進一步降低Cas9 的脫靶概率進而提高其靶向特異性[32,33]。而使用更短的gRNA(<16 nt)(論文中稱為dead-RNAs,dRNAs)允許其僅引導Cas9 蛋白結合脫靶位點但不進行切割,這可以有效保護這些容易出錯的位點[33]。
同時,通過開發和應用如SeqMap[34]、Cas-OFFinder[35]和sgRNAcas9[36]等脫靶預測軟件也可以減少潛在的脫靶位點,進而挑選出最佳的gRNA 序列,幫助降低試驗中出現脫靶的概率。
Komor 等[37]通過將胞苷脫氨酶與dCas9 工程化融合首次實現在不引入DSB 的前提下完成靶向的C>T 或G>A 轉換,該系統被稱為堿基編輯(Base Editing,BE)。根據不同堿基修飾酶,BE可分為胞嘧啶堿基編輯器(Cytosine base editor,CBE)和腺嘌呤堿基編輯器(Adenine base editor,ABE)[38],分別完成C-G>T-A 或A-T>G-C 的轉換。最新的研究更是成功開發了一種C>G 的堿基編輯器CGBE1 及其小型化版本miniCGBE1,受控顛換突變(C>G)現在也是可能的[39]。
2019 年,一種名為先導編輯(Primer Editor,PE)的新型基因編輯方式被開發[40],這是一種基于CRISPR/Cas9 的基因編輯方式,Andrew[41]通過將nCas9 蛋白與反轉錄酶融合,賦予該系統在靶位點切口處基于給定的RNA 模板延伸切口后端DNA 鏈的能力。后續通過細胞自身的修復能力將新的DNA 鏈替換入基因組。通過合理設計反轉錄模板鏈,該技術幾乎可以在基因組的任意位置進行1~30bp 長度的堿基編輯,這極大地拓展了對基因組中短片段的基因編輯能力,較好的解決了堿基編輯器編輯種類固定和編輯位置限制的問題。
傳統家畜育種的主要方法包括雜交育種和選擇性育種。當下幾乎所有牲畜都是通過雜交和長期選擇培育出來的[42]。與傳統育種不同,基因編輯育種可以在生物基因組中人為選定精確位點,直接刪除、修改或插入關鍵調控基因,從而快速培育出具有特定性狀的家畜新種質。與過去的基因編輯技術相比,CRISPR 技術可以有效避免重復而困難的蛋白設計、提純操作,是用于家畜遺傳改良的更有效工具[43]。近些年,研究者們已經利用CRISPR 技術在家畜領域中取得了許多突破性的進展[44]。
動物傳染病是嚴重影響世界畜牧業發展的重要因素Gao 等[45]使用基于nCas9 的HDR 技術將牛的NRAMP1 基因構建到了牛的F-A 基因座上,使該基因原位過表達,顯著提升轉基因牛對牛分枝桿菌(Mycobacterium bovis)的抗病能力。Yuan 等[46]使用CRISPR/Cas9 結合HMEJ 的方法在牛的ROSA26 基因座中插入NRAMP1 基因,同樣獲得了有結核病抗性的牛。
成簇而規律間隔的短回文重復序列/ 相關核酸內切酶9(CRISPR/Cas9)技術已被應用于改善肉牛的產肉能力[47]。肌肉生長抑制素(MSTN,或GDF-8)是在牛的雙肌性狀中被發現的一個關鍵基因,其被證明能有效抑制肌肉生長[48]。通過CRISPR/Cas9 敲除MSTN 能提高包括肉牛在內的多種畜禽的產肉性能[49-51]。
在肉牛的養殖過程中,犢牛經常被人工去角,以便減少爭斗和被更好的管理,然而去角的過程通常違背動物福利原則,因而開展無角牛的育種具有很大的應用前景。目前牛角形成的機制尚不清楚。有研究表明,polled 基因座上的基因突變與牛角形成密切相關,并且目前已知4 種誘發無角等位基因的變體,分別為:蒙古無角(PM)[52]、瓜拉尼無角(PG)[53]、弗里斯蘭無角(PF)和凱爾特無角(PC)[54,55]。Carlson 等[56]使用TALENs 技術將PC突變引入牛基因組中,成功獲得無角牛。然而Hennig 等[57]通過CRISPR/Cas9 敲除polled 基因座中PC突變的關鍵序列,以期獲得無角牛,但即使是雙等位基因敲除也沒有成功,這表明polled 基因座中的部分序列缺失并不一定能導致無角表型。因此仍然需要進一步針對無角表型的成因進行研究。
聚合酶鏈式反應(Polymerase chain reaction,PCR)一直是基于DNA 的標準鑒定技術,但是在實際生產中,因為步驟繁瑣、儀器限制而難以推廣。CRISPR 技術可以提供一種37℃恒溫孵育的基于堿基配對的核酸鑒定方法。CRISPRCas13a 是II 型CRISPR 系統中唯一能夠切割RNA 的蛋白,Yao 等[58]使用CRISPR-Cas13a 技術開發了靈敏、特異且簡單的牛病毒性腹瀉病毒(Bovine Viral Diarrhea Virus,BVDV)檢測方法,該方法是將待測樣品溶液與反應液的混合液置于37℃孵育后使用儀器檢測熒光亮度,其30min 檢測靈敏度達到了1nmol/L,可以幫助用戶快速檢測特定病原體。另一種方法是將重組酶聚合酶擴增技術(RPA)與CRISPR 系統相結合,從而極大提高檢測靈敏度與準確性。RPA 是一種由Piepenburg 等[59]在2006 年開發的相對較新的等溫擴增技術,可以37℃恒溫下用不到30min 的時間擴增各種生物體中的RNA 和DNA 靶標[60]。CRISPR 系統可以通過基于堿基配對的特異性切割對RPA 擴增產物進行二次驗證,大幅降低由引物錯配導致的假陽性出現。在植物領域中已經開發了多種基于CRISPR/Cas12a 與RPA 結合的用于現場檢測方法,可檢測樣品中是否含有病原體[61]或轉基因[62]的DNA 片段。在動物領域也有相關研究成果,Huang 等[63]使用該技術在37℃恒溫下45min 內完成羊奶粉中的牛奶摻假檢測,并且靈敏度達到1%,對基因組的絕對靈敏度為10-2ng/μL,并使用這一技術檢測購買的55 份羊奶粉樣品,共發現15 份樣品存在牛奶摻假。龍翠鈺[64]使用類似技術開發了豬瘟病毒(Classical Swine Fever Virus,CSFV)的核酸檢測方法,該方法僅需37℃反應30min,即可通過在藍光下觀察肉眼可見的熒光判斷陽性樣品,其靈敏度極好,即使模板拷貝數低至7×100拷貝數時,仍能檢測出目的核酸。上述方法能快速、準確地鑒定目標DNA 和RNA,囊括了絕大多數生物材料的鑒定需求,未來應用前景十分廣闊。
如今CRISPR 技術已經在改善牛的抗病、動物福利和牛肉產量等方面取得多方面的卓越成果。與以前的基因編輯技術相比,CRISPR 編輯系統可以顯著提高家畜育種的效率和準確性,但是仍然需要發現更多的高價值基因編輯位點,才能進一步開發CRISPR 編輯系統在基因育種中的巨大潛力。首先,在無角牛的育種中,尚未明確解析無角牛的形成機制,導致已有的成功案例無法簡單復制到其他牛品種中[57],因此探索牛無角表型的分子機制,為無角牛編輯找到更有效的基因位點是無角牛育種中的重要工作。其次,在當今肉牛育種中,其生長和胴體性狀是兩類關鍵性狀,但目前對調控這些性狀的分子機制仍然缺乏研究,通過尋找更多有效的基因或變異位點,能幫助提高肉牛生長速度和胴體品質。再次,對于高品質牛肉的開發,肌內脂肪含量一直是育種工作的重點,但是肌內脂肪的沉積往往伴隨大量其他區域的脂肪,顯著降低了高品質牛肉的產出速度,提高了消費成本,因此找到調控肌間脂肪沉積的關鍵基因具有重要意義。最后,衡量肉牛經濟價值的另一個重要指標是飼料轉換率,飼料在舍飼肉牛養殖成本中占比極高(86%~91%)[65],因而探索相關基因和變異位點以提高飼料轉化率能顯著降低飼養成本。
已有的研究表明CRISPR/Cas12a 與Cas13a 蛋白在細胞外能在對應的crRNA 引導下分別靶向與非靶向地切割目標及其附近的DNA(Cas12a)[64]或RNA(Cas13a)[58]。將這一特性應用于現場核酸檢測能實現便捷、精準且高靈敏度的快速檢測,比如快速檢測牛肉中的其他肉類混合,或者在牛的血液中檢測各種可能的病原微生物,這將極大地降低生物樣品的檢測門檻。應當進一步完善相關技術的開發,在保持可靠性的同時降低核酸檢測的試驗門檻與使用價格,才能讓這一技術真正服務于生產。
但是CRISPR 技術發展至今仍然有許多缺點需要優化。進一步提高基因編輯的效率仍然是CRISPR 技術的研發重點,Allen 等[66]最新研究發現,通過將敲入位點選擇在GAPDH 這樣的必需基因的外顯子內,并結合特殊設計的質粒載體,實現了90%以上的基因敲入效率,這一技術為特定的基因敲入提供了高效的選擇,極大地縮短了基因編輯動物的獲取時間。但是與選擇在基因間區的“安全港”插入目的基因相比,這一技術因為涉及重要的功能基因,也可能增加其他未知的風險。
降低基因編輯帶來的不確定風險同樣值得關注,Xin 等[67]研究首先發現在多種CRISPR 系統編輯后的細胞中存在染色體易位、染色體大片段缺失,特別是Cas9 進行的基因編輯中,5.2%的受編輯細胞中產生了外源性DNA 片段(來源于載體)插入,這些不確定性始終是該技術應用于基因編輯動物生產的巨大障礙。目前,解決此障礙的方式有2 種。一是研發具有更高特異性和安全性的核酸酶,例如Cas12f。二是使用無DNA技術進行基因編輯,即直接使用Cas9 蛋白與sgRNA 復合物(RNP)進行編輯,從而排除外源DNA 片段插入的風險。
最后,確保農業轉基因產品不會對人類健康或環境造成危害是我國推進基因編輯育種的重要前提。因此基因編輯動物的肉質安全不容忽視,Zhao 等[68]研究結果表明,MSTN 和FGF5 雙基因敲除的羊肉對大鼠的健康無影響。同時使用引物延伸介導測序(PEM-seq)和基因組深度測序等技術精確鑒別轉基因動物的靶外事件也是這些動物產品流向大眾前的重要安全保證。
綜上所述,CRISPR 技術在農業育種與核酸檢測方面展現了巨大的價值,極大地推動著肉牛領域的研究。我們應當思考如何更好地開發、應用和監管這一技術以加速我國肉牛育種和生產水平的進步。