張羽慧,徐根興,2,3,華子春,3*
(1.南京大學(xué) 生命科學(xué)學(xué)院,江蘇南京 210023;2.南京吉芮康生物科技有限公司,江蘇南京 210019;3.江蘇省產(chǎn)業(yè)技術(shù)研究院/常州南京大學(xué)高新技術(shù)研究院,江蘇南京 213164)
微生物種類繁多,是包括細菌、病毒、真菌以及 一些小型的原生生物、顯微藻類等在內(nèi)的一大類生物群體,它們個體微小,與人類疾病關(guān)系密切。這些微生物形成的微生物群在營養(yǎng)吸收、宿主代謝、病原體防御、藥物加工等多個過程中發(fā)揮著關(guān)鍵作用[1]。規(guī)律成簇的間隔短回文重復(fù)(Clustered Regularly Interspaced Short Palindromic Repeats,CRISPR)是部分細菌和古細菌在長期自然進化過程中發(fā)展而來的一種對抗外源遺傳物質(zhì)入侵的適應(yīng)性免疫防御系統(tǒng)的一部分[2]。作為一種新興的基因組編輯和調(diào)控工具,研究人員不斷探索更多的微生物或微生物群的基因編輯應(yīng)用潛力[3-4]。隨著CRISPR基因編輯技術(shù)研究不斷升溫,該領(lǐng)域技術(shù)格局不斷變化的同時其技術(shù)演化研究明顯跟進不足[5]。為了更好地理解微生物群基因編輯技術(shù)演進路線和趨勢,本研究檢索了PubMed和Embase數(shù)據(jù)庫,逐層篩選并納入44篇研究,分析探索該領(lǐng)域的技術(shù)變化過程,為基因編輯技術(shù)產(chǎn)業(yè)創(chuàng)新提供參考。
計算機檢索PubMed和Embase數(shù)據(jù)庫。納入英文研究文獻,檢索時間均為建庫至2021年5月30日。檢索關(guān)鍵詞包括 microbiota、microbial community、microbiome、CRISPR、gene editing、genome editing等。
納入標準:①主題詞中含有CRISPR基因編輯和微生物群或與其相關(guān)的關(guān)鍵詞的文獻;②產(chǎn)生技術(shù)進展的文獻。
排除標準:①重復(fù)發(fā)表文獻;②與主題不相關(guān)的文獻;③使用相同基因編輯技術(shù),但不含技術(shù)進展研究的文獻;④文獻綜述、會議摘要等文獻。
使用Excel 2010對納入相關(guān)研究的資料進行匯總;Python 3.8進行關(guān)鍵詞分析。
初步檢索共獲得相關(guān)文獻902篇(PubMed獲得271篇,Embase獲得631篇),圖1顯示了具體篩選流程及排除原因,最終納入研究的有44篇。

圖1 文獻篩選流程及結(jié)果
表1展示了納入分析的44篇文獻的基本特征,將微生物群基因編輯技術(shù)研究范疇主要分為輔助工具、靶向和編輯。(1)輔助工具包括可以輔助CRISPR技術(shù)各個環(huán)節(jié)完成而開發(fā)的各種工具,其中22篇文獻涉及輔助工具的開發(fā)。(2)無論是外源CRISPR系統(tǒng)還是內(nèi)源CRISPR系統(tǒng),都需要人為地遞送相應(yīng)的CRISPR組件到目標位置,因此表2中“遞送”指需要人為遞送相應(yīng)的CRISPR組件到目標位置的技術(shù)研究,在納入分析的文獻中有13篇文獻涉及遞送技術(shù)研究。(3)有11篇文獻圍繞編輯過程的靶向特異性、工具箱擴展等技術(shù)進行研究。

表1 研究納入文獻基本特征
對納入研究的文獻發(fā)表時間進行統(tǒng)計(圖2),可以看出,2013—2018年,相關(guān)研究逐步增多;從2019年起進入研究高峰,基因編輯技術(shù)進入突破期。從研究范疇分析,有20篇文獻著重于輔助工具的研究(45%)、11篇側(cè)重于編輯研究(25%)、13篇則重點關(guān)注遞送技術(shù)研究(30%)。通過對文獻的閱讀分析,基因編輯技術(shù)快速增長的原因主要來自兩方面:一方面,下一代測序技術(shù)和大數(shù)據(jù)、人工智能的發(fā)展,直接或間接促進了微生物中關(guān)于CRISPR-Cas各種輔助工具的開發(fā)[5];另一方面,不同Cas系統(tǒng)的發(fā)現(xiàn)在擴寬學(xué)者們對基因編輯工具箱的選擇范圍的同時,使研究可以更加深入和具有針對性,CRISPR技術(shù)作為一種生物技術(shù)也被用于探索CRISPR基因編輯技術(shù)的各個環(huán)節(jié)中。

圖2 文獻累積發(fā)表量與研究范疇
對納入研究的文獻進行關(guān)鍵詞分析。優(yōu)先匯總作者提供關(guān)鍵詞的研究21篇,利用Python的NLTK模塊對23篇作者未提供關(guān)鍵詞的文章名稱、摘要進行名詞篩選并進行詞頻統(tǒng)計,匯總后人工刪除非主題詞,并制作如圖3所示的詞云圖。從圖3中可以發(fā)現(xiàn),目前出現(xiàn)頻率最高的2個詞是microbiota(微生物群)和Crispr/cas9。從CRISPR系統(tǒng)研究分析,Ⅱ型系統(tǒng)還是研究的重點,尤其是Cas9系統(tǒng),與Cas系統(tǒng)相關(guān)的出現(xiàn)頻率較高的詞還有Crispri、Cas1、Cas12a及Spycas9等,基于I型系統(tǒng)的研究較少。值得注意的是,功效性詞,包括diversity(多樣化)、activity(活性)、variety(多樣性)等高頻出現(xiàn),說明目前的微生物群基因編輯技術(shù)研究的效果呈現(xiàn)出更多元化與細致化的特點。

圖3 關(guān)鍵詞詞云分析圖
2.5.1 主要功能效果分析
為了進一步理解微生物群基因編輯技術(shù)的演進方向,對文獻中技術(shù)效果類詞進行匯總,見圖4。基于基因編輯的組件和特點分析,將其主要分為3大類:Adaptability(適應(yīng)性)、Specificity(特異性)、Diversity(多樣性)。并圍繞這三個功效方向細化基因編輯技術(shù)具體的技術(shù)演進路線。

圖4 功能效果分析
(1)Adaptability(適應(yīng)性)。目前,學(xué)者們大都致力于利用不同方法手段來提高基因編輯技術(shù)在各種微生物上的編輯效率[6-7]。這不僅體現(xiàn)在編輯成功率的提高,還體現(xiàn)在安全性提高、復(fù)雜程度降低等,所以將可以產(chǎn)生功能效果的詞歸為適應(yīng)性范疇,如simplicity(簡單性)、validity(有效性)、stability(穩(wěn)定性)等。
(2)Specificity(特異性)。CRISPR/Cas系統(tǒng)作為第三代基因編輯技術(shù),與ZFNs和TALENS技術(shù)相比屬于輕量級的基因編輯系統(tǒng),擁有設(shè)計簡單、成本低廉的特點。但是由于CRISPR/Cas技術(shù)主要是基于DNA完成的技術(shù),這意味著需要精確的操作才能降低其可能由于脫靶產(chǎn)生的基因組毒性、基因組不穩(wěn)定性、基因功能的破壞、表觀遺傳改變等副作用,因此如何提高基因編輯技術(shù)精準靶向的能力和特異性成為了研究的重中之中。此外,由于CRISPR技術(shù)之間相關(guān)性較強,特異性不僅體現(xiàn)在編輯過程中的靶向特異性,還體現(xiàn)在遞送系統(tǒng)中的遞送特異性,所以將specificity作為第二個功效方向。
(3)Diversity(多樣性)。圖4顯示多樣性是出現(xiàn)頻率最高的功效性詞。從CRISPR的相關(guān)序列技術(shù)發(fā)現(xiàn)以來,由于其在基因研究、疾病防治和遺傳改良等方面展示出了巨大的潛力,學(xué)者們致力于在各種微生物中探索更多新工具箱。
綜上,將目前選入的基因編輯技術(shù)效果總結(jié)為Adaptability(適應(yīng)性)、Specificity(特異性)和Diversity(多樣性),包括了方法層面和工具層面的多樣性、基因編輯預(yù)期達到的各種功能效果的適應(yīng)性及基因編輯技術(shù)本身特點和各種應(yīng)用中最為關(guān)鍵的特異性。
2.5.2 技術(shù)演進分析
如圖5所示,根據(jù)2.5.1分類的三個研究效果方向?qū)λ芯课墨I的具體演進趨勢進一步細化,其中適應(yīng)性的細化包括復(fù)雜度降低、安全性提高、準確度提高及靈敏度提高等;多樣性則主要體現(xiàn)在工具箱的擴展和材料擴展;特異性僅表現(xiàn)為特異性提高。

圖5 技術(shù)演進路線
(1)輔助工具。輔助工具的開發(fā)圍繞著微生物群基因編輯技術(shù)的各個環(huán)節(jié)展開,流向主要集中在多樣性和適應(yīng)性。其中,適應(yīng)性方向體現(xiàn)在準確度提高、靈敏度提高、復(fù)雜度降低和成本降低;多樣性方向主要體現(xiàn)在工具箱的擴展,包括各種輔助工具的開發(fā),大多是基于測序技術(shù)與數(shù)據(jù)算法的結(jié)合探索出的各種輔助軟件,如RNA(gRNA)設(shè)計與效率預(yù)測[8]、PAM位點設(shè)計、CRISPR鑒定、組裝、表征工具[9]等。同時,各種輔助工具的開發(fā)也對編輯和遞送的研究起到了協(xié)同作用,輔助工具的功能也更加細致和智能。
(2)遞送。遞送技術(shù)在多樣性、適應(yīng)性、特異性方向均有細化,高效安全并多樣化地遞送特定的CRISPR組件也是研究的重點。其中,圍繞多樣性的工具箱擴展研究較多,主要包括如何針對特定微生物組開發(fā)更多的遞送策略和系統(tǒng)[10-11]。此外,在開發(fā)更多工具箱的同時,大多研究都帶有適應(yīng)性的提高,包括但不限于遞送復(fù)雜度降低、多路復(fù)用率高、穩(wěn)定性提高等。與輔助工具不同的是,遞送技術(shù)目前還是主要基于一種或幾種微生物探討其在特定微生物群或者相似菌種中的使用,并未有具體的遞送系統(tǒng)可以適用于微生物組研究,因此如何開發(fā)適用于特定微生物群的遞送系統(tǒng)或者策略是一個需要攻克的方向之一。
(3)編輯。編輯的主要研究方向均勻流向特異性、多樣性和適應(yīng)性。在編輯特異性的方向并沒有細致分化,并且除了在編輯方向的靶向特異性研究,在輔助系統(tǒng)、遞送方向均有特異性的探索。編輯的多樣性則集中在工具箱擴展,學(xué)者們不僅探索出更多Cas蛋白,更有多樣化的編輯策略,使編輯工具箱數(shù)量迅速增加,越來越多微生物的基因編輯成為可能。在編輯的適應(yīng)性探索上,多篇研究探討了安全性的提高,為了克服CRISPR技術(shù)由單一Cas或多個Cas蛋白的復(fù)合體介導(dǎo)靶基因產(chǎn)生的DNA雙鏈斷裂問題(Double Strand Break,DSB)[12]并降低其后續(xù)的修復(fù)難度,學(xué)者們開發(fā)了不同的編輯策略,從而提高基因編輯的安全性[3,13]。
微生物群基因編輯領(lǐng)域的技術(shù)演進呈現(xiàn)細致化、多元化的特點,隨著下一代測序技術(shù)的發(fā)展,自2018年起各種輔助工具的開發(fā)帶動了編輯和遞送的技術(shù)研究,使微生物群基因編輯技術(shù)進入快速發(fā)展期。隨著研究的深入,具有不同特征不同類型的CRISPR系統(tǒng)相繼出現(xiàn),研究應(yīng)用范圍也越加多元,如基因組編輯、基因激活和抑制、質(zhì)粒固化和入侵防御等。值得注意的是,目前編輯的對象仍集中在單一或者幾種菌株上,如何更高效地實現(xiàn)特定微生物群的基因編輯還需要科學(xué)家們的進一步探索。綜合分析本研究納入的文獻,鮮有文章涉及修復(fù)技術(shù)的研究,也會是未來研究的重點方向之一。
微生物群基因編輯技術(shù)增長最快的方向為各種輔助工具的研究,大數(shù)據(jù)產(chǎn)業(yè)和人工智能技術(shù)的發(fā)展功不可沒。以Skennerton開發(fā)的Crass為例,其依托于深度學(xué)習(xí)算法,不需要先驗知識就可以自動預(yù)測并重建CRISPR基因組,為微生物群基因編輯技術(shù)帶來新的決策思路。基因編輯作為一個交叉性很強的技術(shù)目前已在各個環(huán)節(jié)直接或者間接得到了大數(shù)據(jù)產(chǎn)業(yè)和人工智能技術(shù)的助力,因此圍繞著人工智能、大數(shù)據(jù)與基因編輯技術(shù)的交匯研究將會給微生物群基因編輯技術(shù)演進帶來新的發(fā)展節(jié)點。