謝曉蕾 李求春
摘要 成簇的規律間隔的短回文重復序列(clustered regularly interspacedshort palindromic repeat,CRISPR)為原核生物構建了一種抵御外源DNA侵擾的防御機制,近年來成為國內外細菌研究者們的研究熱點。在介紹CRISPR系統的研究歷史、分布分類、結構特征的基礎上,對其作用機制以及應用前景方面進行了綜述。
關鍵詞 CRISPR;原核生物;防御機制
中圖分類號 S188 文獻標識碼
A 文章編號 0517-6611(2014)31-10845-03
Reasch Progress on Structure and Mechanism of CRISPR
XIE Xiaolei,LI Qiuchun* (College of Bioscience and Biotechnology,Yangzhou University,Yangzhou,Jiangsu 225009)
Abstract Clustered regularly interspaced short palindromic repeats(CRISPR),which provides effective resistance against foreign nucleicacid elements has become a hot spot in the research of bacteriologists both at home and abroad.On the basis of introducing the research history,distribution clsssification,structure and characteristics,the mechanism and application prospects of CRISPRsystem were reviewed.
Key words CRISPR; Prokaryote; Defense mechanism
在生物進化歷史中,細菌一直受到諸多外源因素的侵擾,噬菌體是其中具有極大威脅的一種,因而細菌在生存壓力下進化出了多種抵抗噬菌體干擾的機制,如DNA注入抑制、吸附抑制、無效感染等[1]。在細菌體內,基因干擾途徑可以通過基因序列保證自身基因的正常表達,同時維持基因組的完整性。該途徑的重要性表現在真核生物中即為RNA干擾,另外在很多細菌和古生菌中也存在類似的干擾途徑[2]。短回文重復序列CRISPR及其相關Cas(CRISPR associated)基因為大多數細菌以及古細菌提供了一套新的免疫防御系統,以抵御外界遺傳物質的入侵,從而維持自身遺傳信息的完整性。任何免疫系統的基本要求之一就是能夠產生免疫記憶,從而能有效地應對再次感染。CRISPRCas免疫系統的特征在于它能記錄入侵的外源DNA序列,并以間隔序列的形式將其整合到自身的DNA序列中,從而產生免疫記憶。間隔序列經轉錄后形成一段短的反義RNA,可與再次入侵的外源DNA序列互補配對,并在Cas蛋白的作用下,使其降解[3],從而抑制外源DNA的轉錄和翻譯,使噬菌體無法在細菌體內生存和繁殖。
1 CRISPR研究歷史
1987年,日本大阪大學課題組在研究E.coli K12的堿性磷酸酶時,在該酶的編碼基因附近觀察到一段串聯間隔重復序列,隨后研究中發現這種間隔重復序列廣泛存在于細菌和古生菌的基因組中[1,4]。MOJICA等[5]于2000年提出把CRISPR作為重復序列家族的一類成員,并將其命名為Short Regularly Spaced Repeats (SRSRs)。直到2002年,JANSEN等[6]才將其正式命名為clustered regularly interspaced short palindromic repects(CRISPR),以更準確的描述這一重復序列的獨特結構特征。隨著CRISPR的發現,CRISPR的功能逐漸被揭示。2005年,3個研究小組均發現CRISPR的間隔序列與宿主菌染色體外的遺傳物質高度同源,推測其可能作為細菌的免疫系統以抵抗外源遺傳物質的入侵[7-11]。BARRANGOU等[12]首次在嗜熱鏈球菌(Streptococcus thermophilus)中發現并通過試驗證實,細菌能通過CRISPR系統抵抗噬菌體的入侵。隨后MARRAFFINI等[13]也發現在葡萄球菌中CRISPR系統能夠阻止外源基因的水平轉移,同時防止耐藥性的產生,從此揭開了CRISPR系統作用機制研究的序幕。2013年,CRISPR介導的基因定位編輯技術出現,研究人員利用這一系統對人類細胞、小鼠、大鼠、斑馬魚、細菌、果蠅、農作物等多種生物的基因進行定向缺失、插入、激活或抑制等遺傳改造操作,從而證明了 CRISPR 技術的廣泛應用價值。
2 CRISPR分布與分類
最近更新的CRISPR數據庫顯示,在已完成全基因組測序的90%古生菌和約40%細菌中均可鑒定出至少一個CRISPR位點。不同菌株中的CRISPR位點數量不同,一個原核細胞基因組中通常存在1至幾個CRISPR位點[7]。其中詹氏甲烷球菌(Methanocaldococcus jannaschii)的染色體上存在18個CRISPR位點,在目前已研究的原核生物中排第一位[14]。CRISPR位點大多定位在染色體上,只有個別出現在質粒中[15]。
根據Cas基因核心原件序列的不同,CRISPR/Cas免疫系統可分為3種類型,每一種類型具有很多亞型。目前應用最廣泛的是II型,也是3種類型中最為簡單的一類。I型系統最為復雜,需要6個Cas蛋白參與,其中Cas3蛋白對CRISPR功能的發揮至關重要,該蛋白具有解旋酶活性及DNA酶活性,是干擾階段的主要作用酶[16]。Ⅱ型系統的組成相對較簡單,以Cas9蛋白為核心。干擾階段,RNAseⅢ在Cas9蛋白存在的情況下發揮作用,Cas9蛋白協助crRNA(CRISPR RNA)的成熟,并參與外源DNA的剪切[17]。在Ⅲ型系統中,Cas6主要參與crRNA的成熟,加工過后的crRNA被運送至特殊的Cas剪切復合體中發揮導向作用[18]。
3 CRISPR結構
CRISPR主體為CRISPR基因座(CRISPR locus),基因座上游含有一段前導序列(leader sequence,LS)以及與CRISPR功能相關的基因(CRISPRassociated genes,Cas genes),三者共同構成了CRISPR系統。
3.1 CRISPR基因座
CRISPR基因座由簡短穩定的同向重復序列(direct repect,DR)和長度相近的非重復的間隔序列(spacer)間隔排列而成,稱為RS結構。其中重復序列的片段長度在21~48 bp[19],且含有5~7 bp的回文序列,通常能形成穩定的莖環結構,間隔序列的長度在26~72 bp,可能來源于噬菌體、質粒等外源DNA序列。
3.2 cas基因
cas基因是存在于CRISPR位點附近的一系列基因,cas基因簇通常由4~10個保守基因組成[20],它表達出的cas蛋白對CRISPR防御機制的實現不可或缺。cas基因根據其保守程度可分為核心cas基因、亞型特異性cas基因和重復序列相關未知蛋白(repeatassociatedmysteriousproteins,RAMP) 組件基因[21]。cas1~6基因廣泛存在于各種CRISPR亞型中,故被稱為核心cas基因,其編碼蛋白的功能現已初步得到證實,例如,Cas1和Cas2蛋白在所有CRISPR類型中均存在,主要在獲取新的重復序列過程中發揮作用[22],Cas3則具有核酸酶和解旋酶的功能,主要作用是剪切目標基因[23]。
3.3 Leader序列
前導序列由300~500 bp堿基組成,位于CRISPR的5′端,與第一個重復序列直接相連,是一段在物種內相對保守的AT富集的區域[24]。研究發現,新的RS總是插入前導序列和第一個重復序列之間,表明前導序列是新插入序列的識別位點,也有研究指出,它能夠作為啟動子,啟動CRISPR基因座的轉錄[7]。
4 CRISPR/Cas系統作用機理
CRISPR/Cas是一種防御系統,用以保護細菌和古細菌不受外來物質的侵害。這些生物基因組中的CRISPR位點能表達出與入侵病毒基因組序列匹配的crRNA,當微生物再次感染這種病毒時,crRNA能通過互補配對與病毒基因組結合,并表達出相關的Cas酶,這些酶能夠切割病毒DNA,從而阻止病毒的基因表達。研究證明,CRISPR作用機制可大致分為3個階段:適應階段、表達階段和干擾階段[25]。
適應階段:在外源物質入侵宿主菌后,外來噬菌體或質粒上的一小段DNA序列(前間區序列,protospacers)會以非同源重組的方式被整合到宿主菌的基因組中,整合的位置位于前導序列與第一個重復序列之間[12],且每插入一段外源序列都會伴隨著一次重復序列的復制,從而形成新的RS結構。這一過程使得宿主CRISPR含有外源序列信息,為干擾階段發揮作用提供基礎。宿主對外源DNA序列的選擇也并非隨機的,研究發現,在前間區序列附近含有一些特定序列稱為前間區序列鄰近序列(protospacer adjacent motifs,PAMs),如嗜熱鏈球菌的NNAGAAW序列[26],不同CRISPR亞型對于PAM的識別具有特異性。目前,對于CRISPR攝取外源基因的作用機制尚不清楚,有待進一步研究。
表達階段:CRISPR基因座首先被轉錄成一段長鏈的RNA,稱為CRISPR RNA前體(PrecrRNA),同時,Cas蛋白將形成一個具有內切酶功能的復合物,特異性地將crRNA切割加工成小的成熟crRNA。成熟的crRNA會與Cas蛋白復合物結合形成具有特殊功能的Cas/crRNA作用復合體,在干擾階段發揮作用。
干擾階段:當宿主再次接觸到外界噬菌體或質粒時,crRNA便會與其同源的外源核酸特異性結合,而后通過Cas/crRNA作用復合體將外源核酸切割成碎片,使其無法行使功能,從而達到保護宿主基因組的目的。
5 CRISPR的應用
5.1 基因定點改造
近年來,RNA干擾(RNAi)、鋅指核酸酶(ZFNs)、轉錄激活因子樣效應因子核酸酶(TALENs)已應用于多種類型的細胞和生物模型的基因改造,而CRISPR/Cas作為一種全新的基因定點改造技術引起了國內外學者的廣泛關注。
RNAi是一種相對快速、廉價、高通量的基于全基因組的基因定向敲除技術。然而,該技術的敲除效果仍不夠理想,不同批次試驗以及不同實驗室的試驗結果都會有所差異,同時也存在不可預知的脫靶情況,所以該方法目前僅用于需要暫時抑制基因發揮功能的試驗中,因此局限性大,實用性不強。
ZFNs,又名鋅指蛋白核酸酶,是一種人工改造的核酸內切酶,由一個DNA 識別域和一個非特異性核酸內切酶構成。該技術能夠對靶基因進行定點切割和基因敲除,可顯著提高同源重組率,是一種高效成熟的基因改造技術。然而ZNFs雖然具有較高的特異性和精確性,但也會發生極低概率的脫靶事件[27]。
TALENs是一種嶄新的分子生物學工具。研究發現,來自植物細菌黃單孢桿菌(Xanthomonas sp.)TAL 蛋白的核酸結合域的氨基酸序列與其靶位點的核酸序列有恒定的對應關系,因而利用 TAL 的序列模塊,即可組裝成特異的蛋白結構域以結合任意 DNA 序列,從而達到定向改造內源基因的目的。目前,TALEN 的研究尚處于起步階段,其優點很明顯,但在識別的特異性方面和免疫性方面也存在一定的局限性。
ZFNs和TALENs都是利用蛋白質來定位靶序列,這些蛋白質通常很難生成而且成本昂貴。而CRISPRs利用的是RNA,使得設計它們變得較為容易,因而具有很好的應用前景。
2013 年 1 月份美國2家實驗室在《Science》雜志發表了基于 CRISPRCas 技術在細胞系中進行基因敲除的新方法,該技術與以往的技術不同,是利用位點特異性的crRNA將Cas9 核酸酶帶到基因組上的具體靶位點,從而對特定基因位點進行切割。該技術又迅速被運用到基因敲除小鼠和大鼠動物模型的構建中,這意味著一種全新的基因定點改造系統(CRISPR/Cas9)已經出現,其特點是制作簡單,成本低,作用高效。
5.2 分子分型
對于同一個物種,CRISPR位點的重復序列絕大多數非常保守[28-29];而間隔序列則具有很強的多態性,即使在同一物種的不同菌株間,間隔序列也往往不同,該性質使得CRISPR位點可以作為細菌分子分型的一個高分辨率的標準[8-9]。SCHOULS等[30]采用CRISPR分型方法對184株空腸彎曲菌進行了分型,分型結果與AFLP、MLST一致性較高。此外,法國研究者對來源于130個血清型的783株沙門菌的CRISPR進行了研究,結果表明,CRISPR序列的多態性與血清型和多位點序列型有著密切的聯系,說明CRISPR對于沙門菌具有較高的分辨率,可用于分型研究。同時還建立了間隔序列數據庫,為沙門菌分型和基因分型提供數據支持,也為菌株溯源追蹤提供信息[31]。CRISPR分型方法與傳統的分型方法相比,操作簡便,對于基因多態性較低的細菌分辨率較高,而對于基因多態性較高的細菌可將CRISPR與其他分型方法相結合。Liu等將MLST與CRISPR 2種方法相結合建立了一種新的CRISPRMVLST分型方法,通過對沙門菌的2個毒力基因SseL、FimH和CRISPR序列的研究,對來源于9個血清型的171株沙門菌進行了分型, CRISPR序列的加入顯著提高了個別疾病爆發菌株的區分能力,另外,該分型方法對腸炎沙門菌的區分能力要高于PFGE[32]。這表明CRISPR可以作為一種新的分型方法,并具有廣闊的運用前景,另外 CRISPR中的間隔序列提供了細菌所處的外界環境信息,也可以為細菌的溯源追蹤提供信息。
6 結語
CRISPR/Cas系統作為原核細胞的適應性免疫系統,不僅具有特異性和記憶性,還具有可遺傳性。CRISPR的間隔序列高度可變、迅速進化[32-33],新間隔序列的獲得需要很多因素的作用及相關蛋白的輔助。間隔序列的獲得使得細菌能夠很快適應外界環境,也有研究指出,在宿主CRISPR位點中重復序列與間隔序列構成的結構有時也會被刪除[9,20,26,33],被刪除的部分大多是位于CRISPR 3′端較為保守的間隔序列。這些間隔序列的刪除可能是因為CRISPR的重復序列間發生了同源重組所導致的[34],對CRISPR位點的大小和轉錄長度的控制具有重要的作用。CRISPR在參與原核細胞的獲得性免疫的同時,在細菌和噬菌體兩者的共同進化過程中發揮著重要作用。事實上,在前間區序列中或前間區序列鄰近序列中,單一核苷酸的改變能使噬菌體逃避CRISPR免疫機制[33]。盡管目前對CRISPR作用機制具有大致的了解,但現階段還存在許多問題有待更深入的研究和探索。
參考文獻
[1]
STURINO J M,K LAENHAMMER T R.Engineered bacteriophagedefence systems in bioprocessing[J].Nat Rev Microbiol,2006,4(5):395-404.
[2] LIU L,FAN X D.CRISPRCas system:a powerful tool for genome engineering[J].Plant Mol Biol,2014,85:209-218.
[3] HELER R,LUCIANO A,MARRAFFINI LA,et al.Adapting to new threats:the generation of memory by CRISPRCas immune systems[J].Molecular Microbiology,2014,93(1):1-9.
[4] ISHINO Y,SHINAGAWA H,MAKINO K,et al.Nucleotide sequence of the iap gene,responsible for alkaline phosphatase isozyme conversion in Escherichia coli, and identification of the gene product[J].Bacteriol,1987,169(12):5429-5433.
[5] MOJICA FJ,DIEZVILLASENOR C,SORIA E,et al.Biological significance of a family of regularly spaced repeats in the genomes of Archaea,Bacteria and mitochondria[J].Mol Microbiol,2000,36(1):244-246.
[6] JANSEN R,EMBDEN J D,GAASTRA W,et al.Identification of genes that are associated with DNA repeats in prokaryotes[J].Mol Microbiol,2002,43(6):1565-1575.
[7] LILLESTL R,REDDER P,GARRETT RA,et al.A putative viral defence mechanism in archaeal cells[J].Archaea,2006,2(1):59-72.
[8] MOJICA F J,DIEZVILLASENOR C,GARCIAMARTINEZ J,et al.Intervening sequences of regularly spaced prokaryotic repeats derive from foreign genetic elements[J].J Mol Evol,2005,60(2):174-182.
[9] POURCEL C,SALVIGNOL G,VERGNAUD G.CRISPR elements in Yersinia pestisacquire new repeats by preferential uptake of bacteriophage DNA,and provide additional tools for evolutionary studies[J]. Microbiology,2005,151(Pt 3):653-663.
[10]BOLOTIN A,QUINQUIS B,SOROKIN A,et al.Clustered regularly interspaced short palindrome repeats (CRISPRs) have spacers of extrachromosomal origin[J].Microbiology,2005,151(Pt 8):2551-2561.
[11] PRANGISHVILI D,FORTERRE P,GARRETT R A.Viruses of the Archaea:a unifying view[J].Nat Rev Microbiol,2006,4(11):837-848.
[12] BARRANGOU R,FREMAUX C,DEVEAU H,et al.CRISPR provides acquired resistance against viruses in prokaryotes[J].Science,2007,315 (5819):1709-1712.
[13] MARRAFFINI L A,SONTHEIMER E J.CRISPR Interference Limits Horizontal Gene Transfer in Staphylococci by Targeting DNA[J].Science,2008,322(5909):1843-1845.
[14] BULT C J,WHITE O,OLSEN G J,et al.Complete genome sequence of the methanogenic archaeon,Methanococcus jannaschii[J].Science,1996,273(5278):1058-1073.
[15] SOREK R,KUNIN V,HUGENHOLTZ P.CRISPRa widespread system that provides acquired resistance against phages in bacteria and archaea[J].Nat Rev Microbiol,2008,6(3):181-186.
[16] SINKUNAS G,GASIUNAS G,FREMAUX C,et al.Cas 3 is a singlestranded DNA nucleaseand ATPdependent helicaseinthe CRISPR/Cas immunesystem[J].EMBOJ,2011,30(7):1335-1342.
[17] DELTCHEVA E,CHYLINSKI K,SHARMA C M,et al.CRISPR RNA maturation by transencoded small RNA and host factor RNase[J].Nature,2011,471(7340):602-607.
[18] WANG R,PREAMPLUME G,TERNS M P,et al.Interactionof the Cas6 riboendonuclease with CRISPR RNAs:recognition and cleavage[J].Structure,2011,19(2):257-264.
[19] GRISSA I,VERGNAUD G,POURCEL C.The CRISPRdb database and tools to display CRISPRs and to generate dictionaries of spacers and repeats[J].BMC Bioinformatics,2007,8:172.
[20] GRISSA I,VERGNAUD G ,POURCEL C,et al.The CRISPR database and tools to display CRISPRs and to generate dictionaries of spacers and repeats [J].BMC Bioinformatics,2007,8:172.
[21] HAFT D H,SELENGUT J,MONGODIN E F,et al.A guild of 45 CRISPRassociated (Cas) protein families and multiple CRISPR/Cas subtypes exist in prokaryotic genomes[J].PLoS Comput Biol,2005,1(6):60.
[22] WIEDENHEFT B,ZHOU K,JINEK M,et al.Structural basisfor DNase activityof a conserved protein implicated in CRISPRmediated genomedefense[J].Structure,2009,17(6):904-912.
[23] HAN D,KRAUSS G.Characterization of the endonuclease SSO2001 from Sulfolobus solfataricus P2[J].FEBS Lett,2009,583(4):771-776.
[24] JANSEN R,VAN EMBDEN J D,GAASTRA W,et al.Identificationof a novel family of sequence repeats among prokaryotes[J].OMICS,2002,6(1):23-33.
[25] MARRAFFINI LA,SONTHEIMER EJ.CRISPR interference:RNAdirected adaptive immunity in bacteria and archaea[J].Nat Rev Genet,2010,11(3):181-190.
[26] DEVEAU H,BARRANGOU R,GARNEAU J E,et al.Phage response to CRISPRencoded resistance in Streptococcus thermophilus[J].Bacteriology,2008,190(4):1390-1400.
[27] DAVIS D,STOKOE D.Zinc finger nucleases as tools to understand and treat human diseases[J].BMC Med,2010,8:42.
[28] JANSEN R,EMBDEN J D,GAASTRA W,et al.Identification of genes that are associated with DNA repeats in prokaryotes[J].Mol Microbiol,2002,43 (6):1565-1575.
[29] KUNIN V,SOREK R,HUGENHOLTZ P.Evolutionary conservation of sequence and secondary structures in CRISPR repeats[J].Genome Biol,2007,8(4):61.
[30] SCHOULS LM,REULEN S,DUIM B,et al.Comparative genotyping of Campylobacter jejuni by amplified fragment length polymorphism,multilocus sequence typing,and short repeat sequencing:strain diversity,host range,and recombination[J].J Clin Microbiol,2003,41(1):15-26.
[31]
FABRE L,ZHANG J,GUIGON G,et al.CRISPR typing and subtyping for improved laboratory surveillance of Salmonella infections[J].PloS One,2012,7(5):36995.
[32] HEIDELBERG J F,NELSON W C,SCHOENFELD T,et al.Germ warfare in a microbial mat community:CRISPRs provide insights into the coevolution of host and viral genomes[J].PLoS One,2009,4(1):4169.
[33] HORVATH P,ROMERO D A,COUTEMONVOISIN A,et al.Diversity,activity,and evolution of CRISPR loci in Streptococcus thermophilus[J].Bacteriology,2008,190(4):1401-412.
[34] WILMES P,SIMMONS S L,DENEF V J,et al.The dynamic genetic repertoire of microbial communities[J].FEMS Microbiol Rev,2009,33(1):109-132.