鄭海青 汪晶波 劉 丹 趙華鋒 佟剛強
(湖北省當陽市中醫院檢驗科,宜昌444100)
?
由CRISPR-Cas介導的細菌和古細菌的適應性免疫系統
鄭海青 汪晶波 劉 丹 趙華鋒 佟剛強
(湖北省當陽市中醫院檢驗科,宜昌444100)
最新研究發現,微生物有一套以核酸為基礎的適應性免疫系統,這改變了之前研究者認為的微生物免疫系統僅局限于固有免疫系統的認識[1]。細菌與古細菌通過整合外源性核酸片段到宿主染色體成簇的規律間隔的短回文重復序列(Clustered regularly interspaced short palindromic repeat sequences,CRISPR)一端,從而獲得對病毒及質粒的抗性。本文對這種免疫系統的功能進行了總結,并討論了這種可遺傳的免疫系統的進化意義。
CRISPR最早由Ishino等[2]在1987年發表的對大腸桿菌iap基因3′下游序列的描述中觀察得到,但此后一直未能引起研究者的重視。直到2002年Jansen等[3]通過生物信息學方法在細菌和古細菌基因組中找出短重復序列以及與重復序列相關的基因,并正式將此種序列命名為“成簇的規律間隔的短回文重復序列”(CRISPR),與其相關的蛋白編碼基因命名為CRISPR相關基因(CRISPRE associated genes,Cas),有關CRISPR的相關研究才真正鋪展開來。隨后對CRISPR進行系統的研究發現該系統是一個具有不同DNA重復片段(長度為20~50個堿基對)的超家族[4],在重復片段的上游還具有cas基因,其編碼的Cas蛋白具有遺傳與功能的多樣性,且是CRISPR系統亞型分類的依據。盡管CRISPR重復序列具有多樣性,但大多數重復序列在3′-端都有一個保守的GAAA(C/G)基序,是一個或多個保守Cas蛋白的結合位點[5]。除了重復序列和間隔序列具有多樣性之外,CRISPR位點的數目及每個基因座的長度也是可變的。不同的CRISPR位點數及這些重復陣列的長度與基因組大小無關,一些最小的微生物基因組,如納米古細菌可包含多個CRISPR位點,且在一些基因組中,CRISPR可占染色體總量的1%以上,如硫化葉菌。重復序列-間隔序列-重復序列的模式是公認的CRISPR位點決定性特征[6]。富含腺嘌呤和胸腺嘧啶的序列被稱為引導序列,往往位于CRISPR位點的兩側。比較分析顯示,最接近引導序列的間隔序列是最多樣的,離引導序列最遠的重復序列往往會被降解[7]。前導序列含有啟動子元件[5]和結合調節蛋白的位點[8],這對CRISPR RNA(crRNA)的表達與新序列的獲得至關重要[9]。CRISPR包括三種亞型:(1)Ⅰ型CRISPR/Cas系統廣泛分布于細菌和古細菌中[10]。Ⅰ型系統包括六個不同的亞型(A~F),所有這些類型都編碼cas3基因。cas3包含一個N末端HD磷酸水解酶結構域和C末端DExH解旋酶結構域[11];(2)Ⅱ型系統只存在于細菌中[12],包括四個cas基因:cas9,cas1,cas2和csn2(Ⅱ-A型)或cas 4(Ⅱ-B型)。cas9基因是該系統的一大特點,它編碼一個大型多功能蛋白,這個蛋白既參與crRNA生物合成也參與入侵DNA的降解[13];(3)目前已鑒定出兩個Ⅲ型系統(Ⅲ-A型和Ⅲ-B型)[14],這些系統在古細菌中更為常見。Ⅲ-B型系統只能與其他CRISPR類型一起發揮作用。兩個Ⅲ型系統都能編碼cas10和cas6基因。Cas6是CRISPR特異性的核糖核酸內切酶,Cas10則與目標序列的干擾相關[15]。
CRISPR/Cas系統介導的免疫保護包括三個階段:CRISPR調節、crRNA生物合成及crRNA指導的干擾。在噬菌體侵入的初期,CRISPR/Cas復合物首先靶向裂解噬菌體基因組中的原型間隔序列,進而將其整合到宿主基因組中CRISPR 位點的5′-端。然后,這些原型間隔序列被轉錄成crRNA。最后,實現對入侵的噬菌體DNA 序列的干擾[16]。
2.1 CRISPR調節 大量研究表明,外源性DNA整合到CRISPR位點是一種普遍存在的現象,CRISPR轉錄子是噬菌體新型防御機制的核心組件,作用類似于真核生物的RNA干擾(RNA interference,RNAi)[17]。如Perez-Rodriguez等[18]從酸奶樣品中分離到兩種不同的噬菌體,感染嗜熱鏈球菌后篩選到九株噬菌體抗性的突變株。所有突變株都含有1~4個新的間隔序列,且這些新間隔序列均整合到了CRISPR位點的引導序列端,這表明間隔序列是提供免疫保護的關鍵所在,從而證實了噬菌體的抗性可通過在CRISPR位點插入或刪除噬菌體靶向間隔來達到增強或削弱的目的。雖然間隔序列的整合機制仍然尚不明確,但基于研究者對嗜熱鏈球菌和大腸桿菌的研究,目前已鑒定出了幾種參與該過程的Cas蛋白。如Babu等[19]研究發現,Cas1和Cas2是參與整合過程的保守核酸酶。值得注意的是,Cas1和Cas2的過表達足以在大腸桿菌BL21(DE3)染色體的內源性CRISPR位點前導序列端添加新的間隔序列重復單元[20]。目前,前導序列端的準確識別機制尚不明確,但可以肯定的是,前導序列的突變能夠阻斷轉錄且不干擾整合;與此相反,引導序列的前60個核苷酸的突變可使整合終止。引導序列的前60個核苷酸是必需的,但至少有一個重復序列,整合過程才會發生。除了Cas1和Cas2外,大腸桿菌I-E型的CRISPR系統還包括六種其他的Cas蛋白。雖然這些蛋白并非是獲得新序列的必需蛋白,但當系統中存在這些蛋白質時,新序列的獲得模式會發生變化[21]。如Swarts等[22]研究發現,在大腸桿菌系統中有完整的8種(類型I-E家族)cas基因,CRISPR位點往往通過獲得多個新的間隔序列而增大。第一個間隔序列的獲取往往會加速隨后的間隔序列的獲得,并且所有的間隔序列可來源于同一個DNA鏈。此外,噬菌體抗性水平的增加也與目標特異性的間隔序列的數量相關;因此,對特定信號響應的快速延伸的CRISPR位點的機制可限制噬菌體突變的機會。
2.2 CRISPR RNA的生物合成 2008年,Brouns等[23]確定了CRISPR特異性內切核糖核酸酶Cas6e(以前稱作CasE或Cse3)對大腸桿菌(I-E型)中前體crRNA的處理,Cas6e是多樣性蛋白大家族中的一員,這個家族被稱為重復序列相關的神秘蛋白質(Repeat-associated mysterious proteins,RAMP)。所有的RAMP蛋白都含有至少一種RNA識別基序(RNA recognition motif,RRM)和保守的富含甘氨酸的環(Glycine rich loop,G環)。RRMs由一個保守的β1α1β2β3α2β4排列組成,其中β鏈組成了四條鏈反平行排列的β片層,兩個螺旋一起位于片層的一面[24]。這種折疊已在多種不同的RNA結合蛋白中發現,常常通過位于β-片層開放面的保守殘基結合RNA。Cas6e蛋白質的晶體結構揭示了兩個結構域組成一個N端和C端的RRM[25]。一個富含脯氨酸的短接頭連接兩個結構域,β-片層中的各個RRM面之間則形成蛋白質表面上的V形槽。這個裂縫最初預測是RNA結合面,但Cas6e與crRNA結合的共結晶結構揭示了一個非典型的結合機制,涉及到序列和結構的特異性相互作用,主要是位于蛋白的相反面。大腸桿菌CRISPR的重復序列部分回文,產生一個具有穩定7 nt的莖環結構的RNA,有一個由GCGU四環組成的帽子結構。Cas6e C-末端結構域帶正電的β-發夾與RNA雙鏈體的大溝相互作用,且位于蛋白質帶正電裂縫的3′-鏈磷酸骨架上[26]。RNA結合誘導構象的變化,從而破壞莖的底部堿基對,并且發生在酶活性位點伸展構象的易斷裂磷酸上。切除機制是不依賴金屬離子的,并且發生在莖的基部,產生一個有5′-羥基和2′,3′-環狀磷酸酯的成熟crRNA。成熟的crRNA(~61 nt)由32-nt的間隔序列相鄰的5′-端8-nt的重復序列(也稱為5′手柄)和21個核苷酸的3′端的21-nt的剩余重復序列組成的。Cas6e仍然綁定到3′-莖-環結構作為召集大型監測復合物-CRISPR內切核糖核酸酶復合體(CRISPR ribonuclease complex,Cascade)的核點,這是免疫系統下一步沉默靶基因所必需的[27]。
2.3 CRISPR RNA指導的干擾 所有的crRNAs都可與Cas蛋白聯系形成大的CRISPR相關的核糖核蛋白復合物,但這些復合物是如何在擁擠的含有大量非目標核酸(非靶RNA和DNA)的胞內環境中找到與crRNA互補的短目標序列的呢?研究表明,許多DNA結合蛋白能夠用比純粹的隨機碰撞高得多的手段定位它們的同源結合位點。一些蛋白質通過靜電吸引到帶負電荷的糖-磷酸主鏈,進而非特異結合到DNA上加速靶標的發現。最初的結合后往往發生分子內易位,被稱為一維滑動。與耗能馬達蛋白(即聚合酶、解旋酶、錯配修復酶和Ⅰ型限制性內切酶)的定向運動相反,DNA滑動是熱擴散驅動的能源獨立的過程[28]。然而,DNA的初步結合是一個沒有引導的過程,受到一維擴散的限制。因此,一個包括3D組件的搜尋過程可加速靶標的發現。所有CRISPR系統目標的識別都包括crRNA-間隔區序列與互補核酸靶序列的雜交。大腸桿菌的crRNA引導監視復合物為Cascade,其可優先結合到長的負超螺旋雙鏈DNA(質粒或噬菌體DNA)上[29]。負超螺旋壓縮雙鏈DNA,從而1D距離很遠的序列可在3D空間位置上接近,從而大大加快了雙鏈DNA結合蛋白的搜尋過程[30]。此外,負超螺旋狀態,有利于鏈的分離。如Westra等[31]最近發現負超螺旋提供了分離32 nt雙鏈DNA大約一半的能量。crRNA間隔序列的前8個核苷酸對靶標的結合最為重要。crRNA間隔序列區域被認為是種子序列,并且與種子序列互補的靶序列的單核苷酸突變會導致嚴重的結合缺陷。與此相反,即使靶標上非種子序列出現多個錯配,仍可進行高親和力結合,并可在噬菌體感染期間發揮正常作用[32]。
在篩選噬菌體抵抗的嗜熱鏈球菌(Streptococcus thermophilus,S.thermophilus)過程中,Barrangou等[32]首次闡明S.thermophilus對噬菌體產生的抵抗作用是由其CRISPR從噬菌體基因組中獲得新的間隔序列而得到的,這種與噬菌體DNA高度同源的片段一旦整合進入細菌基因組DNA中便產生了具有該噬菌體特異性抗性的菌株。此后Garneau等[33]研究發現S.thermophilus亦能從外源性質粒中獲得間隔序列,從而通過RNA介導的Cas蛋白特異性地清除質粒,產生對該質粒免疫的菌株。
CRISPR介導的適應性免疫系統與哺乳動物相較,都具有特異性、多樣性以及記憶性這三大特征。CRISPR系統通過將與噬菌體、病毒或者外源質粒同源的片段整合進間隔序列中,以此獲得相應的特異性清除噬菌體、病毒或質粒DNA的能力。同時通過將不同來源的DNA片段整合進入間隔序列,細菌由此實現CRISPR適應性免疫的多樣性。并且由于新的間隔序列直接整合進入基因組當中,該免疫特性得以在細胞分裂過程中予以保留并最終實現免疫記憶[34]。
CRISPR的應用目前主要集中于生物醫藥及發酵奶制品菌種改造和分子生物技術兩方面。事實上,CRISPR在S.thermophilus中作用機制的闡明便得益于工業化生產中對噬菌體抗性菌株的強烈需求,由此推動了相關分子機制的研究,并由此在生產實踐中對工業上生產用菌株進行改造,通過CRISPR篩選獲得對噬菌體等病毒具有抗性的菌株,達到減少生產過程中噬菌體污染的所帶來經濟損失的目的[35]。除此之外,CRISPR作用機制發現的更大意義在于其帶給分子生物學領域的重大技術革新,CRISPR/Cas9在基因編輯上的優勢使其迅速得到應用并與RNAi技術并列成為日常實驗中哺乳動物基因敲除手段之一[36]。甚至于中國科學家最近使用CRISPR/Cas9技術成功地對人廢棄胚胎β球蛋白基因進行了敲除,雖然這一實驗引起了世界范圍內的巨大爭議,但仍然應該看到CRISPR/Cas9在未來進行人類疾病基因治療的潛力[37]。
20世紀80年代,海洋病毒學家報道,1升海水中含有大約一百億個噬菌體,而這些病毒被普遍認為是地球上最豐富多樣的生物,這些病毒帶來的選擇壓力對微生物群落的組成和行為產生深遠的影響,微生物宿主已經進化形成了不同的機制來逃避感染[38]。除了以限制修飾和受體轉變為代表的先天防御機制外,近八年的研究發現微生物還有一套以核酸為基礎的適應性免疫系統-CRISPR。無論從論文數還是論文質量來看,CRISPR無疑是近三年來的研究明星。隨著對CRISPR研究的深入,該系統的實際應用價值將會愈發凸顯。
[1] Pougach KS,Lopatina AV,Severinov KV.CRISPR adaptive immunity systems of prokaryotes[J].Mol Biol,2012,46(2):175-182.
[2] Ishino Y,Shinagawa H,Makino K,etal.Nucleotide sequence of the iapgene,responsible for alkaline phosphatase isozyme conversion in Escherichia coli,and identification of the gene product[J].J Bacteriol,1987,169(12):5429-5433.
[3] Jansen R,Embden JD,Gaastra W,etal.Identification of genes that are associated with DNA repeats in prokaryotes[J].Mol Microbiol,2002,43(6):1565-1575.
[4] Wiedenheft B,Sternberg SH,Doudna JA.RNA-guided genetic silencing systems in bacteria and archaea[J].Nature,2012,482(7385):331-338.
[5] Westra ER,Swarts DC,Staals RH,etal. The CRISPRs,they are a-changin:how prokaryotes generate adaptive immunity[J].Ann Rev Genetics,2012,46:311-338.
[6] Hale CR,Majumdar S,Elmore J,etal. Essential features and rational design of CRISPR RNAs that function with the Cas RAMPmodule complex to cleave RNAs[J].Mol Cell,2012,45(3):292-302.
[7] Yosef I,Goren MG,Qimron U.Proteins and DNA elements essential for the CRISPR adaptation process in Escherichia coli[J].Nucleic Acids Res,2012,40(12):5569-5576.
[8] Makarova KS,Haft DH,Barrangou R,etal.Evolution and classification of the CRISPR-Cas systems[J].Nat Rev Microbiol,2011,9:467-477.
[9] Jore MM,Lundgren M,van Duijn E,etal.Structural basis for CRISPR RNA-guided DNA recognition by Cascade[J].Nat Struct Mol Biol,2011,18(5):529-536.
[10] Gesner EM,Schellenberg MJ,Garside EL,etal.Recognition and maturation of effector RNAs in a CRISPR interference pathway[J].Nat Struct Mol Biol,2011,18(6):688-692.
[11] Sashital DG,Jinek M,Doudna JA.An RNA induced conformational change required for CRISPR RNA cleavage by the endonuclease Cse3[J].Nat Struct Mol Biol,2011,18(6):680-687.
[12] Wiedenheft B,Lander GC,Zhou K,etal. Structures of the RNA-guided surveillance complex from a bacterial immune system[J].Nature,2011,477(7365):486-489.
[13] Lintner NG,Kerou M,Brumfield SK,etal.Structural and functional characterization of an archaeal clustered regularly interspaced short palindromic repeat(CRISPR)-associated complex for antiviral defense(CASCADE)[J].J Biol Chemi,2011,286(24):21643-21656.
[14] Wiedenheft B,van Duijn E,Bultema JB,etal. RNA-guided complex from a bacterial immune system enhances target recognition through seed sequence interactions[J].Proc National Acad Sci USA,2011,108(25):10092-10097.
[15] Deltcheva E,Chylinski K,Sharma CM,etal.CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III[J].Nature,2011,471(7340):602-607.
[16] Jinek M,Chylinski K,Fonfara I,etal. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity[J].Science,2012,337(6096):816-821.
[17] Plagens A,Tjaden B,Hagemann A,etal. Characterization of the CRISPR/Cas subtype I-A system of the hyperthermophilic crenarchaeon Thermoproteus tena[J].J Bacteriol,2012,194(10):2491-2500.
[18] Perez-Rodriguez R,Haitjema C,Huang Q,etal. Envelope stress is a trigger of CRISPR RNA-mediated DNA silencing in Escherichia coli[J].Mol Microbiol,2011,79(3):584-599.
[19] Babu M,Beloglazova N,Flick R,etal. A dual function of the CRISPR-Cas system in bacterial antivirus immunity and DNA repair[J].Mol Microbiol,2011,79(2):484-502.
[20] Yosef I,Goren MG,Qimron U.Proteins and DNA elements essential for the CRISPR adaptation process in Escherichia coli[J].Nucleic Acids Res,2012,40(12):5569-5576.
[21] Datsenko KA,Pougach K,Tikhonov A,etal.Molecular memory of prior infections activates the CRISPR/Cas adaptive bacterial immunity system[J].Nat Communications,2012,3:945.
[22] Swarts DC,Mosterd C,van Passel MW,etal.CRISPR interference directs strand specific spacer acquisition[J].PLoS ONE,2012,7(4):e35888.
[23] Brouns SJ,Jore MM,Lundgren M,etal. Small CRISPR RNAs guide antiviral defense in prokaryotes[J].Science,2008,321(5891):960-964.
[24] Wang RY,Li H.The mysterious RAMPproteins and their roles in small RNA-based immunity[J].Protein Science,2012,21(4):463-470.
[25] Sternberg SH,Haurwitz RE,Doudna JA.Mechanism of substrate selection by a highly specific CRISPR endoribonuclease[J].RNA,2012,18:661-672.
[26] Wang R,Preamplume G,Terns MP,etal. Interaction of the Cas6 riboendonuclease with CRISPR RNAs:recognition and cleavage[J].Structure,2011,19(2):257-264.
[27] Wang R,Zheng H,Preamplume G,etal. The impact of CRISPR repeat sequence on structures of a Cas6 protein-RNA complex[J].Protein Science,2012,21(3):405-417.
[28] Cocozaki AI,Ramia NF,Shao Y,etal.Structure of the Cmr2 subunit of the CRISPR-Cas RNA silencing complex[J].Structure,2012,20(3):545-553.
[29] Zhu X,Ye K.Crystal structure of Cmr2 suggests a nucleotide cyclase-related enzyme in type Ⅲ CRISPR-Cas systems[J].FEBS Lett,2012,586(6):939-945.
[30] Medina-Aparicio L,Rebollar-Flores JE,Gallego-Hernández AL,etal.The CRISPR/Cas immune system is an operon regulated by LeuO,H-NS,and leucine-responsive regulatory protein in Salmonella enterica serovar Typhi[J].J Bacteriol,2011,193(10):2396-2407.
[31] Westra ER,van ErPPB,Künne T,etal.CRISPR immunity relies on the consecutive binding and degradation of negatively supercoiled invader DNA by Cascade and Cas3[J].Mol Cell,2012,46(5):595-605.
[32] Barrangou R,Horvath P.CRISPR:New horizons in phage resistance and strain identification[J].Ann Rev Food Sci Technol,2012,3:143-162.
[33] Garneau JE,Dupuis M,Villion M,etal.The CRISPR/Cas bacterial immune system cleaves bacteriophage and plasmid DNA[J].Nature,2010,468(7320):67-71.
[34] Heler R,Marraffini LA,Bikard D.Adapting to new threats:The generation of memory by CRISPR-Cas immune systems[J].Mol Microbiol,2014,93(1):1-9.
[35] Barrangou R.CRISPR-Cas systems and RNA-guided interference[J].Wiley Interdiscip Rev RNA,2013 ,4(3):267-278.
[36] Boettcher M, McManus MT.Choosing the Right Tool for the Job:RNAi,TALEN,or CRISPR[J].Mol Cell,2015,58(4):575-585.
[37] Liang P,Xu Y,Zhang X,etal.CRISPR/Cas9-mediated gene editing in human tripronuclear zygotes[J].Protein Cell,2015,6(5):363-372.
[38] Bikard D,Marraffini LA.Innate and adaptive immunity in bacteria:mechanisms of programmed genetic variation to fight bacteriophages[J].Curr Opinion Immunol,2011,24(1):15-20.
[收稿2015-09-07 修回2015-12-23]
(編輯 張曉舟)
10.3969/j.issn.1000-484X.2016.04.035
鄭海青(1975年-),男,主管技師,主要從事微生物及分子免疫學相關研究,E-mail:ycdyzhenghaiqing@sina.com。
R37
A
1000-484X(2016)04-0605-04