曹小利,程莉,周萬青,張之烽,張葵,沈瀚
(南京大學附屬鼓樓醫院檢驗科,南京210008)
肺炎克雷伯菌是醫院和社區獲得性感染的主要病原菌,主要引起尿路感染、肺炎、敗血癥等感染性疾病[1]。目前已知,肺炎克雷伯菌是全球主要流行的碳青霉烯耐藥腸桿科細菌(carbapenem resistant enterobacteraceae, CRE)[2]。KPC-2是碳青霉烯耐藥肺炎克雷伯菌(carbapenem resistanceKlebsiellapneumoniae, CRKP)中主要的碳青霉烯酶,ST11是CRKP的主要流行克隆[3]。本研究主要對南京地區不同醫院分離的3株CRKP-ST11進行基因組測序,并與上海、杭州、美國/印度的相應菌株進行基因組比對,進行基因組學特點分析,報道如下。
1.1實驗菌株 在前期的研究基礎上,挑取南京鼓樓醫院、南京明基醫院、南京醫科大學醫學院附屬第二醫院分離的3株CRKP-ST11菌株[4],樣本分別從患者血液、尿液及痰液培養中獲得。細菌經基質輔助激光解吸電離飛行時間質譜技術鑒定。本研究中CRKP定義為對亞胺培南耐藥,ST11經肺炎克雷伯菌多位點序列分型確定。
1.2儀器和試劑 磁珠法通用型基因組DNA提取試劑盒DP705(北京天根公司);NanoDrop 2000分光光度計(德國Thermo公司);恒溫震蕩培養儀器ZWY-211B(ZHICHENG公司);全自動快速微生物質譜檢測系統(法國生物梅里埃公司)。
1.3基因組提取和全基因組測序 取新鮮培養的單個菌落接種至50 mL LB培養液中,37 ℃ 200 r/min過夜培養后,4 ℃、(4 000~8 000)×g離心10 min,棄上清液,細菌沉渣用無菌水洗2次后,使用磁珠法通用型基因組DNA提取試劑盒DP705,按說明書提取細菌基因組DNA,并用NanoDrop 2000分光光度計檢測基因組的濃度和純度。基因組濃度要求:DNA≥5 ng/μL;純度要求:A260 nm/A280 nm=1.8~2.0。本項目委托廣東美格基因公司進行基因組高通量測序。提取的DNA樣品經電泳檢測合格后,用Covaris超聲波破碎儀隨機打斷成長度約350 bp的DNA片段。經末端修復、加A尾、加測序接頭、純化、PCR擴增等步驟完成文庫制備;構建的文庫先使用Qubit 2.0進行初步定量,稀釋文庫至2 ng/μL,隨后使用Agilent 2100對文庫的插入片段進行檢測,片段符合預期后,使用Q-PCR方法對文庫的有效濃度進行準確定量,以保證文庫質量。庫檢合格后,進行Illumina HiSeq 測序,測序平臺采用Illumina Hiseq PE150。獲得的核苷酸片段在CLC genomics workbench軟件(蘇州協云基因科技公司)上進行拼接,通過軟件去除測序質量較差的片段后,使用de novo拼接成contigs。
1.4細菌單核苷酸多態性(single nucleotide polymorphism,SNP)分析 以中國浙江(JM45)、上海(HS11286)和美國/印度(ATCC BAA-2146)的報道的CRKP-ST11全基因組為對照菌株,進行比對分析。將獲得的3株草圖基因組的contigs,采用CLC Main Workbench進行首尾串連成一條假的完整DNA,然后將6個基因組的核苷酸序列導入Mauve軟件[5],進行多序列比對,比對完成后,選擇導出SNP分析結果即可獲得所有SNP位點信息。采用Circos軟件[6],以每1 000 bp內發生的SNP數量為數據,分別對每個基因組的SNP分布進行可視化。
1.5親緣關系分析 為獲得核心區域的高質量SNP位點信息,采用Perl對Mauve生成的SNP位點信息進行過濾,標準如下:(1)不允許出現“-”;(2)每一個SNP位點只能出現2種不同的堿基。采用自編寫的Perl腳本對過濾后的SNP位點進行串聯,共獲得14 052個SNPs,然后導入RAxML構建最大似然樹[7]。
1.6莢膜多糖(capsular polysaccharide,CPS)基因簇組成及GC含量分析 將基因組gbk格式(序列及基因注釋)文件導入CLC Main Workbench,對CPS區域基因組成進行共線性分析,并導出基因簇組成圖(SVG格式);根據基因注釋并進行人工核對,確定基因名。選擇導出每個基因組的CPS區域核苷酸序列,然后采用自編寫的Perl腳本程序對核苷酸序列進行GC含量步移法(步長設置為120 bp)掃描分析。最后采用Adobe Illustrator CS對圖形進行編輯。
1.7基因組的獲取號 本實驗中測序得到的基因組已上傳NCBI,基因組獲取號分別依次為:RZKL00000000、RZME00000000和RZMP00000000;本實驗中的對照基因組從NCBI中下載,基因組獲取號如下:肺炎克雷伯菌HS11286:NC_016845.1;肺炎克雷伯菌JM45:NC_022082.1;肺炎克雷伯菌ATCCBAA-2146:NZ_CP006659.2。
2.13株CRKP-ST11的基因組組裝結果 3株測序細菌的基因組組裝結果見表1。

表1 3株碳青霉烯耐藥肺炎克雷伯菌ST11菌株的基因組組裝結果
2.2CRKP-ST11菌株的SNP特點 6株細菌基因組的單核苷酸位點多態性見圖1。結果顯示,在整個肺炎克雷伯菌基因組中,CPS基因簇是CRKP-ST11的主要的SNP位點分布區之一。

注:紅色標記表示CPS基因簇的SNP變化,箭頭的幅度越大,顯示該區的多態性越大。
2.3CRKP-ST11菌株的親緣關系特點 CRKP-ST11菌株的群體結構分析見圖2。結果顯示,6株CRKP-ST11菌株分為4個進化枝,其中,南京地區分離的3株CRKP-ST11菌株在同一進化枝中,親緣關系最近;其次,這3株細菌與上海、杭州的CRKP-ST11也有較近的親緣關系,而與美國/印度的CRKP-ST11較遠。

注:NJ699、NJ323和NJ212是在南京分離的3株CRKP-ST11菌;HS11286(中國上海)、JM45(中國杭州)、ATCC BAA-2146(美國/印度)的基因組從NCBI數據庫中下載。
2.4CRKP-ST11菌株的CPS基因簇結構特點 CRKP-ST11的CPS基因簇結構分析見圖3。結果顯示,從南京地區分離的3株CRKP-ST11菌株,其CPS基因簇5′端的galF、orf2、wzi、wza、wzb和wzc及3′端的gnd和ugd基因間的成對核苷酸相似性為99%(galF)到55%(wzc),組成相當一致,具有很好的共線性;但是與杭州、上海及美國/印度的3株CRKP-ST11菌株主要在可變區存在差異。
2.5CRKP-ST11菌株CPS的GC含量特點 南京地區分離的3株CRKP-ST11的CPS區GC含量見圖4。結果顯示,CPS可變區的GC含量大多<50%,顯著低于其保守區域(GC含量>50%)以及基因組平均GC含量(約57%),表明CPS可變區的GC含量明顯不同于基因組核心保守區。

注:藍色區域表示5′端保守區,紅色區域表示3′端保守區,綠色區為可變區。粉色陰影部分表示堿基序列相似或相同。
本研究中,我們獲取的3株細菌的基因組組裝結果與以往的研究結果一致[8],并且提交NCBI時已通過審核,表明我們在基因組提取、測序與組裝方面的結果比較可靠,可以深入分析。通過SNP分析,我們發現,CPS基因簇是CRKP-ST11的主要的SNP位點分布區之一。目前已知全球CRKP主要流行克隆組(clonal group,CG)258包括ST11和ST258等,CG258的對比基因組學分析顯示cps基因簇是CRKP的熱點重組區域,容易發生重組或替換而導致莢膜轉換[9],這種莢膜轉換在CG258中相當常見,更接近于或在CPS基因簇內,可能是CG258進化的主要特征[10],很可能是CG258全球播散主要的和潛在的共同驅動力[9,11]。此外,CPS基因簇內常存在編碼轉座酶或噬菌體相關蛋白的基因[3],表明轉座以及和轉座相關的水平基因轉移可能也在CPS基因簇內發生。其內外的DNA交換可能是肺炎克雷伯菌快速多樣化和進化的重要機制[12]。
親緣性進化分析表明,南京地區分離的3株CRKP-ST11的親緣性相近,這與我們前期的研究結果一致[13],表明CRKP-ST11在南京地區存在播散流行。此外,雖然南京和杭州距離上海很近,但不同地區來源細菌位于不同的進化枝,表明CRKP-ST11菌株的流行可能有地域特點。
目前已知,CPS由染色體基因編碼,在基因組CPS位點成簇,大小一般為21 000~30 000 bp,有16~25個開放讀碼框架(open reading frame,ORF)[14]。其有一個基本結構特征:由兩端的保守區和中間的高度可變區組成,5′端高度保守區由6個基因(galF、orf2、wzi、wza、wzb和wzc)組成,參與CPS易位運輸和細菌表面蛋白加工;3′端有高度保守的葡萄糖-6-磷酸脫氫酶(gnd)和UDP-葡萄糖脫氫酶(ugd)基因;中心區域(wzc-gnd區)為可變區,隨不同的莢膜類型而變化,通常含有編碼葡萄糖轉移酶(GTs)、翻轉酶(wzx)、聚合酶(wzy)和修飾酶(乙酰轉移酶、丙酮酰轉移酶等)的基因,與特定CPS亞基的聚合和裝配有關。研究報道,CPS基因簇中心可變區具有很大的多樣性,很可能是進化的起源[15]。然而目前研究僅集中于CPS的保守區域,不足以解釋其多樣性特征。本研究發現,南京地區分離的CRKP-ST11與杭州、上海及美國/印度的3株CRKP-ST11菌株的差異主要在可變區。Zhou等[16]報道,與非暴發肺炎克雷伯菌菌株相比,暴發菌株KP-ST1427的CPS基因簇可變區多了一段編碼GTs的3個ORF。奧地利學者發現,作為全球最為流行的CRKP,ST258的2個進化枝都具有D-半乳聚糖-Ⅲ,其編碼基因在CPS可變區;相繼的流行病學分析顯示,200多個ST258的全基因組序列中,83%的肺炎克雷伯菌ST258的CPS可變區都有這種編碼GTs的3個基因的ORF[17],提示CPS可變區在ST258流行播散中的作用。最近的一項研究表明,CRKP-ST258的CPS分型與ST258的流行相關[18]。

注:CPS可變區的G+C含量大多<50%。A,NJ699 CPS可變區的GC含量;B,NJ323 CPS可變區的GC含量;C,NJ212 CPS可變區的GC含量。
此外,CPS區的GC含量分析發現,可變區的堿基含量明顯低于保守區域和基因組平均GC含量。有研究發現,細菌的基因組核苷酸含量變化很大,各物種之間的GC含量為13%~75%[19]。微生物進化和環境都會導致微生物群體中的重組,而重組也會影響基因組堿基含量的變化。在大多數原核核心基因組中,GC含量的增加似乎是由系統發育慣性而維持的,而基因組相應的附屬和非核心部分中更為多樣和豐富的堿基組成可能更多地受到環境和其他宿主堿基組成的影響。在核心基因組中觀察到的基因內GC含量越高,GC變異越小,這很可能與選擇性限制有關[20],意味著該菌與其他微生物進行胞內重組和遺傳交換的頻率比其他微生物少[21]。因為細菌的突變主要發生在AT上[22],噬菌體攝取也有AT偏向,所以比起宿主染色體,外源性DNA序列(如噬菌體和質粒)富集更多的AT堿基[23-24]。所以,可變區GC含量越低,表明外源性DNA序列(如噬菌體和質粒等的序列)越多,該區基因重組的可能性越大。
本研究中,不管是基因組GC含量,還是基因組SNP分析均顯示,CPS基因簇很可能是CRKP的熱點重組區域,這與以往的研究報道一致[25],表明CPS基因簇可變區可能通過同源重組等導致了CPS基因座基因內容和總體長度的差異,這可能在細菌的進化中起著重要的作用。總之,CPS是CRKP-ST11的主要單核苷酸位點,其可變區堿基含量<50%,可能是CRKP-ST11菌株的主要進化區,可能與CRKP-ST11的流行有關。