張 欣,姚 粟,劉 洋,劉 勇,張 露,程 池*
(中國食品發酵工業研究院 中國工業微生物菌種保藏管理中心,北京 100015)
(G+C)含量是指生物體脫氧核糖核酸(deoxyribonucleic acid,DNA)中鳥嘌呤(guanine,G)和胞嘧啶(cytosine,C)占整個堿基總量[G+C+腺嘌呤(adenine,A)+胸腺嘧啶(thymine,T)]的摩爾分數,即(G+C)摩爾分數為(G+C)/(G+C+A+T)。(G+C)摩爾分數是微生物物種的重要遺傳指征,尤其是細菌,因其(G+C)摩爾分數范圍較寬,可達20%~80%[1-3],且每一種細菌(G+C)含量變化范圍很小,比較穩定,不受菌齡、生長環境等因素影響。因此,(G+C)含量分析已成為微生物遺傳學分類的一種重要方法,在鑒別細菌種間和種屬間關系以及建立一個新的分類單位時具有重要意義[4-5]。
(G+C)含量測定方法主要有熱變性溫度法和高效液相色譜法[6-8]。熱變性溫度法是1961年MARMUR J等[8]提出的用于測定(G+C)含量的一種物理方法,主要基于雙鏈DNA發生熱變性過程中所呈現的增色效應,通過檢測波長260 nm處的吸光度值變化,獲得雙鏈DNA的溶解曲線和解鏈溫度(Tm),再根據Tm與(G+C)含量的經驗公式換算得到(G+C)摩爾分數[9]。Tm間接反映了菌株G-C堿基對的含量,因為3個氫鍵連接的G-C堿基對斷裂需要的溫度高于兩個氫鍵連接的A-T堿基對,因此DNA中G-C堿基對含量越多,解鏈溫度Tm也就越高[6]。熱變性溫度法得到的DNA(G+C)摩爾分數由于是物理參數解鏈溫度通過經驗公式換算而成,因此間接地反映DNA 的(G+C)含量。
1989年MESBAH M等[7]首次提出利用液相色譜精確測定DNA的(G+C)含量,DNA經過水解(酸解或酶解)處理,再借助色譜分離技術將水解產物(堿基或脫氧核苷)從色譜柱上逐一分離開,并對目標堿基成分進行定量檢測。近年來隨著色譜技術的發展,定量分析的靈敏度和準確度大大提高,高效液相色譜法直接定量測定目標堿基,得到的(G+C)含量精確度更高。
此外,通過對微生物進行全基因組測序,無疑也能從中獲得DNA的(G+C)摩爾分數,但全基因組測序費用昂貴,費時費力,主要用于重要的功能菌株的遺傳學分析,不適合用于(G+C)摩爾分數的常規測定。
本研究使用熱變性溫度法和液相色譜法對大曲高溫放線菌(Thermoactinomyces daqus)CICC 10681的(G+C)摩爾分數進行了分析[10],并首次通過該菌株的全基因組測序結果,對熱變性溫度法和液相色譜法的測定結果進行了驗證。
1.1.1 菌株
參考菌株Escherichia coliK12(CICC 10424)、Escherichia coliDH5α(CICC 10399);樣品菌株大曲高溫放線菌(Thermoactinomyces daqus)CICC 10681:中國工業微生物菌種保藏管理中心。
1.1.2 試劑
標準脫氧核苷:鳥嘌呤脫氧核苷(deoxyriboguanosine monophosphat,dGMP)、胸腺嘧啶脫氧核苷(deoxythymidine,dTMP):生工生物工程有限公司。三乙胺、甲醇(色譜級):百靈威科技有限公司;S1核酸酶和小牛小腸堿性磷酸酶(calf intestinal alkaline phosphatase,CIAP):寶生物(大連)有限公司;其余試劑均使用國產分析純試劑。
0.1×檸檬酸鈉(saline sodium citrate,SSC)緩沖液的配制:175.3 g NaCl和88.2 g檸檬酸鈉溶于1 L ddH2O,再稀釋200倍,調節pH 7.0。
DU 800核酸蛋白分析儀:美國Beckman公司;Ultimate 3000 高效液相色譜儀:賽默飛世爾科技有限公司;SK8200LHC超聲波清洗器:上海科導超聲儀器有限公司;PTFE HPLC用溶劑過濾器:北京邁瑞達科技有限公司。
1.3.1 細菌基因組DNA提取
主要按照MARMUR J等[11]的方法提取細菌基因組DNA,并做了少量改進,具體方案如下:
(1)稱取離心收集到的濕菌體1.0 g,重懸于6 mL氯化鈉-Tris-EDTA緩沖液(sodium chloride-tris-EDTA,STE)緩沖液(10 mmol/L Tris-HCl,10 mmol/L NaCl,1 mmol/L EDTA),振蕩混勻。(2)加入60 μL(100 mg/mL)溶菌酶,10 μL核糖核酸酶(ribonuclease,RNase)A(12.5 mg/mL)37 ℃水浴2 h。(3)加入660 μL 10%十二烷基磺酸鈉(sodium dodecyl sulfate,SDS)、80 μL蛋白酶K,50 ℃溫浴2 h。(4)加入1.7 mL5 mol/L NaCl,使終濃度為1 mol/L,充分混勻。(5)用等體積的酚/氯仿/異戊醇(25∶24∶1,V/V)混合液反復抽提至無蛋白分層。(6)取上清,加0.6倍體積的預冷異丙醇,得到沉淀基因組DNA,用體積分數為70%的乙醇進行脫鹽處理后自然風干。(7)用重蒸水或0.1×SSC充分溶解基因組DNA,并用DU800核酸蛋白分析儀測定檢測DNA純度。
1.3.2 熱變性溫度法測定(G+C)含量
提取的基因組DNA溶解于0.1×SSC中,調節其濃度為5~15 μg/mL。以大腸桿菌(Escherichia coli)K12為參考菌株,參照LI J等[6]的方法,采用DU 800核酸蛋白分析儀,設置升溫范圍50~95 ℃,升溫速度1.0 ℃/min,實時檢測升溫過程中DNA樣品在波長260 nm處的吸光度值,繪制解鏈曲線。通過DU 800軟件分析得到解鏈溫度Tm值,通過公式(G+C)含量=(Tm樣品-Tm參考)×2.08+51.2[2]計算出菌株基因組DNA的(G+C)摩爾分數。
1.3.3 高效液相色譜法測定菌株的堿基組成
以大腸桿菌(Escherichia coli)DH5α為參考菌株,參照MESBAH M等[7,12]的方法并加以優化,主要步驟如下:(1)將提取的基因組DNA溶解于重蒸水中,調節其濃度為100~200 μg/mL。(2)取70 μL DNA溶液于1.5 mL離心管中,100 ℃煮沸5 min,立即冰浴。(3)依次添加5 μL乙酸鈉(0.3 mol/L,pH5.1)、5 μL S1核酸酶(1 U/5 μL),37 ℃溫浴2 h。(4)添加10 μL小牛小腸堿性磷酸酶(1 U/10 μL),水解過夜。(5)酶解液于13 000 r/min離心10 min,上清立即轉入色譜進樣瓶,進行高效液相色譜儀分析。優化的色譜條件為:采用C18(4.6 mm×250 mm,5 μm)色譜柱,88%三乙胺和12%甲醇(pH 5.1)作為流動相,檢測波長260 nm,流速1.0 mL/min,進樣量15 μL,色譜分離時間60 min。
用軟件Chromeleon 7.10 SR1對色譜圖進行分析,獲得DNA酶解液中鳥嘌呤脫氧核苷(dGMP)和胸腺嘧啶脫氧核苷(dTMP)對應的峰面積。(G+C)含量的計算如下:

式中:Ma0為參考菌株的(G+C)表觀摩爾分數,%;SG0、ST0為參考菌株DNA水解產物經HPLC分離所獲得的dGMP、dTMP的峰面積。

式中:X為校正系數;M0為參考菌株的實際摩爾分數;Ma0為參考菌株的(G+C)表觀摩爾分數,%。

式中:Ma為樣品菌株的(G+C)表觀摩爾分數;SG、ST為樣品菌株DNA水解產物經HPLC分離所獲得的dGMP、dTMP的峰面積。

式中:M為樣品菌株的(G+C)摩爾分數,%;X為校正系數;Ma為樣品菌株的(G+C)表觀摩爾分數,%。
1.3.4 全基因組測定
大曲高溫放線菌株CICC10681的全基因組序列測定由北京諾賽基因組研究中心完成。
充分溶解的菌株基因組DNA用1%的瓊脂糖凝膠電泳檢測,結果見圖1。由圖1可知,DNA條帶清晰,無拖尾。DU80核酸蛋白分析儀檢測結果顯示所有菌株基因組DNA OD260nm/OD280nm>1.8,OD260nm/OD230nm>2.0,表明提取的基因組DNA純度較高,無蛋白及小分子鹽等雜質污染。

圖1 菌株基因組DNA的瓊脂糖凝膠電泳圖譜Fig.1 Agarose gel electrophoresis of strain genomic DNA
菌株CICC 10681和參考菌株Escherichia coliK12的熱變性曲線如圖2所示,加熱溫度范圍50~95 ℃,升溫速度1 ℃/min。

圖2 標準菌株(A)及樣品菌株(B)在0.1×SSC溶液中的熱變性曲線Fig.2 Thermal denaturation curve of standard strains(A) and sample strains(B) in 0.1×SSC solution
DU800軟件分析得到CICC 10681和參考菌株Escherichia coliK12的基因組DNA的Tm值分別為74.4℃和76.4 ℃。根據公式:(G+C)摩爾分數=(Tm樣品-Tm參考)×2.08+51.2,計算得到大曲高溫放線菌(Thermoactinomyces daqus)CICC 10681的(G+C)摩爾分數=47.0%。
HPLC得到的菌株脫氧核苷色譜分離結果見圖3,參照菌株E.coliDH5α和CICC 10681 基因組DNA酶解液的色譜圖中鳥嘌呤脫氧核苷(dGMP)、胸腺嘧啶脫氧核苷(dTMP)分離效果良好,峰形正常,無干擾峰。色譜工作站分析得到大腸桿菌(E.coli)DH5α和大曲高溫放線菌(Thermoactinomyces daqus)CICC 10681基因組DNA的dGMP和dTMP對應的峰面積見表1。

圖3 標準菌株(A)及樣品菌株(B)DNA的脫氧核苷色譜圖Fig.3 Deoxyribonucleoside chromatogram of DNA instandard strain(A) and sample strain(B)

表1 HPLC分析得出的樣品脫氧核苷成分的保留時間及峰面積Table 1 Retention time and peak area of sample deoxynucleoside by HPLC analysis
根據公式,參照菌株大腸桿菌(E.coli)DH5α的表觀摩爾分數Ma0=SG0/(SG0+ST0)=46.021 5%;校正系數X=M(1-Ma0)/Ma(1-M0)=1.270 639(大腸桿菌(E.coli)DH5α的實際摩爾分數,M0,=52%);菌株大曲高溫放線菌(Thermoactinomyces daqus)CICC 10681基因組DNA的(G+C)摩爾分數為49.3%。
采用雙端測序法,用軟件CLC Genomics Workbench 5.0.1 進行從頭測序(De novo sequencing),共得到93個片段,拼接后總堿基數為3.46×106個,(G+C)摩爾分數為49.0%。
菌株CICC 10681是本課題組從扳倒井高溫大曲曲塊中分離到的一株高溫放線菌,經分類學研究表明其為高溫放線菌屬內一新種,定名為大曲高溫放線菌(Thermoactinomyces daqus)[10]。目前,高溫放線菌屬正式公布的有2個種,普通高溫放線菌(Thermoactinomyces vulgaris)和中間型高溫放線菌(Thermoactinomyces intermedius)。據權威文獻報道,這兩個種模式株的(G+C)摩爾分數均為48%(HPLC法)[13],本研究測得的大曲高溫放線菌CICC 10681的(G+C)含量47.0%(Tm法)、49.3%(HPLC法),與高溫放線菌屬的(G+C)含量接近,符合該屬耐高溫低(G+C)含量的特征。這與其他放線菌屬高(G+C)含量(65%~75%)的特征差異明顯(超過20%),正基于對(G+C)含量及重組DNA(recombinant DNA,rDNA)序列等遺傳學分析,高溫放線菌屬的分類學地位發生了明顯的改變,從最早的放線菌科轉移到新的分類單元高溫放線菌科中[14-15]。
從2種方法的測定結果看,Tm法和HPLC法測定的CICC 10681的(G+C)摩爾含量分別為47.0%(Tm法)和49.3%(HPLC法),與該菌株的全基因組測序結果(49.0%)相比,Tm法的結果存在一定的偏差。主要原因可能有:(1)Tm法得到的(G+C)含量是通過Tm值與(G+C)含量的經驗公式得到,這種換算關系因DNA緩沖體系的濃度、pH的不同,差異顯著。(2)DNA純度不高或發生輕微降解,尤其是核糖核酸(ribose nucleic acid,RNA)的污染直接對結果產生偏差。另外,Tm法忽略了4種堿基之外的其他稀有堿基,且在Tm值較低或較高時,儀器精密度對結果的影響比較明顯。因此,Tm法對試劑的準確配制、DNA的純度和儀器的要求比較高。而HPLC法直接定量檢測DNA的堿基組分,排除了稀有堿基、修飾堿基和RNA的干擾,色譜靈敏度高于分光光度法,測得的結果與全基因組測序的結果非常接近。而且HPLC法能實現大量樣品的連續化處理,測定效率高。因此,HPLC法更適合用于微生物DNA(G+C)含量的準確描述和大量樣品的測定。
對大曲高溫放線菌(Thermoactinomyces daqus)CICC 10681的分析表明,Tm法和HPLC法測定的(G+C)摩爾分數分別為47.0%(Tm法)和49.3%(HPLC法),與全基因組測序的結果(49.0%)基本一致,符合高溫放線菌屬的低(G+C)含量特征。HPLC法靈敏度高,結果準確,適用于微生物分類學中對微生物(G+C)含量的準確描述。
[1]JOHNSON J L.Use of nucleic acid homologies in the taxonomy of anaerobic bacteria[J].Int J Syst Bacteriol,1973,23(4):308-315.
[2]GOODFELLOW M,O'DONNELL A G.Handbook of new bacterial systematics[M].London:Academic Press Ltd.,1993.
[3]VANDAMME P,POT B,GILLIS M,et al.Polyphasic taxonomy,a consensus approach to bacterial systematics[J].Microbiol Mol Biol Rev,1996,60(2):407-438.
[4]LEE K Y,WAHL R,BARBU E.Contenuen bases puriqueet pyrimidiques des acides deoxyribonucleiques des bacteries[J].Ann Inst Pasteur,1956,91(2):212-224.
[5]林萬明.細菌分子遺傳學分類鑒定法[M].上海:上海科學技術出版社,1990.
[6]LI J,QIN S,YOU Z Q,et al.Melghirimyces profundicolussp.nov.,isolated from a deep-sea sediment[J].Int J Syst Evol Microbiol,2013,63(11),4552-4556.
[7]MESBAH M,PREMACHANDRAN U,WHITMAN W B.Precise measurement of the G+C content of deoxyribonucleic acid by high-performance liquid chromatography[J].Int J Syst Bacteriol,1989,39(2):159-167.
[8]MARMUR J,DOTY P.Determination of the base composition of deoxyribonucleic acid from its thermal denaturation temperature[J].J Mol Biol,1962,5(1):109-118.
[9]MANDEL M,IGAMBI L,BERGENDAHL J,et al.Correlation of melting temperature and cesium chloride buoyant density of bacterial eoxyribonucleic acid[J].J Bacteriol,1970,101(2):333-338.
[10]YAO S,LIU Y,ZHANG M J,et al.Thermoactinomyces daqussp.nov.,a thermophilic bacterium isolated from high temperature Daqu[J].Int J Syst Evol Microbiol,2014,64(1):206-210.
[11]MARMUR J,DOTY P.Thermal renaturation of deoxyribonucleic acids[J].J Mol Biol,1961,3(5):585-594.
[12]LEE Y J,WAGNER I D,BRICE M E,et al.Thermosediminibacter oceanigen.nov.,sp.nov.andThermosediminibacter litoriperuensissp.nov.,new anaerobic thermophilic bacteria isolated from Peru Margin[J].Extremophiles,2005,9(5):375-383.
[13]YOON J H,KIM I G,SHIN Y K,et al.Proposal of the genusThermoactinomyces sensu strictoand three new genera,Laceyella,ThermoflavimicrobiumandSeinonella,on the basis of phenotypic,phylogenetic and chemotaxonomic analyses[J].Int J Syst Evol Microbiol,2005,55(1):395-400.
[14]YOON J H,PARK Y H.Phylogenetic analysis of the genusThermoactinomycesbased on 16S rDNA sequences[J].Int J Syst Evol Microbiol,2000,50(3):1081-1086.
[15]YOSHIHIDE M,ATSUKO K,SATORU M.Mechercharimyces mesophilusgen.nov.,sp.nov.andMechercharimyces asporophorigenenssp.nov.,antitumour substance-producing marine bacteria,and description ofThermoactinomycetaceaefam.nov.[J].Int J Syst Evol Microbiol,2006,56(12):2837-2842.