彭明芳,李培駿,2 *,單楊,2,3,陳玉秋,楊岱峻,雷麗嫦,黃芝輝,余孔新
1(桂林理工大學 化學與生物工程學院,廣西 桂林,541004)2(湖南省農業科學院,湖南省農產品加工研究所,湖南 長沙,410125)3(湖南大學 研究生院隆平分院,湖南 長沙,410125)
碳水化合物活性酶(carbohydrate active enzymes,CAZymes)參與了復雜碳水化合物和糖復合物的組裝和分解,按功能可分為糖苷水解酶(glycoside hydrolases,GHs)、糖基轉移酶(glycosyl transferases,GTs)、多糖裂合酶(polysaccharidelyases ,PLs)、碳水化合物酯酶(carbohydrate esterases,CEs)、碳水化合物結合模塊(carbohydrate-binding modules,CBMs)和具有輔助活性的酶(auxiliary activities,AAs)等六大類[1-3]。大部分的CAZymes來源于微生物和無脊椎動物,真菌是植物生物質的主要降解微生物,子囊菌和擔子菌來源的CAZymes已經廣泛應用于工業加工領域[3]。隨著高通量測序技術的廣泛應用,特別是組學數據的大量產生,系統地揭示微生物的生理代謝途徑成為可能,這也為篩選CAZymes基因提供了一個新的思路[4]。
除了霉菌可以產生CAZymes降解植物細胞壁多糖,細菌也可以產生纖維素酶、半纖維素酶和果膠酶來降解植物多糖。近年來,乳桿菌中CAZymes基因發掘成為其功能研究的切入點。研究表明,酸菜中的Paenibacilluspeoriae,Bacillusstratosphericus,B.toyonensi和B.cereus能夠產生纖維素酶、果膠酶,這是植物組織軟化的重要因素[5]。發酵食品中常見的乳酸菌具有胞外蛋白水解酶、β-葡萄糖苷酶、β-甘露糖苷酶和β-甘露聚糖酶活性,篩選自馬來西亞發酵食品的Lactobacillusplantarum具有轉化棕櫚仁餅中生物質的能力[6]。YE等[7]通過全基因組測序表明嬰兒糞便中L.pentosusZFM94含碳水化合物代謝、轉運和CAZymes的基因,而CAZymes基因中含有10個GHs和29個GTs,這些基因與其益生功能密切相關。陳臣[8]通過對L.plantarumST-III全基因組序列分析發現其含有多個潛在的代謝低聚果糖的相關碳水化合物活性酶基因。由此可見,無論從表型還是全基因組水平來看,乳桿菌中存在的CAZymes基因對于其益生功能、生物質轉化以及果蔬組織的軟化起著關鍵的作用。
相對于絲狀真菌,乳桿菌中降解植物多糖的酶活力較小,對其代謝和產酶過程相關基因的研究還不夠深入;雖然乳桿菌的全基因組測序表明存在CAZymes和表型特征的基因,但這些特異基因仍然需要進一步的確認[9]。所以,本研究以酸菜中的乳桿菌為研究對象,利用基因組學對從中篩選出的菌種開展CAZymes相關基因的比較研究,這將有助于我們更好的認識酸菜中乳桿菌降解和軟化植物細胞壁的作用機理,對功能性乳桿菌的開發應用提供理論參考。
1.1.1 實驗菌種及培養基
MRS液體培養基:蛋白胨10 g,牛肉膏10 g,酵母浸膏5 g,K2HPO42 g,檸檬酸三銨2 g,CH3COONa 5 g,吐溫-80 1 mL,MgSO40.58 g,MnSO40.25 g,葡萄糖20 g,自然pH;果膠-MRS:MRS中加入2%(質量分數)的果膠(Sigma,P9135)代替葡萄糖;MRS固態培養基:液態培養基加入1.8%(質量分數)瓊脂粉。
菌種篩選:從廣西酸菜中篩選出的3株具有降解果膠的乳桿菌,分別命名為DC4、GLKK1和GLKK2;篩選培養基為果膠-MRS固態培養基。
1.1.2 儀器與設備
UV760CRT型紫外分光光度計,上海傲譜分析儀器分析有限公司;LDZX-50KBS型立式壓力蒸汽滅菌器,上海申安;LRH-250-Z型振蕩培養箱,韶關市宏泰醫療器械有限公司;SZGMA3-30K型高速冷凍離心機,德國SZGMA公司;iMark型酶標儀,美國BIO-RAO公司。
1.2.1 菌株活化
將冷凍保藏的乳桿菌菌種接種至MRS液態培養基上,37 ℃恒溫培養2 d,活化菌株后備用。
1.2.2 乳桿菌產酶及酶活測定
乳桿菌產酶過程:將乳桿菌分別按10%的接種量接種至以果膠、羧甲基纖維素鈉(carboxymethylcellulose sodium,CMC)以及木聚糖代替葡萄糖的MRS液體培養基中,37 ℃,200 r/min,搖床振蕩培養5 d,期間每隔12 h取樣,10 000 r/min離心10 min,得到的上清液即為樣品酶液。
果膠酶、纖維素酶和半纖維素酶活力測定[10-11]:樣品組與對照組分別加入0.48 mL果膠、CMC和木聚糖溶液(2 g/L),45 ℃水浴鍋預熱10 min后,樣品組加入0.24 mL酶液,對照組加入0.24 mL經煮沸滅活的酶液,同時在45 ℃的水浴鍋中反應20 min后取出,立刻加入0.40 mL的DNS試劑,沸水中顯色5 min,冷卻后540 nm測吸光度值。酶活單位:1 mL酶液1 min分解果膠、CMC和木聚糖生成1 μmol單糖所需的酶量定義為1個酶活單位U[12]。
1.2.3 乳桿菌的鑒定和基因組測序
將乳桿菌培養至對數生長中期(9 h),冷凍離心獲得活菌體樣品后進行菌株的鑒定(上海美吉);采用二代測序平臺Illumina Hiseq×10對菌株進行全基因組測序,利用SOAPdenovo 2.04[13]進行二代測序數據組裝。
1.2.4 功能注釋
使用Glimmer 3.02[14]和GeneMarkS 4.3[15]預測編碼DNA序列(coding sequences,CDSs),通過EggNOG(Evolutionary Genealogy of Genes: Non-supervised Orthologous Groups)和KEGG(Kyoto Encyclopedia of Genes and Genomes)數據庫對預測得到的編碼基因進行功能注釋;還通過CAZy數據庫[16]對CAZymes進行了識別、分類和注釋。
1.2.5 三株乳桿菌比較基因組分析
使用OrthoMCL對3株乳桿菌全基因組中編碼基因進行同源基因聚類分析,根據KEGG注釋結果,針對某一特定的KEGG代謝通路進行每個節點的基因數量統計以及可視化展示,展現3株乳桿菌之間的代謝通路差異。
由圖1-a可看出,乳桿菌GLKK1和GLKK2的果膠酶酶活力的峰值均出現在72 h;而DC4的峰值最高,出現在48 h,為(0.40±0.01)U/mL。由圖1-b和1-c得出,3株乳桿菌中,DC4的纖維素酶與木聚糖酶活力較高,其最高峰均處于72 h,纖維素酶和木聚糖酶活力分別為(0.04±0.01)和(0.19±0.01)U/mL;而GLKK1兩種酶的活力最高值為(0.02±0.01)和(0.11±0.01)U/mL;GLKK2產兩種酶最高值為(0.03±0.01)和(0.15±0.01) U/mL。由此可見,DC4產果膠酶、纖維素酶與木聚糖酶的能力均較強于另外2株乳桿菌。

a-乳桿菌產果膠酶;b-乳桿菌產纖維素酶;c-乳桿菌產木聚糖酶圖1 乳桿菌產CAZymes情況圖Fig.1 CAZymes production by Lactobacillus spp.
用16S rRNA測序技術分別鑒定3株乳桿菌,對得到的序列進行系統進化分析(圖2),發現乳桿菌DC4的近緣物種是短乳桿菌 ATCC 14869(NR_044704.2),GLKK1與GLKK2的近緣物種是植物乳桿菌JCM 1149(NR_117813.1)。因此分別命名上述3株乳桿菌為L.brevisDC4,L.plantarumGLKK1和L.plantarumGLKK2。

圖2 三株乳桿菌的系統發育樹Fig.2 Phylogenetic trees of three strains of Lactobacillus spp.
2.3.1 全基因組測序和組裝結果
利用二代測序平臺對3株乳桿菌進行全基因測序,測序組裝結果如表1所示,DC4、GLKK1和GLKK2基因全長分別為2 640 916、3 637 522以及3 535 112 bp;總Scaffold數量分別為126、103和49個;GC含量分別為45.66%、46.25%和46.37%;編碼基因分別有2 615、3 355以及3 270個;預測出總tRNA數量分別為66、67和63個;預測出總rRNA數量分別為4、7和2個。

表1 三株乳桿菌基因組測序結果概況統計表Table 1 Summary of the results of genome sequencing of three strains of Lactobacillus spp.
2.3.2 基因注釋
2.3.2.1 COG注釋
3株乳桿菌全基因組COG注釋結果如圖3所示,乳桿菌DC4、GLKK1和GLKK2基因組上的全部編碼基因中,分別有2 102、2 663以及2 610個蛋白編碼基因被注釋到19個COG功能類別上。3株乳桿菌的注釋結果非常相似,主要集中在碳水化合物轉運與代謝(179、294、293個基因),轉錄(179、236、233個基因),氨基酸轉運與代謝(141、214、211個基因),細胞膜壁的合成(109、158、159個基因)等這幾個功能分類上。功能注釋的多樣性表明,3株乳桿菌具有較好的降解多糖的能力。

圖3 三株乳桿菌的COG注釋功能分類情況圖Fig.3 Classification of COG annotation function of three strains of Lactobacillus spp.
2.3.2.2 KEGG注釋
圖4對乳桿菌的代謝通路進行注釋基因分析,乳桿菌DC4的基因主要集中在其他氨基酸代謝、碳水化合物代謝、多糖合成和代謝,而GLKK1和GLKK2主要集中在碳水化合物代謝、全局和概覽通路、氨基酸代謝等。KEGG注釋表明,3株乳桿菌的代謝系統都較為完整,碳水化合物代謝和氨基酸代謝通路占據了主導地位,這些重要的功能或富集通路與植物多糖代謝相關的基因表達調控等都有不可或缺的關系。

圖4 三株乳桿菌KEGG注釋中代謝的分類詳情圖Fig.4 Classification of metabolism of three strains of Lactobacillus spp.from KEGG annotations
2.3.3 CAZymes功能預測
乳桿菌CAZymes功能預測結果如圖5所示,乳桿菌DC4、GLKK1和GLKK2分別有63、114和115個CAZymes編碼基因。3株菌的CAZymes注釋在GHs基因數量最多;除此之外,L.brevisDC4中的CEs高于GTs,而L.plantarumGLKK1和GLKK2中GTs高于CEs。由此可見,雖然乳桿菌具有降解植物多糖的基因,但水解酶、酯酶和轉移酶的比例分布與菌種的種類有直接的聯系。

圖5 三株乳桿菌的CAZymes功能預測Fig.5 CAZymes functions prediction of three strains of Lactobacillus spp.
2.3.4 乳桿菌中植物多糖降解相關CAZymes基因
表2是乳桿菌被注釋到的CAZymes與其基因家族分布,可見3株乳桿菌均含有較多與降解半纖維素、果膠、纖維素和淀粉等相關的基因家族。
半纖維素的降解需要解聚酶和輔助酶[17],解聚酶包括木聚糖酶、甘露聚糖酶和木葡聚糖酶等。3株乳桿菌中都含有CE1、CE3、CE4、CE7、CE9,GH1、GH2、GH31、GH36和GH42等基因家族,GH1和GH2家族基因編碼的β-葡萄糖醛酸酶和α-L-阿拉伯糖呋喃糖苷酶等解聚酶可以從木聚糖上移走葡糖苷側鏈[11];CE1、CE2、CE3、CE4和CE7家族基因編碼的酯酶可作為半纖維素降解的輔助酶參與木聚糖的降解。果膠降解的主要水解酶屬于GH28家族[18],在3株乳桿菌的全基因組中雖然沒有發現該基因家族,但出現了GH1、GH2、GH42、GH51和GH78等這幾個降解果膠側鏈的基因家族,其基因編碼的β-半乳糖苷酶(EC 3.2.1.23)水解去除非還原末端的β-D-半乳糖殘基,作用于細胞壁中鼠李半乳糖醛酸聚糖 Ⅰ 果膠和半纖維素的木葡聚糖[19],α-L-鼠李糖苷酶與外切β-1,4-葡聚糖酶等負責切割果膠毛發區,從而參與到果膠降解當中。降解纖維素的酶系主要為內切葡聚糖酶、外切葡聚糖酶(纖維二糖水解酶)以及β-葡萄糖苷酶3種[20]。3株乳桿菌中發現了與降解纖維素相關的GH1、GH8、GH30以及GH51家族基因,其中GH1為3株乳桿菌所共有,而其余基因則為DC4所特有,在基因層面進一步揭示了乳桿菌DC4的纖維素降解能力較強的原因。
此外,經CAZy注釋分析得出,乳桿菌DC4、GLKK1和GLKK2基因組中含有的與植物多糖降解相關基因總數分別為19、31和31個,在CAZy注釋的基因中占比分別為30.16%,27.19%和26.96%。由表2可見,3株乳桿菌包含17種CAZymes共有基因,包括纖維素、半纖維素、果膠和淀粉的水解酶和酯酶。除了共有基因外,DC4菌株有10種纖維素和半纖維素的特有基因,包括GH8、GH30和GH51家族。而GLKK1和GLKK2包含7種與半纖維素、果膠和淀粉相關特有基因,包括GH39、GH13、CE2和GH78??梢?,乳桿菌DC4多糖降解基因數量高于其他乳桿菌,此結果與上述乳桿菌發酵產酶情況相吻合(圖1)。

表2 三株乳桿菌降解多糖的碳水化合物活性酶注釋表Table 2 CAZymes annotations for polysaccharide degradation from Lactobacillus spp.
2.4.1 同源基因分析
圖6是3株乳桿菌的同源基因分析,三者共有的基因數量為1 501個,而DC4、GLKK1和GLKK2特有的基因分別為878、87和49個;GLKK1與GLKK2兩者共有1 692個基因家族,而DC4與GLKK1和GLKK2之間共有基因家族分別為46和1個。以上數據說明DC4與GLKK1、GLKK2之間差異性較大,GLKK1和GLKK2的同源性較強。

圖6 三株乳桿菌的同源基因分析圖Fig.6 Homologous gene analysis of three strains of Lactobacillus spp.
2.4.2 KEGG代謝通路差異分析
3株乳桿菌的KEGG代謝通路差異分析見圖7,從圖7可看出3株菌株糖酵解/糖異生途徑并不完整,均缺少己糖激酶[21](EC 2.7.1.1),而DC4相較于GLKK1和GLKK2還缺少了一些編碼酶基因(表3),另外還發現了3株乳桿菌全基因組中都含有eda(2-酮-3-脫氧-6-磷酸葡萄糖醛酸酶)基因,而eda基因是胞內果膠代謝和ED(Entner-Doudoroff)代謝途徑的兩個關鍵酶之一[22],說明3株乳桿菌除了利用糖酵解途徑代謝糖類外,還可能通過ED途徑進行糖代謝產生能量。

圖7 糖酵解/糖異生代謝通路差異檢驗圖Fig.7 Differential test of glycolysis/glycosylated metabolic pathway注:圖中標色的長方框中每一格表示對應菌株注釋到該位置的基因個數,從左往右分別為GLKK2、GLKK1、DC4,方框顏色深淺代表基因的多少,顏色越深基因個數越多

表3 三株乳桿菌的糖酵解/糖異生途徑差異分析表Table 3 Analysis of the difference of glycolysis/glycopenia pathway among three Lactobacillus spp.
本研究從廣西酸菜中篩選獲得了3株產CAZymes的乳桿菌,并通過二代測序技術比較其編碼基因。通過鑒定可知3株菌分屬于L.brevisDC4,L.plantarumGLKK1和GLKK2,液態發酵L.brevisDC4具有較高果膠酶、纖維素酶和半纖維素酶。通過COG和KEGG對其功能基因和代謝通路進行了注釋,CAZymes注釋表明其多糖降解功能基因集中在GHs、GTs和CEs。3株乳桿菌包含17種CAZymes共有基因,包括纖維素、半纖維素、果膠和淀粉水解酶和酯酶。而L.brevisDC4有10種特有基因,L.plantarumGLKK1和GLKK2包含7種特有基因。從表型和基因組數據可見上述乳桿菌具有降解植物細胞壁多糖的能力,后續的研究中將對于其產酶的基因進行克隆表達,為開發具有特異功能乳桿菌以及新型CAZymes提供參考。