薛正楷,薛原,楊根慶,張宿義,倪斌,6
(1.瀘州職業技術學院白酒學院,四川瀘州646001;2.瀘州市生物醫學工程研究所,四川瀘州646000;3.同濟大學化學科學與工程學院,上海200016;4.新鄉醫學院第三附屬醫院檢驗科,河南新鄉453003;5.瀘州老窖股份有限責任公司,四川瀘州646000;6.瀘州江潭窖酒業有限公司,四川瀘州646300)
產己酸菌LysinibacillusfusiformisSigA基因的克隆、表達及生物信息學分析
薛正楷1,2,薛原3,楊根慶4,張宿義5,倪斌5,6
(1.瀘州職業技術學院白酒學院,四川瀘州646001;2.瀘州市生物醫學工程研究所,四川瀘州646000;3.同濟大學化學科學與工程學院,上海200016;4.新鄉醫學院第三附屬醫院檢驗科,河南新鄉453003;5.瀘州老窖股份有限責任公司,四川瀘州646000;6.瀘州江潭窖酒業有限公司,四川瀘州646300)
通過克隆產己酸菌LysinibacillusfusiformisSigA全長基因,并對其進行表達和生物信息學分析。結果表明,SigA基因開放閱讀框(ORF)有1 128個堿基,編碼327個氨基酸,其分子質量為45.275 kDa;生物信息學預測表明,L.fusiformis與Lysinibacillussphaericus具有較近的親緣關系,二者序列相似度達97%;該蛋白為親水性可溶性蛋白,與Bacillus sp.B14905相似度達100%,其二級結構主要由α-螺旋和loop環狀構成,α-螺旋和loop環狀分別占其二級結構的60.15%和37.79%;預測并優化的三級結構由14個α-螺旋和15個loop構成。
產己酸菌;Lysinibacillusfusiformis;SigA基因;生物信息學
細菌的轉錄是一個復雜的過程,由多種分子共同調控,其中核糖核酸(ribonucleic acid,RNA)聚合酶是催化轉錄合成RNA的重要酶,也是調控基因轉錄的關鍵酶,是以脫氧核糖核酸(deoxyribonucleic acid,DNA)或RNA為模板合成RNA的酶,全酶是由核心酶及一個獨立的亞基σ因子兩部分組成。σ因子參與了轉錄起始的各個過程,包括啟動子的定位、啟動子的解鏈、起始RNA的合成、脫離啟動子等過程[1-3]。σ因子種類繁多,目前在美國國家生物技術信息中心(nationalcenterofbiotechnology information,NCBI)數據庫中,細菌σ因子基因序列已高達31 236條。σ因子按其功能,可分為σ70和σ54家族,σ70屬于細菌σ因子的一個家族,它是以大腸桿菌中70 kDa的σ因子命名,可分為四個亞族:初級σ因子、類初級σ因子、選擇性σ因子以及孢子形成相關σ,其中的初級σ亞家族中的σD(rpod)是最主要的σ因子,負責與細胞生長相關的超過1 000個基因的轉錄控,尤其是與生存相關基因的表達,是調原核生物抗脅迫的最佳對象[4-6],被廣泛用于隨機突變篩選高抗脅迫性的突變菌株,取得了較好的應用價值[7-10]。
己酸菌是一類產己酸微生物,在濃香型白酒生產過程中,生活在窖泥和糟醅中的己酸菌,代謝產生的己酸與糟醅中乙醇作用,生成了己酸乙酯,己酸乙酯是濃香型白酒主體香物質,在很大程度上決定著濃香型白酒的品質,因此,提高己酸在糟醅中的濃度是提高濃香型白酒質量的關鍵[11-12]。由于濃香型白酒發酵過程中,低酸度和高乙醇濃度等脅迫條件的限制,己酸生長和代謝受到嚴重影響,因此,如何增強己酸菌的抗脅迫能力,日益成為提高己酸菌產己酸特性的理論和技術依據。
本研究擬采用基因工程的方法,以產己酸菌的Lysini bacillusfusiformis為出發菌,克隆其轉錄調節因子rpod基因SigA,并在大腸桿菌(Escherichia coli)BL21(DE3)中誘導表達,并進行實物信息學分析,以期為構建原位超表達SigA工程菌奠定基礎。
1.1 材料與試劑
1.1.1 菌株與質粒
菌株Lysinibacillusfusiform is:本實驗室保存;pET32(+):重慶富進生物醫藥工程公司范開教授惠贈提供。
1.1.2 試劑
細菌基因組提取試劑盒、質粒小量提取試劑盒、DNA純化試劑盒:天根生化科技有限公司;2×TSINGKEMaster M ix(blue)聚合酶鏈式反應(polymerasechain reaction,PCR)擴增試劑盒、DL2000和感受態細胞BL21(DE3):北京擎科新業生物技術有限公司;限制性內切酶XbaI和Hind III:美國Fermentas公司;TAKARA DNA Ligation Kit Ver.2.1:寶生物工程(大連)有限公司;GeneRulerTMDNA Ladder M ix(100~10 000 bp):美國Thermo Fisher Scientific公司;DL15000 Plus:瑞楚生物科技有限公司;蛋白質分子質量標準:碧云天生物技術有限公司;胰蛋白胨、酵母膏(均為生化試劑):成都科龍試劑廠。
1.2 儀器與設備
BSD-YF3600全溫培養搖床:上海博迅醫療生物儀器股份有限公司;TGL-16M臺式高速冷凍離心機:金壇市良友儀器有限公司;SCIENTZ.IID超聲波細胞粉碎機:寧波新芝生物科技有限公司:759MC紫外可見分光光度計:上海箐海儀器有限公司;DYY-8C電泳儀:北京市六一儀器廠;梯度PCR儀:杭州艾普儀器設備股份有限公司。
1.3 方法
1.3.1 基因SigA表達載體的構建
(1)引物設計及合成
采用引物設計軟件,根據NCBI數據庫中L.fusiform is SigA序列,設計PCR引物:上游引物為GTACCCGGGGA TATCTCTAGAATGGCGGACAAGTCAGAACG,下游引物為GACACTATAGAATACAAGCTTTTATTCTAAGAA GTCTTT TAGACGTTTACTACG。上下游引物斜體部分分別為XbaI和HindII酶切位點,將設計引物送上海捷瑞生物技術公司合成。
(2)L.fusiform is基因組DNA的提取
取L.fusiformis甘油菌,在固體乙酸鈉培養基上劃線培養,3 d后挑單菌落入乙酸鈉液體培養基中,34℃、0.08MPa條件下靜置培養8~10 d,采用細菌基因組提取試劑盒進行L.fusiform is總基因組提取,并進行基因組濃度測定。
(3)基因SigA的PCR擴增及純化
以L.fusiform is總基因組DNA為模板,建立PCR反應體系:上、下游引物(10μmol/L)各1μL,2×TSINGKEMaster M ix 25μL,總DNA 1μL,ddH2O 22μL,總體積50μL;反應條件:95℃、3min,95℃、24 s,60℃、25 s,72℃、60 s,72℃、5m in,32個循環,PCR產物結束后,采用天根公司普通產物純化試劑盒進行PCR產物純化。
(4)基因SigA的PCR純化產物的雙酶切及與原核表達質粒pET32a(+)的連接
基因SigA的PCR純化產物和pET32a(+)按Fermentas XbaI和Hind III提供的反應體系和條件進行雙酶切,酶切產物進行1%瓊脂糖電泳,并進行酶切產物的純化;將目的基因與pET32a(+)片段按照DNA Ligation KitVer.2.1使用說明書提供的方法進行連接,并將連接產物轉染BL21(DE3),篩選陽性克隆,進行菌落PCR,挑取菌落PCR驗證正確的菌落至3m L含100μg/m L氨芐青霉素LB培養基中,37℃、200 r/min過夜培養,采用天根公司質粒小提試劑盒提取質粒,進行雙酶切驗證,將酶切驗證正確的質粒,送上海生工工程公司測序,測序結果采用Chromas2.41軟件進行分析。
1.3.2 基因SigA的誘導表達
挑pET-rpod單克隆至5m L 100μg/m L的氨芐青霉素LB培養基中,培養16 h后,按1∶20接種至5m L 100μg/m L的氨芐青霉素LB培養基,37℃、180 r/min培養2.5 h,加異丙基硫代半乳糖苷(isopropylβ-D-1-thiogalactopyranoside,IPTG)至終濃度為1mmol/L,30℃、180 r/m in繼續培養OD值至0.4~0.6,后放置于冰上過夜。
取上述培養液1m L,4℃、10000g×離心10m in,去上清,加入8mol/L尿素,煮沸6~8min至菌液澄清,冷卻至室溫,10 000 g×離心5min,取60μL上清,加10μL 5×buffer,煮沸3~5m in,冷卻至室溫,取10μL上樣,進行十二烷基硫酸鈉聚丙烯酰胺凝膠電泳(sodium dodecyl sulfate-polyacry lam ide gelelectrophoresis,SDS-PAGE)檢測。
1.3.3 基因SigA的生物信息學分析
采用NCBI的blast工具繪制L.fusiformis SigA基因系統進化樹;運用Expasy tool軟件分析L.fusiform is rpod理化性質、疏水性。
采用在線工具預測L.fusiformis rpod因子的二級結構,采用Phyre2軟件構建L.fusiformis rpod三維結構,并運用分子動力學程序中的SPC(simple pointcharge)水模型、GROMOS54A7 force field力場、在溫度為300K條件下,做步長為1ns分子動力學模擬優化,并取出最后一組坐標生成程序數據庫文件(program database file,PDB),采用Discovery studio2.5軟件對優化后的結果進行拉曼分析。
2.1 L.fusiform is SigA基因的克隆
以L.fusiformis基因組DNA為模板,擴增SigA基因。結果見圖1。

圖1 PCR擴增產物增凝膠電泳圖Fig.1 Gelelectrophoresis of PCR amp lification products
由圖1可知,經1%凝膠電泳鑒定擴增產物大小為1 140 bp左右,與理論值相符。
2.2 L.fusiformis SigA基因表達載體pET-SigA的構建
目的基因轉化后陽性克隆的菌落PCR和其質粒雙酶切結果分別見圖2和圖3。

圖2 菌落PCR凝膠電泳圖Fig.2 Gelelectrophoresis of colony PCR products
由圖2可知,泳道1菌落為pET-rpod陽性克隆。由圖3可知,酶切產物符合pET32(+)和SigA基因大小,因此,菌落PCR和雙酶切結果表明,pET-SigA表達載體初步構建成功。將菌落PCR鑒定正確的菌落搖菌后取1m L菌液送上海生工工程公司進行進一步測序鑒定。

圖3 質粒雙酶切電泳圖Fig.3 Double enzyme digestion of plasm id
2.3 基因SigA的表達
基因SigA重組表達細菌株與空載體細菌株IPTG誘導表達后,上清進行SDS-PAGE,結果見圖4。

圖4 SigA基因的表達Fig.4 Expression o f gene SigA
由圖4可知,pET-SigA重組菌株表達蛋白質分子質量大小在45 kDa左右,符合rpod大小特征,且其表達量明顯高于對照組(BL21空載體組),表明SigA基因在大腸桿菌中得到超表達。
2.4 以L.fusiform isSigA基因序列為基礎的系統進化樹分析
將rpod基因測序結果采用NCBI中blast工具獲得不同物種序列,選取其中與L.fusiformis SigA基因序列覆蓋度超過75%的序列,采取鄰位連接法(neighbor-joining)構建系統進化樹,結果見圖5。

圖5 L.fusiform is以SigA基因序列為基礎的系統進化樹Fig.5 Phylogenetic tree of L.fusiform is based on gene SigA
由圖5可知,L.fusiform is與Lysinibacillus sphaericus和Lysinibacillus varians GY32菌株具有較近的親緣關系,其相似度分別達97%和87%,三者間只有點突變,沒有插入或缺失突變。
2.5 L.fusiform is rpod的理化性質
對L.fusiformisSigA基因序列首先采用expasy translate軟件采用獲得氨基酸序列,結果見圖6,并運用expasy protparam軟件進行蛋白質理化性質分析。

圖6 L.fusiform is rpod氨基酸序列Fig.6 Am ino acid sequence of rpod in L.fusiform is
由圖6可知,L.fusiform is rpod具有375個氨基酸,分子質量為45.275 kDa;理論等電點為4.73;在波長280 nm時,其消光系數為19 940 L/(mol·cm);在大腸桿菌的體內的預測半衰期>10 h;其不穩定指數為52.65,屬于不穩定蛋白;脂肪族氨基酸指數為89.05,這是由于分子中含有較多的谷氨酸和精氨酸所致。
2.6 L.fusiform is rpod氨基酸序列相似性分析
采用NCBIblast工具,獲得L.fusiform is rpod的同源序列,將其與其他細菌σ70序列采用軟件進行UPMAG聚類分析,結果見圖7。

圖7 L.fusiform is rpod與其細菌σ70的UPMAG聚類分析Fig.7 UPMAG cluster analysis o f rpod in L.fusiform is and bacteriaσ70
由圖7可知,L.fusiform is rpod的氨基酸序列與Bacillus sp.B14905的rpod序列最相似,二者相似度達100%;與Lysinibacillus macroides、Lysinibacillus sphaericus、Lysinibacillus sp.FJAT-14222、Lysinibacillus sp.AC-3和Lysinibacillus xylanilyticus的σ70的相似性也達99%,表明Lysinibacillusfusiform is rpod氨基酸序列同源性高,也說明σ70在進化過程中比較保守。
2.7 親疏水性分析
采用軟件分析L.fusiform is rpod的親疏水性,結果見圖8。

圖8 L.fusiform is rpod的親疏水性Fig.8 Hydrophily and hydrophobicity of L.fusiform is rpod
由圖8可知,L.fusiform is rpod分子其中親水性最高的氨基酸為多肽鏈上137位的谷氨酸,其親水性分值高達-2.833;疏水性最高的是位于多肽鏈149和150位的亮氨酸和纈氨酸,其疏水性分值為1.5;該蛋白總的親水性平均系數為-0.705,預測該蛋白屬于親水性蛋白。
2.8 二級結構預測
L.fusiform is rpod的二級結構預測結果見圖9。

圖9 L.fusiform is rpod二級結構預測Fig.9 Secondary structure prediction of L.fusiform is rpod
由圖9可知,L.fusiformis rpod因子分子中α-螺旋占60.15%,loop環狀結構占37.79%,β-折疊股占僅2.06%。2.9三級結構預測
預測并優化的L.fusiform is rpod三維結構見圖10A,其拉曼圖分析結果見圖10B。
由圖10A可知,模擬的L.fusiform is rpod三級結構與模板分子pdb數據庫中的5UH8均為只有螺旋和環這2種二級結構,α-螺旋均為14個,15個loop,說明本研究預測結果與晶體結構較相符合;由圖10B可知,其拉曼圖中蛋白質分子325個氨基酸中有4個分子處于不允許構象,其允許構象達98.77%,表明本研究模擬結構合理。

圖10 L.fusiform is rpod三級結構預測、優化及評價Fig.10 Tertiary structure prediction,optim ization and evaluation o f L.fusiform is rpod
rpod是微生物啟動轉錄過程管家轉錄調節因子,調節細胞內近1 000個基因的表達,在對抗微生物環境脅迫的過程中起了關鍵的作用,因此,對該基因進行遺傳修飾并定向篩選有利突變,實現在轉錄組水平上改造微生物表型的分子育種新方法[13-14]。
本研究利用瀘州老窖180余年老窖池窖底泥分離的產己酸菌Lysinibacillusfusiformis克隆了rpod轉錄因子基因SigA,測序結果表明,基因ORF有1 128個堿基,編碼327個氨基酸,其分子質量為45.275 kDa,該蛋白在BL21細胞中成功進行了表達,表明蛋白質主要以可溶性蛋白形式存在。進一步,采用鄰位連接法建立該基因系統進化樹,表明該L.fusiformis與Lysinibacillus sphaericus和Lysinibacillus varians GY32具有較近的親緣關系;理化分析表明,該轉錄因子為親水性蛋白,其中親水性最高的氨基酸為多肽鏈上137位的谷氨酸,其親水性分值達-2.833;對該蛋白的二級結構分析表明,該蛋白主要由α-螺旋構成和loop環狀結構構成,二分別占60.15%和37.79%;拉曼圖分析結果表明,該模擬結構合理,符合立體化學規則。由于,目前對產己酸微生物主要集中于生產應用研究,對轉錄調節因子研究較少,因此本研究將為rpod轉錄因子在產己酸微生物菌種改良方面研究提供理論和應用依據。
[1]GOLDMAN SR,NAIRNU,WELLSCD,etal.The primaryσfactor in Escherichia coli can access the transcription elongation complex from solution in vivo[J].Elife,2015,4(13):2273-2280.
[2]HARDEN T T,WELLS C D,FRIEDMAN L J,et al.Bacterial RNA polymerasecan retainσ70throughouttranscription[J].NatlAcad SciUSA, 2016,113:602-607.
[3]XUE X,DAVISM C,STEEVES T,et al.Characterization of a protein-protein interaction w ithin the SigO-RsoA two-subunitσfactor:the σ70region 2.3-like segment of RsoA mediates interaction w ith SigO[J]. M icrobiology,2016,162:1857-1869.
[4]WANG E A,DEIGHAN P,GARCIA C P,etal.An am ino acid substitution in RNA polymerase that inhibits the utilization of an alternative sigma factor[J].JBacteriol, doi:10.1128/JB.00277-17.
[5]ZACHRDLAM,PADRTA P,RABATINOVáA,etal.Solution structure of domain 1.1 of theσ(A)factor from Bacillus subtilis is preformed for binding to theRNA polymerase core[J].JBiol Chem,2017, doi:10.1074/ jbc.M 117.784074.
[6]白卉,閆華,侯征,等.細菌RNA聚合酶亞單位研究進展[J].生理科學進展,2011,42(1):47-51.
[7]TAN F,WU B,DAIL,etal.Using global transcriptionmachinery engineering(gTME)to improve ethanol tolerance of Zymomonasmobilis[J]. M icrobial Cell Fact,2016,15(1):4.
[8]ZHANG F,QIAN X,SIH,etal.Significantly improved solvent tolerance of Escherichia coli,by global transcription machinery engineering[J]. M icrobial Cell Fact,2015,14(1):1-11.
[9]LIU W,JIANG R.Combinatorial and high-throughput screening approaches for strain engineering[J].Appl M icrobiol Biot,2015,99(5): 2093-2104.
[10]LANZA A M,ALPER H S.Global strain engineering bymutant transcription factors[J].M eth M ol Biol,2011,765:253.
[11]HU X L,DU H,XU Y.Identification and quantification of the caproic acid-producing bacterium Clostridium kluyveri,in the fermentation of pitmud used for Chinese strong-aroma type liquor production[J].Int J Food M icrobiol,2015,214:116-22.
[12]TAO Y,LIJ,RUIJ,etal.Prokaryotic communities in pitmud from different-aged cellars used for the production of Chinese strong-flavored liquor[J].Appl Environ M icrobiol,2014,80(7):2254-2260.
[13]高茜,朱麗英,周偉,等.RAISE技術改組轉錄因子RpoD調控大腸桿菌的低pH值耐受性[J].化學與生物工程,2016,33(3):14-18.
[14]王康,葛喜珍,田平芳.基于sigma因子全局代謝擾動提高克雷伯肺炎桿菌的3-羥基丙酸產量[J].北京化工大學學報:自然科學版,2012,39(4):72-76.
[15]喬志新,于群.全局轉錄調控及其在代謝工程中的應用[J].生物技術通訊,2009,20(5):689-691.
Cloning,expression and bioinformaticsanalysisofgene SigA in hexanoic acid-producing Lysinibacillusfusiform is
XUEZhengkai1,2,XUEYuan3,YANGGenqing4,ZHANG Suyi5,NIBin5,6
(1.SchoolofLiquor-making Engineering,Luzhou Vocationaland TechnicalCollege,Luzhou 646001,China;2.Institute ofBiomedical Engineering,Luzhou 646000,China;3.SchoolofChemicalScience and Engineering,TongjiUniversity,Shanghai200016,China; 4.Departmentof Inspection,the Third Affiliated HospitalofXingxiang MedicalUniversity,Xinxiang 453003,China; 5.Luzhou Laojiao Group Co.,Ltd.,Luzhou 646000,China;6.Luzhou Jiangtanjiao Co.,Ltd.,Luzhou 646300,China)
The full-length of gene SigA,which encodes transcription factor rpod,was cloned from hexanoic acid-producing Lysinibacillus fusiform is, meanwhile,the expression and bioinformatics analysiswere carried out.The results demonstrated that the open reading frame(ORF)of gene SigA contained 1 128 bases,encoded 327 am ino acids and itsmolecularmass was 45.275 kDa.The bioinformatics prediction results showed that L. fusiform is and Lysinibacillussphaericus had a closegenetic relationship,and the similarity was97%.The predicted protein wasa hydrophilic soluble protein,and the similarity to Bacillus sp.B14905wasup to 100%.Thesecondary structurewasmainly composed ofalphahelix and loop ring,two of whichwere60.15%and 37.79%,respectively.The predicted and optimized tertiary structure consisted of14 alpha-helix and 15 loops.
hexanoic-acid producing bacterium;Lysinibacillusfusiformis;SigA;bioinformatics
TS262.1
0254-5071(2017)08-0120-05
10.11882/j.issn.0254-5071.2017.08.026
2017-05-31
四川省科技支撐計劃項目(NO.2014FZ0018);瀘州市生物工程研究所重點項目(BME201702)
薛正楷(1968-),男,副研究員,博士,研究方向為微生物代謝工程。