張曉元,郝榮華,劉 飛,2,3*,袁丹丹,陳 勉,凌沛學,2,3
(1. 山東省藥學科學院 山東省生物藥物重點實驗室 山東省多糖類藥物工程實驗室 多糖類藥物發酵與精制國家地方聯合工程實驗室 博士后科研工作站,山東 濟南 250101;2. 山東大學 藥學院,山東 濟南 250012;3. 山東福瑞達醫藥集團有限公司,山東 濟南 250101)
海藻糖合成酶(trehalose synthase)通過分子內轉苷作用,可催化麥芽糖中兩個葡萄糖分子α,α-1,4 糖苷鍵轉變成葡萄糖α,α-1, 1 糖苷鍵,從而生成海藻糖。已報道利用生物酶法合成海藻糖存在TPS/TPP、TS、TreY/TreZ、TreP、TreT等5種途徑[1-2]。其中海藻糖合成酶途徑(TS途徑,又稱Tres途徑)僅需一種酶一步酶反應,在海藻糖的工業化生產中,相比傳統酵母細胞提取法及其他生物合成途徑具有底物廉價、工藝簡單、易于調控等顯著優點,是生物酶法工業化合成海藻糖的研究熱點[3-4]。
來源于灰色鏈霉菌Streptomyces griseus subsp.Griseus的海藻糖合成酶轉化效率高、反應速度快,葡萄糖副產物少[5]。但該酶在天然的灰色鏈霉菌中屬胞內酶,表達量極低,需濃縮上千倍才能檢測到海藻糖合成酶活性[5]。大腸桿菌(Escherichia coli)繁殖迅速、培養簡單、遺傳背景清楚、表達系統成熟,利用基因工程法構建大腸桿菌工程菌株來表達灰色鏈霉菌海藻糖合成酶,有望解決這一問題。外源蛋白在大腸桿菌中的表達差異,除受表達條件的直觀影響外,外源基因自身特性的影響也至關重要。其中密碼子的選擇是左右表達量的參數之一, 基因表達水平高低與嗜好密碼子的使用程度之間存在較強的相關性。灰色鏈霉菌密碼子偏好性與大腸桿菌存在著很大差別,本研究旨在不改變灰色鏈霉菌海藻糖合成酶氨基酸組成的前提下,將編碼灰色鏈霉菌TreS蛋白的密碼子優化為大腸桿菌的偏愛密碼子,以減少翻譯過程中產生的瓶頸效應,實現外源蛋白在大腸桿菌體內表達量的提高。
Multitron通用型振蕩培養箱(伊孚森生物技術公司);HPS-250生化培養箱(哈爾濱東聯);GelDocXR+全自動凝膠成像系統(Bio-rad);Power Pac BasicTM型蛋白電泳儀(Bio-rad);生物樣品均質器(Bertin);1200型高效液相色譜儀(Agilent)。
質粒pET-26b(+)作為表達載體,大腸桿菌E.coliBL21(DE3)作為表達宿主,均為本實驗室保藏。
LB種子培養基(g/L):蛋白胨 10,酵母粉5,氯化鈉10,pH 7.0,固體培養基含1.5 %瓊脂粉。
液體發酵培養基(g/L):蛋白胨12,酵母粉24,甘油4,KH2PO42.31,K2HPO412.54,pH 7.5。
限制性內切酶,T4 DNA連接酶等(NEB);低分子量標準蛋白(Fermentas);質粒小提試劑盒,DNA純化回收試劑盒,瓊脂糖凝膠回收試劑盒等(Tiangen);其他化學試劑均為國產分析純。
根據http://www.kazusa.or.jp/codon、CodonW 1.4.2與GenScript Rare Codon Analysis Tool對編碼灰色鏈霉菌海藻糖合成酶基因序列(Genbank:HQ915641.1)密碼子組成、GC含量組成、密碼子使用頻率等進行分析,發現灰色鏈霉菌海藻糖合成酶基因存在多處大腸桿菌稀有密碼子。利用密碼子優化軟件Jcat等進行序列優化,優化前提:不改變氨基酸序列,密碼子偏好性參考大腸桿菌K12 MG1655。
優化前、優化后海藻糖合成酶基因序列tres、tres1由濟南博尚生物科技有限公司合成,序列首尾分別設計引入NcoI、XhoI酶切位點。NcoI/XhoI雙酶切tres、tres1全基因序列與同樣處理過的pET-26b(+)質粒在T4 DNA 連接酶作用下進行連接,得重組質粒載體pET-26b(+)-tres、pET-26b(+)-tres1。構建好的重組質粒采用CaCl2法轉化大腸桿菌E. coliBL21(DE3)感受態細胞,37 ℃,LB平板培養18~24 h,直至長出轉化子。挑取單菌落接種于含50 μg/ml卡那霉素的LB液體培養基中,37 ℃,220 r/min培養過夜,提取質粒雙酶酶切及序列測定驗證讀碼框正確性。
將經電泳及測序鑒定正確的陽性轉化子,過夜培養活化后,按1 %的接種量轉接于含50 μg/ml卡那霉素的LB 液體培養基中培養,37 ℃、220 r/min振蕩培養至OD600=1.0時,加入異丙基硫代半乳糖苷(IPTG)至終濃度1 mmol/L,25 ℃、每2 h取1.5 ml培養液至18 h,所取樣品采用生物樣品均質器Precellys 24均質破碎,均質速度5500 r/min,3個循環,每個循環運行時間為15 s,循環間隔10 s。均質液12 000 r/min離心后上清即為粗酶液。
將不同時間取樣制備的粗酶液進行酶活性測定,取200 μl酶液,加入200 μl 10 %麥芽糖溶液(0.1 mol/L pH 6.5磷酸鹽緩沖液配制),24 ℃水浴反應1 h后,沸水浴10 min終止反應。酶反應產物進行高效液相色譜(HPLC)分析。HPLC條件:分離柱ZORBAX NH2,4.6 mm×250 mm,5 μm,流動相為乙腈:水=75:25,柱溫:50 ℃,流速 1.0 ml/min。海藻糖合酶酶活力1 U定義:24 ℃、pH 6.5反應條件下,以10 % 麥芽糖溶液為底物,每1 min產生1 μmoL海藻糖所需酶量。
以牛血清蛋白為標準蛋白,采用Bradford法[6]測定粗酶液的蛋白質含量。
取發酵粗酶液,加入適量5×SDS上樣緩沖液,沸水浴處理10 min,4 ℃,12 000 r/min離心5 min,取10 μl進行SDS-PAGE電泳檢測。
灰色鏈霉菌的海藻糖合成酶tres基因開放閱讀框(ORF)共計1707 bp,因灰色鏈霉菌與大腸桿菌存在物種間差異,對照圖1E. coliK-12 MG1655密碼子使用情況,縱坐標Wij代表編碼第i個氨基酸的第j個同義密碼子的“相對適應性”,即該同義密碼子的觀察值除以編碼該氨基酸的同義密碼子的最大值,其值在0~1之間,越高則表明該基因的密碼子使用偏好性越強。tres基因所用三聯密碼子存在大腸桿菌稀有密碼子或低頻使用密碼子,如CCC(14個)、CGG(12個)、GGG(8個)、GGA(2個)、AGG(1個)、CGA(1個)等(見表1),這些密碼子的存在會影響tres基因在大腸桿菌異源表達水平。經Jcat密碼子優化軟件優化得基因序列tres1,tres1與tres基因密碼子優化前后的核甘酸序列對比分析結果見圖2。由圖2可見,優化后的tres1基因序列共有268 bp堿基進行大腸桿菌適應性變化,但所編碼的氨基酸的序列無任何改變。

表1 海藻糖合成酶tres基因優化前后編碼密碼子數量統計表

圖1 E. coli K-12 MG1655密碼子使用情況

圖2 海藻糖合成酶基因tres和tres1的核苷酸序列
GC含量是鳥嘌呤和胞嘧啶所占DNA 4種堿基的比率。GC含量隨DNA來源物種不同而異。GC含量高低影響DNA的密度,GC含量高,相應DNA密度也高,加熱及加堿均不易使之變性,GC含量理想的比例范圍是30 %~70 %[7]。鏈霉菌基因組GC含量整體較高[8],經計算,來源于灰色鏈霉菌tres基因的GC含量約為65.8 %,高于大腸桿菌平均50 %左右的GC含量。序列優化后,如圖3所示:優化后的tres1基因序列平均GC含量降低至54.4 %,更接近大腸桿菌表達基因的GC百分比,有利于基因高效表達。

圖3 優化前后基因序列GC含量分布曲線圖
密碼子適應指數(codon adaption index,CAI)反映基因編碼區所有同義密碼子中某一指定密碼子的使用頻率與最優密碼子頻率相符合的程度。取值范圍在0~1之間,表達量較高的基因常具有較高的CAI值,表達量較低的基因則具有較低的CAI值。CAI已廣泛應用于基因表達水平的預測[9-11]。經優化軟件測算,基因tres1經合理優化后,密碼子適應指數CAI值由0.37提升至0.97,符合GenScript's OptimumGeneTM密碼子優化軟件所建議的高表達優化CAI 0.8~1.0取值范圍。密碼子使用頻率分布(condon frequency distribution,CFD)見圖4。由圖4可見,優化前基因序列出現使用頻率小于30 %的密碼子,存在阻礙基因高效表達的可能性,優化后基因多數密碼子的使用頻率在90 %以上,未發現有使用頻率小于50 %的密碼子,有利于基因高效表達。

圖4 密碼子優化前后密碼子使用頻率分布情況
采用CaCl2法進行了tres、tres1基因的大腸桿菌轉化,測序鑒定篩選出正確的陽性轉化子進行搖瓶誘導發酵。pET-26b(+)載體設計含有pelB信號肽,蛋白表達時可將目的基因定位于細胞周質。因此,含質粒pET-26b(+)-tres、pET-26b(+)-tres1基因工程菌株在加入IPTG誘導后每2 h所取發酵液,均質破碎,取上清做表達產物分析。SDS-PAGE分析結果見圖5。由表5可見,tres、tres1氨基酸序列編碼相同的568個氨基酸,相對分子質量(Mr)理論值約66×103。有圖5可見,含密碼子優化的tres1大腸桿菌基因工程菌株Mr66×103的條帶明顯濃于tres基因工程菌株,目的蛋白表達量高。

圖5 Tres1、Tres蛋白表達SDS-PAGE電泳圖
灰色鏈霉菌海藻糖合成酶在轉化麥芽糖生成海藻糖過程中會產生少量葡萄糖副產物,產生的海藻糖與未反應的麥芽糖分子量大小一致,HPLC不易區分。本實驗優選色譜柱 ZORBAX NH2(4.6 mm×250 mm,5 μm),流動相采用乙腈:水=75:25,柱溫 50 ℃,流速 1.0 ml/min。該條件下海藻糖與麥芽糖具備了較好的區分度,且出峰時間短(<10 min),易于海藻糖的快速檢測(見圖6)。

圖6 葡萄糖、麥芽糖、海藻糖 HPLC圖譜
含質粒pET-26b(+)-tres、pET-26b(+)-tres1基因工程菌株在同樣條件下采用IPTG誘導后2,4,6,8,10,12,14 ,16 和18 h 分別取樣進行酶活力的測定,比較結果見圖7,由圖7可見在誘導反應開始的2 h內,兩者的酶活力幾乎都不存在。2 h后海藻糖合成酶均開始表達,優化后菌株海藻糖合成酶活性在誘導4 h后呈明顯增加趨勢,12 h時即可達到未優化菌株18 h發酵水平。優化菌株18 h取樣測定酶活性為48.9 U/ml,比未優化對照菌株酶活性30.5U/ml提高了60.3 %。經蛋白含量測定,計算海藻糖合成酶蛋白比活性不存在顯著性差異,這與優化前后氨基酸序列無改變直接相關,單位時間內產酶量的增加,推測與優化后的tres1翻譯效率提高關系密切。

圖7 基因優化前后產酶酶活性曲線圖
天然蛋白質的氨基酸可由1~6個核苷酸三聯密碼子編碼,稱為同義密碼子。不同物種其基因在同義密碼子的使用上存在偏愛性。密碼子偏愛性的不匹配是外源基因在宿主系統表達不好的主要原因之一,利用生物信息學方法統計物種間不同密碼子使用頻率,把不匹配的非偏愛性密碼子加以定點突變,可改變外源基因的密碼子偏愛性使之和宿主系統更加匹配,從而得到較高產量的表達產物。
已全基因組測序的鏈霉菌編碼基因普遍具有較高GC含量[8]。本研究來源自灰色鏈霉菌的海藻糖合成酶基因GC含量就高達65.8 %,三聯密碼子第三位簡并密碼子更傾向于GC,CodonW軟件分析GC3s(密碼子第三位G或C)出現頻率0.955很好驗證這一特點。序列合理優化后,tres基因GC含量下降至54.5 %,GC3s出現頻率降低至0.592,密碼子適應指數CAI值由0.37提升至0.97,更接近于大腸桿菌基因編碼特點,基因工程菌株表達海藻糖合成酶酶活性也因此提高了60.3 %。該密碼子優化方法為不同物種來源的外源蛋白在大腸桿菌高效表達提供理論指導。然而,外源基因表達水平不僅僅與密碼子偏愛性直接相關,還取決于基因表達啟動子終止子強度、識別密碼子的tRNA豐度、序列二級結構復雜程度等。因此,開發一種基于DNA序列組成方面的多尺度、系統性、綜合性的生物信息學分析方法對實現外源基因在不同物種間高效表達至關重要。