鄭小梅,鄭平,孫際賓
面向工業生物技術的系統生物學
鄭小梅1,2,3,鄭平1,2,3,孫際賓1,2,3
1中國科學院天津工業生物技術研究所,天津 300308 2中國科學院系統微生物工程重點實驗室,天津 300308 3中國科學院大學,北京 100049
工業生物技術是以微生物細胞工廠利用可再生的生物原料來生產能源、材料與化學品等的生物技術,在解決資源、能源與環境等問題方面起著越來越重要的作用。系統生物學是全面解析微生物細胞工廠及其發酵過程從“黑箱”到“白箱”的重要研究方法。系統生物學借助基因組、轉錄組、蛋白質組、代謝組以及代謝流組等多組學數據,可解析微生物細胞工廠在RNA、蛋白與代謝物等不同水平上的變化規律與調控機制。目前,系統生物學在微生物細胞工廠的設計創建與發酵工藝優化中起著越來越重要的指導作用,許多成功應用實例不斷涌現,推動著工業生物技術的快速發展。文中重點綜述基因組、轉錄組、蛋白質組、代謝組與代謝流組以及基因組規模的網絡模型等各組學技術的最新發展及其在工業生物技術尤其是菌株改造與發酵優化中的應用,并就工業生物技術中系統生物學的未來發展方向進行展望。
工業生物技術,系統生物學,多組學,菌株設計,發酵優化
工業生物技術以微生物細胞工廠利用可再生的生物原料來生產能源、材料與化學品等,是繼醫藥生物技術、農業生物技術之后全球生物技術的第3次浪潮,在解決資源、能源與環境問題上起著越來越重要的作用,在建設綠色、低碳與可持續的產業經濟體系上具有重大戰略意義[1]。工業生物技術的兩大核心問題即微生物細胞工廠(即工業菌種) 的設計構建與生物發酵過程的優化放大。對微生物細胞工廠及其發酵過程的認識與理解是解決這兩大問題的關鍵,而系統生物學是解析工業菌種及發酵過程從“黑箱”到“白箱”的重要研究方法,是推動工業生物技術發展的重要驅動力。
系統生物學通過基因組、轉錄組、蛋白質組、代謝組以及代謝流組等組學分析技術,系統解析細胞在RNA、蛋白與代謝物等不同水平上的變化規律與調控機制,進而通過數據驅動的方法與數學模型化來模擬和認識工業細胞工廠的生命過程[2]。近年來,DNA測序與質譜等組學技術的發展將對生物細胞與生命過程的認識推入了系統化與數據化的時代。系統生物學在解決工業生物技術核心問題中起到越來越重要的指導作用,許多成功的應用實例不斷在工業菌種的設計改造和發酵過程的優化放大中涌現,具體包括細胞工廠底盤細胞的選擇與設計、新代謝途徑的設計與構建、基因組規模的改造靶點鑒定、代謝途徑優化、耐受性的提升、碳源利用的優化以及工業發酵工藝優化與放大等方面。本文首先簡述基因組、轉錄組、蛋白質組、代謝組與代謝流組等組學技術及相關數據庫的最新研究,然后系統綜述各組學技術或跨多組學的(Trans- omics) 整合策略在工業生物技術中的應用,最后就工業生物技術中系統生物學的未來發展方向進行展望。
近年來,隨著不同物種在不同條件下的多組學海量數據的井噴式涌現,各組學數據庫與多組學分析技術成為揭示生命過程分子機制的重要工具(表1)。本節中將簡述基因組、轉錄組、蛋白質組、代謝組與代謝流組等相關技術及數據庫的發展。
基因組(Genome) 是生物體的全部遺傳信息的總和,是研究認識生命過程的基礎。基因組測序技術,尤其是第二代與第三代測序技術的快速發展,大大降低了基因組的測序成本,推動了基因組學的發展。以Illumina公司的Hiseq為代表的第二代測序技術[3]具有高通量、高精確度與高覆蓋度等優勢,但其測序讀長較短。而第三代單分子測序技術[4]則具有10–20 kb的測序讀長甚至可以跨越絕大多數的重復序列區域,但其精確度相對較低。第二代測序和第三代測序可互相取長補短,采用兩個測序技術可得到更加完整和高質量的基因組數據。
基因組組裝與注釋是挖掘認識基因組信息的重要手段。基因組的注釋關鍵包括基因組結構注釋與功能注釋。基因組結構注釋預測定位各基因的物理圖譜,獲得基因起始密碼子、內含子和外顯子、基因的終止密碼子等結構信息,可采用基于機器學習的從頭預測或基于同源序列的比對預測。基因功能注釋則多采用基于數據庫中的已知序列進行同源比對的方式。常用的基因組數據庫有GenBank[5]、Genome[5]與GOLD[6]等綜合數據庫以及物種特異性數據庫如包含大腸桿菌和谷氨酸棒桿菌等細菌基因組的數據庫Microbesonline[7]、釀酒酵母基因組數據庫SGD[8]、真菌基因組數據庫FungiDB[9]等(表1)。除基因組的從頭預測注釋外,比較基因組可通過對比具有不同表型的菌株的基因組,獲得與特定表型相關的單核苷酸多態性(Single nucleotide polymorphisms,SNPs)、基因的插入與缺失等。
轉錄組(Transcriptome) 指在特定環境條件下表達的所有RNA。轉錄組學通過對不同條件下特定細胞內的所有RNA的定量檢測,來分析各基因的表達水平[10]。轉錄組定量檢測技術主要包括基因表達芯片技術與基于第二代測序的RNA測序技術(RNA-seq) 等。基因芯片在RNA的數量、物種靈活性、定量與序列分析等方面具有一定的局限,而RNA-seq技術由于具有高準確度、高分辨率、高靈敏度等優勢,由于測序成本不斷降低而被廣泛應用。
比較轉錄組學通過對不同條件下基因表達水平的比對分析,來研究不同條件下的響應變化與不同菌株之間的差異。時間序列轉錄組數據可以動態地再現細胞內基因的表達變化,變化趨勢一致的基因可能會有比較一致的功能。時間序列的轉錄組數據可展示不同生命過程中基因的動態變化,這些變化信息蘊含著豐富的調控關系,有助于我們更加深刻地認識微生物內部基因的動態關系,理解代謝過程。轉錄組數據庫收集了不同物種不同條件下的轉錄組數據,如GEO[11]、ArrayExpress[12]與M3D[13]等為轉錄組的整合分析提供了寶貴的數據資源(表1)。

表1 各組學數據庫
蛋白質組(Proteome) 指在特定環境條件下表達的所有蛋白質。蛋白質組學對不同環境條件下表達的所有蛋白質進行定性和定量分析,系統研究蛋白質的加工、修飾以及蛋白質間的相互作用。隨著蛋白質組的發展,有許多不同方法用于蛋白質組的研究,如蛋白芯片、二維聚丙烯酰胺凝膠電泳-質譜(Two-dimensional polyacrylamide gel electrophoresis/Mass spectrometry,2D-PAGE/MS)與液質聯用 (Liquid chromatography-tandem mass spectrometry,LC-MS/MS)等。近年來,質譜相關技術的迅速發展,大大促進了蛋白質的鑒定與定量分析。一系列定量蛋白質組技術發展起來,如細胞培養氨基酸穩定同位素標記(Stable isotope labeling with amino acids in cell culture,SILAC)[14]、同位素親和標簽(Isotope coded affinity tag,ICAT)[15]與同位素標記相對和絕對定量標記(Isobaric tags for relative and absolute quantitation,iTRAQ)[16]等,為全面、系統地定性和定量分析復雜細胞蛋白質組提供了有效的技術手段。
目前,常用蛋白質組數據庫主要包括基于質譜的蛋白質組數據庫如PRIDE[17]、GPM[18]與PeptideAtlas[19]等,綜合蛋白質組數據庫Uniprot[20]與特定蛋白質組數據如線粒體蛋白質組MitoMiner[21]與膜蛋白質組Plasma Proteome Database等[22](表1)。這些數據庫資源也為蛋白質組的鑒定與定量分析提供了有力的支持。
與轉錄組與蛋白質組相似,代謝組也是在特定生理條件下細胞所有代謝物的集合,尤其是相對分子質量為1 000 Da以下的小分子代謝物。代謝組學主要系統研究代謝物的變化,揭示生命過程中細胞代謝調控變化。由于基因突變或環境擾動可能不會引起轉錄和翻譯的變化,但會導致酶活性和代謝物濃度的變化。因此,與轉錄組和蛋白質組相比,代謝組更能反映出細胞代謝的動態變化[23]。質譜相關技術如液質聯用、氣質聯用(Gas chromatography-Mass spectrometry,GC-MS/MS)與毛細管電泳質譜(Capillary electrophoresis-Mass spectrometry,CE-MS/MS) 以及核磁共振技術(Nuclear magnetic resonance spectroscopy,NMR)的發展,大大推動了代謝組研究。
可靠的胞內代謝物組數據是認識細胞真實代謝狀態的直接證據,對于提高菌株代謝改造和工業發酵過程優化具有重要意義。但與RNA與蛋白質相比,許多代謝組的半衰期非常短,代謝組樣品制備會直接影響代謝組數據質量。由于不同微生物在代謝物譜上差異,針對不同微生物需要進行代謝組樣品制備的優化,尤其是針對復雜的胞內代謝組[24-28]。代謝組的樣品制備需對細胞淬滅與代謝物提取等步驟進行優化。常用細胞淬滅方法有冷甲醇淬滅、冷乙醇淬滅與液氮速凍等,如冷甲醇或冷乙醇等對細胞造成損傷時,可考慮采用快速取樣與液氮速凍相結合的方法。代謝物提取有熱乙醇、熱水、冷氯仿-甲醇、冷甲醇、冷乙腈等,由于不同提取劑的提取效率不同,為獲得完整的胞內代謝物信息,也往往需要測試不同代謝物提取方法。
代謝組數據分析往往包括峰識別與匹配、歸一化處理、小分子代謝物的鑒定與定量分析等。液相質譜數據庫Metlin[29]和MassBank、氣相質譜數據庫Golm Metabolome Database[30]以及綜合質譜數據庫MetaboLights[31]和HMDB[32]等可用于小分子代謝物的鑒定(表1)。目前,代謝組分析的挑戰主要在于不同微生物的樣品方法優化、非靶向代謝組中的結構鑒定、復雜未知代謝物的結構鑒定以及不同代謝物的絕對定量等[33]。
與代謝組相比,代謝流組更側重胞內代謝流量的分析。目前,多采用13C-標記物來分析不同特定條件下細胞內的碳流分布,通常包括13C-標記物存在下的菌株培養、胞內代謝物的同位素分布檢測、13C-標記輔助下的代謝途徑與代謝流分析等步驟[34]。代謝流分析(13C-Metabolic flux analysis,MFA) 往往需要同位素數據處理與相應分析軟件,如OpenFLUX2[35]、13CFLUX2[36]與INCA[37]等。目前,代謝流分析數據庫CeCaFDB收集了100多個基于13C-標記的代謝流數據[38](表1)。在代謝流分析相關研究方面也已有許多比較優秀的綜述,如2009年花強與楊琛[39]系統綜述了代謝流比率分析的研究方法及其在代謝改造中的應用。再如Guo等[34]對13C-MFA相關分析方法及其在不同工業菌株的應用進行了詳細的綜述。
各組學數據的不斷豐富為從系統的角度全面解析生命過程奠定了基礎。但如何解析海量多組學數據仍然是系統生物學面臨的挑戰。全基因組規模的生物網絡是解決這一問題的有效策略。目前,多個重要微生物不同層次的生物網絡已經建立,尤其是基因組規模的代謝網絡模型、轉錄調控網絡模型與蛋白互作網絡等。
目前,許多重要工業微生物,如大腸桿菌[40]、釀酒酵母[41-43]與黑曲霉[44-45]的基因組規模的代謝網絡模型已建立。在代謝網絡模型的構建中,首先可根據代謝途徑相關的數據庫如KEGG[46]、WikiPathways[47]、MetaCYC[48]、BioCYC[49]、LIGAND[50]與BRENDA[51]等對基因組進行解析,獲得“基因-酶-通路-反應”的關系,進而搭建代謝網絡框架(表1)。然后,利用代謝流平衡分析(Flux balance analysis,FBA) 方法[52],結合自動化和人工校正,獲得計量學的代謝網絡模型。后續,可通過整合如時間序列的多組學數據,進一步建立基于動力學的代謝網絡模型[53]。基因組規模的代謝網絡動力學模型,可以微分方程等數學方程刻畫細胞過程,對細胞遺傳因素與環境因素的預測更加可靠,將會成為未來的重要發展趨勢。
轉錄調控網絡模型是全局研究基因表達與調控的有效方法。利用時間序列的轉錄組數據或針對不同條件下的轉錄組數據進行基因共表達模式的整合分析,是構建轉錄調控網絡模型常用策略。比如,Schape等[54]通過對155組不同條件下的黑曲霉轉錄組數據基于斯皮爾曼相關性分析,構建了基因組規模的基因共表達網絡以及9 500個基因的共表達子網絡,為基因組規模的基因功能研究提供有力的數據支撐。
目前大部分工業微生物還沒有可靠的蛋白質相互作用網絡。Kludas等[55]利用機器學習的算法,以從GOLD數據庫中提取的釀酒酵母蛋白互作網絡為訓練集,對里氏木霉的蛋白-蛋白互作關系進行了預測分析,獲得了里氏木霉的蛋白互作網絡,其陽性率可達75%[55]。利用機器學習的模擬有希望成為根據已知網絡模型獲得未知網絡模型的重要方法。
近年來,基于各組學的系統生物技術的快速發展,為我們認識改造微生物成為細胞工廠提供了強有力的指導。全基因組測序與細胞轉錄、翻譯與代謝等各個層次的定量分析是破解其遺傳密碼、進行基因組育種、基因信息挖掘與基因組規模建模的基礎。基于多組學的系統分析,使我們可以從全局上理解細胞的代謝與調控機制,成為系統代謝工程的學習-設計-創建-測試(Learn-Design-Build-Test,LDBT) 研究策略中的重要環節(圖1)。
各組學數據是認識細胞代謝與生命過程的重要研究策略,但值得注意的是組學研究應是問題驅動的。在研究伊始,就需要提出明確的研究目標與擬解決的問題,然后根據相應問題來選擇相應的研究方法。比如,轉錄組與蛋白質組都是分析胞內基因表達水平的有效策略,但細分來看,轉錄組的通量更高、成本相對更低,是分析基因轉錄水平差異的首選。但轉錄組無法預測可能在翻譯或翻譯后修飾上存在限制的相關基因,針對這一問題,蛋白質組尤其是修飾蛋白質組有成為更為有效的方法。同時,由于蛋白質組還與蛋白的穩定性相關,因此不同基因的轉錄組與蛋白質組可能并不是一一對應的。但也可利用兩者之間的差異,通過轉錄組與蛋白質組的整合,可獲得在翻譯或翻譯后修飾等方面的蛋白信息。
基于質譜的蛋白質組與代謝組分析,往往涉及非靶向與靶向的問題。非靶向分析更傾向于利用如主成分分析(Principal component analysis,PCA) 等發現新的靶點,從檢測與分析上,就需要求全以獲得更為完整的胞內蛋白或代謝物信息。靶向分析則更多地用于已知途徑中不同蛋白或代謝物的分析。

圖1 系統生物學驅動的合成生物學細胞工廠創建優化策略[101]
由于細胞是一個復雜的整體,跨多組學數據的整合分析是全面解析細胞不同層面分子機制的重要研究方法。比如,Zhu等[56]利用基因組、比較轉錄組與比較蛋白質組等多組學分析,揭示氮源缺乏是導致產油真菌圓紅冬孢酵母油脂積累的重要原因,為系統闡釋該菌株的全局調控奠定了基礎,也為該菌株的理性改造提供新的靶點。
工業生物技術可利用微生物細胞工廠以可再生的生物原料來生產目標能源、材料與化學品,是石油化學品工業生產的高效替代途徑。理論上,微生物細胞工廠具有生產任一代謝網絡中的代謝中間物的潛力,但目前絕大部分的天然微生物的生產能力是非常有限的。因此,基于系統生物學的認識與設計,利用合成生物學的手段來最終實現微生物細胞工廠的構建與優化,不斷提升產量、轉化率與生產強度這三大發酵指標,是目前工業生物技術的重要研究策略[58-60]。系統生物學在微生物細胞工廠的設計改造以及工業發酵優化中具有重要的指導作用,許多成功的應用實例不斷涌現。本節將根據具體實例分析系統生物學在工業生物技術中的應用。
2.1.1 細胞工廠底盤細胞的選擇與設計
重要模式微生物如大腸桿菌與酵母等由于清晰的遺傳背景與高效的遺傳操作,目前被開發拓展為可用于許多不同產品生產的工業底盤細胞[60]。一些傳統工業發酵菌株,如高產氨基酸的谷氨酸棒桿菌、高產有機酸的黑曲霉、高產丁醇的梭菌sp、高產脂類物質的解脂酵母以及高產多酮類化合物的放線菌等,由于具有強工業魯棒性、高生產強度與低發酵成本等優勢,也成為非常理想的細胞工廠底盤[2,61]。另外,一些具有獨特生化特性的微生物,如藍藻、微藻和甲烷菌等一碳底物利用菌株[62],如嗜熱毀絲霉與嗜熱側孢霉等嗜熱菌[63],也是底盤細胞的候選菌株。
在底盤細胞的設計中,通過重塑中心代謝途徑來提高某一關鍵中間代謝物的合成流量,然后以這一中間代謝物為基礎前體物質,用于后續一系列代謝物的生產。如Jouhten等[64]利用FBA、MiMBl與代謝通量變化分析 (Flux variability analysis,FVA) 3種代謝流分析算法,重新設計了釀酒酵母的中心代謝流分布,構建了乙酰CoA的底盤細胞。而乙酰CoA作為參與34個代謝反應的重要中間代謝物,可用于一系列工業價值產品的生產,如可用于生物柴油與生物醫藥的脂類物質、可用于抗生素與抗癌藥物合成的多酮類化合物以及可用于化妝品與食品添加劑的異戊二烯類物質等[64-65](表2)。
2.1.2 新代謝途徑的設計與構建
由于涉及關鍵酶的篩選與選擇,目標特定化學品的代謝途徑設計是一個較為復雜的問題。傳統途徑設計多基于文獻分析或基于KEGG、MetaCyc與BRENDA等代謝途徑數據庫的已知代謝途徑分析,設計難度大,設計能力有限。目前,基于有機化學和生物化學的原理,通過計算機輔助設計,以基因組技術挖掘催化特定反應的酶的編碼基因,實現快速非自然途徑的創建[33]。結合高效的DNA組裝技術與基因組編輯技術,可在底盤細胞異源構建涉及多步反應的復雜化合物的合成,如天然代謝產物與微生物的異源合成。
Galanie等[66]借助基因組新酶挖掘,設計了阿片藥物(Opioid) 的完整合成途徑,通過在釀酒酵母底盤細胞中,整合來源于植物、動物、酵母與細菌的21個二甲基嗎啡(Thebaine) 合成相關與 23個氫可酮(Hydrocodone) 合成相關的關鍵酶,成功獲得阿片藥物細胞工廠,實現二甲基嗎啡與氫可酮的異源合成。Liu等[67]通過對燈盞花基因組的系統挖掘,成功篩選鑒定到燈盞花素合成途徑中的P450酶EbF6H和糖基轉移酶EbF7GAT這兩個關鍵酶,通過在釀酒酵母底盤細胞中異源構建燈盞花素合成途徑,成功獲得燈盞花素合成的細胞工廠,燈盞花素含量達到百毫克級。該研究對將傳統農業種植生產方式轉變為規模化工業發酵生產路線,具有非常好的借鑒意義。
另外,Fang等[68]通過系統解析維生素B12好氧合成途徑中鈷螯合與腺苷鈷啉醇酰胺磷酸的合成機理,將來源于5種不同細菌中的28個基因在大腸桿菌底盤細胞中成功組裝與基因表達調控,成功在大腸桿菌中實現了維生素B12的從頭合成,轉化率達307 mg/g DCW,發酵周期大大縮短,僅為目前工業水平的1/10,為復雜化學品的從頭合成與傳統發酵菌株升級換代提供了很好的示范。

表2 系統生物學在工業生物技術中的應用實例
2.1.3 基因組規模的改造靶點鑒定
代謝途徑中限速節點的發現是細胞工廠的設計優化的關鍵。傳統代謝工程中,往往基于先驗知識的試錯或大規模的文庫篩選來發現代謝瓶頸。但這種策略在菌株改造靶點的發現也往往會進入一個瓶頸。基于各組學及其整合分析則成為從全基因組規模上發現代謝瓶頸的有效策略。
比較組學是發現代謝瓶頸的有效策略。殷嫻等[69]利用比較基因組與比較轉錄組分析了檸檬酸高產黑曲霉菌株與低產的退化菌株之間的差異,發現檸檬酸轉運蛋白的候選基因可能是檸檬酸高產的重要因素。Steiger等[70]通過基因組挖掘的方式也發現了相同的檸檬酸轉運蛋白編碼基因,利用Tet-on誘導表達系統來過表達該轉運蛋白后,可使檸檬酸的產量較出發菌株提高了5倍。Redding-Johanson等[71]利用選擇反應監測-質譜(Selected-reaction monitoring-Mass spectrometry,SRM-MS) 對倍半萜烯(Amorpha-4,11-diene) 的大腸桿菌工程菌株進行定量蛋白質組分析,發現來源于釀酒酵母的甲羥戊酸激酶(Mevalonate kinase,MK) 與磷酸甲羥戊酸激酶(Phospho- mevalonate kinase,PMK) 可能是倍半萜烯代謝途徑中的限速節點。通過對MK與PMK的密碼子優化與強啟動子替換,倍半萜烯的產量提高3倍,達到500 mg/L以上。
另外,PCA分析也是發現代謝節點的有效方法。Alonso-Gutierrez等[72]對27個具有不同檸檬烯產量的大腸桿菌中的9個甲羥戊酸合成關鍵酶的靶向定量蛋白質組數據進行PCA分析,鑒定出高產菌株中的表達強化的關鍵酶,進一步強化關鍵酶的表達后,檸檬烯的產量提高40%。
多組學整合分析可用于發現翻譯后修飾等調控所導致的代謝瓶頸。多酚銀松素具有抗細菌與抗真菌的活性,丙二酰CoA是其重要的前體,需要外源添加淺藍菌素(Cerulenin) 來獲得,但其高水平反而抑制生產。為解析其抑制機制,Xu 等[73]進行蛋白質組與代謝組分析,發現胞內高水平的丙二酰CoA與胞內蛋白的丙二酰化相關聯。進一步分析發現4-香豆酸CoA連接酶(4-coumarate- CoA ligase,4CL) 與芪合成酶(Stilbene synthase,STS) 丙二酰化后活性喪失,這可能是淺藍菌素抑制銀松素合成的關鍵。將STS的丙二酰化位點Lys113與Lys161突變為精氨酸,避免其丙二酰化后,突變菌株可耐受更高水平的丙二酰CoA,銀松素的產量提高了2.2倍。由此可見,在菌株設計改造中,如翻譯后修飾等不同調控水平上的限制因素分析是非常重要的。
2.1.4 代謝途徑優化
除在限速代謝節點的預測外,各組學及基因組規模的代謝網絡模型等在整體代謝途徑的優化上也發揮著越來越大的作用,許多成功的例子不斷被報道。
Meng等[74]通過轉錄組與代謝流模型的整合分析,來預測在6-脫氧赤酮酸內酯B (6- deoxyerythronolide B,6dEB) 合成中不同代謝模塊的作用。研究通過弱化磷酸戊糖途徑與核甘酸代謝中的所有25個基因,顯著提高6dEB的生產,與出發菌株相比產量提高了3倍,達到210 mg/L。值得注意的是,不同組學分析的預測結果可能會存在差異,比如在比較轉錄組中發現上調的基因,在代謝流模型可能預測為下調。這提示我們轉錄組數據反映的是胞內基因的表達水平,會影響胞內代謝狀態,但并不能直接代表代謝水平。
代謝組分析可能更有助于設計優化胞內的代謝流分布。Ohtake等[75]利用野生大腸桿菌菌株與敲除菌株的比較代謝組分析,發現當敲除途徑后會引起CoA代謝失衡,而引起其他副產物丙酮酸與丁酸甲酯的生成,進一步分析發現由乙醇脫氫酶AdhE2所催化的丁酰CoA到正丁醛的合成流量降低可能是限速步驟。通過乙醇脫氫酶AdhE2表達的精細調控,提高胞內CoA水平后,顯著降低副產物的生成,最終實現大腸桿菌中的正丁醇產量提升22%,達到18.3 g/L。
13C-同位素標記的代謝流分析可利用質譜與核磁檢測計算各胞內代謝物的13C-同位素分布情況,進而定量計算胞內各酶催化下的代謝通量,被認為是最能反映胞內真實代謝狀態的組學分析工具,也不斷應用于許多不同的工業生產菌株的認識與改造中。如Lu等[76]利用同位素標記的代謝組與13C代謝流分析相結合,比較分析了黑曲霉糖化酶高產菌株DS03043和野生型CBS 513.88的代謝差異。研究發現在高產菌株中,ATP/AMP的比率更高,高濃度ATP抑制了葡萄糖-6-磷酸異構酶的活性,使碳流更多地流向氧化磷酸化途徑,導致TCA循環的碳流減少,從而降低了如檸檬酸與草酸等副產物的積累。再如Lange等[77]利用基于GC-MS的13C-代謝流分析了產琥珀酸巴斯夫菌胞內從蔗糖到琥珀酸的代謝通量。通過對460種代謝物的同位素分布檢測,準確定量了完整的中心代謝通量,發現一個新的果糖激酶RbsK參與到蔗糖的分解產物果糖的磷酸化活化。通過對PTS葡萄糖轉運系統中FruA的弱化與果糖激酶RbsK的強化,可有效降低PTS系統造成的碳流損失,從而大大提高了琥珀酸的轉化率,轉化率達到2.5 mol/mol,接近3 mol/mol的理論轉化率。另外,Yang等[78]發現甲基磷酸赤蘚糖醇途徑(Methylerythritol phosphate pathway,MEP) 與甲羥戊酸途徑(Mevalonate pathway,MVA) 兩個途徑的同時過表達,相對單獨過表達時,可分別使大腸桿菌的異戊二烯產率提高了 20倍和3倍。進一步利用13C-代謝流分析,發現兩途徑協同過表達時,可使MEP途徑與MVA途徑的流量分別增強4.8倍和1.5倍,表明還原力的平衡與ATP供給在兩途徑協同平衡中起重要作用。兩途徑的協同作用可使大腸桿菌的異戊二烯的產量達到24 g/L,葡萄糖轉化率達到0.267 g/g。
另一個利用代謝流分析的成功例子是谷氨酸棒桿菌以甘露醇為原料生產賴氨酸[79]。甘露醇是新一代非糧原料海草中的主要成分。研究發現,當以甘露醇為原料時,碳流多流向糖酵解途徑,磷酸戊糖途徑代謝流量較低,使NADPH的供給嚴重不足。研究首次通過在胞內引入異源的果糖激酶來重新分配碳流,從而增加磷酸戊糖途徑的代謝流量,但發現提升效果較低。為另尋他路,通過表達參與糖酵解途徑中的NADP-依賴的甘油醛脫氫酶來提高NADPH還原力的供給,成功解決了還原力供給不足的問題。
2.1.5 細胞工廠耐受性的提升
細胞工廠對發酵終產物或毒性中間代謝物的耐受性是制約工業發酵性能提升的重要因素。如果壓力響應機制或毒性機制是清晰的,則可通過相應的策略來緩解壓力對細胞的脅迫,提升菌株的耐受性[80]。比如,芳香族或烷烴等疏水化合物可直接插入至細胞膜中,進而影響細胞膜的完整性與流動性引起細胞損傷。針對這一問題可利用細胞膜組分修飾來緩解,如過表達細胞膜脂類順反異構酶與去飽和酶等,增加細胞膜中環丙基脂肪酸或改變脂肪酸鏈長度等。有的壓力脅迫會激活胞內的未折疊蛋白應激反應(Unfolded protein response,UPR) 而導致胞內蛋白質的錯誤折疊,因此過表達分子伴侶也是較為常用的方式。比如在大腸桿菌或丙酮丁醇梭菌中過表達分子伴侶GroESL可顯著提高正丁醇等的耐受性[81-82]。再如,Zhu等[83]發現如5-氨基乙酰丙酸(5-aminolevulinic acid,5-ALA) 等氨基酮類物質的積累也會產生活性氧等而損失細胞,過表達過氧化氫酶KatG/KatE或超氧化物歧化酶SodA/SodB/SodC等可有效緩解氧化應激,提高菌株的耐受性并增強5-ALA的產量。一些毒性化合物的外排蛋白如RND外排泵或壓力調控轉錄因子MetR與SoxS的改造也有助于提高菌株的耐受性。
當耐受性機制尚不清楚時,則可采用定向適應性進化的策略,利用連續傳代富集獲得耐受性顯著提高的菌株。然后,利用比較組學的手段來發現引起耐受性提高的分子機制,再通過對底盤菌株的理性設計改造,獲得耐受性不斷提高的菌株[60]。比如異丙醇對細胞有一定的毒性,會抑制細胞生長并降低產量。Horinouchi等[84]通過在異丙醇壓力條件對大腸桿菌進行適應性進化,獲得了耐受性提升的菌株。借助比較基因組,鑒定出、、、與基因上的突變可有助于耐受性的提高,進一步利用比較轉錄組分析,發現氨基酸合成代謝、鐵離子穩態維持以及能量代謝等與耐受性有關。Wang等[85]利用基因組復制元件DnaQ突變體輔助的連續進化技術(Genome replication engineering assisted continuous evolution,GREACE) 將大腸桿菌在賴氨酸終點發酵液中了進行了定向進化,獲得了賴氨酸產量顯著提升的菌株RS3,其賴氨酸產量可達到155 g/L,比出發菌株MU-1提升14.8%。進一步通過比較基因組與比較代謝組的分析,發現菌株RS3中SpeB、AtpB與SecY等基因的點突變,可能有助于提高細胞完整性與增強賴氨酸合成的碳流。
靶標產品的積累會對細胞產生一定的壓力,從而限制菌株發酵性能的不斷提升。如谷氨酸棒桿菌發酵生產琥珀酸時,琥珀酸的不斷積累會反饋抑制葡萄糖的吸收、細胞適應性以及琥珀酸生產。Chung等[86]利用基于DNA芯片的轉錄組分析發現隨著琥珀酸的積累,轉運途徑與轉錄調控的基因表達發生顯著變化。通過過表達一些轉錄下調的基因時可提高葡萄糖利用速率,但過表達中心代謝的關鍵酶對生產并無促進。然而,過表達轉錄因子NCgl0275可提高細胞適應性,并使琥珀酸生產大幅提高38%,產量達152 g/L。另外,蛋白質組與代謝組的整合也用于通過分析大腸桿菌的靜止細胞(Q-cell,quiescent cell),來揭示Q-cell獨特的代謝調控與耐受性[87]。Q-cell由質子載體吲哚誘導而生,可使細胞不再生長,但維持較高的代謝活性。通過比對細胞正常生長下與處于Q-cell的蛋白質組,發現加入吲哚后,壓力響應蛋白的蛋白水平顯著提高。這些壓力蛋白將維持Q-cell耐受胞內的代謝失衡。利用這種代謝失衡引起的乙酰CoA與磷酸烯醇式丙酮酸的積累,可驅動羥基丙酸(3-hydroxypropionate,3HP) 的合成,使3HP的產量提高2倍,達到39 g/L。
2.1.6 細胞工廠碳源利用的優化
目前,葡萄糖與蔗糖等是工業發酵中的主要碳源。但隨著糧食危機的風險,許多替代性的非糧碳源如秸稈纖維素以及甲醇與甲酸等一碳化學品的利用也成為研究熱點。與菌株耐受性提升的策略相似,替代性碳源利用菌株也可通過適應性進化的方式來獲得,然后再借助多組學技術來分析在碳源利用中的關鍵酶。比如Tuyishime等[88]利用適應性進化成功獲得甲醇利用率顯著提升的菌株,進一步利用比較基因組的方法發現胞內NAD+/NADH、甲醇的吸收與耐受等是影響甲醇利用的關鍵因素。在碳源利用中,底物的轉運是重要的影響因素。Bracher等[89]采用比較轉錄組分析了產黃青霉在葡萄糖、阿拉伯糖與乙醇3種不同碳源條件下的基因表達差異,預測出5個潛在的阿拉伯糖轉運蛋白,通過驗證發現,PcAraT可回補酵母中GAL2的缺失,并可進一步提高阿拉伯糖的吸收與利用。由于該轉運蛋白的高親和力與專一性、在復雜碳源中仍保持較高的活性等特點,有望在生物煉制中具有較好的應用。
代謝組分析也在碳源利用的優化中發揮重要作用。Kawaguchi等[90]利用胞內代謝組分析了谷氨酸棒桿菌對葡萄糖與阿拉伯糖的代謝利用。與許多微生物一樣,谷氨酸棒桿菌也存在葡萄糖抑制效應,會優先利用葡萄糖,而抑制阿拉伯糖的利用。代謝組分析發現磷酸烯醇式丙酮酸與丙酮酸的開關是優化阿拉伯糖利用的關鍵。過表達丙酮酸激酶后,谷氨酸棒桿菌可同時利用葡萄糖與阿拉伯糖,尤其是當敲除阿拉伯糖抑制轉錄因子AraR時,可提高阿拉伯糖的利用。這一研究使谷氨酸棒桿菌可以在PTS系統存在下同時利用已糖與戊糖。
2.2.1 工業發酵工藝優化
多組學及基因組規模的代謝網絡模型除在菌株的設計改造中發揮著越來越重要的作用外,在工業發酵優化中也逐漸得到應用。
發酵條件與工藝如溫度、pH、溶氧與底物補料等都是目標產品發酵性能的重要影響因素,針對特定的工業菌株,往往需要優化其發酵工藝以達到最優的發酵性能。由于發酵過程的復雜性,許多統計方法與數學模型不斷用于發酵優化。Jones等[91]利用數據驅動的高斯模型(Empirically-derived scaled-Gaussian model) 對大腸桿菌共培養下的黃酮發酵過程進行模擬與優化。首先利用最小二乘回歸(Least squares regression) 對21個參數進行擬合,然后利用該模型優化如菌株間的適配度、碳源濃度、溫度、誘導時間以及接種比例等發酵參數,以獲得最優的黃酮類物質黃烷(Flavan-3-ols) 的發酵條件。利用該模型優化的條件,可使黃烷的產量提高65%,達到40.7 mg/L,是單菌發酵的970倍。另外,神經元網絡模型(Artificial neural network models,ANN) 也是發酵過程動態仿真與優化的重要方法。Pappu等[92]利用ANN模型以339個實驗數據為訓練集,來系統評估了發酵pH、溫度與溶氧等條件對卡森德巴利酵母木糖醇生產的影響。
代謝流分析可反映胞內真實代謝狀態,除在代謝改造中,在發酵工藝優化中也被不斷應用。Schwechheimer等[93]利用GC/MS、LC/MS與1D-/2D-NMR等多種質譜與核磁的方法系統檢測了棉阿舒囊霉在生長與維生素B2等核黃素生產等不同階段的胞內代謝物的13C分布,細致刻畫了核黃素代謝流分析。研究發現,甲酸的跨膜流量變化可能是核黃素合成初期的代謝瓶頸。通過分段補加少量甲酸與絲氨酸的補料方式則可解決一碳原料瞬時供給不足的問題,最終通過增加胞內甘氨酸、絲氨酸與甲酸可使核黃素的產量提高45%。
2.2.2 工業發酵工藝放大
在工業發酵過程,發酵過程的逐級放大也是非常重要的環節。如何有效從實驗室規模放大到工業實際生產規模,還是較大的挑戰。工業發酵的規模往往較大,充分的攪拌是發酵的關鍵。不充分的攪拌可能會導致傳質傳氧傳熱的不均一,使微生物細胞所處的微環境不斷變化,如底物、毒性副產物、溶氧、溫度、pH及CO2等,最終導致生物量、轉化率與生產速率的不均一,從而形成復雜的細胞響應與代謝變化。
針對這一問題,發酵過程的多組學整合分析以及整合流體力學與細胞代謝動力學的分析可能成為有效的解決方法[94]。通過對同一細胞工廠在不同發酵規模上的比較組學分析,可揭示出在逐級放大過程中的宏觀發酵表型與微觀細胞代謝的變化,有助于解決發酵放大中的瓶頸問題。另外,針對同一發酵過程中的各組學數據的整合分析及整合模型建立也有助于加深在發酵過程中細胞內各不同分子水平上的動態變化。同時,13C-代謝流分析也是檢測不同發酵規模中細胞代謝變化的有效手段。de Jonge等[95]利用間歇性葡萄糖補料工藝與13C-代謝流相結合的方法,分析了產黃青霉的青霉素發酵過程中的碳源充足與饑餓條件下的變化,發現不同條件下有的胞內代謝物的濃度出現100倍的變化。這表明工業發酵放大過程,攪拌所帶來的底物供給非均一化,會引起局部微環境中細胞代謝的劇烈變化,這可能是導致放大效果難以成線性的重要原因。流體動力學模型(Computational fluid dynamics,CFD)也是預測不同發酵規模下的發酵條件變化的有力工具[2],可通過對發酵罐內的傳熱與傳質等不同參數的動態模擬來發現在發酵工藝控制與放大中的限速步驟。
隨著以DNA測序技術與質譜技術為代表的組學技術與基因組規模生物網絡的快速發展,系統生物學在工業生物技術的菌株改造與發酵過程優化中起著越來越重要的作用。結合許多工業菌株中高效基因組編輯工具[96-99]、基因精細調控技術[100]以及適應性進化,系統生物學的發展也將不斷加速細胞工廠的改造與發酵優化(圖1)[101]。
在細胞工廠的設計與優化中,各組學及多組學的整合分析與基因組規模的生物網絡模型將是未來的重要研究方向。利用整合多種不同條件的組學數據的生物網絡,可不斷推進我們對微生物在基因密碼、轉錄調控、翻譯調控、翻譯后修飾與代謝調控等各個不同層次上的認識,使基于數據模擬與仿真的細胞工廠設計成為現實,尤其是在復雜天然產物的人工合成上具有獨特的優 勢[102]。此外,針對不同物種的基因組信息挖掘與新酶從頭設計改造也是細胞工廠的設計與優化的重要方向。
在工業發酵過程優化中,利用系統生物學的研究策略正在不斷加深工業發酵過程中工業菌種的細胞代謝動態變化。各組學數據與一系列宏觀發酵表型數據以及發酵罐的流體動力學數據[2]的整合分析,也是未來從微觀到宏觀、從分子水平到發酵水平系統認識工業發酵過程,并實現高效放大優化的有效策略。
[1] Chen F, Ding CJ, Chen YW, et al. A study on global trends of industrial biotechnology and the perspectives in China. World Sci-Tech R & D, 2018, 40(2): 133–148 (in Chinese).陳方, 丁陳君, 陳云偉, 等. 工業生物技術領域國際發展態勢及我國發展前景展望. 世界科技研究與發展, 2018, 40(2): 133–148.
[2] Campbell K, Xia JY, Nielsen J. The impact of systems biology on bioprocessing. Trends Biotechnol, 2017, 35(12): 1156–1168.
[3] Goodwin S, McPherson JD, McCombie WR. Coming of age: ten years of next-generation sequencing technologies. Nat Rev Genet, 2016, 17(6): 333–351.
[4] Roberts RJ, Carneiro MO, Schatz MC. The advantages of SMRT sequencing. Genome Biol, 2013, 14: 405.
[5] Sayers EW, Cavanaugh M, Clark K, et al. GenBank. Nucleic Acids Res, 2019, 47(D1): D94–D99.
[6] Mukherjee S, Stamatis D, Bertsch J, et al. Genomes OnLine database (GOLD) v.7: updates and new features. Nucleic Acids Res, 2019, 47(D1): D649–D659.
[7] Dehal PS, Joachimiak MP, Price MN, et al. MicrobesOnline: an integrated portal for comparative and functional genomics. Nucleic Acids Res, 2010, 38(D4): D396–D400.
[8] Cherry JM, Hong EL, Amundsen C, et al. Saccharomyces genome database: the genomics resource of budding yeast. Nucleic Acids Res, 2012, 40(D1): D700–D705.
[9] Basenko EY, Pulman JA, Shanmugasundram A, et al. FungiDB: an integrated bioinformatic resource for fungi and oomycetes. J Fungi, 2018, 4(1): 39.
[10] Velculescu VE, Zhang L, Zhou W, et al. Characterization of the yeast transcriptome. Cell, 1997, 88(2): 243–251.
[11] Clough E, Barrett T. The gene expression omnibus database//Mathé E, Davis S, Eds. Statistical Genomics: Methods and Protocols. New York, NY: Humana Press, 2016: 93–110.
[12] Athar A, Füllgrabe A, George N, et al. ArrayExpress update - from bulk to single-cell expression data. Nucleic Acids Res, 2019, 47(D1): D711–D715.
[13] Faith JJ, Driscoll ME, Fusaro VA, et al. Many microbe microarrays database: uniformly normalized Affymetrix compendia with structured experimental metadata. Nucleic Acids Res, 2008, 36(D4): D866–D870.
[14] Hoedt E, Zhang GA, Neubert TA. Stable isotope labeling by amino acids in cell culture (SILAC) for quantitative proteomics//Woods AG, Darie CC, Eds. Advancements of Mass Spectrometry in Biomedical Research. Cham: Springer, 2014: 93–106.
[15] Xiao Z, Veenstra TD. Comparison of protein expression by isotope-coded affinity tag labeling// Vlahou A, Ed. Clinical Proteomics: Methods and Protocols. Totowa, NJ: Humana Press, 2008: 181–192.
[16] Gan CS, Chong PK, Pham TK, et al. Technical, experimental, and biological variations in isobaric tags for relative and absolute quantitation (iTRAQ). J Proteome Res, 2007, 6(2): 821–827.
[17] Vizcaíno JA, C?téRG, Csordas A, et al. The PRoteomics IDEntifications (PRIDE) database and associated tools: status in 2013. Nucleic Acids Res, 2013, 41(D1): D1063–D1069.
[18] Craig R, Cortens JP, Beavis RC. Open source system for analyzing, validating, and storing protein identification data. J Proteome Res, 2004, 3(6): 1234–1242.
[19] McCord J, Sun Z, Deutsch EW, et al. The PeptideAtlas of the domestic laying hen. J Proteome Res, 2017, 16(3): 1352–1363.
[20] The UniProt Consortium. UniProt: a worldwide hub of protein knowledge. Nucleic Acids Res, 2019, 47(D1): D506–D515.
[21] Smith AC, Robinson AJ. MitoMiner v3.1, an update on the mitochondrial proteomics database. Nucleic Acids Res, 2016, 44(D1): D1258–D1261.
[22] Nanjappa V, Thomas JK, Marimuthu A, et al. Plasma proteome database as a resource for proteomics research: 2014 update. Nucleic Acids Res, 2014, 42(D1): D959–D965.
[23] Urbanczyk-Wochniak E, Luedemann A, Kopka J, et al. Parallel analysis of transcript and metabolic profiles: a new approach in systems biology. EMBO Rep, 2003, 4(10): 989–993.
[24] Zhang QQ, Zheng XM, Wang Y, et al. Comprehensive optimization of the metabolomic methodology for metabolite profiling of. Appl Microbiol Biotechnol, 2018, 102(16): 7113–7121.
[25] Zheng XM, Yu JD, Cairns TC, et al. Comprehensive improvement of sample preparation methodologies facilitates dynamic metabolomics of. Biotechnol J, 2019, 14(3): 1800315.
[26] Meinert S, Rapp S, Schmitz K, et al. Quantitative quenching evaluation and direct intracellular metabolite analysis in. Anal Biochem, 2013, 438(1): 47–52.
[27] Kim S, Lee DY, Wohlgemuth G, et al. Evaluation and optimization of metabolome sample preparation methods for. Anal Chem, 2013, 85(4): 2169–2176.
[28] Sch?del F, David F, Franco-Lara E. Evaluation of cell damage caused by cold sampling and quenching for metabolome analysis. Appl Microbiol Biotechnol, 2011, 92(6): 1261–1274.
[29] Guijas C, Montenegro-Burke JR, Domingo-Almenara X, et al. METLIN: a technology platform for identifying knowns and unknowns. Anal Chem, 2018, 90(5): 3156–3164.
[30] Kopka J, Schauer N, Krueger S, et al. GMD@CSB.DB: the golm metabolome database. Bioinformatics, 2005, 21(8): 1635–1638.
[31] Kale NS, Haug K, Conesa P, et al. MetaboLights: an open-access database repository for metabolomics data. Curr Protoc Bioinformatics, 2016, 53(1): 14.13.1–14.13.18.
[32] Wishart DS, Feunang YD, Marcu A, et al. HMDB 4.0: the human metabolome database for 2018. Nucleic Acids Res, 2018, 46(D1): D608–D617.
[33] Presnell KV, Alper HS. Systems metabolic engineering meets machine learning: a new era for data-driven metabolic engineering. Biotechnol J, 2019, 14(9): 1800416.
[34] Guo WH, Sheng JY, Feng XY.13C-metabolic flux analysis: an accurate approach to demystify microbial metabolism for biochemical production. Bioengineering, 2015, 3(1): 3.
[35] Shupletsov MS, Golubeva LI, Rubina SS, et al. OpenFLUX2:13C-MFA modeling software package adjusted for the comprehensive analysis of single and parallel labeling experiments. Microb Cell Fact, 2014, 13: 152.
[36] Weitzel M, N?h K, Dalman T, et al. 13CFLUX2-high-performance software suite for13C-metabolic flux analysis. Bioinformatics, 2013, 29(1): 143–145.
[37] Young JD. INCA: a computational platform for isotopically non-stationary metabolic flux analysis. Bioinformatics, 2014, 30(9): 1333–1335.
[38] Zhang ZD, Shen T, Rui B, et al. CeCaFDB: a curated database for the documentation, visualization and comparative analysis of central carbon metabolic flux distributions explored by13C-fluxomics. Nucleic Acids Res, 2015, 43(D1): D549–D557.
[39] Hua Q, Yang C. Application of metabolic flux ratio analysis in metabolic engineering-a review. Chin J Biotech, 2009, 25(9): 1303–1311 (in Chinese).花強, 楊琛. 代謝流量比率分析及其在代謝工程中的應用. 生物工程學報, 2009, 25(9): 1303–1311.
[40] Chandrasekaran S, Price ND. Probabilistic integrative modeling of genome-scale metabolic and regulatory networks inand. Proc Natl Acad Sci USA, 2010, 107(41): 17845–17850.
[41] Chi BF, Tao SH, Liu YL. Physiologically shrinking the solution space of agenome-scale model suggests the role of the metabolic network in shaping gene expression noise. PLoS ONE, 2015, 10(10): e0139590.
[42] ?sterlund T, Nookaew I, Bordel S, Nielsen J. Mapping condition-dependent regulation of metabolism in yeast through genome-scale modeling. BMC Syst Biol. 2013, 7: 36.
[43] F?rster J, Famili I, Fu P, et al. Genome-scale reconstruction of themetabolic network. Genome Res, 2003, 13(2): 244–253.
[44] Sun JB, Lu X, Rinas U, et al. Metabolic peculiarities ofdisclosed by comparative metabolic genomics. Genome Biol, 2007, 8(9): R182.
[45] Lu HZ, Cao WQ, Ouyang LM, et al. Comprehensive reconstruction andanalysis ofgenome-scale metabolic network model that accounts for 1210 ORFs. Biotechnol Bioeng, 2017, 114(3): 685–695.
[46] Kanehisa M. The KEGG database//Bock G, Goode JA, Eds. ‘’ Simulation of Biological Processes. Chichester, West Sussex: John Wiley, 2002, 247: 91–101.
[47] Slenter DN, Kutmon M, Hanspers K, et al. WikiPathways: a multifaceted pathway database bridging metabolomics to other omics research. Nucleic Acids Res, 2018, 46(D1): D661–D667.
[48] Caspi R, Billington R, Fulcher CA, et al. The MetaCyc database of metabolic pathways and enzymes. Nucleic Acids Res, 2018, 46(D1): D633–D639.
[49] Karp PD, Ouzounis CA, Moore-Kochlacs C, et al. Expansion of the BioCyc collection of pathway/genome databases to 160 genomes. Nucleic Acids Res, 2005, 33(19): 6083–6089.
[50] Goto S, Nishioka T, Kanehisa M. LIGAND: chemical database of enzyme reactions. Nucleic Acids Res, 2000, 28(1): 380–382.
[51] Schomburg I, Chang A, Hofmann O, et al. BRENDA: a resource for enzyme data and metabolic information. Trends Biochem Sci, 2002, 27(1): 54–56.
[52] Lakshmanan M, Koh G, Chung BKS, et al. Software applications for flux balance analysis. Brief Bioinform, 2014, 15(1): 108–122.
[53] Gomez JA, Barton PI. Dynamic flux balance analysis using DFBAlab//Fondi M, Ed. Metabolic Network Reconstruction and Modeling: Methods and Protocols. New York, NY: Humana Press, 2018: 353–370.
[54] Sch?pe P, Kwon MJ, Baumann B, et al. Updating genome annotation for the microbial cell factoryusing gene co-expression networks. Nucleic Acids Res, 2019, 47(2): 559–569.
[55] Kludas J, Arvas M, Castillo S, et al. Machine learning of protein interactions in fungal secretory pathways. PLoS ONE, 2016, 11(7): e0159302.
[56] Zhu ZW, Zhang SF, Liu HW, et al. A multi-omic map of the lipid-producing yeast. Nat Commun, 2012, 3: 1112.
[57] Horai H, Arita M, Kanaya S, et al. MassBank: a public repository for sharing mass spectral data for life sciences. J Mass Spectrom, 2010, 45(7): 703–714.
[58] Nielsen J, Keasling JD. Engineering cellular metabolism. Cell, 2016, 164(6): 1185–1197.
[59] Chae TU, Choi SY, Kim JW, et al. Recent advances in systems metabolic engineering tools and strategies. Curr Opin Biotechnol, 2017, 47: 67–82.
[60] Choi KR, Jang WD, Yang D, et al. Systems metabolic engineering strategies: integrating systems and synthetic biology with metabolic engineering. Trends Biotechnol, 2019, 37(8): 817–837.
[61] Guo YM, Zheng P, Sun JB. Aspergillus niger as a potential cellular factory: prior knowledge and key technology. Chin J Biotech, 2010, 26(10): 1410–1418 (in Chinese).郭艷梅, 鄭平, 孫際賓. 黑曲霉作為細胞工廠: 知識準備與技術基礎. 生物工程學報, 2010, 26(10): 1410–1418.
[62] Kalyuzhnaya MG, Puri AW, Lidstrom ME. Metabolic engineering in methanotrophic bacteria. Metab Eng, 2015, 29: 142–152.
[63] Singh B.syn.: a thermophilic mould of biotechnological potential. Crit Rev Biotechnol, 2016, 36(1): 59–69.
[64] Jouhten P, Boruta T, Andrejev S, et al. Yeast metabolic chassis designs for diverse biotechnological products. Sci Rep, 2016, 6: 29694.
[65] Chen Y, Daviet L, Schalk M, et al. Establishing a platform cell factory through engineering of yeast acetyl-CoA metabolism. Metab Eng, 2013, 15: 48–54.
[66] Galanie S, Thodey K, Trenchard IJ, et al. Complete biosynthesis of opioids in yeast. Science, 2015, 349(6252): 1095–1100.
[67] Liu XN, Cheng J, Zhang GH, et al. Engineering yeast for the production of breviscapine by genomic analysis and synthetic biology approaches. Nat Commun, 2018, 9(1): 448.
[68] Fang H, Li D, Kang J, et al. Metabolic engineering offorbiosynthesis of vitamin B12. Nat Commun, 2018, 9(1): 4917.
[69] Yin X, Shin HD, Li JH, et al. Comparative genomics and transcriptome analysis ofand metabolic engineering for citrate production. Sci Rep, 2017, 7: 41040.
[70] Steiger MG, Rassinger A, Mattanovich D, et al. Engineering of the citrate exporter protein enables high citric acid production in. Metab Eng, 2019, 52: 224–231.
[71] Redding-Johanson AM, Batth TS, Chan R, et al. Targeted proteomics for metabolic pathway optimization: application to terpene production. Metab Eng, 2011, 13(2): 194–203.
[72] Alonso-Gutierrez J, Kim EM, Batth TS, et al. Principal component analysis of proteomics (PCAP) as a tool to direct metabolic engineering. Metab Eng, 2015, 28: 123–133.
[73] Xu JY, Xu Y, Chu XH, et al. Protein acylation affects the artificial biosynthetic pathway for pinosylvin production in engineered.. ACS Chem Biol, 2018, 13(5): 1200–1208.
[74] Meng HL, Xiong ZQ, Song SJ, et al. Construction of polyketide overproducingstrains via synthetic antisense RNAs based on in silico fluxome analysis and comparative transcriptome analysis. Biotechnol J, 2016, 11(4): 530–541.
[75] Ohtake T, Pontrelli S, Lavi?a WA, et al. Metabolomics-driven approach to solving a CoA imbalance for improved 1-butanol production in. Metab Eng, 2017, 41: 135–143.
[76] Lu HZ, Liu XY, Huang MZ, et al. Integrated isotope-assisted metabolomics and13C metabolic flux analysis reveals metabolic flux redistribution for high glucoamylase production by. Microb Cell Fact, 2015, 14: 147.
[77] Lange A, Becker J, Schulze D, et al. Bio-based succinate from sucrose: high-resolution13C metabolic flux analysis and metabolic engineering of the rumen bacterium. Metab Eng, 2017, 44: 198–212.
[78] Yang C, Gao X, Jiang Y, et al. Synergy between methylerythritol phosphate pathway and mevalonate pathway for isoprene production in. Metab Eng, 2016, 37: 79–91.
[79] Hoffmann SL, Jungmann L, Schiefelbein S, et al. Lysine production from the sugar alcohol mannitol: design of the cell factorySEA-3 through integrated analysis and engineering of metabolic pathway fluxes. Metab Eng, 2018, 47: 475–487.
[80] Mukhopadhyay A. Tolerance engineering in bacteria for the production of advanced biofuels and chemicals. Trends Microbiol, 2015, 23(8): 498–508.
[81] Zingaro KA, Papoutsakis ET. Toward a semisynthetic stress response system to engineer microbial solvent tolerance. mBio, 2012, 3(5): e00308–12.
[82] Tomas CA, Welker NE, Papoutsakis ET. Overexpression ofinresults in increased solvent production and tolerance, prolonged metabolism, and changes in the cell's transcriptional program. Appl Environ Microbiol, 2003, 69(8): 4951–4965.
[83] Zhu CC, Chen JZ, Wang Y, et al. Enhancing 5-aminolevulinic acid tolerance and production by engineering the antioxidant defense system of. Biotechnol Bioeng, 2019, 116(8): 2018–2028.
[84] Horinouchi T, Sakai A, Kotani H, et al. Improvement of isopropanol tolerance ofusing adaptive laboratory evolution and omics technologies. J Biotechnol, 2017, 255: 47–56.
[85] Wang XW, Li QG, Sun CM, et al. GREACE-assisted adaptive laboratory evolution in endpoint fermentation broth enhances lysine production by. Microb Cell Fact, 2019, 18: 106.
[86] Chung SC, Park JS, Yun J, et al. Improvement of succinate production by release of end-product inhibition in. Metab Eng, 2017, 40: 157–164.
[87] Thomson NM, Shirai T, Chiapello M, et al. Efficient 3-hydroxybutyrate production by quiescentmicrobial cell factories is facilitated by indole-induced proteomic and metabolomic changes. Biotechnol J, 2018, 13(5): 1700571.
[88] Tuyishime P, Wang Y, Fan LW, et al. Engineeringfor methanol-dependent growth and glutamate production. Metab Eng, 2018, 49: 220–231.
[89] Bracher JM, Verhoeven MD, Wisselink HW, et al. Thetransporter PcAraT enables high-affinity, glucose-insensitiveL-arabinose transport in. Biotechnol Biofuels, 2018, 11: 63.
[90] Kawaguchi H, Yoshihara K, Hara KY, et al. Metabolome analysis-based design and engineering of a metabolic pathway into match rates of simultaneous utilization ofD-glucose andL-arabinose. Microb Cell Fact, 2018, 17: 76.
[91] Jones JA, Vernacchio VR, Sinkoe AL, et al. Experimental and computational optimization of anco-culture for the efficient production of flavonoids. Metab Eng, 2016, 35: 55–63.
[92] Pappu JSM, Gummadi SN. Modeling and simulation of xylitol production in bioreactor byNCYC 3413 using unstructured and artificial neural network models. Bioresour Technol, 2016, 220: 490–499.
[93] Schwechheimer SK, Becker J, Peyriga L, et al. Improved riboflavin production withfrom vegetable oil based on13C metabolic network analysis with combined labeling analysis by GC/MS, LC/MS, 1D, and 2D NMR. Metab Eng, 2018, 47: 357–373.
[94] Wang G, Tang WJ, Xia JY, et al. Integration of microbial kinetics and fluid dynamics toward model-driven scale-up of industrial bioprocesses. Eng Life Sci, 2015, 15(1): 20–29.
[95] de Jonge L, Buijs NAA, Heijnen JJ, et al. Flux response of glycolysis and storage metabolism during rapid feast/famine conditions inusing dynamic13C labeling. Biotechnol J, 2014, 9(3): 372–385.
[96] Zheng XM, Zheng P, Sun JB, et al. Heterologous and endogenoussnRNA promoters enable CRISPR/Cas9 mediated genome editing in. Fungal Biol Biotechnol, 2018, 5: 2.
[97] Zheng XM, Zheng P, Zhang K, et al. 5S rRNA Promoter for guide RNA expression enabled highly efficient CRISPR/Cas9 genome editing in. ACS Synth Biol, 2019, 8(7): 1568?1574.
[98] Liu J, Wang Y, Lu YJ, et al. Development of a CRISPR/Cas9 genome editing toolbox for. Microb Cell Fact, 2017, 16(1): 205.
[99] Wang Y, Liu Y, Liu J, et al. MACBETH: Multiplex automatedbase editing method. Metab Eng, 2018, 47: 200–210.
[100] Sun DH, Chen JZ, Wang Y, et al. Metabolic engineering ofby synthetic small regulatory RNAs. J Ind Microbiol Biotechnol, 2019, 46(2): 203–208.
[101] Tong ZY, Zheng XM, Tong Y, et al. Systems metabolic engineering for citric acid production byin the post-genomic era. Microb Cell Fact, 2019, 18: 28.
[102] Barrett CL, Kim TY, Kim HU, et al. Systems biology as a foundation for genome-scale synthetic biology. Curr Opin Biotechnol, 2006, 17(5): 488–492.
Systems biology for industrial biotechnology
Xiaomei Zheng1,2,3, Ping Zheng1,2,3, and Jibin Sun1,2,3
1 Tianjin Institute of Industrial Biotechnology, Chinese Academy of Sciences, Tianjin 300308, China 2 Key Laboratory of Systems Microbial Biotechnology, Chinese Academy of Sciences, Tianjin 300308, China 3 University of Chinese Academy of Sciences, Beijing 100049, China
In industrial biotechnology, microbial cell factories utilize renewable resources to produce energy, materials and chemicals. Industrial biotechnology plays an increasingly important role in solving the resource, energy and environmental problems. Systems biology has shed new light on industrial biotechnology, deepening our understanding of industrialmicrobial cell factories and their bioprocess from “Black-box” to “White-box”. Systems-wide profiling of genome, transcriptome, proteome, metabolome, and fluxome has proven valuable to better unveil network operation and regulation on the genome scale. System biology has been successfully applied to create microbial cell factories for numerous products and derive attractive industrial processes, which has constantly expedited the development of industrial biotechnology. This review focused on the recent advance and applications of omics and trans-omics in industrial biotechnology, including genomics, transcriptomics, proteomics, metabolomics, fluxomics and genome scale modeling, and so on. Furthermore, this review also discussed the potential and promise of systems biology in industrial biotechnology.
industrial biotechnology, system biology, multi-omics, strain design, fermentation optimization
10.13345/j.cjb.190217
孫際賓 博士,博士生導師,中國科學院天津工業生物技術研究所副所長,中國科學院“百人計劃”入選者,中國科學院特聘研究員,中國科學院科技創新交叉與合作團隊牽頭人,中國生物發酵產業協會理事。致力于發展工業微生物的系統與合成生物技術,以復雜生物網絡研究為基礎,整合組學數據,解析工業微生物的高產抗逆分子基礎和代謝瓶頸,設計和創造符合工業化需求的微生物。承擔了國家自然科學基金、973計劃、863計劃、中科院科技服務網絡計劃 (STS計劃)、中科院科技創新交叉與合作團隊、天津市首批A類重點領域創新團隊以及多個企業合作項目。已發表SCI論文90余篇,申請中國發明專利30余項,獲中國專利授權9項,PCT專利2項,曾獲教育部提名國家技術發明獎二等獎與中國產學研合作創新成果獎等。

鄭平 博士,博士生導師,中國科學院天津工業生物技術研究所研究員,天津市濱海新區“131”人才工程第二層次人才,天津市三八紅旗手,天津市濱海新區第三屆人大代表。長期從事細菌的代謝工程改造和系統生物學研究,致力于創建綠色、高效、低成本的生物制造體系,創新現代生物技術,提升推動傳統生物及化工企業轉型升級,承擔國家自然科學基金面上項目、863計劃、中科院知識創新工程重要方向項目、天津市應用基礎及前沿技術研究計劃項目,并參與973項目與中科院知識創新工程項目等,已發表SCI論文20余篇,申請中國發明專利20余項,PCT專利2項,已獲中國專利授權9項。
鄭小梅, 鄭平, 孫際賓. 面向工業生物技術的系統生物學. 生物工程學報, 2019, 35(10): 1955–1973.
Zheng XM, Zheng P, Sun JB. Systems biology for industrial biotechnology. Chin J Biotech, 2019, 35(10): 1955–1973.
May 28, 2019;
August 5, 2019
National Natural Science Foundation of China (Nos. 31700085, 31370113).
Jibin Sun. Tel: +86-22-84861949; Fax: +86-22-84861943; E-mail: sun_jb@tib.cas.cn
Ping Zheng. Tel: +86-22-84861945; Fax: +86-22-84861943; E-mail: zheng_p@tib.cas.cn
國家自然科學基金 (Nos. 31700085, 31370113) 資助。
2019-08-23
http://kns.cnki.net/kcms/detail/11.1998.Q.20190823.1520.001.html
(本文責編 陳宏宇)