儲攀,朱靜雯,黃文琦,劉陳立,傅雄飛
(1 中國科學院深圳先進技術研究院,深圳合成生物學創新研究院,中國科學院定量工程生物學重點實驗室,廣東省合成基因組學重點實驗室,廣東 深圳 518055;2 中國科學院大學,北京 100049)
本世紀初兩項創造性的工作——撥動開關[1]和壓縮振蕩子[2]——利用工程化的思想設計了人工基因回路并使其實現特定的生理功能。秉承這一思想,合成生物學在眾多學科的交叉中誕生,在生命科學領域的研究中逐漸受到廣泛的關注。近20 年來該學科出現許多重要的突破:一方面,通過對基因組的挖掘,人類得到大量定量刻畫的生物元件[3-5],并設計出了越來越復雜的基因邏輯回路[6-7],它們能響應特定的外界信號并輸出預期的結果;另一方面,利用合成生物學工具,人類對生命系統的工作機理有了更深層次的認識,例如揭示細胞生長、分裂的普適機制[8-9];利用化學合成技術合成細胞基因組[10-11]為實現從頭設計合成生命打下物質基礎。另外,在產業方面,大量具有高價值的復雜產物通過合成基因回路實現了工業化生產,有望取代傳統化工合成,降低對環境的破壞和對化石能源的依賴性[12-13]。
盡管如此,我們對基因的解讀能力仍處在較低的水平:DNA 序列提供的信息高度復雜,通過人工組合、設計的復雜基因回路放入到底盤細胞后,底盤細胞對特定信號的響應往往出乎我們的預期[14-15]。細胞在執行命令的過程中存在許多細節我們仍不清楚或難以定量描述,但這些細節卻也是基因回路功能實現的重要環節?;蚧芈吠妆P細胞之間存在種種聯系,回路功能實現依賴細胞的DNA 復制系統、轉錄和翻譯系統以及各種代謝產物前體。不同的菌株、不同的生長條件,都會對基因的表達量產生影響[16-17],而基因回路中不同基因的表達量決定了回路的輸出結果;同時,外源的基因回路的表達對于底盤細胞而言是一種“負擔”[18-19],外源基因表達將占用有限的DNA、RNA、蛋白質的合成機器以及各種底物,這種資源上的占用將改變底盤細胞內源的基因表達,進而改變底盤細胞的生理狀態。因此,基因回路和底盤細胞兩者存在天然的耦合。然而長期以來,我們對合成基因的回路設計思路主要集中在單獨元件的定量和預測上,忽略了底盤細胞與基因回路元件之間的影響。所以,使用特定條件下的單個基因模塊的定量數據來預測不同工作背景下在基因回路的行為會出現偏差,導致合成基因回路設計不可避免地進入無限循環的“設計?構建?調試”中。不僅如此,許多工程菌,如環境治理工程菌、腸道菌群改造工程菌等,其工作環境往往不是標準的實驗室條件,底盤細胞生理顯然受環境的影響而發生了變化,導致很多基因回路無法實現預期功能[20]。
得益于系統生物學理論以及組學實驗方法的發展,近年來,許多工作使得我們對于底盤細胞生理的理解有了更加全面、定量的認識[15,21-22]。將底盤細胞的生理狀態納入到對基因回路行為的理解中,許多反常規的問題迎刃而解[23];同時,這些理論也被應用到了合成基因回路設計的實踐中,給合成基因回路設計帶來了新的思路。除此之外,開發正交性元件和更加精巧的模塊化設計也為解決這一問題提供了新的思路[24]。
本文將梳理近年來合成基因回路與底盤細胞相互耦合的理論研究,介紹底盤細胞與基因回路的相互作用,以及與之相關的定量技術,并進一步介紹近年來關于解開底盤-回路耦合的成果。
細胞通過一系列的生理生化過程從外界環境中攝取維持生長所需的物質,通過同化作用轉化為復制、轉錄、翻譯和酶促反應等生物過程所需的資源。在不同底盤細胞中,或者同一底盤細胞在不同的環境和生長條件中,細胞會將其資源以不同的策略分配給不同的環節,以最大限度地提高其適應性[9,21,25-26],分配策略的變化會導致回路的響應變化。同時基因回路作為外源基因,會競爭各種共享資源,如RNA 聚合酶、核糖體和氨基酸,以及各種生化反應所需的酶和能量[27-29]對底盤細胞的生理狀態產生影響,導致細胞生長緩慢、形態發生變化,這些變化同樣作為基因回路的輸入函數,影響基因回路行為,并可能產生難以預料的結果[30]。而且不同回路模塊之間同樣也存在競爭,這種競爭同樣會導致回路的輸出不符合預期[圖1(a)]。本節將介紹回路-底盤相互作用的機制研究成果,并討論這些機制帶來的生理效應。

圖1 底盤細胞和基因回路之間的相互作用[31-32]Fig.1 Schematic of interactions between host cells and genetic circuits[31-32]
不同生物底盤細胞之間的基因背景差異會導致標準化的基因元件的輸出結果的差異[33-34],這為合成生物學的標準化設計提出了重大挑戰。Moser等[35]研究指出轉化到不同Escherichia coli菌株中的與邏輯門(AND 門)會有不同的表現。同一培養條件下,AND 門回路在E.coliDS68637 中能夠正常響應,而轉入到E.coliDH10B 菌株中卻完全失去功能。而不同營養成分的培養基以及不同的培養條件也會對基因元件的響應產生改變[16,36-37]。AND 門在LB 培養基中對誘導劑的響應非常靈敏;而轉入貧瘠培養基后,誘導劑的加入甚至使細胞停止生長。
除了底盤細胞的遺傳背景差異以及培養環境差異對基因回路造成的影響之外,底盤細胞的生長速率也是影響回路功能的關鍵因素之一。細胞中蛋白的降解主要以細胞生長的方式對胞內蛋白進行稀釋[38],因此表達水平往往和底盤細胞生長速率相耦合,而蛋白表達水平的濃度高低則決定了基因線路的輸出行為[39]。Tan 等[40]分析了由自激活突變體T7 RNA 聚合酶組成的基因回路,雖然該自激活過程是非協同的,但該回路的基因表達水平卻呈現出雙穩態。這一反常規的現象可以解釋為,基因回路的表達引起了細胞生長速率的減慢,而細胞的生長對基因元件的表達存在著正反饋調節,進一步增加蛋白的積累,從而實現了雙穩態現象。
人工基因回路的表達占用了底盤細胞生長代謝相關的資源,影響細胞的正常生長[41-42]。外源基因回路對RNA聚合酶和核糖體[36]的競爭是導致這種壓力的主要因素。當E.coli細胞表達與生存不相關蛋白占細胞蛋白總量約30%時,細胞會完全停止生長[25,43]。除此之外,元件與底盤細胞的特異互作可能導致毒性,比如代謝過程中的酶發生互作等。
另外,外源基因的表達甚至會引起底盤細胞的整體資源分配策略的改變。細胞本身存在動態調節分配策略的機制[44-46],(p)ppGpp[guanosine tetra-phosphate or penta-phosphate,鳥苷四(五)磷酸]轉錄翻譯調節機制,當外源蛋白持續表達幾代之后,E.coli細胞可以利用(p)ppGpp 的調控機制,實現對全局性資源的重新分配[44,47]。較高的(p)ppGpp 水平通過直接抑制核糖體合成以及蛋白翻譯速度來抑制細胞生長。較低的(p)ppGpp 水平限制參與細胞代謝相關蛋白的表達水平。在引入外源基因回路的條件下,外源基因對細胞內氨基酸資源的消耗,使得(p)ppGpp 水平升高,降低核糖體的水平,提高代謝相關蛋白的表達量,這一策略在貧瘠培養基中可以有效協調細菌的資源分配。
基因回路中不同的模塊之間也會競爭細胞資源[48-51]。當外源回路中的基因都在爭奪這些有限的資源時,基因之間就會產生非預期的相互作用。這些相互作用可以極大改變基因回路的預期行為,導致實驗結果與模型預測完全不符。例如,Qian等[52]的工作表明,當兩個激活模塊單獨存在時,希爾函數可以很好地吻合實驗結果。但是將兩個模塊串聯形成更復雜的體系后,理論預測的結果甚至和實驗結果完全相反。Wei 等[50]則建立了粗粒化的模型框架,用于描述生命體中轉錄因子、核糖體、蛋白降解酶等資源的競爭行為,通過統一的模型框架可以有效評估和理解基因回路中可能存在的競爭效應。
除了上述三種競爭效應外,底盤細胞和基因回路的互作還帶來了一系列其他效應,例如增加同基因群體的異質性、降低遺傳穩定性以及毒性效應。
即使是相同基因型的細胞,在生長分裂等動態過程以及各種生理生化過程都存在噪聲,造成了表型多樣性[53-55]。研究表明,這種差異往往隨著生長速率的減小而變得顯著[56-57]。因此,外源基因的表達使得這種擾動變得更加明顯,從而導致底盤細胞的生理異質性增強。而這種異質性導致一部分表達量相對較低的細胞獲得相對較快的生長速度,這類細胞便可以在不斷的傳代培養中取得優勢,最終導致合成基因回路的失效[40][圖1(b)]。另外,在細菌細胞中,資源的分配比例也可能會隨著個體的差異而不同。例如,外源基因和底盤細胞基因往往公用E.coli內源蛋白質降解系統ClpXP,過量表達的蛋白可能導致不同蛋白的降解出現“排隊效應”,這一隨機的分配過程導致細胞的異質性增強[48]。
細胞的生長壓力帶來的負向篩選作用會減弱人工基因回路的遺傳穩定性。研究表明基因回路功能可以給細胞帶來很大的適應性劣勢(fitness disadvantage)[31],并且發生適應性進化以減輕與表達外源蛋白質相關的代謝負荷或毒性。基因回路給底盤細胞帶來壓力,同時導致底盤細胞生長速率往往低于野生型菌株,而突變導致的含有失效的基因回路的菌株往往具有更好的適應性,這樣一來,在連續培養的過程中,帶有期望功能的合成菌株會逐漸失去優勢。Sleight 等[31]評估了帶有不同的調控元件的3 種熒光蛋白在E.coli中的遺傳穩定性,發現表達量低和帶有更少重復序列的基因回路具有更好的遺傳穩定性[圖1(c),修改自文獻[31]]。重復序列容易導致基因重組進而導致序列丟失,因此有必要建立更大的優質元件庫,減少元件在同一基因回路中的重復使用,使用低拷貝的質粒或者將基因回路整合到基因組也可以降低重組發生的概率[58]。同時在設計的環節中加入同源序列檢查的過程,避免元件組合的過程中產生意外的同源序列。
在基因回路的測試過程,往往會發現有些基因元件或回路會導致細胞形態發生變化,如纖維化。一般認為這種現象是由基因回路與細胞的一些生理過程發生了意外相互作用引起的。一種可能是,異源DNA 中存在一些意外的功能序列。如,DnaA Box 會嚴重影響細菌的分裂[59];另外,富含AT 序列的DNA 序列可能是未知的啟動子,高頻的轉錄占用了細胞大量RNAP,造成RNAP不足[60]。另外,外源基因的表達產物也可能與底盤細胞的基因組意外互作,例如TetR 家族中一些阻遏的蛋白異常調節底盤細胞的基因表達[61-62]。高表達dCas9 也會嚴重影響細胞生理。組學實驗發現dCas9 蛋白在高表達水平下,能夠非特異性結合到基因組上影響部分基因的轉錄水平[32][圖1(d),修改自文獻[32]],導致細胞生長速率的急劇下降和細胞形態的纖維化。另外,也有實驗表明gRNA 只含有9 堿基與目標位點匹配的情況下,也能有效結合到基因組上引起轉錄下調[63]。目前,還沒有系統性的定量毒性的方法,對于這些意外的互作情況,使用組學技術,如RNA-seq 等[36],可以有效地進行評估。
綜上所述,基因表達與細胞生長之間存在著多方面的聯系。對這些關系的認識可以提高對基因回路行為認識和預測,為合成基因回路的理性設計提供指導?;谏鲜鰧嶒炞C據,很多數學模型被用于描述這些機制,以進一步解釋更復雜的生理現象。
由于底盤細胞與基因回路之間存在復雜的相互作用,近年來不少工作利用數學模型解釋了不同生長速度和藥物作用下的細胞的行為[25],將基因回路與底盤同時納入到模型的框架中,使得許多基因回路失效的案例得到了解釋,并為下一步底盤改造提供了方向。本節將介紹近年來出現的代表性的工作,介紹如何用生物物理模型去預測耦合效應。
近十幾年來,隨著合成生物學的發展,用生物物理模型描述回路與底盤的互作逐漸興起,但模擬細胞內全部或主要生理過程的思想早在1979 年就有報道[64]。進入20 世紀以來,伴隨著組學技術、生物定量技術的發展以及運算能力的提高,出現了全盤考慮所有已知生化過程的數學模型,其被稱為全細胞模型(whole cell model)[65-67][圖2(a),修改自文獻[67]]。也有忽略大部分生化過程,僅考慮關鍵的幾個生化過程的粗粒化的模型(coarsegrained model)[25,68-69][圖2(b),修改自文獻[69]]。
隨著組學技術的興起,構建全細胞模型的想法自然而然地產生,自2000 年以來經歷了構建全基因組網絡結構、整合組學數據階段[65],到目前擁有一定的預測能力。
2012 年,Karr 等[67]基于多維組學數據對Mycoplasma genitalium進行全細胞建模,將細胞的生理過程分為28 個子過程并用16 個細胞變量將子過程整合起來,用合適的數學模型進行模擬,例如細胞代謝產物使用流平衡分析(flux-balance analysis,FBA)方法,蛋白質等代謝產物降解采用泊松過程。在每個細胞周期內,每個子過程都在一個較短的時間尺度內獨立模擬,并通過細胞變量整合。該模型可以對基因組各基因與轉錄因子之間的互作等諸多細胞行為做出預測,在這基礎上通過對單基因擾動的模擬發現了已注釋基因的新功能。除了M.genitalium以外,另一個比較成熟的生物模型是E.coli模型,有研究以它為對象嘗試建立對應全細胞模型,成功預測大部分基因或環境擾動對生長速率的影響[70]。除了預測實驗現象以外,全細胞模型在生理機制證明方面也有應用,通過將染色體上的DnaA Box 整合進全細胞復制模型,可以建立染色體復制起始時間決策的模型[71]。從全細胞模型出發研究關于噪聲對基因開關的影響,發現生長狀態對噪聲大小存在影響,由于轉錄翻譯元件擴散速度慢和自我復制特性會產生正反饋機制,導致快速生長條件下的細胞存在更大的噪聲[72]。通過在模型中加入基因線路模塊,全細胞模型也可以進行基因線路動力學預測,Purcell 等[73]在回路噪聲模擬問題上初步應用了M.genitalium全細胞模型,再現了自抑制振蕩回路中的噪聲現象。
全細胞模型涉及大量的參數,在M.genitalium的全細胞模型中整理了1900 個參數,包括小分子和蛋白質濃度、DNA 蛋白質親和力大小、RNA 蛋白質降解速率、超螺旋程度影響等,以及更多當前無法定量的參數[74]。另外,繁雜的參數使得模型模擬結果與參數之間的關系變得難以解讀。從“一切從簡”的觀點出發的粗粒化模型成為了與之互補的另一條途徑。
人們希望通過一些簡化模型,抓住所關注問題的核心機制,來對現象進行解釋。早期細胞生理學家通過粗?;P拖胍卮鸬膯栴}是,如何預測特定環境下的細胞生長速度。然而單純從營養物質能量大小出發,無法解釋實驗結果,于是科學家們注意到前體代謝物對生長的關鍵作用以及蛋白質合成和底物之間的調節效應,相關內容總結于文獻[75],這算是最初的粗粒化模型。而Scott等[25]基于實驗現象,進一步將蛋白質組分為核糖體相關部分、代謝部分和其他部分,通過構建粗?;P偷靡越忉寣嶒炛杏^察得到的現象。2015 年Wei?e 等[68]又系統性地從能量角度整合Scott 的研究結果并精簡了相關因素,對細胞生長做出了更為準確的預測,并進一步討論了其中回路與宿主之間的作用機制。2017 年,Liao 等[69]引入ppGpp 作為全局調控因子,進一步對營養物質切換時細胞生長的實驗現象進行了解釋,并且引入了更多的競爭機制成功解釋了基因回路相關的實驗現象。粗?;P蛯毎硇袨榈拿枋鲈桨l準確,并且細胞與回路之間的互作也被越來越多地考慮到其中。粗粒化模型的參數數量比全細胞模型的要少得多,Liao等[69]的關于E.coli的粗粒化模型中的參數僅97 個,實驗測得有52 個,其中部分參數相對穩定,不需要重復測量,可解釋性和可實現性方面比全細胞模型更具有優勢。
研究底盤-回路耦合效應,要抓住兩者之間相互作用的關鍵節點,資源的競爭和全局性調度是繞不開的話題。根據不同的研究需要,抓住資源競爭過程中的瓶頸和底盤細胞相互作用的調節分子,研究人員構建了一系列模型幫助理解底盤-回路相互耦合的源頭。外源基因回路的表達,對底盤細胞轉錄和翻譯資源的競爭已經通過模型和實驗得到了闡述,例如,Vecchio 課題組[49]和Macía課題組[42]分別對宿主細胞內的不同基因回路資源競爭進行研究,提出了基因表達的“等成本曲線”模型,將RNA 聚合酶資源和核糖體資源納入到模型框架中,并成功地解釋了實驗現象。
另外,在資源較強的競爭條件下,隨機性也會被放大,類似于“排隊過程”。例如,蛋白質翻譯過程中不同種mRNA 的豐度對有限核糖體結合競爭帶來的基因表達波動[76],類似的作用機制在轉錄、蛋白質降解[48]過程中都會有所體現,Wei等[50]提出的分子競爭粗?;P蜑榻忉尭偁庍^程在基因調控網絡中的影響提供模型框架。
本質上,全細胞模型和粗?;P褪莾煞N不同的思考方向,全細胞模型是自下而上地逐一還原生化細節來構建完整細胞模型,而粗?;P褪亲陨隙碌貙毎M行簡化。或許未來某個時刻這兩條回路最終會到達一個終點,伴隨著自動化實驗技術的成熟,發展出一套成熟的細胞模型刻畫體系,加快生物資源開發效率[77]。
通過生物物理模型,可以幫助有效理解回路-底盤耦合的根源。減弱或者規避這種耦合可以大幅降低預測、構建大規?;蚧芈返碾y度。目前主要有兩種思路,回路元件正交化[78]和設計模塊化[79-80]。前者通過人工的改造和導入各個層次上的正交元件(包括正交DNA 堿基,正交rRNA、tRNA、mRNA,正交蛋白質),來減弱甚至最終消除回路與細胞之間的耦合效應;后者通過基因互作拓撲結構的設計,來增強回路本身魯棒性,減少其受宿主本身狀態影響的效果。
正交化希望實現在維持回路其內部的邏輯調控的前提下,盡可能減少其內部元件與元件之間,以及元件與底盤細胞自身系統的不必要的交互?;蚧芈窌豢杀苊獾厥褂玫妆P細胞的各種資源,在特定情況下也需要建立與底盤細胞系統的接口,比如在進行天然產物的生產中,對底盤細胞原有的代謝網絡進行連接[81-82]。正交化基因回路,減少了與底盤細胞的過多交互,在進行模擬預測時可以減少參數,提高系統的可預測性。通過在基因庫中挖掘,正交化的DNA 復制、轉錄、翻譯系統也不斷涌現出來,正交中心法則系統這一概念也被提出。正交中心法則系統希望中心法則中涉及的生物合成過程使用一套正交的系統完成,可以類比為計算機科學中虛擬機的概念[83]。正交轉錄機器則早已在合成生物領域廣泛使用,噬菌體RNA 聚合酶是使用最多的元件,這類RNA 聚合酶識別特定的啟動子序列進行轉錄,大多為單體酶,且具有很強的轉錄活性。同時它們也容易被改造成為蛋白質相互作用層次的邏輯門,例如對其結構域進行分割,融合其他類型的蛋白質或結構域可以豐富其功能,例如,感光T7 RNAP[84-85]。類似地,將RNA聚合酶與DNA識別能力的蛋白[例如鋅指蛋白(ZFNs)、轉錄激活因子(TALENs)或CRISPR Cas 蛋白等]進行融合表達,可以擴展其使用的范疇。例如拓展理性化設計的啟動子的轉錄動力學范圍[86]。
另一類正交轉錄系統則基于σ因子,利用不同來源的胞質外功能(extracytoplasmic function,ECF)σ因子對啟動子序列的親和性不同,通過共享RNA 聚合酶核心酶庫和不同家族的ECFσ因子,可以設計出正交的ECFσ因子組合,實現在轉錄層面的絕緣[87]。蛋白的翻譯涉及大量復雜的生物過程,利用理性化和定向進化等手段,近年來,正交翻譯體系也取得大量的進展。例如,改造氨酰tRNA 合成酶可以將非天然氨基酸引入到蛋白質的序列中,有希望給蛋白質帶來更多樣的生理功能;得益于DNA 合成成本的降低,Freden 等從頭設計DNA 序列替換細菌天然基因組,成功將E.coli中64 種密碼子壓縮到了61 種,為擴充非天然氨基酸到合成生命的蛋白庫打下了基礎[88]。改變核糖體16S rRNA 的序列,則可以得到正交核糖體,識別非典型的核糖體結合位點(ribosomal binding site,RBS)序列,從而絕緣合成基因回路和底盤細胞的基因表達[78,89]。
轉錄因子是合成基因回路設計中主要承擔邏輯運算的元件,這類元件識別特定的序列激活或抑制下游基因的轉錄,未經正交化的轉錄因子存在交叉識別對應結合位點的風險。另外,結合到管家基因相關的DNA 序列上可能影響細胞正常代謝,產生毒性。
通過定向進化等手段對阻遏蛋白進行優化,增強其序列識別的特異性,也有助于降低細胞毒性[90]。除了典型的阻遏蛋白和激活蛋白外,許多具有識別序列功能的蛋白都可以通過理性化設計成為轉錄因子,如dCas9、TALENs 等,由于上述的非特異性結合等原因,高表達此類蛋白往往給細胞帶來較大的代謝壓力。正交化設計的dCas9*_Phlf 在dCas9 上引入了R1335K 的突變,去除了dCas9 的PAM(protospacer adjacent motif,前間區序列鄰近基序)結合依賴性,并融合阻遏蛋白Phlf,使得它需要同時識別20 堿基的sgRNA 結合序列和30 堿基的Phlf 特異序列才能結合到DNA上,擴充了特異性結合序列的長度,降低了脫靶的風險,使細胞能耐受更高的表達量[91]。
合成生物學的一大愿景是實現基因元件的即插即用[92],即通過對基因元件的排列組合實現復雜的網絡調控。傳統的模塊化主要是指元件模塊化,即對啟動子、編碼序列、終止子等功能序列定義其邊界,將它們獨立出來。除了在元件設計過程中的模塊化,更高層次的功能回路模塊化方案最近備受關注。功能回路模塊化將功能回路(例如邏輯門等)看作一個功能單元,通過合理的設計使每一個實現特定功能的回路的輸入輸出水平在插入到基因回路中時不受外部參數影響而發生變化[24]?;蚧芈分懈鱾€功能模塊之間的相互作用主要由轉錄因子來實現,例如結合到基因位點將導致游離轉錄因子濃度下降,進而擾動上游模塊;對于底盤細胞而言,基因回路對轉錄翻譯資源的消耗,將改變細胞生長速率以及各種資源庫的總量,進而又影響了基因線中的各種動力學參數,這就產生了所謂的回溯效力(retroactivity)[52],回溯效力的存在導致功能模塊之間以及功能模塊與細胞生理發生干擾,導致隨著基因回路增加,功能模塊的動力學屬性發生變化。如何能夠消除或規避回溯效力,實現回路的功能模塊化呢?控制理論中反饋控制和非協同前饋環(incoherent feedforward loop,iFFL)[93]為功能模塊化提供了思路。在原先的功能模塊中加入一個控制器,來執行反饋調節功能或與原先模塊組成一個非協同前饋環,在一定程度上解決了這一問題。
負反饋調節可以使基因回路的穩態輸出水平僅與自生元件的動力學性質決定,而不受基因表達生成和稀釋速率影響[圖3(a)]。當前大量基于反饋控制的解決方案已經被應用到基因回路的設計上,可以歸結為局部水平和全局水平兩類(圖3)。
局部水平的反饋策略主要著眼于功能模塊輸出本身的穩定性,希望利用負反饋系統來隔離模塊與模塊之間,以及模塊與底盤細胞之間的相互影響[94-95]。例如,使用轉錄后調控元件sRNA 形成負反饋環,使每一模塊的穩態表達水平都得以固定,使得它們對來自資源競爭產生的擾動具有抵抗的能力[圖3(b)][95]。類似地,Aoki 等[96]則采用了對偶積分反饋的策略,在保證了模塊的抗擾動能力的同時,實現了模塊穩態輸出的可調性[圖3(c)]。
基于全局的資源調控反饋策略能夠根據基因回路表達帶來的負擔對所需的資源進行調控。這樣的模塊化策略還可以與正交系統聯用。例如,正交核糖體基因表達系統中加入反饋控制模塊,能夠實現對正交核糖體與內源核糖體比例的動態分配,使正交核糖體的比例按需分配給基因回路,減輕基因回路內部的資源競爭帶來的耦合[圖3(d)][97]。

圖3 模塊化的基因回路設計Fig.3 Modularity of circuits design
另一種反饋策略則由宿主生理狀態決定,根據代謝壓力的大小來決定外源基因的表達。通過實驗篩選出外源基因高表達時轉錄水平上調的啟動子,利用這類啟動子激活下游基于dCas9的轉錄抑制系統,從而確保外源基因回路對細胞的壓力維持在一個較低的水平[圖3(e)][98]。
正反饋回路雖然無法使模塊的輸出水平更加穩定,但也有獨特的用處。在代謝工程領域,為了增強基因回路的遺傳穩定性,會利用與生理狀態偶聯的正反饋回路[圖3(f)],這一策略使得表達目的產物的個體具有生長優勢[99-100]。
除了反饋環這一策略外,另一種基于轉錄調控的模塊化手段則采用了非協調前饋環,Segall-Shapiro 等[101]通過對iFFL 模體的分析,指出當iFFL 模體中阻遏蛋白無協同效應時,穩態下模體的輸出將為一個常數而不依賴基因的拷貝數、細胞生長速度,通過這一簡單的策略,可以使基因在不同拷貝數下實現穩定表達[圖3(g)]。
過去20 年來,合成生物學領域涌現出了大量創造性的工作,從復雜而精巧的邏輯門回路,到多功能生物活性材料,乃至藥物、化工產品的生物合成,都證明了利用合成生物學理論、方法的可行性;同時,利用合成基因回路,通過自上而下的手段,擾動生命體系,總結規律,這樣一種“建物致知”的研究范式,讓我們對生命的基本運行法則有了更加深入的認識。合成基因回路從實驗室走出來,進入到工業大規模應用,必須要能夠適應更多的遺傳背景迥異的底盤細胞,以及更加復雜多變的使用環境。然而,由于對底盤細胞缺乏更系統的認識,導致更為復雜的人工生命系統的開發工作效率低下。
本文總結了近年來底盤細胞生理、底盤細胞之間相互耦合機制的研究進展,以及避免因耦合引起的基因回路失效等方面的策略。誠然,生命系統的復雜遠遠超出了我們的想象,掌握生命運行的基本規律是我們理性化設計基因回路的根基。目前,我們已經對合成生命體系的穩態行為有了較為全面的認識。然而,生物定量手段的匱乏、底盤細胞生理機制的空白、優質的生物元件庫的缺乏仍然是限制人類實現完全自下而上設計生命體的瓶頸,未來,我們應當更加注重于以下幾個方面的研究:
(1)開發更加精準、高通量的定量手段,利用多層次的組學技術,為定量刻畫底盤細胞-基因回路相互作用機制提供更加可靠、全面的數據。生命系統是一個非線性復雜系統,精準的定量有助于研究這一充滿噪聲的系統,找到隱藏在“平均數”后的復雜機制。
(2)更加系統、定量化的底盤細胞生理研究,理清底盤細胞在各種條件下(如逆境、非穩態)的資源調控機制,擴大的底盤細胞研究種類。在真實應用場景下,不論是發酵生產還是疾病治療,基因線路不可避免地經歷外界環境變化,因此,在亞穩態下,基因回路行為遵循的規律是回路設計能力提升繞不開的門檻。
(3)挖掘、定量、優化更多的正交基因調控元件,闡明不同遺傳背景的底盤細胞基因元件的性能。隨著合成回路的規模日益龐大,高質量的正交元件可以減少回路邏輯網絡中意外產生的拓撲結構,提高回路的可預測性。
(4)建立更加精準的模型預測框架,包括:將底盤細胞與回路的模型描述整合在一起,結合高質量定量數據,將非穩態狀態下的行為納入到模型的模擬范疇中,增強基因回路行為的可預測性;從DNA 序列生成環節出發,檢查序列組合中隨機產生的功能序列,如DnaA、啟動子、轉錄因子結合序列等。
(5)規避“非預期”的底盤細胞與基因回路相互作用的解決方案,如利用反饋控制機制設計更加模塊化的基因回路。