黃婷,溫賽
(北京工商大學 輕工科學與技術學院,北京,100048)
在臨床醫(yī)學方面,次生代謝衍生藥物已成為治療感染性疾病的基本藥物。其中,非核糖體多肽是新型抗菌劑的來源之一,它們的結(jié)構多樣性使其具有許多生理活性,典型產(chǎn)品包括萬古霉素、環(huán)孢菌素A和達托霉素等。非核糖體多肽的生產(chǎn)者大多是土壤微生物,如革蘭氏陽性放線菌和桿菌的成員,但也有絲狀真菌,最近海洋微生物也成為這類次級代謝物的新的豐富來源。已知負責合成非核糖體多肽的是一種非核糖體肽合成酶(nonribosomal peptide synthetase, NRPS),具有非常大的分子質(zhì)量和多個模塊單元,以重復的、裝配線式的方式催化化學反應,產(chǎn)生次生多肽代謝物。NRPS的每個模塊可以進一步劃分為多個催化域或結(jié)構域[1]。由于NRPS模塊的順序主要反映了肽產(chǎn)物中氨基酸的序列,通過重組其組成模塊和操縱其特異性來重新編程NRPS,為創(chuàng)造新的生物活性化合物提供了一條有希望的途徑。
NRPS系統(tǒng)中模塊的數(shù)量和順序決定了形成的肽段的長度和序列,模塊本身由保守結(jié)構域組成,每個保守結(jié)構域在游離氨基酸結(jié)合到多肽產(chǎn)物的循環(huán)中催化特定的反應步驟。一個典型的非核糖體肽合成酶模塊通常含有腺苷化 (adenylation,A)結(jié)構域、縮合(condensation,C)結(jié)構域和硫酯化(thiolation,T)結(jié)構域。終止模塊通常為硫酯酶(thioesterase,TE)結(jié)構域,負責終止上載氨基酸并且水解釋放或者環(huán)化多肽鏈。腺苷化結(jié)構域按其選擇性識別并激活氨基酸生成氨基酰-AMP,隨后結(jié)合到硫酯化結(jié)構域上,縮合結(jié)構域?qū)⑸嫌味嚯逆満拖掠问荏w底物縮合生成肽鍵。該過程按照NRPS模塊排列順序,特異性上載氨基酸使肽鏈延長,最終由硫酯酶結(jié)構域釋放鏈狀或環(huán)狀多肽。非核糖體肽合成酶還含有多種修飾結(jié)構域、包括甲基化(methylation,MT)結(jié)構域、縮合環(huán)化結(jié)構域(cyclization,Cy)、差向異構化(epimerization,E)結(jié)構域和氧化(oxidation,Ox)結(jié)構域等。在大多數(shù)真菌中,一個產(chǎn)生目標產(chǎn)物的NRPS既可以是一條多肽鏈,也可以由幾個相互作用的亞基(每個亞基也稱為NRPS)組成[2](圖1)。

圖1 非核糖體肽合成酶組裝合成機制
根據(jù)其生物合成邏輯,已知的NRPS系統(tǒng)可分為三類:線性(A型)、迭代(B型)和非線性(C型)[3](圖2)。線性NRPS模塊的數(shù)量與多肽產(chǎn)物中加入的氨基酸單體數(shù)量相對應,產(chǎn)物的氨基酸序列與模塊上載氨基酸特異性一致[4]。迭代NRPS在單個產(chǎn)物的組裝中重復使用它的模塊或結(jié)構域,這種策略被用來建立由重復的小序列組成的肽鏈[5]。非線性NRPS模塊排列則并不按照熟知的順序排列,通常伴隨著一些不同尋常的內(nèi)部環(huán)化結(jié)構域或其他修飾結(jié)構域[6]。

a-線性(A型)NRPS系統(tǒng);b-迭代(B型)NRPS系統(tǒng); c-非線性(C型)NRPS系統(tǒng)

圖3 Adenylierung單個NRPS模塊立體結(jié)構
A結(jié)構域是NRPS特異選擇性上載氨基酸的關鍵部位,因此成為研究熱點。目前科研人員已經(jīng)開發(fā)了許多基于序列相似性來預測腺苷化結(jié)構域特異性的方法,BAUNACH等[8]在DNA水平上主要針對A結(jié)構域進行分析,比較了序列之間每個位點的平均核苷酸差異數(shù),發(fā)現(xiàn)A結(jié)構域重組似乎有助于實現(xiàn)產(chǎn)物多樣化,在更復雜的重組中,多重重組事件促進了NRPS基因的多樣化。有學者將能夠合成假單胞鐵載體(pyoverdine)的NRPS中原11位特異性為Thr的C-A模塊替換為特異性為Lys的C-A模塊,產(chǎn)物生成了11位為賴氨酸的假單胞鐵載體,因此發(fā)現(xiàn)了C-A模塊的替換可以改變上載氨基酸的特異性;實驗人員發(fā)現(xiàn)其NRPS第8個模塊(Pa8)和第11個模塊(Pa11)縮合(condensation,C)結(jié)構域氨基酸序列幾乎是平行的(附圖1-a,https://doi.org/10.13995/j.cnki.11-1802/ts.035832),隨后將C結(jié)構域中3個區(qū)域進行重組,產(chǎn)生8種可能的組合(附圖1-b),然后將每個重組的C結(jié)構域引入到pvdD基因結(jié)構體中,對8種組合產(chǎn)物進行進化分析,發(fā)現(xiàn)除了重組的C結(jié)構域KKT外,包含Pa11 3區(qū)域的C結(jié)構域與Pa11 A結(jié)構域的關系更為活躍,包含Pa8 3區(qū)域的C結(jié)構域與Pa8 A結(jié)構域的關系更為活躍,說明區(qū)域3是與A結(jié)構域連接的關鍵,為了縮小關鍵底物的范圍,實驗人員將Thr特異性模塊Pa11 C域內(nèi)的近端殘基簇用Pa8中相應的殘基取代,C結(jié)構域的修改對pyoverdine的生產(chǎn)幾乎沒有影響(附圖1-c,https://doi.org/10.13995/j.cnki.11-1802/ts.035832),然而,將Pa11連接區(qū)域改變?yōu)镻a8連接區(qū)域,發(fā)現(xiàn)原生的PvdD C結(jié)構域與Pa8的A結(jié)構域一起有效地發(fā)揮作用,這個結(jié)果表明非核糖體多肽差異主要是由A“核心”結(jié)構域或“亞”結(jié)構域的重組驅(qū)動的,而非C結(jié)構域[9]。這展示了直接和自然進化研究的證據(jù),表明新的非核糖體多肽可以僅通過替換A結(jié)構域生成。
因此,理論上通過預測NRPS中所有A結(jié)構域的底物特異性,可以確定NRPS多肽產(chǎn)物的所有氨基酸構建順序。在具體的實驗操作中,有實驗人員通過對A結(jié)構域進行基因突變,或?qū)結(jié)構域進行交換成功改變了A結(jié)構域特異性[10-11]。LEE等[12]對NRPS的A結(jié)構域進行了虛擬篩選,結(jié)果表明,A結(jié)構域的一個關鍵的保守芳香殘基的構象對于底物富集有顯著影響。當前評估NRPS中A結(jié)構域底物特異性的標準方法是ATP-[32P]PPi交換實驗,但是由于其操作麻煩,HARA等[13]創(chuàng)建了一種新的檢測方法比ATP-[32P]PPi交換實驗更加方便易操作,該方法利用氨酰-AMP(aminoacyl-AMP)與羥胺(hydroxylamine)形成羥肟酸(hydroxamate),在鐵離子存在情況下,羥肟酸和鐵離子會形成亮紫色復合物,以此方便進行觀察。
研究人員通過在NRPS腺苷化結(jié)構域的結(jié)合袋中引入單個或聯(lián)合點突變,可以將非天然氨基酸摻入非核糖體多肽中,或使所需產(chǎn)品成為改造后NRPS系統(tǒng)的主要或唯一產(chǎn)品。有文獻報道了第二個A結(jié)構域被設計用于引入含氮氨基酸衍生物的例子。在該研究中,A結(jié)構域具有同時識別2種不同的氨基酸Arg和Tyr的能力,推測3個位點(E204、S243、A307)的氨基酸突變可導致A結(jié)構域?qū)yr特異性發(fā)生變化,試驗中,在307位的19個點突變中,只有4個突變體是有活性的;對243位突變,在19個含有大量非極性側(cè)鏈氨基酸的突變中產(chǎn)生了15個具有活性的突變,且其A結(jié)構域再次選擇Tyr而不是Arg[14]。因此,許多研究證據(jù)表明,自然界中發(fā)現(xiàn)的大量非核糖體多肽生物合成途徑是通過點突變、遺傳復制、刪除和插入事件進化而來的。
通常研究NRPS的A結(jié)構域都是在微生物體內(nèi)進行,但是最近有文獻報道,可以通過非核糖體肽合成酶的A結(jié)構域可以在體外合成二肽[15]。此外,在一些情況下A結(jié)構域可以上載D型氨基酸。有研究人員實驗發(fā)現(xiàn)以D型氨基酸作為底物,在體外合成二肽時,A結(jié)構域也可以順利上載D型氨基酸[16]。研究人員還發(fā)現(xiàn)多數(shù)情況下,異源表達A結(jié)構域并在胞外使用A結(jié)構域合成二肽時,會出現(xiàn)選擇性上載結(jié)構相似的不同氨基酸的情況,利用這一發(fā)現(xiàn)也成功使用A結(jié)構域在體外合成了阿斯巴甜[17]。
T結(jié)構域在NRPS的功能中起著核心作用,不僅與A結(jié)構域相互作用,還與肽鍵形成、肽修飾或肽釋放中涉及的其他催化結(jié)構域相互作用。在一個完整的NRPS體系中,T結(jié)構域?qū)⑸嫌蜛結(jié)構域上載的氨基酸殘基或多肽鏈轉(zhuǎn)運到下游C結(jié)構域上,也可以將氨基酸或多肽鏈呈現(xiàn)給內(nèi)部修飾酶,如鹵素酶、轉(zhuǎn)移酶或單加氧酶[18]。CALCOTT等[19]為研究重組假單胞鐵載體非核糖體肽合成酶的T結(jié)構域可移植性,如附圖2(https://doi.org/10.13995/j.cnki.11-1802/ts.035832)所示,將18例不同T結(jié)構域移植到各自C結(jié)構域的上游,其中6例的T結(jié)構域位于C結(jié)構域的上游(記為TC),4例T結(jié)構域位于E結(jié)構域的上游(記為TE),4例T結(jié)構域位于TE結(jié)構域上游(記為TTE),4例T結(jié)構域位于2個亞型之間(記為TCT)。將18種替換后的菌株在平板上培養(yǎng),觀察熒光可知引入TC的假單胞鐵載體的產(chǎn)量與野生型幾乎沒有差別,其余3種替換均各有一株沒有產(chǎn)生熒光;并且通過MALDI-TOF質(zhì)譜確認了每個菌株產(chǎn)生的假單胞鐵載體的同一性。因此可知T結(jié)構域通??梢杂行У嘏c非相鄰的C結(jié)構域相互作用。但此前也有其他實驗證明,在C域上游的T域,如果置于E域或TE域的上游,通常不能正常工作[20-21]。因此T-C結(jié)構域的接頭處和T-TE結(jié)構域接頭處值得深入探究。例如,有研究人員擴增編碼Plipastatin合成酶的第7 T結(jié)構域、第8 T結(jié)構域(含有天然的T-C接頭)與TE結(jié)構域重組,研究發(fā)現(xiàn)產(chǎn)物均與Plipastatin無關,但當保留T-TE的連接部分進行模塊拼接時,產(chǎn)物中檢測出活性物質(zhì),因此在實驗中進行模塊拼接時,T-TE的連接部分必須保持完整[22]。綜上,在T結(jié)構域與其他結(jié)構域接口處尚需深入研究。
C結(jié)構域通常是NRPS模塊中的第一個結(jié)構域,將供體酰基鏈與受體氨基酸縮合,起著肽鏈延伸的作用,而近期有報道發(fā)現(xiàn)C結(jié)構域可以在NRPS合成多肽時催化內(nèi)部環(huán)化[23]。因此除了少數(shù)例外,NRPS的啟動模塊通常缺乏C結(jié)構域。目前在C結(jié)構域中發(fā)現(xiàn)一段保守的HHXXXDG蛋白質(zhì)序列[24],對于C結(jié)構域的功能研究意義重大。在這個保守基序中第2個氨基酸被認為是催化反應的關鍵[25]。有實驗佐證了這一觀點,SAMEL等[26]將Tyrocidine NRPS模塊TycC中第5個PCP-C結(jié)構域的HHXXXDG序列里第2個氨基酸進行突變,分別突變?yōu)镠AXXXDG和HVXXXDG,在相同的培養(yǎng)條件下,這2個PCP-C突變體既沒有出現(xiàn)肽環(huán)化現(xiàn)象,也沒有出現(xiàn)水解現(xiàn)象,然后對于該基序的第一個氨基酸進行突變,突變?yōu)锳HXXXDG卻顯示出了28%的野生型活性,因此HHxxxDG核心基序中第2個組氨酸(H224)的突變會導致完全失活。最近,在對于NRPS的C結(jié)構域活性位點分析方面也取得了成功,發(fā)現(xiàn)了在C結(jié)構域中2個關鍵突變點和控制?;滈L度的關鍵部位,它們改變了底物對脂肪酰基底物的選擇性[26-27]。
雖然含有底物結(jié)合位點的A結(jié)構域是NRPS的主要特異性決定因素,但C結(jié)構域也可以表現(xiàn)出特異性,因此在考慮模塊重組時,需要同時考慮C、A結(jié)構域和C-A連接的完整,BOZHüYüK等[28]對于NRPS模塊組裝形式提出了一個概念:exchange units(XUs),使用這個XU概念(A-T-C或A-T-C/E)得到了一個對NRPS的研究新方法。他們對合成Ambactin、Kolossin、Xenoamicin和GameXPeptide的非核糖體肽合成酶分別進行重新組裝,發(fā)現(xiàn)當以XU為單位進行完整替換的話,可以產(chǎn)生目的產(chǎn)物并且達到野生型產(chǎn)量的50%及以上。但值得注意的是,在所有的替換中發(fā)現(xiàn)替換后的產(chǎn)量與原始相比均會有所下降,而且替換的模塊越多產(chǎn)量越低。XU概念還具有一定的使用限制性:在模塊替換時必須保證替換模塊的氨基酸特異性必須與原模塊的氨基酸特異性保持一致,例如,原模塊氨基酸特異性為賴氨酸時,替換模塊的氨基酸特異性也必須是賴氨酸。
本文從簡化代表庫、SLAF-seq技術以及基于限制性酶切的簡化基因組測序3方面介紹了簡化基因組測序技術的研究進展,為快速檢測出高密度的SNPs位點,建立高密度遺傳圖譜和分子標記開發(fā)提供參考.
隨后,BOZHüYüK等[29]在上述實驗的基礎上又提出了一個新的概念:exchange unit condensation domain (XUC)。研究人員在實驗中將C-A或C-A-T作為一個整體進行模塊替換時發(fā)現(xiàn)了一個新的融合位點,根據(jù)實驗中拼接的C結(jié)構域序列比對,發(fā)現(xiàn)HHXXXDG序列,實驗中假設該基序附近的4個氨基酸(Gln267-ala270)的Gln267和Ser268可能是一個理想的融合位點,以此位點進行C結(jié)構域的融合得以實現(xiàn)多肽的高效生產(chǎn)、甚至建立肽庫。此外,研究人員將來自于PhotorhabdusluminescensTT01NRPS亞基GxpS的XUC1和亞基XtpS的XUC1進行替換后發(fā)現(xiàn)原始GxpS的產(chǎn)物沒有出現(xiàn),而出現(xiàn)了其他的新產(chǎn)物,以此證明XUC概念還可以改變產(chǎn)物特異性。與XU概念相比,XUC概念在不同屬的模塊之間是不兼容的,即必須來自同一屬的XUC模塊進行組合。例如文中的GxpS來自于PhotorhabdusluminescensTT01,其替換模塊均來自于Bacillus或僅僅來自Photorhabdus/Xenorhabdus。因此,根據(jù)XU和XUC概念,實驗中可以有效進行模塊的同源重組,產(chǎn)生特異的非核糖體多肽。這2個實驗也為后續(xù)NRPS研究提供重要參考,通過模塊拼接產(chǎn)生新的產(chǎn)物,可能會產(chǎn)生對人類健康有益的多肽產(chǎn)品。
TE結(jié)構域處于裝配過程的末端,負責催化NRPS釋放完整的肽鏈。在一些情況下,硫酯酶結(jié)構域也可以作為一個大的環(huán)化酶,是這類天然產(chǎn)物實現(xiàn)結(jié)構多樣性和生物活性的重要手段。在NRPS流水線上,TE結(jié)構域被分成兩類:TE I和TE Ⅱ,其中I型TE結(jié)構域通常是最后一個NRPS模塊的最后一個結(jié)構域,而Ⅱ型TE結(jié)構域是獨立的酶,識別錯誤裝載[18]。在TE Ⅱ結(jié)構域中存在著一個保守氨基酸序列:GHSXG,有效保證TE Ⅱ結(jié)構域具有生物活性[30-32]。短桿菌肽S(GS)的生物合成簇GrsA的A結(jié)構域可以上載L-Phe和D-Phe,T結(jié)構域上L-Phe和D-Phe均存在,而GrsB1的C結(jié)構域?qū)-Phe具有立體選擇性。GrsA中的E結(jié)構域可以將A結(jié)構域上載的L-Phe異構化為D-Phe,因此當GrsA的E結(jié)構域被滅活、L-Phe在T域累積時,GrsB1 的C結(jié)構域這種立體選擇性阻礙了二肽的形成。
多年來,科學家們對于TE結(jié)構域的重組能力進行了深入的研究。SCHWARZER等[33]將雜合NRPS(由短桿菌素NRPS亞基TycA和ProCAT組成)與來源不同且催化終止模式不同的6種TE結(jié)構域融合組成雙模型重組NRPS,并檢測TE結(jié)構域在產(chǎn)物釋放方面的活性,發(fā)現(xiàn)異源NRPS中的TE結(jié)構域可用于構建雜合NRPS。TE結(jié)構域固有的特異性和區(qū)域選擇性可能導致其他有助于產(chǎn)生結(jié)構多樣性的終止模式,并且發(fā)現(xiàn)重組來源不同的TE結(jié)構域,其活性與原生系統(tǒng)的活性基本一致。可見TE結(jié)構域重組可以比較順利地進行。
GAO等[22]在實驗中發(fā)現(xiàn)Plipastatin合成酶TE結(jié)構域的缺失導致酶的合成被截斷,不能產(chǎn)生相應的肽;隨后,將Plipastatin合成酶的linker-TE結(jié)構域前移,產(chǎn)物中不僅檢測到了預期的線性多肽,而且還檢測到了線性和環(huán)狀八肽,并評估這種變化對體內(nèi)截短的活性類似物產(chǎn)生的影響,發(fā)現(xiàn)只有使用完整linker-TE(即天然的T-TE連接子)與之前的模塊結(jié)合,才能誘導TE結(jié)構域催化雜化肽合成酶中成熟的線性多肽的水解釋放,并且發(fā)現(xiàn)TE結(jié)構域原本的功能可能在重組后產(chǎn)生新的變化,例如:原本釋放環(huán)化產(chǎn)物,在重組后釋放線性產(chǎn)物。所以在重組NRPS的時候,T-TE結(jié)構域連接處保持完整對于重組NRPS具有重要意義。
根據(jù)序列分析研究,可知NRPS機制的進化是由常規(guī)遺傳和水平基因轉(zhuǎn)移共同驅(qū)動的。細菌中NRPS基因簇的出現(xiàn)頻率更高,它們多見于細菌中的變形菌門、放線菌門、厚壁菌門、藍藻門和真菌中的子囊菌門[34]。這些NRPS基因簇大多得到了此前未知的最終產(chǎn)物,這凸顯了基因組挖掘在識別次級代謝產(chǎn)物生物合成的新遺傳機制方面的威力。對NRPS進行了多年的研究后,科學家們也開始嘗試研究NRPS整體的合成機制,而不僅僅研究某一個結(jié)構域的表現(xiàn)。然而,NRPS復雜的蛋白與蛋白質(zhì)之間的相互作用給工程設計帶來了挑戰(zhàn),因此NRPS系統(tǒng)的改造生產(chǎn)新的衍生物或天然產(chǎn)物,不僅需要有效的修飾催化結(jié)構域[28, 35],可能還需要考慮模塊與模塊之間的相互作用。這些研究通常集中于利用NRPS的模塊重組產(chǎn)生新的產(chǎn)物,在模塊連接處進行處理,增加或減少模塊研究對于產(chǎn)物的影響等。
NRPS模塊結(jié)構本身和這些重復功能單元中的結(jié)構域排列指向了一個產(chǎn)生新脂肽的策略,即如何通過模塊或結(jié)構域替換來設計現(xiàn)有的NRPS來生產(chǎn)改變的肽,或者如何設計全新的酶系統(tǒng)來合成新的肽。通過與完整模塊交換來創(chuàng)建混合NRPS需要在最保守的域序列中選擇融合點,因為這些融合點在模塊和模塊之間高度相似。根據(jù)這個思路,研究人員等研究了土曲霉(Aspergillusterreus)幾個類似的NRPS模塊(ApvA、MelA、BtyA、AtrA、PgnA、AstA、AtqA),其模塊組成均為A-T-TE,然后將這些模塊中的A結(jié)構域,T結(jié)構域和TE結(jié)構域按照A-T-TE順序重組,比如將ApvA的A-T和AstA的TE結(jié)構域重組,AstA的A結(jié)構域和ApvA的T-TE重組,共獲得了24種構造,轉(zhuǎn)化進酵母培養(yǎng)表達后,產(chǎn)生了10種活性產(chǎn)物[36]??蒲腥藛T替換A54145的E結(jié)構域也導致了新的類似物的形成,說明總的模塊替換(C-A-T-E)是可行的,但同時這一改變導致產(chǎn)品的產(chǎn)量明顯低于原生型,所以保持模塊與模塊之間形成的連接區(qū)域的完整性對產(chǎn)物活性是至關重要的[37]。有實驗人員在銅綠假單胞菌體內(nèi)生產(chǎn)新型鐵載體(pyoverdine)衍生物時,僅僅通過替換A結(jié)構域或C結(jié)構域,用這種結(jié)構域替換來產(chǎn)生新的產(chǎn)物[38]。腸桿菌素(enterobactin)和弧菌素(vibriobactin)是由NRPS合成的非核糖體多肽。大腸桿菌中合成腸桿菌素的合成關鍵模塊為entA、entB、entC、entD、entE,霍亂弧菌(Vibriocholerae)中合成弧菌素的合成關鍵模塊為vibF和vibH。而普城沙雷菌(Serratiaplymuthica)V4中用于產(chǎn)生塞拉提奧切林(serratiochelin)的合成關鍵模塊schA、schB、schC、schE,schG與entABCDE具有同源性,schF1F2F3與vibF具有同源性,schH與vibH同源,實驗人員將能夠合成serratiochelin的schABCEGF1F2F3H克隆到pDSW204質(zhì)粒中,發(fā)現(xiàn)在大腸桿菌中無法表達,為解決這一問題,實驗人員利用大腸桿菌和霍亂弧菌中與S.plymuthicaV4同源的基因替換產(chǎn)生serratiochelin的基因(entA替換schA,entB替換schB,以此規(guī)律一一替換),構建了合成serratiochelin的替代途徑,純化后的上清液中檢測到了serratiochelin。在這個路徑中,同源基因替換生物合成基因,從而成功地實現(xiàn)了異源NRP的表達[39]。
在模塊替換實驗中,可以通過模塊排列預測產(chǎn)物的氨基酸序列,從而預測產(chǎn)物性能,然而工程天然產(chǎn)物途徑往往會產(chǎn)生不佳的結(jié)果,部分原因是計算模型預測和實際分子表達功能的途徑不能完美對應匹配上。在實驗操作中,完全從頭設計新NRPS和異源表達培養(yǎng)條件都需要精確地考量。多數(shù)情況下,試圖改變條件以產(chǎn)生新產(chǎn)物或異源表達條件不夠精準都會導致生產(chǎn)完全停止。
由于非核糖體多肽的氨基酸序列受單個NRPS模塊的順序控制,改變多肽序列的最有效的策略是替換或改變這些NRPS多聚體結(jié)構。這種方法遇到的一個問題:即使對模塊結(jié)構做很小的改變,也會影響其蛋白質(zhì)的折疊和蛋白質(zhì)之間的相互作用。直接的模塊替換會干擾這些模塊之間的連接,阻止域/模塊的關聯(lián),會導致其失活。因此,模塊與模塊之間如何拼接顯得至關重要。
NRPS亞基之間的非共價相互作用是由特異的N末端和C末端對接結(jié)構域(docking domains,DDS)所介導的(附圖3-a,https://doi.org/10.13995/j.cnki.11-1802/ts.035832),在合成短桿菌素(tyrocidin)和表面活性劑(surfactin)的NRPS系統(tǒng)中提供肽基的NRPS的C端記為CDD(約25個氨基酸),接受肽基的NRPS的N端記為NDD(約14個氨基酸)[40]。實驗人員從XenorhabdusstockiaeKJ12.1中提取橫紋肌肽/異質(zhì)肽樣肽NRPS(Kj12A、Kj12B、Kj12C),對NRPS的Kj12A、Kj12B、Kj12C中的3個NDD和2個CDD進行了研究。通過異核單量子相關(heteronuclear singular quantum correlation,HSQC)實驗和等溫滴定法(isothermal titration colarimetry,ITC)實驗滴定發(fā)現(xiàn)3個NDD均與CDD相互作用,CDD多肽在滴定逐漸添加的過程中出現(xiàn)不同程度的化學位移和峰增寬現(xiàn)象,其中β1和β2被認為是NDD和CDD對接結(jié)構域上的關鍵氨基酸序列(附圖3-b,附圖3-c,https://doi.org/10.13995/j.cnki.11-1802/ts.035832),NDD和CDD對接結(jié)構域的形成依賴兩分子間β1和β2的折疊;實驗人員還重組了融合到T域上的Kj12BCDD 和全長Kj12C模塊;ITC實驗表明,Kj12B T域的存在并不影響Kj12BCDD對Kj12CNDD的親和力,因此可以通過調(diào)節(jié)模塊兩分子之間DDs的形成來影響對接結(jié)構域之間的相互作用,進而影響NRPS模塊之間的相互作用[36]。研究表明,CDD和NDD通過它們之間的DDs或通信中介域(communication-mediating,COM)進行配對[40]。實驗人員通過比較Tyrocidin A和Surfactinlike NRPS的COM結(jié)構域,在體外構建了一個“通用COM系統(tǒng)”,使得不同生物合成系統(tǒng)之間的酶相互作用,促進了不同肽的合成[41-42]。對CDD和NDD上關鍵氨基酸進行突變,可發(fā)現(xiàn)產(chǎn)物出現(xiàn)不同的多肽,說明這些DDs突變導致上載氨基酸特異性發(fā)生了改變,即蛋白質(zhì)對底物親和力改變[36]。除了模塊之間的CDD和NDD被報道外,E結(jié)構域到C結(jié)構域,T結(jié)構域到環(huán)化(cyclisation,Cyc)結(jié)構域的模塊域接口也已經(jīng)被發(fā)現(xiàn)[37-38]。
多亞基非核糖體肽合成酶(NRPS)的相互作用是由對接域介導的,以確保亞基與亞基之間正確相互作用。KEGLER等[43]具體研究了嗜線蟲致病桿菌(X.bovienii.)的xefoampeptide(XFP)NRPS合成簇XfpS,將其分為XfpS1、XfpS2、XfpS3亞基。他們在XfpS1的E結(jié)構域和XfpS2的C結(jié)構域中間插入來自Taxlllaik的NRPS的DD對,在XfpS2的T結(jié)構域和XfpS3的C結(jié)構域中間插入同源基因簇paxABC的DD對,或同時插入2組DD對,將其終產(chǎn)物產(chǎn)量與野生型比較,發(fā)現(xiàn)通過DD對連接的基因簇均有活性。但是當進行缺少CDD、缺少NDD和同時缺少CDD和NDD的3組對照實驗時,在E結(jié)構域和C結(jié)構域之間:單獨缺少CDD時產(chǎn)量變化不大,但是缺少NDD和同時缺少CDD和NDD時產(chǎn)量急劇下降;在T結(jié)構域和C結(jié)構域之間:缺少CDD導致DD對功能受損,從而使產(chǎn)量下降;在同時插入2組DD對時產(chǎn)物產(chǎn)量均明顯少于野生型[43]。因此可知,DD對在連接T結(jié)構域和C結(jié)構域時更加重要。
模塊與模塊間拼接的研究除了依靠N端與C端的對接結(jié)構域介導,前文介紹的XU和XUC概念以外,還有其他的拼接方式。合成生物學工具包含了許多用于調(diào)節(jié)轉(zhuǎn)錄和翻譯的,但很少有用來控制蛋白質(zhì)關聯(lián)的。有科學家報道了22個被叫做SYNZIPs的特異性合成卷曲肽(SZs),對其SZs的寡聚態(tài)、螺旋取向和親和性進行了生物物理分析,認為SZs極大地增加了合成生物學中可用的蛋白質(zhì)相互作用部件的數(shù)量,這將促進分子工程的廣泛應用[39]。實驗中,研究人員設計了與人類bZIP轉(zhuǎn)錄因子區(qū)相互作用的合成肽,這些設計的肽段長度為35~54個氨基酸,與bZIP亮氨酸拉鏈的氨基酸組成特征相同[44]。將這種設計進行應用延伸,SZs是通過前述計算和設計的合成肽,科研人員插入SZs將單個蛋白NRPSs分裂成獨立表達和翻譯的多肽鏈,在引入SZs之前,必須滿足野生型C-A結(jié)構域間連接子設定的距離標準,以確保正確的C-A雙結(jié)構域接觸。實驗人員通過重組XtpS、GxpS、RtpS、和Szentiamide合成酶的構建塊,生成并共表達了4組合成的NRPS,提供了簡單快速的組合不同NRPS亞基構建肽庫方法[45]。近年來,人們成功地將SZs應用于PKS中,以取代天然存在的DDs作為工具來創(chuàng)建嵌合的PKS[46]。
實驗操作時,有多種基于分子生物學的可用于重塑基因組以促進天然產(chǎn)物生物合成方法,如上調(diào)正調(diào)控基因的表達、下調(diào)負調(diào)控基因的表達、刪除非靶基因簇等。
丁烯基殺菌素(butenyl-spinosyn)是由須糖多孢菌(Saccharopolysporapogona)生產(chǎn)的一種很有前途的生物農(nóng)藥,具有更強的殺蟲活性和更廣泛的殺蟲光譜。有學者有效地刪除了須糖多孢菌中一個負責phthoxazolin生物合成的NRPS-T1PKS雜合簇(~20 kb),使得突變體對數(shù)期延長,生物量增加;缺少phthoxazolin合成基因簇,抑制了除丁烯基殺菌素之外的其他產(chǎn)物的生產(chǎn)路徑,在相同條件下,該菌株比野生型菌株需要更多的時間(240 h)來完成葡萄糖消耗,所以導致葡萄糖消耗率降低,因此丁烯基殺菌素產(chǎn)量比野生型菌株提高了4.72倍[47]。因此在進行NRPS產(chǎn)物研究時,可以通過刪除其他次生代謝產(chǎn)物合成基因簇,減少葡萄糖等營養(yǎng)成分的消耗,讓反應集中于目的產(chǎn)物途徑,來進一步促進目的產(chǎn)物的產(chǎn)生。
有實驗證明,刪除或突變核心結(jié)構形成的關鍵氨基酸會完全破壞酶的活性[48]。TAYLOR等[49]對含有定向突變的非核糖體肽合成酶基因Tex7的青木霉進行定性研究時,觀察到一種未知化合物異常大量的出現(xiàn),并且鑒定出該化合物為七萜酸,研究后發(fā)現(xiàn)是Tex7的突變導致了大量具有生物活性的抗癌化合物七萜酸的積累。這為在生產(chǎn)中提高目的產(chǎn)物產(chǎn)量提供了思路,但刪除模塊后導致NRPS活性的變化,還需要更為深入的研究。
從植物、真菌和細菌中獲得的天然產(chǎn)物通過治療諸如癌癥和細菌感染之類的疑難疾病延長了人類的預期壽命并提高了生活質(zhì)量。許多PKs和NRPS合成的聚酮、聚肽和聚酮-聚肽雜合的天然產(chǎn)物已作為臨床藥物使用。

表1 來自于NRPS用于臨床治療疾病的天然產(chǎn)物Table 1 Natural products from NRPS for the clinical treatment of diseases
實驗中可以通過編碼基因的基因工程操縱NRPS,生物合成具有潛在作用的變種的知名藥物,甚至完全新的產(chǎn)品[51-52]。托霉素是一種典型的由NRPS合成的環(huán)脂肽類抗生素,A54145是一種具有抗革蘭氏陽性病原菌活性的環(huán)狀脂肽抗生素,兩者分子結(jié)構具有許多相似之處,有實驗將用達托霉素的NRPS模塊替換了A54145的NRPS模塊,產(chǎn)生了新的脂肽,并且發(fā)現(xiàn)該新脂肽在牛表面活性劑存在的情況下表現(xiàn)出良好的抑菌活性,并且對肺炎鏈球菌表現(xiàn)出低抑菌性[53]。
微生物是許多用于癌癥治療的化學療法的來源,其中放線菌是最有希望的來源生物。DHANEESHA等[54]從北極峽灣沉積物中分離出的海洋放線菌進行了潛在的抗癌活性篩選,擴增的PKs和NRPS參與次生代謝產(chǎn)物的產(chǎn)生,與鏈霉菌已知生物合成基因的相似性僅為82%,表明該提取物可能產(chǎn)生一種新的次生代謝產(chǎn)物。利用LC-MS/MS分子網(wǎng)絡進行化學解離的努力表明存在一系列未描述的四烯多元醇,它對NCIH460細胞具有最強的生長抑制作用。這些結(jié)果表明,北極蒿屬S.Artemisiae菌株MCCB 248是一個有希望的天然產(chǎn)物藥物發(fā)現(xiàn)和基因組挖掘潛在抗癌藥物的候選株。
asperphenamate是一種小肽類天然產(chǎn)物,因其抗腫瘤活性而備受關注。最近的研究還表明它是一種潛在的神經(jīng)炎癥抑制劑,并具有抗HIV和抗糖尿病的特性。SUBKO等[55]對已知和新的asperphenamate類似物進行解離。結(jié)果發(fā)現(xiàn)22種新的阿斯奮乃酯用HRMS/MS對類似物進行了表征,其中21個是用蛋白源和非蛋白源氨基酸作為生長培養(yǎng)基的補充設計的。
抗生素耐藥性的蔓延對公共健康構成嚴重威脅,預計到2050年將達到驚人的水平,因此開發(fā)過程中新抗菌藥物迫在眉睫。非核糖體肽合成酶在底物可用性的基礎上具有非凡的靈活性,因此有可能在絲狀真菌中操縱和設計新的肽天然抗菌產(chǎn)物。在放線桿菌屬中有一個很少被探索的成員,科學家通過對88個本屬分離物提取物的分析,確定了一個由C20聚酮鏈?;沫h(huán)肽家族,將其命名為別肽霉素。別肽霉素的生物合成基因簇中含有3個非核糖體肽合成酶模塊,由此發(fā)現(xiàn)了一種新的抗菌肽是由PKS-NRPS產(chǎn)生的。在尋找具有抗菌活性的新陳代謝物時,必須采用創(chuàng)新的方法來增加從微生物來源發(fā)現(xiàn)新化學物質(zhì)的可能性[56]。
目前,NRPS生物合成途徑被認為是天然產(chǎn)物新類似物的豐富來源,是獲得具有藥物活性的天然產(chǎn)物的一種經(jīng)濟可行的方法。已經(jīng)有許多報道,結(jié)構域或模塊替換和誘變實驗成功開發(fā)NRPS功能。然而,這些設計的NRPS往往比它們的野生型效率低得多,因此,這些酶系統(tǒng)的復雜機制需要進一步深入研究。NRPS的高度動態(tài)結(jié)構和復雜的蛋白與蛋白相互作用給工程設計帶來了挑戰(zhàn),另一個障礙是NRPS蛋白的巨大尺寸阻礙了異源表達。由于多種因素的影響,獲取NRPS結(jié)構域相互作用的結(jié)構信息并將其完全應用于NRPS工程仍然具有挑戰(zhàn)性。本文通過對NRPS結(jié)構域以及NRPS模塊改造策略的探討,將有助于通過合理的工程化努力,實現(xiàn)擴大NRPS生物合成產(chǎn)品的多樣性。
實驗中,對NRPS的改造工程進展并不迅速,很多實驗結(jié)果表明相同的方法并不一定適用于所有案例。如何重新編程非核糖體肽合成酶,同時保持與野生型酶相同的活性,似乎還需要深入挖掘。值得期待的是,在過去的幾年中合成生物學有了一些顯著的發(fā)展,這些發(fā)展有可能加快NRPS工程化改造的進程,創(chuàng)建和優(yōu)化多種新的NRPS裝配線。不斷降低的基因合成成本,新的組裝和編輯技術可以比傳統(tǒng)基因技術產(chǎn)生和檢測更多的突變和重組NRPS結(jié)構。如果這些進展被充分利用,NRPS結(jié)構的規(guī)則將變得更加容易理解,最終可能產(chǎn)生完全人為理性設計的非核糖體多肽。

a-Pa11和Pa8的C結(jié)構域的氨基酸序列比對;b-8種C結(jié)構域重組示意圖;c-通過測量相對于野生型綠膿菌在400 nm處的吸光度來評估 由來自b的變體pvdD基因轉(zhuǎn)化的pvdD缺失菌株的綠膿菌熒光素生產(chǎn)。

a-將18例不同T結(jié)構域移植到各自C結(jié)構域的上游;b-6個TC(藍色)、4個TCT(紅色)、4個TE(綠色)和4個TTE(紫色)的 位置和編號由彩色編碼的陰影框表示