楊新宇,朱彤,李瑞峰,吳邊
(1 中國科學院微生物研究所,中國科學院微生物生理與代謝工程重點實驗室,微生物資源前期開發國家重點實驗室,北京 100101;2 中國科學院大學生命科學學院,北京 100049)
自20 世紀20 年代人類發現胰島素以來,蛋白多肽類藥物在體液調節、抗菌、抗炎、抗病毒及抗腫瘤等臨床應用方面的重要性愈加顯著[1-3]。截至2017年,全世界已有60多種多肽類藥物獲批上市,并以平均每年1種的速度持續增長[4-5]。雖然以重組表達為代表的現代分子生物學技術能夠高效生產重組蛋白且可摻入個別非天然氨基酸,但難以合成含有多種非天然氨基酸的人工設計多肽與蛋白質[6-7]。目前多肽固相合成法仍是便捷獲取非天然多肽的主要途徑,然而該方法能夠合成的多肽長度一般限于30~50個氨基酸殘基,研究人員需要將多個多肽片段順次拼接從而獲得完整目標蛋白[8-9]。除此之外,許多待研究的多肽或蛋白質分子需要在特定位點連接寡糖鏈、脂類分子、核酸、熒光分子或另一個蛋白質分子等多樣的功能基團。為了降低這些蛋白質的合成難度與成本,研究者采取了半合成策略,即利用化學方法合成一段帶有功能基團的短肽,再將該片段與重組表達的蛋白質連為一體[10-11]。兩段合成多肽的拼接以及蛋白質半合成均極具挑戰,其難點在于需要保證酰胺縮合反應的區域選擇性,同時必須抑制末端氨基酸殘基的外消旋化副反應[12]。因此,探索具有嚴格區域選擇性且盡可能避免外消旋的多肽拼接方法成為了蛋白質化學合成與修飾領域近年來的研究焦點。
現有的多肽拼接方法分為化學法與酶促法兩大類?;瘜W法包括自然化學連接(native chemical ligation,NCL)[13]、無痕施陶丁格連接(traceless Staudinger ligation)[14]、酮酸-羥胺連接(ketoacidhydroxylamine ligation,KAHA)[15]、絲氨酸/蘇氨酸連接(serine/threonine ligation,STL)[16]以及二硒醚-硒酯連接(diselenide-selenoester ligation,DSL)[17]等(圖1)。這些化學方法均采取了相似的策略,即兩條多肽片段的末端化學基團發生選擇性反應形成共價鍵,之后通過分子內重排形成肽鍵[12]。由Kent團隊提出的NCL 是目前應用最為廣泛的一種方法,該方法的原理為將一條多肽的C端活化為硫酯形式,而另一條多肽的N 端第一個殘基固定為Cys,二者經過硫醇-硫酯交換與分子內重排兩步反應形成肽鍵[18]。多肽硫酯可通過Boc 固相合成法(保護基為叔丁氧羰基)直接合成,也可通過Fmoc 固相合成法(保護基為9-芴甲氧羰基)制備多肽酰肼,再經過一步反應生成疊氮[19]或吡唑[20]中間產物,加入硫醇得到對應的多肽硫酯。若待連接片段為重組蛋白,則需要通過分子生物學方法在蛋白N 端添加Cys殘基,或是將蛋白質C端活化為硫酯形式。目前最常用的EPL策略需在蛋白質C 端融合表達內含肽(Intein),之后在反應體系中加入苯硫酚以進攻內含肽與目標蛋白的結合處,從而形成硫酯[21]。NCL 方法的主要缺陷在于Cys是天然蛋白質中豐度最低的氨基酸種類之一,這嚴重限制了拼接位點的選擇范圍,盡管連接后可通過脫硫處理將Cys 變為Ala,但如果存在其他非連接位點的Cys殘基,又需要增加保護與脫保護操作,這些步驟都會降低最終產物的收率[22]。此外EPL 策略最初使用的內含肽長約140 個氨基酸殘基,雖然后續研究縮短了融合表達內含肽片段的長度[23],仍可能對重組蛋白的表達產生較大影響。
與化學法的原理不同,酶促法反應的區域選擇性與立體選擇性來源于酶活性中心的空間位阻以及基團間的非共價作用,滿足多肽拼接在區域選擇性及抑制外消旋方面的基本要求。目前研究較深的酶促多肽拼接策略主要有三種,分別使用Sortase A 轉肽酶、Butelase 1 轉肽酶以及Subtilisin人工連接酶,這些方法在拼接位點限制、蛋白質表達難度、酶活性等方面凸顯出不同的優勢,但在各個應用領域又分別有各自的限制,下文將系統闡述與比較。

圖1 主要化學連接方法[13-17]Fig.1 Chemical ligation methods[13-17]
SortaseA(SrtA)是源自革蘭氏陽性菌的一種轉肽酶,其中來源于金黃色葡萄球菌(Staphylococcus aureus)的SrtA 轉肽酶應用最為廣泛,該酶識別蛋白的LPXTG 序列(X 為任意氨基酸殘基),切斷蘇氨酸和甘氨酸殘基之間的肽鍵并形成酶-底物中間體,隨后位于肽聚糖的寡聚甘氨酸肽橋進攻中間體,與目標蛋白C端之間形成新的肽鍵從而實現目標蛋白在細胞壁表面的錨定[24]。此外還存在識別LPXTA 序列的SrtA 轉肽酶,這種來自化膿性鏈球菌(Streptococcus pyogenes)的轉肽酶常出現在與金黃色葡萄球菌來源的SrtA 轉肽酶聯合使用的場合,兩種酶對拼接位點的序列識別具有正交性[25]。SrtA 轉肽酶可通過重組表達來大量制備,現已實現商品化,這讓不同領域的研究者均能嘗試以此為基礎開發新型生物技術[26]。與內含肽介導的EPL 策略相比,使用SrtA 轉肽酶催化蛋白質拼接時,僅需在目標蛋白末端融合表達長度僅有幾個氨基酸殘基的標簽序列,雖然最終會留下一段“疤痕序列”[圖2(a)],但與融合表達內含肽的策略相比,已大幅降低了蛋白質表達與折疊可能受到的影響,并且底物末端無需活化,獲取底物的難度與成本較低。
2004 年,Mao[27]等首次利用SrtA 轉肽酶進行蛋白修飾,在綠色熒光蛋白(green fluorescent protein,GFP)的C 端融合表達LPETG(H)6標簽,再通過轉肽反應將葉酸等小分子化合物或另一個GFP 分子連接至目標蛋白C 端[圖2(b)],此后SrtA 轉肽酶蛋白拼接技術很快被應用于多個生物學研究方向。細胞表面蛋白參與了細胞生長、分化、識別等眾多生物學過程,一直作為重要的藥物靶點受到廣泛關注,Tanaka 等[28]將LPETGG 序列添加至重組破骨細胞分化因子C 端并運用SrtA轉肽酶方法進行修飾[圖2(c)],為細胞表面蛋白的時空動力學表征提供了新的研究思路,同樣的方法亦可用于細胞表面蛋白的N 端修飾[29]。噬菌體表面展示技術是當下建立抗原抗體庫、篩選藥物等研究的常用手段,Hess 等[30]提出了組合應用衣殼蛋白的策略,通過在M13噬菌體衣殼蛋白pIII與pVIII 的N 末端分別添加寡聚Gly 和寡聚Ala(G5-pIII-A2-pVIII),先利用化膿性鏈球菌(Streptococcus pyogenes)來源的SrtA 轉肽酶[Sortase A(strep)]將四甲基羅丹明(tetramethylrhodamine,TAMRA)修飾的七肽(KLPETAA)選擇性連接至pVIII,再利用金黃色葡萄球菌(Staphylococcus aureus)來源的SrtA 轉肽酶[Sortase A(staph)]將帶有五肽標簽(LPETG)的駱駝科重鏈抗體7(camelid heavy-chain antibody 7,VHH7)選擇性連接至pIII,拓寬了噬菌體表面展示技術的功能范圍[圖2(d)]。與蛋白修飾相比,SrtA 轉肽酶在環肽合成方面的成果較少,主要原因是連接后留下的“疤痕”較長,另外待環化多肽的長度一般需要超過19 個氨基酸殘基,否則將傾向于肽段寡聚[31]。目前SrtA 轉肽酶方法合成環蛋白的代表案例包括人唾液肽組蛋白Hst1[圖2(e)][32]、重組胱氨酸結環肽rMCoTI-II[33]以及向日葵胰蛋白酶抑制劑SFTI-1[34]等,環化后蛋白的熱穩定性以及抗蛋白酶水解能力均有不同程度的提升。

圖2 SrtA轉肽酶的催化過程及應用示意圖[26-28,30,32]Fig.2 The catalysis process of Sortase A and its applications[26-28,30,32]
SrtA 轉肽酶的主要不足之處在于其催化的連接反應是可逆的,因而需要較高的多肽底物濃度以保證連接效率,此外酶的催化速率偏慢,酶用量一般為蛋白底物物質的量的0.1~1倍[10,35-36]。當下研究者的一種優化思路是將SrtA 轉肽酶與其他化學或酶學方法結合以取長補短,例如Muir 團隊提出了基于內含肽自剪切技術與SrtA 轉肽酶轉肽反應的TAIL 策略,該策略可用于細胞核等復雜生物環境下的蛋白質末端不可逆連接,“疤痕”序列僅含一個Cys 殘基[37]。清華大學劉磊團隊[38]則用肼或肼衍生物替代寡聚甘氨酸底物進攻SrtA 轉肽酶-底物中間體,產物變為不再被SrtA 轉肽酶識別的蛋白質酰肼,由此可制備NCL 方法所需的蛋白質硫酯,或是在蛋白質末端引入炔基、疊氮等功能基團,通過點擊化學反應(click reaction)完成二次修飾。SrtA 轉肽酶的技術擴展案例為蛋白質合成與修飾領域指出了一個潛在的發展方向,即搭配使用現有的化學與酶促方法,建立充分發揮多種方法優勢的多肽連接策略。
Butelase 1 轉肽酶是熱帶藥用植物蝶豆(Clitoria ternatea)合成環肽的過程中催化多肽環化的連接酶,識別多肽C 端的N/D-HV 序列并切斷N/D 的C 端肽鍵形成酶-底物中間體,之后底物N 端進攻中間體從而完成多肽的環化[39-40]。Butelase 1 轉肽酶的連接位點最終僅留下一個氨基酸殘基(Asn或Asp)的“疤痕”[圖3(a)],底物N 端的序列限制也比SrtA 轉肽酶低得多,因此Butelase 1 轉肽酶在環肽合成方面更具優勢[40-41]。Tam 團隊[42]利用Butelase 1 轉肽酶合成了多種環蛋白,例如環狀細菌素AS-48[圖3(b)]、Uberolysin和Garvicin ML,其中AS-48 對包括李斯特菌(Listeria monocytogenes)在內的多種致病細菌具有優秀的抑制效果,其最小抑菌濃度低至0.1 μmol/L 數量級,為開發針對“超級細菌”的特效藥物指明了新方向。可被Butelase 1 轉肽酶環化的多肽長短不一,大到含有約250個氨基酸殘基的GFP(環化速率約為SrtA轉肽酶的20 000 倍),小到九肽,更短的多肽片段則一般會先寡聚后成環[43]。
實驗表明,Butelase 1 轉肽酶催化的多肽首尾環化反應不可逆,但兩條多肽間的拼接反應是可逆的,釋放的HV 二肽同樣可以作為親核試劑進攻酶-底物中間體,這導致Butelase 1轉肽酶和SrtA轉肽酶類似,需要較高的底物濃度來保證多肽拼接效率[44]。為了解決這一問題,Tam 團隊[44]合成了C端序列為N-(thioglycolic)-V的多肽底物,此序列依舊能被Butelase 1 轉肽酶識別,但釋放的硫代二肽無法進攻酶-底物中間體,改進后的方法用于泛素N 端修飾時取得了高達95%的連接率[44]。不過在對連接率要求不是特別高的情況下,普通的底物已經能滿足大部分需求,例如在大腸桿菌表面的OmpA 蛋白C 端添加NHV 序列,利用Butelase 1轉肽酶即可將帶有甘-異亮(GI)二肽的分子探針連接至OmpA 蛋白上,從而實現細菌活體標記[圖3(c)][45]。當被修飾的蛋白質分子是一個以Lys為節點的多肽分支骨架時,就可以在這個“樹干”上連接“枝葉”,將八條具有抗菌作用的四肽(RLYR)連接至這種骨架上[圖3(d)],形成的樹狀多肽大分子的廣譜抑菌活性相比單體有大幅提升,最小抑菌濃度降低了2 個數量級[46]。此外Butelase 1 轉肽酶亦可用于蛋白硫酯的制備,目標蛋白C 端僅需額外表達NHV 三個氨基酸殘基,再通過轉肽反應連接多肽硫酯,無需內含肽的參與[圖3(e)][47]。
Butelase 1 轉肽酶的活性比SrtA 轉肽酶高出2~3 個數量級,用酶量低至底物物質的量的百分之一,然而Butelase 1 轉肽酶一直是從植物材料中提取,目前仍無法重組表達[10,48-49]。Tam 團隊后續又發現了催化過程基本一致的OaAEP1轉肽酶,該酶可在大腸桿菌中重組表達,但產量依舊較低(約2 mg/L),且kcat/Km值比Butelase 1轉肽酶低2個數量級,經過酶工程改造后也僅能達到后者的三分之一[50]。獲取困難成為了當下Butelase 1 轉肽酶以及同家族連接酶推廣過程的最大障礙,繼續挖掘同家族的新酶是現階段的一個重要研究方向。

圖3 Butelase 1轉肽酶的催化過程及應用示意圖[26,42,45-47]Fig.3 The catalysis process of Butelase 1 and its applications[26,42,45-47]
Subtilisin 是來自解淀粉芽孢桿菌(Bacillus amyloliquefaciens)的絲氨酸蛋白酶,具有六個廣譜的氨基酸殘基識別口袋,最初作為一種具有廣泛切割位點的蛋白水解酶而受到關注。早在20 世紀60 年代,Bender 團隊[51]即使用化學方法將Subtilisin 的關鍵活性基團從Ser 轉變為Cys(S221C),得到的人工連接酶Thiolsubtilisin 在50% DMF 溶液中展現出了多肽連接酶的活性,但在水溶液中效率極為低下[52]。隨著定點突變技術的發展,Wells團隊[53]獲得了重組表達的多肽連接酶Subtiligase,在S221C 之外還引入了P225A 突變來降低活性中心的空間位阻,將該酶的連接活性提高了1 個數量級且水解活性降低了2 個數量級,從此奠定了Subtilisin 人工連接酶的基本形態。之后Wells 團隊[54]開展了一系列酶工程研究,先是額外引入5 個突變位點(M50F/N76D/N109S/K213R/N218S)以提高連接酶的穩定性,使得連接酶在4 mol/L 鹽酸胍的環境中依舊能保留50%的活性;后續又在噬菌體表面展示技術[55]以及蛋白質組技術[56]的輔助下,改造得到一系列具有不同序列識別偏好的Subtiligase 突變體,從而擴展P1'與P2'口袋的底物譜。
相比SrtA 轉肽酶和Butelase 1 轉肽酶,Subtilisin 人工連接酶對連接位點的序列限制更少,不會出現“疤痕”序列[圖4(a)],因此具有更廣闊的應用范圍。早在1994 年,Wells 團隊[57]便利用Subtiligase 將6 個多肽片段(每段長度在11~31個殘基)拼接為含有124個氨基酸殘基的核糖核酸酶A,?;w多肽N 端被異煙堿(isonicotinyl,iNOC)基團保護以防止重復拼接,每輪連接反應后去除保護基來進行下一輪的連接[圖4(b)],這比NCL 方法更早地實現了將多個多肽片段拼接為完整蛋白質[57]。Subtiligase還被用于環化長度在12~31 個氨基酸殘基的多肽[圖4(c)][58],在內含肽的輔助下可以實現蛋白質C 端的無痕拼接,例如Cole 等[59]利用Subtiligase催化重組表達的泛素硫酯與合成的十肽-生物素(GLSGRGKGGK-Biotin)的連接,解除了?;荏w肽N 端必須為半胱氨酸殘基的限制[圖4(d)]。不過Subtiligase目前最主要的應用方向仍是蛋白質N端修飾,Wells團隊[60]建立了一個細胞凋亡相關蛋白水解酶研究平臺,首先用Subtiligase 將帶有生物素標簽的多肽連接在混合蛋白樣品的N 端[圖4(e)],再用待研究的蛋白水解酶處理樣品,酶切后用親和素富集帶有生物素標簽的樣品N 端片段,最后進行HPLC-MS/MS 分析[60]。生物素標記與親和素富集的操作實現了酶解多肽片段的正向篩選,該平臺可以幫助研究人員發現特定蛋白水解酶在細胞中的潛在靶標蛋白與切割位點。
除Subtiligase 之外,該家族的另一成員的研究也在近年獲得突破。荷蘭帝斯曼集團與格羅寧根大學合作,篩選了來自八十余種古菌和細菌的上百種Subtilisin 家族蛋白酶,確定了一個不依賴鈣離子且高度穩定的模板蛋白,并對其活性中心進行改造設計,創制了一種新型多肽連接酶Peptiligase[4,61]。與Subtiligase 相比,Peptiligase 的折疊不依賴前體肽,表達量大幅提高且連接活性更高(酶用量可低至多肽底物物質的量的萬分之三),還具有適用于工業生產的極高穩定性,足以耐受60 ℃的高溫、高濃度DMF 與鹽酸胍。后續帝斯曼集團將該部分業務獨立,組建了全世界第一家應用生物法合成多肽與蛋白質的商業公司——Enzypep公司。通過對Peptiligase 的深入研究與改造,Enzypep公司推出了新一代廣譜連接酶Omniligase-1,為低序列限制的通用多肽拼接策略提供了優秀的工具酶[62]。在多肽藥物Exenatide 百克級合成過程中[圖4(f)],Omniligase-1 催化下的兩段多肽拼接效率達到88%,總產率是原先固相合成法單次合成完整多肽的兩倍,展現了該酶極為突出的工業應用價值[63]。Omniligase-1 亦可與二硫鍵構筑[64]、點擊化學[65]、肟連接(oxime ligation)[66]等方法聯用以合成具有多環結構的環肽。不只是廣譜連接酶,Enzypep 公司還推出了針對特定藥物多肽序列的連接酶,例如專門用于生產Thymosin-α1的Thymoligase,該酶在P1 位特異識別帶正電氨基酸,在P1'位特異識別帶負電氨基酸,兩段多肽底物的拼接效率高達94%,最終產率相比原有生產工藝提升了兩倍[67]。Peptiligase 系列連接酶在連接/水解比、反應活性、底物序列限制等多個方面突破了工業化瓶頸,使多種藥物多肽的生產成本下降了60%~80%,顯著的工業應用優勢讓Peptiligase 系統被視為目前酶促多肽拼接領域最受矚目的技術平臺[68],針對不同應用方向來改造獲得滿足不同序列需求的突變體依舊是其未來的主要發展方向。

圖4 Subtiligase/Peptiligase的催化過程及應用示意圖[7,26,57-60,63]Fig.4 The catalysis process of Subtiligase/Peptiligase and its applications[7,26,57-60,63]
蛋白質重組表達與多肽固相合成技術在摻入非天然氨基酸、蛋白質表達系統適用性與多肽合成長度等方面都存在一定的限制,多肽連接技術可以將多個短肽連接成較長的肽段,同時解決了非天然氨基酸修飾與蛋白質合成長度的問題,而其中酶促多肽連接法由于其獨特的區域選擇性與立體選擇性在蛋白質合成領域發揮著愈加重要的作用。近年來三種酶促多肽拼接策略經過優化與發展,各自具有其適合的應用場合(表1)。SrtA轉肽酶可通過重組表達獲得,也可以通過商業渠道購買,在蛋白質末端修飾方面便于使用,是目前應用案例最多的多肽連接酶,但在連接產物中會保留數個氨基酸殘基的連接“疤痕”,不適合用于特定序列多肽或蛋白質的合成。Butelase 1 轉肽酶活性較高,拼接位點的序列限制比SrtA 轉肽酶少,連接后殘留的“疤痕”較短,適合催化多肽與蛋白質的環化。然而該酶目前還無法通過重組表達制備,研究所用的酶需要從植物中獲得,每千克的植物材料約能提取出5 mg 酶,難以實現大規模生產,這成為該酶應用的主要限制因素。Subtilisin 人工連接酶則在拼接位點序列限制方面優于前兩種酶,只需要底物C末端活化為氧酯或硫酯而無需具備特定的氨基酸序列,雖然該酶的6個氨基酸殘基識別口袋具有不同的氨基酸偏好性,但經過多年的研究優化,該系列酶已經產生了較多廣譜突變體,并能整合具有互補選擇性的連接酶突變體,建立的酶工具箱用于不同領域,功能最為全面[61]。并且Peptiligase系列商品酶是當下唯一能在工業級合成中使用的酶,不過這些商品酶大多價格高昂且序列保密,尚未普遍推廣。三類酶促多肽拼接策略依舊具有較大的優化空間,研究者不僅可以聯用化學和酶促方法來實現優勢互補,建立不同的生物合成技術路線,還可以通過酶工程改造來提升連接酶的性能,過去三十年在這一方向已出現大量的理性設計與定向進化成果。而隨著運算能力大幅提升以及先進算法不斷涌現,近年來蛋白質計算設計得到了極大的發展,蛋白質從頭設計的時代已經到來[69]。在蛋白質人工合成與蛋白質計算設計這兩個領域相逢之際,計算機輔助手段既可以指導新型連接酶的設計與改造,提升連接/水解比,又能夠幫助設計具有特殊修飾的非天然蛋白質[70],為酶促多肽拼接策略開拓嶄新的應用場景。無論是化學方法與酶促策略的結合,還是人工合成與計算設計的相遇,均是不同領域的碰撞而閃現出的火花,深刻體現了學科交叉的意義與價值。相信在越來越多潛在相關領域的研究人員參與后,未來酶促多肽拼接策略的技術方法能再上一層臺階,應用于更多的多肽環化、蛋白質修飾乃至蛋白質全合成研究項目。

表1 三類酶促連接策略以及NCL方法的比較Tab.1 Comparison between NCL method and three enzymatic strategies