王瑞萍,岳士忠,于家峰,李 季,李潔明*
(1.山東省生物物理重點實驗室(德州學院 生物物理研究院),山東 德州 253023;2.中國農業大學 資源與環境學院,北京 100193)
微囊藻毒素(Microcystins, MCs)是藍藻中出現頻率最廣和危害最大的一種單環七肽肝毒素[1],分子量在1 000 左右,一般結構見圖1,其中A、B是可變氨基酸,Adda的分子式為3-氨基-9-甲氧基-2,6,8-三甲基-10-苯基-4,6-二烯酸,是MCs潛在的毒性基團[2]。由于A、B的可變性以及其它氨基酸甲基化與去甲基化的差異,使得MCs具有多種亞型[3-4],到2017年已發現240余種[5-6],其中MC-LR、-RR、-YR(L,R,Y分別代表亮氨酸、精氨酸、酪氨酸)在天然水體中出現頻率最高,MC-LR毒性最大,其次為-RR,-YR[7]。MCs主要作用器官是肝臟,對生態系統及人類健康存在極大威脅。生物降解去除MCs因其安全、高效、成本低、無污染等特點引起了國內外的廣泛研究。

圖1 MCs化學結構式[2]Fig.1 Chemical structure of MCs [2]
MCs的生物降解是在蛋白酶催化作用下完成的,目前的研究主要集中在基因功能方面。早期利用分子生物學手段研究發現,MCs降解菌Sphingomonassp. ACM-3962 (MJ-PV) 在降解MC-LR的過程中,mlr基因簇發揮了重要作用,其中mlrA表達的水解酶(MlrA)通過斷裂Adda-Arg鍵將環狀MC-LR水解為線性,隨后mlrB表達的酶(MlrB)將線性MC-LR的Ala-Leu鍵斷裂,使其進一步裂解產生四肽,最終四肽在mlrC表達的酶(MlrC)的催化作用下裂解為更小片段[8- 9]。后續通過異源表達的方式在其他降解菌中證實了mlrA、mlrB、mlrC的功能,同時表明MlrC 能夠直接降解線性MC-LR和-RR而無需MlrB的作用[10-12]。最初的研究表明,mlrD和mlrA組成一個操縱子,并推論mlrD基因能夠編碼一種轉運蛋白[8],但到目前為止并沒有進一步研究mlrD基因的功能。本課題組曾試圖通過基因敲除的方式研究野生菌Novosphingobiumsp. THN1中mlrD基因的功能,但因同源雙交換難以發生以及敲除后的菌株很快死亡,導致后續功能驗證無法繼續進行。通過生物信息學的手段探究MlrD結構特征,預測其活性位點,可為進一步研究其功能奠定基礎。
對蛋白質序列進行分析有助于了解其結構和功能,進而為研究生物學功能提供關鍵信息[13]。Bourne等在發現mlr基因簇的同時,對ACM-3962降解酶Mlr蛋白的性質進行了分析[8],表明MlrA包括336個氨基酸殘基,分子量為36.6 kD,預測等電點為9.76,存在信號肽,裂解位置在第26和27個氨基酸之間,之后通過序列比對預測并確認了其活性位點H260AIHNE265[14]。Xu等構建了MlrA的三級結構,并通過分子對接和定點突變驗證了其他活性位點(Glu172、Trp176、His205、Trp201)[15]。Bourne等[8, 16]對MlrC蛋白序列進行分析,發現并證實了活性位點Asp167、His169、His191。Wang等[17]通過定點突變確定了其他幾個活性位點,同時結合MlrC的三級結構進一步分析了活性位點在空間上的分布,推測了其活性口袋。
早期研究表明MlrD包含422個氨基酸殘基,分子量為45.4 kD,預測等電點為9.83,有12個跨膜結構域,序列相似性結果顯示MlrD屬于PTR2超家族[8]。MCs降解酶MlrA、MlrB和MlrC的功能已經被證實,但被認為是轉運蛋白的MlrD的功能及結構依然是未知的。近年來,隨著基因組學和蛋白質組學的發展,數以萬計的蛋白質三維結構尚待分析,但蛋白質結構的確定非常困難[18]。隨著計算機技術的發展和已知三維結構蛋白的增多,對未知結構蛋白的預測成為可能。平均50%~70%的典型基因組可以使用計算技術進行結構建模[19]。預測蛋白質結構將有助于探索其活性位點及作用方式,進一步多角度了解MCs的降解。本研究在前人研究的基礎上,全面的分析mlrD的序列特征,構建其三級結構,預測活性位點,為進一步研究mlrD的功能及結構提供理論依據。
通過在NCBI數據庫中檢索并下載降解菌的ACM-3962的MlrD(MlrD-ACM-3962)蛋白序列,分別利用在線軟件Cell-PLoc 2.0和Protscale分析該蛋白亞細胞定位和親/疏水性。利用 STRING 數據庫對蛋白相互作用關系進行分析。
在NCBI數據庫搜索并下載MCs降解菌的MlrD及16S rDNA序列,同時下載外圍基因的相應序列。用clusterW[20]進行多序列比對,MEGA7.0構建系統發育樹,對mlrD親緣關系和進化關系進行分析。
利用HMMTOP工具分析MlrD二級結構,在PDB數據庫中檢索與MlrD-ACM-3962高度相似的蛋白,篩選模板蛋白并下載其三級結構,選取easymodeller 4.0(Modeller 9.20)[21]軟件建模。首先將模板蛋白導入軟件,通過模板比對、模板與目的蛋白比對等過程,構建9個模型。構建好的模型用Ramachandran圖和Verify-3D[22-23]程序進行評估。評分都通過的模型作為最終的蛋白結構模型,并在PyMOL2中分析展示。
在上述結構分析的基礎上,進一步分析MlrD的保守結構,通過同一蛋白家族已有蛋白活性位點的分析,推測MlrD的活性位點。
對ACM-3962的MlrD蛋 白 的 一 級 結 構 進 行ProtScale 分析,該多肽鏈的第 182位 異亮氨酸(Ile)和第361位的半胱氨酸(Cys)分別具有最高分值(1.500)和最低分(-2.867),即前者疏水性最強,后者親水性最強 (見圖2a)。利用 ProtParam 分析可知,氨基酸序列平均疏水指數為0.677,即該蛋白為疏水性蛋白。使用Cell-PLoc 2.0 在線網站分析目標蛋白亞細胞定位,結果表明此蛋白質位于細胞內膜上。

圖2 MlrD蛋白親水性及互作網絡分析Fig.2 Analysis of hydrophilicity and interaction network of MlrD protein
蛋白互作網絡中的SCI_04307為MlrD蛋白序列,SCI_03700、nadK和SCI_01691與MlrD 相互作用(見圖 2b ),其中 nadK 得分最高說明其與 MlrD 蛋白相互作用更緊密。nadK參與調節NAD和NADP的胞內平衡,是NADP生物合成的關鍵酶,特異性催化NAD腺苷部分2'-羥基的磷酸化生成NADP;SCI_03700是 NADH焦磷酸酶,屬于Nudix水解酶家族;SCI_01691為二肽/三肽轉運酶。根據互作網絡推測,MlrD可能參與了NADH的合成,MCs的轉運可能是在MlrD與SCI_01691的協同作用下完成的。
在ACM-3962菌株中首次鑒定出mlrD基因后,后續研究根據已經發現的序列,通過PCR或基因組測序,在其他降解菌中也發現了mlrD基因序列。本文通過在NCBI數據庫中檢索MCs降解菌的mlrD的基因序列,對降解菌及MlrD蛋白注釋進行了總結(見表1)。目前分離到的攜帶mlrD基因的降解菌共有17株,都屬于α變形菌門,其中鞘氨醇盒菌屬(Sphingopyxissp.)有9株,占有最高的比例。由于有些菌株只測了mlrD基因的部分序列,所以在序列長度方面差異比較大。對mlrD的基因注釋并不統一,可以分為三類,第一類(8株)注釋為微囊藻毒素降解酶(包括THN1菌株中較為模糊地注釋為參與了微囊藻毒素的降解);第二類注釋為肽轉運蛋白,其中6株為寡肽轉運蛋白,1株(Novosphingobiumsp. MD-1菌株)注釋為二肽/三肽轉運蛋白,1株(Sphingosinicellasp. strain JEZ-8L菌株)較為確定的注釋為微囊藻毒素轉運蛋白;第三類未進行注釋(菌株Sphingopyxissp. LH21 和Sphingopyxissp. C-1)。

表1 MCs降解菌中MlrD 的特征Table 1 Characteristics of MlrD in diverse MCs-degradation bacteria
為進一步分析不同菌株之間MlrD的保守性,用clustal W進行了多序列比對,結果表明序列較短的MlrD是長序列中的一部分,不同菌株之間的MlrD是保守的。采用MEGA7.0 Neighbor-Joining法對mlrD基因及相應菌株的16S rDNA序列構建系統發育樹,選取Myxococcusfulvus124B02和Nitrosomonadalesbacterium0125_3作為外圍基因,在mlrD基因發育樹中,降解菌形成了三個分支。除Sphingopyxissp.X20以外,Sphingopyxis屬的降解菌形成了一個獨立的分支(Clade I),Sphingomonas屬和Novosphingobium屬的降解菌形成了一個分支(Clade II)(見圖3a),這兩個分支具有較近的親緣關系,Sphingosinicella屬和Rhizobium屬形成了另一個分支(Clade III)。16S rDNA基因發育樹的結構(見圖3b)與mlrD基因相同,也形成了三個獨立的分支,除Sphingopyxissp.X20和SphingosinicellamicrocystinivoransB9的分支位置不一致外,其余菌株分支與mlrD基因完全相同。

圖3 不同 MCs 降解菌系統發育分析Fig. 3 Phylogenetic analysis of various MCs-degrading bacteria
在Bourne等[8]對MlrD-ACM-3962初步分析的基礎上,構建了其三級結構模型。將MlrD-ACM-3962序列與PDB數據庫中蛋白序列進行比較,根據比對的結果,發現與MlrD相似的蛋白較多,相似率在30%左右,大部分屬于肽轉運蛋白,充分利用較多的相似蛋白,采用Modeller多模板建模預測其三級結構。Modeller同源建模使用多個模板可以組合來自各個模板結構的信息,通常會提高模型的準確性[21]。
根據相似性,以4ikxa、4ikva、4q65a、4oh3a、4xnia、4apsa、5mmta、4lepa、4w6va、6exsa、2xuta、6ei3a、5a2na蛋白為模板,通過模板蛋白互相比對、與目的蛋白比對、主鏈生成、loop區建模、模型優化[32],用Modeller構建9個模型。9個模型分別用Ramachandran 圖和Verify-3D評分進行評價,Ranmachandran 圖在最允許范圍內氨基酸所占比例達到90%以上,被認為是一個高質量的模型[33],Verify-3D 分析原子模型與自身序列在位置和環境上的兼容性,如果 80%的氨基酸殘基得分大于等于0.2,可認為模型是合理的[34]。經過比較,選取評分較高的模型(見圖4a),從Ramachandran圖統計結果(見圖4b)可以看出,模型中93.0%的氨基酸在最允許區域內,5.9%在額外允許區域。Verify-3D評估結果表明85.78%的殘基3D-1D評分大于等于0.2(見圖4c),即相容性是通過的。綜上MlrD的三維結構具有一定的理論意義和參考價值。

圖4 MlrD蛋白三級結構 及其評價Fig.4 The 3D structure of MlrD and its evaluation
MlrD由422個氨基酸組成,HMMTOP二級結構預測表明由12個跨膜α-螺旋和無規則卷曲組成,沒有β-折疊結構。在12個跨膜α-螺旋中,前6個與后6個跨膜α-螺旋結構域呈現出非常相似的拓撲結構,以一種假二次軸對稱的方式存在,對稱軸垂直于膜平面
經過保守結構域的查找,發現MlrD蛋白屬于質子依賴型寡肽轉運蛋白PTR2(Peptide transport)超家族,這個家族的蛋白屬于二肽/三肽滲透酶,參與氨基酸運輸與代謝。
PTR2家族有兩個保守基序(Motif)序列,分別是位于第2和3跨膜螺旋連接處的GXXXADXXXGKXXTI(X代表任意氨基酸)和位于第5個跨膜螺旋上的FYXXINXG(X代表任意氨基酸),第二個保守motif在肽轉運家族的所有成員中都表現出絕對的保守性[35-36]。在MlrD序列中這兩個motif與PTR2具有一些差異 (見圖5),第1個保守序列位于第2和3跨膜螺旋連接處,位于MlrD-ACM-3962的69-83 bp,氨基酸序列為GGWIADRFIGRSAAI,即上述保守序列中的K和T分別變成了R和A;第2個保守序列在MlrD中不存在,比較相似的序列位于第5個跨膜螺旋上142 -150 bp,氨基酸序列為FYYLAVSAG。這兩個序列中個別氨基酸的差異可能是由于底物的差異性造成的,這些序列在不同MCs降解菌之間是保守的(見圖5)。綜上所述,位于第2和3跨膜螺旋連接處的Gly69、Ala73、Asp74、Gly78、Arg79、 Ala82、Ile83和位于第五個跨膜螺旋上的Phe142、Tyr143、Ala146、Val147、Gly150可能為MlrD的活性位點。
到目前為止,MlrD的功能并未通過實驗證實,對其基因注釋大多是根據序列保守性分析或依據前人的經驗得到的,導致注釋存在差異。
系統發育樹分析表明mlrD和16S rDNA具有相同的拓撲結構。Qin等[25]的研究表明其他mlr基因構建的系統發育樹都形成了三個主要分支,而且整體結構相同,表明mlrD基因與其他mlr基因具有相同的進化來源,整個mlr基因簇共同進行進化。 經過多序列比對及系統發育樹分析,表明MlrD在MCs降解菌之間是高度保守的,MlrD 具有功能特異性。
Dziga等通過異源表達的方式研究MlrA、MlrB、MlrC的功能[10, 11, 14, 16-17, 37],表明在沒有mlrD基因的情況下,菌株能夠降解MCs及其產物,說明在異源表達菌株中mlrD基因對于MCs及其產物的轉運和降解不是必需的,然而在異源表達菌株中的情況并不適應于野生菌。利用同源雙交換敲除基因是研究野生菌基因功能的常用方法之一,但在對mlrD進行敲除時,因二次同源雙交換難以發生,雙交換菌株不穩定等原因,基因敲除沒有成功,表明MlrD是菌株生長所必需的,大片段的缺失會導致菌株的死亡。通過生物信息學的方法預測MlrD活性位點,進一步采用活性位點堿基突變、敲除等方法,可在野生菌中進一步研究MlrD的功能。
保守結構域分析表明MlrD屬于PTR2超家族,在膜轉運蛋白分類數據庫(TCDB)中,PTR是位于主要協助轉運蛋白超家族(MFS)內的一個蛋白家族。MFS家族的蛋白大多數都含有400-600個氨基酸殘基,大多數擁有12個跨膜α-螺旋[38],N端和C端分別由6個跨膜α螺旋組成,呈現出非常相似的拓撲結構,以假二次軸對稱的方式存在[39-40]。MlrD的結構完全符合MFS家族的特性。MlrD的結構與上述特征相符合,從三級結構的角度說明MlrD屬于MFS超家族。
MFS家族的蛋白都是次級轉運蛋白的典型代表,利用膜內外底物濃度差產生的電化學勢能轉運底物[41-42], MCs及其產物可能通過濃度差在MlrD的作用下進出細胞。有研究表明,突變MFS上述兩個保守序列會導致轉運活性喪失[43-44],因此后續研究可以通過定點突變的或小片段基因敲除方法,突變或敲除GGWIADRFIGRSAAI和FYYLAVSAG這兩個區域,深度了解MCs及其降解產物的轉運。
MCs降解菌的mlrD和16S rDNA系統發育樹有相同的拓撲結構,MlrD蛋白屬于PTR2超家族,其二級結構由α-螺旋和無規則卷曲結構組成,且完全符合PTR2家族的特性,可能的活性位點為位于第2和3跨膜螺旋連接處的Gly69、Ala73、Asp74、Gly78、Arg79、Ala82、Ile83和位于第5個跨膜螺旋上的Phe142、Tyr143、Ala146、Val147、Gly150,可以通過突變或敲除這兩個結構域來研究其功能。