丁士標,肖國輝,孔亮亮,嚴 杰,林旭璦
?
問號鉤端螺旋體GGDEF和EAL/HD-GYP結構域蛋白生物信息學分析
丁士標1,2,肖國輝2,孔亮亮2,嚴杰2,林旭璦2
1.浙江省杭州市紅十字會醫院檢驗科,杭州310003;;2.浙江大學醫學院病原生物學系,杭州310058
摘要:目的分析問號鉤端螺旋體(鉤體)環二鳥苷酸(Cyclic dimeric-GMP,c-di-GMP)調節相關的GGDEF和EAL/HD-GYP結構域蛋白生物信息學結果,為后續的功能研究奠定基礎。方法PSI-BLAST方法分析編碼GGDEF和EAL/HD-GYP結構域蛋白的基因;利用相應生物信息學軟件對蛋白信號肽序列、跨膜序列、蛋白結構、同源性進行分析并構建目的蛋白進化樹。結果問號鉤體中22個蛋白分別含有GGDEF或EAL/HD-GYP結構域,多數蛋白均有感受器結構域和跨膜區。7個具有PAS輸入感受器的GGDEF結構域蛋白進化較為獨立,位于單獨的一個分支,其余6個GGDEF結構域蛋白則分散在不同的分支上。4個EAL結構域蛋白和2個HD-GYP結構域蛋白進化上也較為獨立,分別處于同一進化分支。3個GGDEF和EAL結構域耦合的蛋白在進化關系上更趨向于PDE活性蛋白。結論鉤體具有多拷貝的合成和降解c-di-GMP相關蛋白編碼基因,表明在鉤體中c-di-GMP網絡具有高度復雜性,同時反映出鉤體對環境條件的改變具有復雜的應對機制。
關鍵詞:問號鉤端螺旋體;環二鳥苷酸;鳥苷酸環化酶;磷酸二酯酶
致病性鉤端螺旋體(簡稱鉤體)感染引起的鉤體病是全球流行的人畜共患傳染病,鉤體可在水或濕土中存活較長時間,通過疫水或污染的土壤感染宿主[1]。感染是病原微生物與宿主相互作用的過程,在長期的進化過程中,病原菌擁有了感受環境條件變化并作出適應性應答的機制,尤其在感染的早期階段,病原菌識別環境改變并調整靶基因表達水平,以便侵入宿主、對抗宿主免疫力,達到在宿主體內生存與繁殖的目的。近年發現一些原核生物中存在一類環二鳥苷酸(Cyclic dimeric-GMP,c-di-GMP)分子,主要控制細菌對不同環境條件的適應性應答[2-3]。c-di-GMP由具有GGDEF結構域的二鳥苷環化酶(DGC)合成、而由EAL/HD-GYP結構域的磷酸二酯酶(PDE)降解,具有感受溫度、氧分子、pH等外界信號并廣泛調控多種靶基因表達的功能,尤其在細菌生物膜形成、毒力因子表達、細菌在宿主體內生存過程中發揮重要作用[4-5]。
本文分析了鉤體賴型賴株中的GGDEF和EAL/HD-GYP結構域蛋白,包括保守的GGDEF、EAL/HD-GYP結構域,與這些蛋白相關的感受器結構域,信號肽及跨膜片段等,同時對這些結構域蛋白進行了同源性和進化樹分析。結果發現鉤體中有多拷貝的GGDEF和EAL/HD-GYP結構域蛋白,有些是賴株特有的,有些與其它細菌菌株中的蛋白有同源性。通過進一步對這些蛋白的功能研究必將豐富對鉤體致病機制的認識。
1材料與方法
1.1鉤體基因組鉤體賴株基因組(GenBank Nos. AE010300,AE010301)。
1.2蛋白序列分析采用PSI-BLAST方法分析GGDEF和EAL/HD-GYP結構域蛋白的編碼序列。Signal P 4.0分析蛋白信號肽序列(http://www.cbs.dtu.dk/services/SignalP/);采用EMBNET方法分析蛋白中的跨膜序列(http://www.ch.embnet.org/software/TMPRED_form.html);采用SMART和NCBI中的CDD方法分析蛋白中的結構域(http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi、 http://smart.embl-heidelberg.de/);采用DNAstar軟件進行蛋白序列間的同源性分析。
1.3進化樹構建采用MEGA 6.06程序構建蛋白的進化樹。首先將獲得的蛋白序列用ClustalW進行序列比對,默認參數。比對后的序列用鄰位相連法(Neighbor-joining,NJ法)構建進化樹。進化樹檢驗采用Bootstrap法(Bootstrap replication=1 000),模型使用Poisson model。蛋白序列來自于Signal Census database。
2結果
2.1GGDEF和EAL結構域蛋白編碼基因的多樣性為了統計致病性鉤體賴株中GGDEF和EAL/HD-GYP結構域蛋白的數量,用Position-Specific Iterated(PSI)-BLAST程序鑒定了鉤體賴株基因組中的保守結構域基因。賴株鉤體中有多拷貝的GGDEF結構域蛋白(表1):僅含有GGDEF結構域蛋白13個,大部分為GGEEF基序,只有LA2704和LA3929為GGDEF基序,LA1185和LA3909為退化的GGDEF基序。單純EAL結構域蛋白的拷貝數相對于GGDEF少,僅有4個;另有兩個具有與EAL結構域蛋白功能類似的HD-GYP結構域蛋白。在已經研究的一些細菌中,亦發現很多蛋白同時具有GGDEF和EAL結構域,其中有的活化位點已退化而失去相應的合成或降解c-di-GMP的功能,但可作為c-di-GMP結合效應蛋白或直接與非c-di-GMP大分子相互作用[5],鉤體賴株基因組中亦有3個GGDEF-EAL結構域偶聯蛋白,其具體的生物學功能尚需進一步的實驗驗證。
結構域蛋白通常含有一至兩個跨膜區和信號肽,這有助于蛋白錨定在膜上,并有利于不同的GGDEF和EAL蛋白從獨特的微環境分離[5]。為進一步了解鉤體中這些蛋白的特性,通過軟件對其信號肽和保守結構域等進行了分析。結果發現所有的GGDEF和EAL/HD-GYP結構域蛋白均不含信號肽序列,表明它們不能穿過或錨定在膜上。大部分的蛋白(77%的GGDEF、86%的EAL/HD-DYP和100%的GGDEF-EAL結構域偶聯蛋白)含有轉膜片段(表1),表明調控和/或酶活性主要發生在膜上。
2.2預測的GGDEF結構域蛋白催化活性活化的DGC蛋白包括2個亞單位:在兩個亞單位表面結合GTP分子的A位點和抑制c-di-GMP結合的I位點。A位點為保守的特征性GGD/(E)EF基序,發生突變則酶活性喪失[5];I位點距離A位點5個氨基酸,為DGC蛋白的變構抑制位點,通過結合c-di-GMP至特征性RxxD基序而發生變構控制,R突變導致抑制功能和變構控制的改變,目前尚未發現D突變對其功能的影響[4]。在賴株中,GGDEF結構域蛋白均包含完整的A位點,LA1483和LA2926的I位點R突變為G;在3個GGDEF-EAL結構域偶聯蛋白則無典型的A或I位點。已有研究表明,GGDEF退化蛋白通常缺失DGC活性但擁有其它功能,如結合c-di-GMP或其它大分子物質等[7-8]。

表1 問號鉤端螺旋體賴株GGDEF和EAL/HD-GYP結構域蛋白
2.3GGDEF和EAL/HD-GYP蛋白中的傳感器結構域c-di-GMP能夠感受外界環境條件的改變主要是由于其具有接受信號輸入的保守結構域,包括周質、胞質和完整的膜結構域等。已有研究表明在GGDEF結構域蛋白中除了C末端的催化活性位點A,很多在N端具有傳感器結構域以感應不同的內在或外在信號,從而啟動DGC或PDE功能的活化[9]。因此,本文對鉤體GGDEF和EAL/HD-GYP結構域蛋白中相關的傳感器結構域進行了分析,結果發現大部分的GGDEF結構域蛋白含有相關結構域(FAS、GAF和REC)(表1),7個為PAS結構域(54%),兩個(LA1483和LA3929)為GAF結構域,還有一個(LA2528)為REC結構域;在EAL結構域蛋白中僅有LA2827含有REC結構域;而在3個GGDEF-EAL結構域偶聯蛋白中則有2個含有REC結構域。目前已知PAS結構域能夠結合亞鐵血紅素、核黃素和腺嘌呤等小分子物質[10];GAF與PAS結構相似,是胞質內感受器結構域,能夠結合包括單環核苷、氧氣等小分子[11]。不同感受器結構域的存在表明鉤體對不同環境刺激調控應答具有多樣性。
2.4GGDEF和EAL/HD-GYP結構域蛋白的進化分析我們將賴株中的GGDEF與EAL/HD-GYP結構域蛋白與NCBI數據庫中相關蛋白序列進行了比對分析,13個僅GGDEF結構域蛋白中有6個與其它各型鉤體中相應蛋白同源性較高,基本超過80%,7個具有PAS結構域的蛋白與其他型鉤體的同源性相對較低,但與寇氏鉤端螺旋體(L.Kirschneri)、沖繩鉤端螺旋體(L. Noquchii)同源性較高,均超過90%;與非致病性的雙曲鉤體Protoc I相比,LA1483、LA2704、LB240有較低同源性(分別為67%、35%、56%)的對應蛋白,其余10個蛋白為致病性鉤體賴株所特有。3個GGDEF-EAL結構域偶聯蛋白除了LA1185外,LA3909和LB235與其它各型致病性鉤體同源性較高,均達到80%以上;3者與Protoc I同源性均低于50%。5個EAL與2個HD-GYP結構域蛋白與其它致病性鉤體中對應蛋白同源性均高,與Protoc I中蛋白同源性較低或無同源蛋白。
為了進一步分析鉤體中的GGDEF和EAL/HD-GYP結構域蛋白,我們分別針對GGDEF和EAL/HD-GYP結構域蛋白構建了相應的進化樹(圖 1,圖2)。如圖1所示,僅含GGDEF結構域蛋白與分別來自于伯氏疏螺旋體和非致病性雙曲鉤體Protoc I的GGDEF結構域蛋白歸于同一群,其中7個具有PAS輸入感受器的蛋白處于一個獨立的分支;兩個具有GAF輸入感受器的蛋白則相距較遠;位于鉤體小染色體上的LB237和LB240只含有GGDEF結構域且處于相對較近的進化分支,而位于大染色體上的LA2704雖然也只含有GGDEF結構域,但與另外兩個蛋白相距較遠,卻與雙曲鉤體中蛋白親緣較近;具有GGEEF和REC結構域的LA2528則與伯氏螺旋體中的蛋白相距較近。REC結構蛋白的進化情況如圖2所示,4個僅含EAL結構域蛋白中,LA1983和LA3104歸于同一進化分支,LB133則處于相對獨立的分支中,LA2827帶有REC感受器,進化位置與另外的3個蛋白更遠些。鉤體中僅兩個蛋白具有HD-GYP結構域,二者也分別屬于不同的進化分支,與雙曲鉤體中相應蛋白進化關系較近。本文中,我們將3個GGDEF-EAL結構域偶聯蛋白同時分別歸于GGDEF和EAL/HD-GYP結構域的那邊分析,如圖1所示,3個偶聯蛋白處于獨立的進化分支,且帶有REC感受器的兩個蛋白親緣關系更近;圖2則表明,帶有REC感受器的兩個蛋白親緣較近,LA3909則與EAL結構域蛋白處于類似的進化分支。
3結論
細菌對外部環境變化的感應往往通過信號轉導的方式進行,這種調控過程非常復雜,需依賴許多不同組份相互作用來協調完成細菌的生理生化反應,其中一個重要的組份是第二信使分子。近年發現c-di-GMP是細菌中廣泛存在的第二信使分子,其與鳥苷酸環化酶(DGC)、磷酸二酯酶(PDE)和下游的效應分子共同組成c-di-GMP信號系統。不同濃度c-di-GMP調控下游不同靶基因及其表達水平,從而控制細菌眾多功能,如細菌生物膜形成、毒力因子表達、耐藥性、細胞分化等。
c-di-GMP由二鳥苷環化酶(DGC)合成,磷酸二酯酶(PDE)分解。DGC含特征性GGDEF(Gly-Gly-Asp-Glu-Phe)基序的酶功能結構域,而PDE含EAL(Glu-Ala-Leu)或HD-GYP(His-Asp, Gly-Tyr-Pro)基序的酶功能結構域,PDE屬于金屬依賴磷酸水解酶超家族蛋白,發揮酶活性時需Mg2+和Mn2+,但其活性可被Ca2+和Zn2+所抑制,分子結構顯示大多數GGDEF和EAL/HD-GYP結構域蛋白胞外區都有一個含PAS、GAF、REC或HTH基序的胞外信號感受器結構域[7,12]。全基因組測序結果顯示細菌中存在數量較多的GGDEF和EAL結構域蛋白,例如大腸埃希菌有29個GGDEF或EAL結構域蛋白,腸炎沙門菌Typimurium有19個,新月柄桿菌(Caulobactercrescentus)有14個,而弧菌屬細菌則超過50個,而HD-GYP結構域蛋白相對較少或缺失[5]。鉤體中同樣具有眾多的GGDEF和EAL/HD-GYP結構域蛋白且多具有PAS、GAF或REC感受器結構域和轉膜片段,表明DGC和PDE的酶活性調控主要通過感受外環境因素變化并在膜上完成。GGDEF-EAL結構域蛋白是一種較為特殊的蛋白,這類蛋白可能是單功能酶或雙功能酶,活性可能互相激活或抑制。例如,葡糖醋桿菌有6個GGDEF-EAL結構域蛋白,其中3個表現為GDC活性,3個為PDE活性,其功能主要是調控細菌纖維素合成[13],而恥垢分枝桿菌中調控細菌長期饑餓狀態下存活的GGDEF-EAL結構域蛋白MSDGC1同時具有DGC和PDE活性,但兩個結構域分離后均無活性[8]。鉤體中有3個GGDEF-EAL結構域偶聯蛋白,其中兩個帶有REC感受器結構域,但功能尚不清楚。

采用MEGA6.06軟件的Neighbor-joining法構建,Bootstrap法(Bootstrap replication=1000)檢驗,模型為Poisson model。標注▲的蛋白序列表示為GGDEF-EAL結構域偶聯蛋白
圖1問號鉤端螺旋體賴株GGDEF結構域蛋白進化分析
Fig.1Phylogeny of L. interrogans strain Lai proteins with GGDEF domain

采用MEGA6.06軟件中Neighbor-joining法構建,Bootstrap法(Bootstrap replication=1000)檢驗,模型為Poisson model。標注▲的蛋白序列表示為GGDEF-EAL結構域偶聯蛋白
圖2問號鉤端螺旋體賴株EAL/HD-GYP結構域蛋白進化分析
Fig.2Phylogeny of L. interrogans strain Lai proteins with EAL/HD-GYP domain
基因序列比對和進化構建可以分析同一結構域蛋白在不種屬細菌中是否來自同一進化祖先,推測其功能是否有差異。本研究根據蛋白結構域的不同分別構建了相應的進化樹,在GGDEF結構域蛋白中,與非致病性雙曲鉤體Protoc I相關蛋白比較,7個具有PAS感受器結構域和1個具有GAF感受器結構域蛋白分別處于相對獨立分枝,推測其在鉤體致病過程中可能具有獨特的調控作用。具有REC感受器的LA2528蛋白與伯氏疏螺旋體B31的NP212553蛋白處于同一分枝,提示來源于同一進化祖先,REC感受器主要感知光、氣體(如NO和氧分子)、磷酸化、抗生素壓力等,進而產生相應的細胞生物學行為來適應外界環境的變化[14]。雖然EAL和HD-GYP均是PDE蛋白的酶功能結構域,但在進化上分別處于獨立群,顯示兩者來自不同的進化祖先。令人感興趣的是,鉤體3個GGDEF-EAL結構域偶聯蛋白與GGDEF結構域蛋白在進化上分別處于獨立群,而與EAL結構域蛋白有同一進化分枝,提示GGDEF-EA偶聯L結構域蛋白發揮的作用可能更傾向PDE活性。
綜上所述,利用生物信息學方法對鉤體GGDEF和EAL/HD-GYP結構域蛋白數量和結構特征分析發現其與其它細菌中的相應蛋白具有同源性,且有些蛋白具有復雜的結構域,提示在鉤體中可能存在復雜的c-di-GMP網絡,在鉤體生長和在不同環境中存活的過程中發揮重要作用,其中某些蛋白或許與鉤體毒力有關并在鉤體感染過程中具有重要作用。進一步對這些蛋白的功能研究必將有助于更好的了解鉤體在不同的環境條件中生長、存活的調節機制。
參考文獻:
[1]Adler B, Moctezuma A.Leptospiraand leptospirosis[J]. Vet Microbiol, 2010, 140: 287-296.
[2]Galperin MY, Nikolskaya AN. Identification of sensory and signal-transducing domains in two-component signaling systems[J]. Methods Enzymol, 2007, 422: 47-74.
[3]Pesavento C, Hengge R. Bacterial nucleotide-based second messengers[J]. Curr Opin Microbiol, 2009, 12: 170-176.
[4]Schirmer T, Jenal U. Structural and mechanistic determinants of c-di-GMP signaling[J]. Nat Rev Microbiol, 2009, 7(10): 724-735.
[5]Hengge R. Principles of c-di-GMP signalling in bacteria[J]. Nat Rev Microbiol, 2009, 7(4): 263-273.
[6]Ryan RP, Fouhy Y, Dow JM. Cyclic di-GMP signaling in bacteria: recent advances and new puzzles[J]. J Bacteriol, 2006, 188: 8327-8334.
[7]Seshasayee AS, Fraser GM, Luscombe NM. Comparative genomics of cyclic-di-GMP signaling in bacteria: post-translational regulation and catalytic activity[J]. Nucleic Acids Res, 2010, 38(18): 5970-5981.
[8]Jenal U, Malone J. Mechanisms of cyclic-di-GMP signaling in bacteria[J]. Annu Rev Genet, 2006, 40: 385-407.
[9]Cotter PA, Stibitz S. c-di-GMP-mediated regulation of virulence and biofilm formation[J]. Curr Opin Microbiol, 2007, 10(1): 17-23.
[10]Zhulin IB, Nikolskaya AN, Galperin MY. Common extracellular sensory domains in transmembrane receptors for diverse signal transduction pathways in bacteria and archaea[J]. J Bacteriol, 2003, 185(1): 285-294.
[11]Ho YS, Burden LM, Hurley JH. Structure of the GAF domain, a ubiquitous signaling motif and a new class of cyclic GMP receptor[J]. EMBO J, 2000, 19(20): 5288-5299.
[12]Schmidt AJ, Ryjenkov DA, Gomelsky M. The ubiquitous protein domain EAL is a cyclic diguanylate specific phosphodiesterase: enzymatically active and inactive EAL domains[J]. J Bacteriol, 2005, 187: 4774-4781.
[13]Tal R, Wong HC, Calhoon R, et al. Three cdg operons control cellular turnover of cyclic di-GMP inAcetobacterxylinum: genetic organization and occurrence of conserved domains in isoenzymes[J]. J Bacteriol, 1998, 180(17): 4416-4425.
[14]Galperin MY. Diversity of structure and function of response regulator output domains[J]. Cuur Opin Microbiol, 2010, 13(2): 150-159.
DOI:10.3969/j.issn.1002-2694.2016.02.002
通訊作者:林旭璦,Email:lxai122@163.com
Corresponding author:Lin Xü-ai, Email: lxai122@163.com
中圖分類號:R377
文獻標識碼:A
文章編號:1002-2694(2016)02-0109-05
收稿日期:2015-04-06;修回日期:2015-09-17
Bioinformatic analysis of proteins with GGDEF/EAL/HD-GYP domain in Leptospira interrogans
DING Shi-biao1,2,XIAO Guo-hui2,KONG Liang-liang2,YAN Jie2,LIN Xü-ai2
(1.Department of Clinical Laboratory, Zhejiang Hangzhou Red Cross Hospital, Hangzhou 310003, China;2.DepartmentofMicrobiologyandParasitology,CollegeofMedicine,ZhejiangUniversity,Hangzhou310058,China)
Abstract:To further understand the function and regulation of c-di-GMP, the second messenger of bacteria, bioinformatic methods were used to analysis the proteins in Leptospira interrogans with GGDEF or EAL/HD-GYP domain, which regulate the synthesis and delegation of c-di-GMP. Genes, encoded proteins with GGDEF or EAL/HD-GYP domain, in the genome of Leptospira interrogans Lai, were analyzed by PSI-BLAST. The signal peptide sequences were analyzed by Signal P 4.0 software. Protein structures were analyzed by SMART and CCD in NCBI. The transmembrane sequences were detected by EMBNET. Homology analysis of protein sequences were detected by DNAstar. The phylogenetic tree was constructed using Neighbor-joining method. There are 22 proteins of Leptospira interrogans with GGDEF or EAL/HD-GYP domain, most of them contain receptor domain, such as PAS, GAF or REC, and the transmembrane region. Seven proteins with PAS receptor domain are more independent and located in a separate evolutionary branch, while the remaining 6 proteins with GGDEF domain are distributed in different branches. Four proteins with EAL domain and 2 proteins with HD-GYP domain are also more independent and are in the different evolutionary branch. Three proteins coupling GGDEF and EAL domains are more likely to be related to PDE activity, based on the analysis of evolutionary relationships. The genes coded proteins with GGDEF and EAL/HD-GYP domain are widely exist in Leptospira interrogans genome. The analysis of related protein indicated that 1) c-di-GMP signal network with a high degree of complexity; 2) L. interrogans can reflect a hook on the environmental alteration with a sophisticated mechanism.
Keywords:Leptospira interrogans; cyclic dimeric-GMP (c-di-GMP); diguanylic cyclase (DGC); phosphodiesterase (PDE)
國家自然科學基金(No.81271781)、浙江省自然科學基金(No.LY12H19007) 資助
Supported by the National Natural Science Foundation of China(No.81271781) and the Zhejiang Province Natural Science Foundation(No.LY12H19007)