寧梓健 姜宏波 劉 琦 包 杰
(沈陽農業大學 畜牧獸醫學院 沈陽 110866)
蝦肝腸胞蟲(Enterocytozoon hepatopenaei, EHP)是一種嚴格細胞內寄生的微孢子蟲,成熟的孢子呈橢圓形,大小為(1.4±0.3)×(0.8±0.1) μm,后端有1 個空泡,胞內含1 個細胞核,5~6 圈極絲,1 個與極絲相連的錨定盤和 1 層電子致密的孢子壁(喬毅等, 2018)。EHP 于2009 年首次從斑節對蝦(Penaeus monodon)中發現并命名(Tourtip et al, 2009),感染EHP 的對蝦往往正常進食,但生長緩慢甚至停滯,直接影響到養殖產量,給養殖戶帶來嚴重的經濟損失(劉珍等, 2016; 宋增磊等, 2019),如何預防和治療 EHP 已經成為對蝦養殖產業急需解決的科學問題。明確EHP 的入侵機理是切斷EHP 的傳播途徑和針對性用藥的基礎。EHP 的一些生物合成途徑和三羧酸循環的基因缺失表明其對宿主有很強的依賴性(Katinka et al, 2001),需要從宿主吸收營養完成生活史發育,因此,在進化過程中微孢子蟲進化出一種極其復雜和獨特的感染機制以抵抗宿主免疫系統的攻擊。
分泌蛋白(Secreted protein)是在細胞內合成后分泌到細胞外起作用的蛋白質,已有研究表明,其是介導真核病原微生物與宿主之間相互作用的重要因子(McKerrow et al, 1993; Gupta et al, 2012)。在其他微孢子蟲中已有研究表明,一些分泌蛋白在蟲體入侵宿主過程中扮演著重要角色(李田等, 2013; Wang et al,2015)。因此,查找和分析EHP 的分泌蛋白對于揭示入侵機理和蟲體的免疫逃避將具有重要意義。目前,對EHP 在蝦體內的感染機制了解甚少,尤其是在宿主–寄生蟲相互作用水平上。本研究在基因組測序數據的基礎上,利用生物信息學方法在全基因組范圍內預測EHP 的分泌蛋白,同時,對所得分泌蛋白的功能進行注釋,并對其序列特征和基序進行分析,研究結果可為篩選EHP 致病相關因子和探究其侵染機理提供參考。
蝦肝腸胞蟲基因組數據來源于GenBank 數據庫(http://www.ncbi.nlm.nih.gov),其 NCBI 登錄號為MNPJ00000000.1。
用到的主要分析軟件和網站如下:蛋白質跨膜結構域預測軟件Tmhmm-2.0c(Krogh et al, 2001),線粒體蛋白預測軟件MitoProtⅡ(Claros et al, 1996),細胞核蛋白預測軟件Nucpred-1.1(Brameier et al, 2007)、NLStradamus.1.7(Nguyen Ba et al, 2009)和PredictNLS(https:// rostlab.org/owiki/index.php/PredictNLS),蛋白質信號肽預測軟件SignalP-4.0(Petersen et al, 2011),蛋白質GPI 錨定位點預測軟件Kohgpi-1.5(Fankhauser et al, 2005),蛋白質亞細胞定位預測軟件TargetP-1.1(Emanuelsson et al, 2000)和WoLF PSORT(Horton et al,2007),真核生物分泌蛋白預測程序 EuSecPred2.0(https://silkpathdb.swu.edu.cn/eusecpred),氨基酸組成分析軟件WebLogo(http://weblogo.threeplusone.com/create.cgi)(Crooks et al, 2004),蛋白質序列基序分析程序為MEME(http://meme-suite.org/tools/meme)(Bailey et al,2009)。
針對 EHP 全基因組的蛋白質編碼序列,運行EuSecPred 2.0在線流程篩選分泌蛋白(Druzhinina et al,2012)。由于本程序的局限性,只能預測到經典途徑分泌的蛋白質,可能會漏掉部分非經典途徑分泌的蛋白質。運行Tmhmm 程序去除跨膜蛋白,運行Nucpred、NLStradamus.pl 和PredictNLS 程序剔去其中的細胞核蛋白質,然后,通過SignalP-4.0 過濾掉其中無信號肽序列的蛋白質,通過MitoProt 程序過濾掉定位于線粒體的蛋白,利用TargetP 和WoLF PSORT 對具有信號肽的蛋白質進行亞細胞定位預測,保留定位于細胞膜外的蛋白質,最后,利用Kohgpi 程序剔除具有GPI 錨定位點的蛋白質,最終得到EHP 的分泌蛋白集合。
利用BLASTP 程序,將預測獲得的EHP 分泌蛋白序列分別與數據庫Nr 和Swiss-Prot 數據庫進行比對,將比對結果中得分最高的同源序列的功能作為對應分泌蛋白的功能參考(李田等, 2013; 罕園園等, 2014)。
根據SingalP-4.0 信號肽預測的結果,截取所有分泌蛋白的信號肽序列,并統計分泌蛋白和信號肽序列的長度以及各類氨基酸組成,同時,截取信號肽剪切位點前后各3 個氨基酸,并利用WebLogo 對其組成進行統計,然后,利用MEME 程序預測分泌蛋白和信號肽中的基序。
利用EuSecPred 流程對獲得的2548 個蝦肝腸胞蟲蛋白質序列進行預測,發現具有跨膜域的蛋白有2018 個,1741 個蛋白質具有細胞核定位信號,144 個蛋白質具有信號肽序列,126 個蛋白具有線粒體定位信號,119 個蛋白具有亞細胞定位信號,篩選后最終獲得了109 個分泌蛋白(表1)。
預測獲得109 個分泌蛋白,對其進行功能注釋得出,其中60 個蛋白質(占預測所得分泌蛋白的54.05%)為無明確功能信息的蛋白質,另外49 個分泌蛋白在數據庫中檢索到了同源蛋白,其中酶類數目最多,包括具有調控宿主細胞增殖和免疫系統功能的酶類:多肽N-乙酰氨基半乳糖轉移酶和泛素羧基末端水解酶;同時,還預測到1 個孢壁蛋白:SWP7,孢壁蛋白被認為在粘附、侵染以及致病等方面扮演著重要角色;另外,預測到2 種蛋白抑制因子:α-胰蛋白酶抑制劑重鏈H1、亮氨酸拉鏈假定腫瘤抑制因子2,這2 種蛋白抑制因子可能會抑制宿主免疫系統、調控細胞增殖;還預測到2 種糖蛋白(圖1)。
2.3.1 分泌蛋白與信號肽的長度和氨基酸組成 蝦肝腸胞蟲109 個分泌蛋白序列長度范圍為30~700 aa,主要集中在30~400 aa,平均長度為219.34 aa,中值為181.00 aa(圖2);信號肽長度范圍在9~32 aa,主要長度集中在15~20 aa,平均長度為18.09 aa,中值為18.00 aa (圖3)。

表1 預測的蝦肝腸胞蟲分泌蛋白基因及序列分析Tab.1 Coding genes and sequence information of the predicted EHP secreted proteins

續表

圖1 蝦肝腸胞蟲分泌蛋白的功能分類Fig.1 Functional classification of EHP secreted proteins

圖2 蝦肝腸胞蟲分泌蛋白氨基酸長度分析Fig.2 Analysis of the lengths of EHP scecreted proteins

圖3 蝦肝腸胞蟲分泌蛋白信號肽長度分析Fig.3 Analysis of the signal peptides length of secreted proteins in EHP
對分泌蛋白和信號肽的氨基酸組成統計分析發現,分泌蛋白和信號肽均以疏水性氨基酸為主(圖4)。分泌蛋白序列中疏水性氨基酸占比為42.57%,其次是親水性氨基酸,占比為29.30%。而信號肽同樣以疏水性氨基酸為主,占比高達68.93%,而親水性氨基酸比例僅為22.42%。

圖4 蝦肝腸胞蟲分泌蛋白的氨基酸組成Fig.4 Amino acid composition of EHP secreted proteins

圖5 蝦肝腸胞蟲分泌蛋白信號肽剪切位點處氨基酸的組成Fig.5 The composition of amino acids flanking the signal peptide splice site in the secretory proteins of EHP
2.3.2 信號肽剪切位點處氨基酸組成 統計信號肽剪切位點前后各3 個氨基酸的組成(圖5),分析發現,與整個信號肽氨基酸組成類似,信號肽剪切位點氨基酸組成同樣以疏水性氨基酸為主,其占比為47.90%,其中,異亮氨酸(I)和丙氨酸(A)含量最豐富;親水性氨基酸占比為34.95%,其中,絲氨酸(S)和天冬酰胺(N)所占比例較高。從各個位置的氨基酸組成分析,上游的–3 位主要為異亮氨酸(I),–2 位主要為苯丙氨酸(F),緊鄰信號肽剪切位點的–1 和1 位主要為丙氨酸(A),下游的3 位同樣主要為異亮氨酸(I)(圖6)。

圖6 蝦肝腸胞蟲分泌蛋白信號肽剪切位點處氨基酸組成Fig.6 Composition patterns of amino acids flanking the signal peptide splice site in the secreted proteins of EHP

圖7 蝦肝腸胞蟲分泌蛋白信號肽基序Fig.7 Motif in signal peptide of EHP secreted proteins
2.3.3 分泌蛋白和信號肽中的基序 對蝦肝腸胞蟲信號肽區域的基序分析,發現了1 種氨基酸組成模式:NV[VT][IK]CA[ED][SA](圖7)。對其非信號肽區分析發現3 種基序:VAYDMFLSRCILHMLDVMMLYVE NESFMDQVAEVFCFNWTATEFYNSIIR,[QM]L[RK][FA]QN[TR][ND]G[SC][NK]D[NE][KE]I[SK][QE]L[KF][IE]KIK[TE][MI]C[NK][RK]I[ED][LA][IF][VI][NF][MK][VI][VE]Q[QA][QM][TQ][YN][QE][LI]K[ME]DD[PH]和SCFGKFSFPISNRSAEYFKTVYDQWNELTVKIPV KIYRTTL(圖8)。

圖8 蝦肝腸胞蟲非信號肽區基序Fig.8 Motif in non-signal peptide of EHP secreted proteins
對于專性胞內寄生的微孢子蟲來說,目前,僅有一些關于孢壁蛋白分離方法的報道(吳正理等, 2007),尚沒有分泌蛋白的分離方法。生物信息學算法的快速發展為成功預測微孢子蟲的分泌蛋白提供了可能。本研究基于蝦肝腸胞蟲基因組數據庫,運行EuSecPred 2.0 在線流程在全基因組2548 條蛋白質中進行篩選和預測,最終獲得了109 條分泌蛋白,這些分泌蛋白組成以疏水性氨基酸為主,這與其信號肽和剪切位點前后各3 個氨基酸組成相一致。
本研究預測獲得的 109 條分泌蛋白,其中,60 個是無功能注釋的蛋白質,這部分蛋白質可能是蝦肝腸胞蟲分泌的特有蛋白質。在有明確功能注釋的49 個分泌蛋白中,有些是與微孢子蟲黏附和入侵相關的蛋白,如孢壁蛋白(Spore wall protein,SWP)、鈣粘蛋白(Cadherin)和多肽N-乙酰氨基半乳糖轉移酶12(Polypeptide N-acetylgalactosam inyltransferase 12,GALNT12)。孢壁(Spore wall)是微孢子蟲最外層的結構,在侵染過程中,孢壁應最先與宿主細胞接觸。孢壁蛋白作為孢壁的主要成分,對維持孢壁穩固結構和保護胞內原生質起著重要作用,同時直接參與侵染過程中與宿主細胞的特異性識別過程。Jaroenlak 等(2018)鑒定并分離了EHP 的第1 個孢壁蛋白(EhSWP1),在其N 末端發現了3 個肝素結合基序,進一步的體外結合實驗、競爭實驗和誘變研究表明,EhSWP1 能夠和肝素結合進而引發入侵。同樣,Yang 等(2018)研究證明,家蠶微孢子蟲(Nosema bombycis)的部分孢壁蛋白在粘附和侵染過程中起關鍵作用,本研究中篩選的SWP7 也可能與EHP 的入侵相關。鈣粘蛋白是1 種Ca 依賴的細胞粘著糖蛋白,可能與宿主細胞的靶向信號識別并粘附;同時,Frixione 等(1994)研究表明,Ca2+會以某種方式觸發孢子萌發。GALNT12 是合成O-糖鏈的起始酶,而粘蛋白主要由O-糖鏈組成,參與很多與粘附相關的過程,O-糖鏈還可調控細胞表面受體的表達,進而影響細胞的生長和凋亡(劉可人等,2006)。因此,推測EHP 侵染過程中分泌的GALNT1可能參與到宿主細胞的識別和粘附。
在這些分泌蛋白中還有一些抑制宿主免疫功能的分泌蛋白。α-胰蛋白酶抑制劑重鏈H1(Inter-alphatrypsin inhibitor heavy chain H1, ITIH1)可調控細胞外基質穩定并抑制C5 轉化酶活性(Zhuo et al, 2008),進而抑制宿主免疫系統。泛素羧基末端水解酶(Ubiquitin carboxyl-terminal hydrolase,UCH)可水解被泛素(Ubiquitin)標記的需要被分解的蛋白質,也可以標記跨膜蛋白,然后通過酶促反應相互連接,進而介導靶蛋白的降解或跨膜運輸。Ciechanover 等(2000)研究表明,泛素蛋白水解系統在廣泛的細胞基本過程中發揮重要作用。其中,包括調節細胞周期、調節免疫和炎癥反應、控制信號轉導途徑、發育和分化、DNA修復等。這些復雜的過程是通過蛋白質的單個或子集的特異性降解來控制的。蝦肝腸胞蟲UCH7 在侵染過程中的信號傳遞及調控宿主免疫方面行使何種功能尚需研究進行明確。
另外,還有調控細胞增殖的蛋白,比如亮氨酸拉鏈假定腫瘤抑制因子2 (Leucine zipper putative tumor suppressor, LZTS2),擁有特定的亮氨酸拉鏈結構域(LZ),參與Wnt/β-catenin信號通路調控β-catenin的表達及細胞內分布,與NF-κB擁有廣泛的相互作用,從而調控細胞增殖和凋亡(Peng et al, 2011; 王梟雄等,2014)。在微管系統中,LZTS2也有重要的調節作用,可抑制細胞的有絲分裂和遷移(張軼等, 2016)。EHP分泌的LZTS2是否能抑制宿主細胞的增殖和遷移從而抑制宿主細胞行使其功能尚需進一步研究。
分泌蛋白在多種寄生蟲系統中介導粘附和侵襲,對于明確胞內寄生蟲的感染機制至關重要。本研究初步篩選了109 個分泌蛋白,接下來進一步對這些分泌蛋白進行功能研究對于理解蝦肝腸胞蟲的入侵機理具有重要意義。