董章勇,舒永馨,陳欣瑜,羅 梅
(仲愷農業工程學院 農業與生物學院,廣州 510225)
玫煙色棒束孢(Isariafumosorosea,原名玫煙色擬青霉Paecilomycesfumosoroseus)屬于半知菌亞門(Deuteromycotian)絲孢綱(Hyphomycetes)絲孢目(Moniliales)叢梗孢科(Moniliaceae)棒束孢屬(Isaria),是一種重要的昆蟲致病真菌。其分布廣泛,寄主范圍也相當廣泛,能侵染粉虱、蚜蟲、小菜蛾等多種半翅目、雙翅目、鞘翅目等昆蟲[1-4]。黃振等[5]研究表明,玫煙色棒束孢與毗蟲琳等化學農藥使用時能較好地發揮其聯合控制的效果。念曉歌等[6]用玫煙色棒束孢與化學農藥進行混配使用,驗證其與高效氯氰菊酯的相容性最好,在常規使用濃度下,該農藥對玫煙色棒束孢菌絲生長和孢子萌發影響極小。而目前國內外對玫煙色棒束孢的研究報道主要為生物學、分類鑒定、致病力測定、致病機理、防治應用等方面并且北美和歐洲已經有真菌殺蟲劑產品登記注冊并用于害蟲的防治[7-8]。但是由于生防真菌受多種生態因子影響,對寄主昆蟲的致病過程復雜,實踐應用防效不穩定,在一定程度上限制了其應用[9]。隨著分子生物學技術的發展,利用基因工程等生物技術手段對菌株進行改良以提高菌株的毒力和穩定性成為目前的研究熱點。昆蟲病原真菌的侵染過程分為體表吸附階段、孢子萌發、體壁穿透階段和菌體在寄主體內增殖等4個階段。而昆蟲在長期進化過程中也建立了一套特殊的針對外來病原物的防御體系。在昆蟲寄主與病原物的互作過程中,有眾多的影響因素。隨著多種昆蟲生物防治菌株的測序完成[10],給該研究帶來極大便利。
效應因子也稱效應子或效應蛋白,廣義上是指能夠選擇性地結合其他目標蛋白及調節其生物活性的一類小分子蛋白[11-13]。隨著研究的深入,效應因子被認為在病原物與寄主的互作過程中發揮著重要作用[11-16]。傳統效應因子的驗證是通過寄主互作的試驗進行驗證[17-18],這種方法效率較慢。隨著生物信息學的快速發展,已經有越來越多的人選擇利用高通量的方法進行快速篩選[19-20]。效應分子一般具有以下特征:(1)含有N-端信號肽;(2)無跨膜結構域;(3)定位于細胞質;(4)序列具有特異性;(5)富含半胱氨酸;(6)重復元件多;(7)氨基酸殘基數量大約在50~300氨基酸[13-14]。運用生物信息學的方法可以高效快速地找到靶標。
本研究擬以玫煙色棒束孢全基因組的10061個蛋白序列作為研究序列,根據效應因子的7個典型特征,利用生物信息學軟件對其候選效應因子進行預測,并對預測結果作初步分析,為玫煙色棒束孢效應子的進一步篩選與驗證提供一定的理論依據,并為探究效應子在昆蟲與病原菌互作過程中的作用奠定基礎,為玫煙色棒束孢的防治應用提供新的依據和途徑。
玫煙色棒束孢蛋白序列于NCBI(https://www.ncbi.nlm.nih.gov/genome/?term=Isaria+fumosorosea)下載,共包含10 061個蛋白序列(GenBank ID:AZHB00000000.1)。
利用SignalP v4.1進行信號肽的預測[21],利用TMHMM v2.0進行跨膜層數的預測[22-23],采用TargetP v1.1 和ProtComp v9.0在線分析軟件進行細胞定位分析[24],篩選出定位于細胞質器中的分泌蛋白序列。
將“1.2”分析得到的蛋白序列進行半胱氨酸(Cysteine)含量及多串聯重復序列(Multiple tandem repeats)進行分析。半胱氨酸含量采用perl工具進行計算。將具有高半胱氨酸含量的(≥6)的蛋白序列進行多個串聯重復序列分析。多個串聯重復序列采用T-Reks (http://bioinfo.montp.cnrs.fr/?r= t-reks/)進行預測。
將“1.3”所獲得的蛋白序列和PHI數據庫(Pathogen-Host interaction database,http://www.Phi-bas e.org/downloadLink.htm)進行比對分析,篩選出具有致病功能的蛋白。
將“1.4”獲得的蛋白序列進行長度篩選,去除大于300個氨基酸的蛋白序列,剩余的為候選的效應因子。
玫煙色棒束孢全基因組共10 061個蛋白序列。利用SignalP v4.1進行信號肽的分析,共得到1 112個蛋白具有信號肽;然后以1 112個蛋白進一步應用TMHMM v2.0進行跨膜結構分析,得到1 030個跨膜數小于2的蛋白;將1 030個蛋白用TargetP v1.1進行分析,得到1 001個定位為分泌途徑的信號肽(SP);最后將這1 001個蛋白用ProtComp v9.0進行定位分析,得到929個蛋白定位于細胞質中(圖1)。以這929個蛋白作進一步分析。

圖1 玫煙色棒束孢基因組分泌蛋白的鑒定Fig.1 Identification of secretome in Isaria fumosorosea
將929個蛋白序列進行半胱氨酸含量及多串聯重復分析。得到半胱氨酸含量大于等于6的蛋白序列共495個。含有半胱氨酸的個數為6~51。其中含有6個半胱氨酸的蛋白最多,有117個蛋白;含有7、8、9、10個的分別有68、86、38和55個;超過21個半胱氨酸個數的蛋白相對較少(圖2)。將495個蛋白序列進一步進行多串聯重復分析,最終得到146個多串聯重復大于或等于9的蛋白序列。
將富含半胱氨酸且多串聯重復性高的146個蛋白序列和PHI數據庫進行比對。結果如下:共有137個蛋白在PHI數據中獲得注釋。其中,68個蛋白被證明缺失后會造成致病力減弱(Reduced virulence),占總數的50.7%;2個蛋白缺失后會完全失去致病力(Loss of pathogenicity),占總數的1.5%,推測其為致病因子;9個蛋白已被證明是效應因子,占總數的6.7%;其中7個Mixed outcome蛋白序列里面有4個蛋白序列分別為失去致病力-毒性減弱和毒性減弱-失去致病力,歸為候選效應因子,占總數的3.0%;剩余的41個蛋白則被認為是不影響病原的致病力(Unaffected pathogenicity),占總數的30.6%,2個蛋白會導致毒力增強,占總數的1.5%。通過與PHI數據庫比對后,作為候選效應因子的基因共有91個,其中包括:效應因子9個,致病力減弱基因68個,失去致病力基因2個,混合型基因4個,致死的有8個(表1)。
一般的效應因子蛋白序列長度小于300。因此,將上述步驟獲得的137個基因序列進一步進行長度篩選。結果剩余19個基因序列,這19個基因序列則被認為是候選致病相關效應因子(表2)。

圖2 495個玫煙色棒束孢分泌基因的半胱氨酸含量分類Fig.2 Classification of cysteine content in 495 Isaria fumosorosea secretory genes

表1 137個玫煙色棒束孢候選效應蛋白的基因功能的匯總Table 1 Summary of gene functions of 137 candidate effectors of Isaria fumosorosea
注:*混合型里面有4個蛋白序列分別為失去致病性以及效應因子,歸為候選效應因子。
Note: * Four protein sequnces in mixed outcome are loss of pathogenicities and effectors,it belongs to candidate effectors.
植物病原菌的分泌蛋白及效應因子的研究相對較多。如曹友志[25]利用楊生褐盤二孢菌(Marssoninabrunnea)全基因組數據,預測出106個符合要求的候選效應因子。李孟瓊[26]從稻瘟菌基因組中分析得到21個效應因子。陳琦光等[20]從希金斯刺盤孢基因組中分析得到135個蛋白。在病原菌的生防真菌的預測主要集中在分泌蛋白。如枯草芽孢桿菌、粘綠木霉和哈赤木霉[27-29]。昆蟲病原真菌的效應蛋白預測研究相對較少。而在效應蛋白的預測上,前期分泌蛋白的預測方法相對較統一,后期的篩選由于使用方法的不一樣,導致獲得效應因子的數量也有很大差別。本研究通過與PHI數據庫進行比較,剔除了一些已經證實與致病效果不相關的蛋白,有利于縮小范圍進行后續功能驗證試驗的開展。最終得到19個候選效應因子,16個為敲除后致病能力減弱的效應因子,其他3個分別為失去致病力以及植物無毒性決定簇的效應因子。其中15個基因的注釋均為假定蛋白,說明尚有許多基因尚未定名,而此15個候選的玫煙色棒束孢的效應因子的功能需要進一步的進行驗證。其余4個蛋白分別為細胞外膜蛋白,CFEM結構域(Extracellular membrane protein,CFEM domain protein,OAA52920)、類胰蛋白酶絲氨酸蛋白酶(Trypsin-like serine protease,OAA57155)、細胞壁半乳甘露蛋白MP2/類過敏原F17蛋白(Cell wall galactomannoprotein Mp2/allergen F17-like protein,OAA57821)及藍藻抗病毒蛋白N(Cyanovirin-N,OAA72610)。有意思的是,其中CFEM結構域蛋白在球孢白僵菌的效應蛋白中也分析到該蛋白[30]。張騰飛等[31]在球孢白僵菌對小菜蛾的侵染相關基因分析中表明,胞外絲氨酸富集蛋白在其侵染過程中表達差異顯著,該蛋白在玫煙色棒束孢的致病過程中發揮何種作用尚需進一步分析。

表2 19個玫煙色棒束孢候選致病相關效應因子Table 2 19 candidate pathogenic effectors of Isaria fumosorosea
注:*基因編碼指玫煙色棒束孢基因組翻譯蛋白的NCBI序列號。
Note: * Gene code refers to the sequence number of translated protein ofIsariafumosoroseagenome in NCBI.
隨著更多的昆蟲病原真菌全基因組序列的公布,為進一步利用生物信息學的方法對這些基因組進行效應因子分析提供了數據。預測得到的這些效應蛋白液仍然需要進一步進行相應的功能驗證及與寄主互作的驗證。本研究首次對玫煙色棒束孢全基因組的效應因子進行標準化的預測和分析,結果準確。
本研究通過對玫煙色棒束孢全基因組的 10 061個蛋白序列進行篩選,共獲得929個分泌蛋白;將940個蛋白序列進行半胱氨酸含量及多個串聯重復序列分析,共得到495個含有高半胱氨酸含量(≥ 6)的蛋白和146個含有多個串聯重復序列(≥ 9)的蛋白;病原寄主互作數據庫進行比對,篩選到91個致病蛋白,去除>300的氨基酸序列,最終得到19個候選致病相關的效應因子。本研究為進一步深入研究玫煙色棒束孢效應子的功能奠定一定理論基礎。