張華崇,張文蔚,簡桂良*,李蔚
(1. 中國農業科學院植物保護研究所/植物病蟲害生物學國家重點實驗室,北京100193;2. 黃岡市農業科學院,湖北黃岡438000)
植物與病原體協同進化過程中,逐漸形成了一系列復雜高效的保護機制來抵御病原物的侵染。在抗病性產生過程中,植物常激活各種形式的防衛反應,其中就包括病程相關蛋白(Pathogenesis-related proteins,PR 蛋白)的產生和積累。PR 蛋白根據氨基酸組成、生物化學和血清學特性,分為17個家族[1],其中PR5 蛋白,又稱類甜蛋白(Thaumatin-like proteins,TLP),包含1 段G-X-[GF]-X-C-X-T-[GA]-D-C-X-(1,2)-G-X-(2,3)-C的保守結構域[2]。
TLP 是植物天然免疫系統的重要組成部分,具有β-1,3-葡聚糖酶活性,參與多種植物病原真菌侵染后的防御反應,如水稻紋枯病菌(Rhizocotonia solani)的侵染可誘導水稻TLP基因表達,增強了其對該病原菌的抗性[3-4];超表達羅勒(Ocimum basilicum)ObTLP1基因明顯提高了擬南芥對核盤菌(Scleretonia sclerotiorum)和灰霉菌(Botrytis cinerea)的抗性[5]。轉入海島棉GbTLP1基因的煙草對黃萎病菌(Verticillium dahliae)和尖孢鐮刀菌(Fusarium oxysporum)有顯著的抗性[6]。此外,TLP 介導對多種非生物脅迫的耐受性,超表達TLP1基因可明顯提高擬南芥種子在鹽脅迫和氧脅迫下的萌發率[5,7],也可以提高轉基因煙草對鹽脅迫和干旱脅迫耐受性[8]。
TLP屬于多基因家族,目前已分別從擬南芥和水稻的基因組和表達序列標簽(Expressed sequence tag,EST)數據庫中分離得到TLP家族基因28 和31個[9-10],而棉花中TLP家族基因的數量還未見報道。為了全面了解陸地棉基因組中TLP家族基因結構和蛋白功能,本研究通過生物信息學方法利用陸地棉基因組數據庫和陸地棉遺傳標準系TM-1 全基因組測序結果[11-12],分析了陸地棉中TLP基因的數目、基因結構、染色體位置、系統發育以及響應棉花黃萎病菌侵染表達。
供試棉花品種為耐病品種岡早1號(GZ-1)和感病品種86-1。2個品種種子用濃硫酸脫絨處理后,挑選飽滿、大小一致的滅菌,然后將其點播于花盆中(裝填營養土與蛭石的體積比為2∶1),放置于溫度24 ℃、16h 光照、8h 黑暗、相對濕度為70%的溫室生長,當棉株長出真葉時,移至燒杯中,采用營養栽培法培養棉株[13]。2 片真葉完全展開時,采用蘸根法接種棉花黃萎病菌(強致病力大麗輪枝菌菌株V991),孢子懸浮液的含量為107mL-1,接種0、3、6、12、24、36 和48h 后分別取2個品種棉株幼根,液氮冷凍處理后保存于-80 ℃超低溫冰箱中。
以Pfam(http://pfam.xfam.org/)數據庫下載的基因種子文件Thaumatin(PF00314)為探針,用BLASTp 在Cottongen(https://www.cottongen.org/)數據庫中檢索陸地棉TLP基因家族編碼的氨基酸序列,剔除冗余序列后,利用和SMART[14](http://smart.embl-heidelberg.de)對所有候選的棉花TLP 進行結構域鑒定,保留含有完整結構域的序列,最終獲得棉花TLP基因家族。
通過ExPASy 網站中的程序Protparam[15](http://web.expasy.org/protparam/)對TLP 相對分子質量、理論等電點等基本理化性質進行預測分析,同時利用在線網站Soft Berry(http://linux1.softberry.com/berry.phtml)中的PROTCOMP 程序對TLP 家族進行亞細胞定位預測分析。
利用分子進化分析軟件MEGA 5.2的Clustal W 程序對鑒定的陸地棉TLP 家族和10個擬南芥中典型TLP 進行多重序列比對,采用鄰接法(NJ,neighbor-joining)構建系統發育樹,進行1 000 次重復。
通過在線工具GSDS2.0[16](http://gsds.cbi.pku.edu.cn/index.php)分析和繪制棉花TLP基因家族成員的基因結構圖。利用在線軟件MEME[17](http://meme-suite.org/)對TLP 保守結構域進行分析。模體最大發現數量設置為5,其他參數為默認值。
在Cottongen(https://www.cottongen.org/)數據庫中獲得的TLP基因序列及其編碼序列,利用MapInspect 進行染色體定位作圖。
各個時間點樣品RNA 提取參照RNAprep Pure 多糖多酚植物總RNA 提取試劑盒說明書,利用Fast Quant cDNA 第一鏈合成試劑盒反轉錄合成cDNA,實時熒光定量聚合酶鏈式反應(Quantitative real-time polymerase chain reaction,qRT-PCR)采用Super Real Pre Mix Plus(SYBR Green)試劑盒,以上試劑盒均購自TIANGEN 公司。反應體系(20 μL):2×SuperReal PreMix Plus 10 μL,上下游引物各0.6 μL,cDNA 1 μL,50×ROX Reference Dye 0.4 μL,RNase-free ddH2O 7.4 μL。兩步法反應程序:94 ℃15 min;95 ℃10 s,60 ℃32 s,40個循環。利用Primer Premier 5.0 軟件設計候選基因的qRT-PCR 特異引物(表1),以陸地棉GhUBQ7(DQ116441)作為內參基因。在ABI 7500 實時熒光定量PCR 儀中進行,采用2-ΔΔCT 計算候選基因相對表達量[18],采用Origin 8軟件對候選基因的定量結果進行柱形圖分析。

表1 熒光定量PCR 引物Table 1 Primer sequences used in qPCR analysis
利用結構域預測得到的結構域信息(PF00314),對陸地棉全基因組搜索,剔除冗余序列后,發現陸地棉有88個具有典型完整TNH 結構域蛋白家族成員(表2)。蛋白質理化性質分析結果顯示,最長的蛋白質序列為Gohir.A11G164600,包含817個氨基酸殘基,最短的蛋白質序列為Gohir.D02G093800,包含200個氨基酸殘基。相對分子質量最大的蛋白質序列為Gohir.A11G164600(90 274.52 Da),相對分子質量最小的序列為Gohir.D02G093800(20 580.13 Da)。理論等電點差異較大:Gohir.D11G002900 最大,為9.31;Gohir.D01G097200 最小,為4.34。亞細胞定位顯示,大多數TLP 定位在胞外,少數蛋白定位在液泡,僅Gohir.A11G164600 定位在細胞質膜。
系統進化樹(圖1)顯示,88個棉花TLP 與來源于擬南芥的10個TLP 共聚成11類。其中:基于擬南芥的10個TLP分別聚成10類,這與前人研究結果[19-20]類似,來源于陸地棉的TLP 在10類中都有分布;另外6個陸地棉的TLP(Gohir.D09G140300、Gohir.A09G144500、Gohir.A04-G069700 、Gohir . D04G108100 、Gohir . D04G-108300 和Gohir.D04G108200)單獨聚類,來源于同源染色體A 亞組和D 亞組的TLP 蛋白有聚于同一分支的趨勢。其中聚類6 TLP 最多,包含19個陸地棉TLP。有研究顯示,聚類5 中TLP 具有抑菌活性,能提高植物對病原真菌抗性[5],推測位于聚類5的陸地棉TLP 也參與植物的抗病反應。
為了解TLP基因家族基因結構,根據其系統發育關系,利用GSDS 構建了陸地棉TLP基因家族基因結構,比較了TLP基因的內含子和外顯子(圖2)。分析發現,陸地棉中的TLP基因長度變化很大,在723~2 243 bp,TLP 基因家族外顯子數量介于1~5 之間,內含子介于0~4 之間,同一聚類內存在相似的外顯子、內含子組織結構,也進一步證實了系統發育樹的可靠性。利用在線程序MEME 對陸地棉TLP 家族保守模體分析,結果發現:TLP 家族含有5個保守的motif(圖3),其長度不等,介于15~31個氨基酸殘基;其結構域高度保守,除了Gohir.D12G228600,其他TLP 家族都還有完整的5個motif,且具有相同的模體組織模式,均為Motif 5_4_2_3_1。

表2 陸地棉TLP 家族信息Table 2 Information of TLP family identified in Gossypium hirsutum

表2 (續)Table 2 (Continued)

表2 (續)Table 2 (Continued)

圖1 陸地棉中TLP 家族系統進化樹Fig. 1 Phylogenetic tree of the TLP sequences in G. hirsutum

圖2 陸地棉TLP 家族基因結構Fig. 2 Gene structure of the TLP family in G. hirsutum

圖3 陸地棉TLP 家族保守模體分析Fig. 3 Conservation motif analysis of TLP protein family in G. hirsutum
根據基因位置信息,利用MapInspect 繪制了基因的染色體定位圖(圖4),除了Gohir.1Z057000,其余87個TLP基因定位于陸地棉20條染色體上,其中A 亞組分布有42個TLP家族基因,且在A12染色體上分布最多,有8個TLP家族基因;D 亞組分布有45個TLP家族基因,且在D5 和D12染色體上分布最多,各有7個TLP家族基因。此外,TLP基因在染色體上的分布存在大量串聯重復現象,例如A 亞組中A12染色體的上Gohir.A12G226100 和Gohir.A12G226200,DA 亞組中A12染色體的上Gohir.D04G108100和Gohir.D04G107900,這表明陸地棉TLP基因在染色體上并不是隨機分布的。
qRT-PCR 分析結果(圖5)顯示,黃萎病菌侵染可以誘導6個候選基因的表達,在抗病性不同的2個棉花品種中相對表達量達到峰值的時間不同,且基因表達量在耐病品種中比在感病品種中有增高的趨勢。對于耐病品種GZ-1,其在接種黃萎病菌6~24h 后基因的相對表達量達到峰值;而對于感病品種86-1,其在接種黃萎病菌6~36h 后基因的相對表達量達到峰值。因此,這些基因可能與陸地棉抗病性相關,參與陸地棉對黃萎病菌的應答和信號傳導等。

圖4 陸地棉TLP 家族基因染色體定位Fig. 4 Chromosome location of TLP family gene in G. hirsutum
隨著大量物種基因組測序結果的釋放,在基因組水平上獲得基因家族的序列、結構和比較不同物種之間同源基因的進化關系成為可能。本研究根據釋放的陸地棉遺傳標準系TM-1,利用BLASTp 檢索篩選出88個編碼典型完整TNH結構域的TLP 氨基酸序列;利用生物信息學方法分析發現其編碼的氨基酸殘基在200~817個,相對分子質量介于20 580.13~90 274.52 Da 之間,理論等電點介于4.34~9.31 之間;亞細胞定位顯示,大多數TLP 定位在胞外,少數蛋白定位在液泡。這與劉潮等[21]在桑樹上鑒定的TLP 亞細胞定位結果一致,TLP 可能在胞外發揮作用。

圖4 (續)Fig. 4 (Continued)

圖5 接種黃萎病菌后6個候選基因在抗病性不同的2個陸地棉品種中的相對表達量Fig. 5 Relative expression of six candidate genes in two upland cotton cultivars with different disease resistance after V. dahliae inoculation
TLP的系統進化樹分析發現,陸地棉中大部分TLP 家族能和來源于擬南芥中的10個典型TLP分別聚為10個類,來源于水稻的47個TLP也聚于10類,來源于辣椒的28個聚于8類TLP[22-23],說明TLP 家族基因存在高度分化,這與該家族基因功能多樣性是一致。但有6個TLP 不在以上10類內,這可能其分化形成在與擬南芥物種分化之后,有其特殊性。同一聚類內各基因結構和蛋白序列保守基序組織模式相似,這也說明系統發育樹的可靠性。
TLP基因家族染色體定位顯示,87個TLP基因定位于陸地棉20條染色體上,其中A 亞組和D 亞組各分布有42 和45個TLP家族基因,且在A12染色體上分布最多,有8個;TLP基因在染色體上的分布存在大量串聯重復現象,以前研究[24-26]在全基因組鑒定棉花中FAR1/FHY3、HD-ZipⅣ和BZR基因家族都有串聯重復或者片段復制事件,這也是基因家族擴增的主要方式[27]。
其他物種中,聚類5 蛋白與病原菌響應有關[5]。植物TLP 蛋白主要通過裂解真菌孢子,抑制孢子萌發對病原真菌產生抑制作用[28-29];TLP具有β-1,3-葡聚糖酶活性,能結合并降解真菌細胞壁[30-31]。本研究選取編碼聚類5 蛋白的6個候選基因進行qRT-PCR 分析,結果發現,接種黃萎病菌后6個候選基因表達量都顯著升高,且在耐病品種GZ-1 中比感病品種86-1 中表達量更高。據此推測,6個候選基因在棉花介導抗病反應中發揮重要的作用,但其作用機制還需要進一步研究。