解美霞,楊君,王國寧,李志坤,張艷,孟成生,馬峙英,王省芬
(教育部華北作物種質資源研究與利用重點實驗室/ 河北省棉花產業協同創新中心/河北省作物種質資源重點實驗室/ 河北農業大學農學院,河北保定071001)
在蛋白家族數據庫Pfam 中有3 700 多種未知功能域(Domains of unknown function,DUF)蛋白,占到所有已知結構域蛋白的25%左右[1]。基因組學與蛋白質組學的快速發展為系統研究DUF家族蛋白提供了重要的生物信息學數據,更為揭示這些未知結構域家族基因在調控植物生長發育以及響應逆境脅迫方面的研究奠定了基礎[2]。
DUF642 家族蛋白包含1~2 個高度保守的DUF642 結構域,是種子植物所特有的高度保守的細胞壁相關蛋白[3]。在水稻(Oryza sativa)和擬南芥(Arabidopsis thaliana)中分別有 12 個和 10個 DUF642 家族成員[4-6]。DUF642 在植物抵抗病原菌侵染和非生物逆境脅迫響應過程中發揮重要作用。擬南芥DUF642 基因 At5g25460 和At3g08030 可受細菌侵染和害蟲取食誘導表達。在接種青枯雷爾氏菌(Ralstonia solanacearum)后At5g25460 下調表達[7],而 At3G08030 在接種帶化紅球菌(Rhodococcus fascians)后上調表達[8]。擬南芥 DUF642 家族蛋白 BIIDXI(BDX)參與調節不同組織中細胞壁果膠甲基酯化[9]。Xie 等[10]從中國葡萄(Vitis quinquangularis)丹鳳 2 號中克隆到VqDUF642,其過表達能夠使植株果膠甲酯酶(Pectin methylesterases,PME)活性增強,從而提高對灰葡萄孢菌(Botrytis cinerea)的抗性,表明VqDUF642 與漿果發育和抗病性有關。籽粒莧(Amaranthus hypochondriacus)AhDGR2 是 1 個編碼DUF642 蛋白的基因,在鹽和干旱等脅迫誘導下發生顯著表達變化[11]。玉米ZmDUF642 基因在干旱、鹽和鋁等脅迫誘導下也能發生顯著表達變化[12]。
目前,我國各大棉區都遭受不同程度的鹽堿、干旱、冷害、病害、蟲害的威脅[13-20]。不斷發掘和篩選具有抗逆功能的基因成為棉花研究領域的重要科學問題之一。陸地棉(Gossypium hirsutum)基因組測序工作取得明顯進展[21-22],使系統地鑒定和研究棉花基因家族成為可能。DUF642基因已經顯示出參與植物抗逆反應的潛在重要性,但目前尚未見其在棉花中的研究報道。本研究基于陸地棉全基因組數據,對DUF642 基因家族進行了系統鑒定和生物信息學分析,特別是應用轉錄組數據和實時定量聚合酶鏈式反應(Real-time quantitative polymerase chain reaction,RT-qPCR)技術分析了DUF642 家族基因在不同組織和多種逆境脅迫下的表達規律,為后續解析其功能奠定基礎。
通過 TAIR(https://www.arabidopsis.org)網站下載擬南芥DUF642 家族基因序列,在陸地棉TM-1 基因組數據 (NAU version 1.1) 中進行BLAST 分析,并利用Pfam 數據庫進一步鑒定。通過 ExPASy-ProtParam tool(http: //www.expasy.org/tools/protparam.html) 在線軟件分析 DUF642蛋白的氨基酸殘基數量、相對分子質量、理論等電點及不穩定指數等[23]。使用CELLO V.2.5(http://cello.life.nctu.edu.tw/) 在線工具進行蛋白亞細胞定位預測[24]。使用 SignalP 4.0(http://www.cbs.dtu.dk/services/SignalP/)預測信號肽[25]。
從 Cotton Functional Genomics Database(CottonFGD)(https://cottonfgd.org/)[26]提取陸地棉DUF642 基因家族的基本信息,包括基因序列、編碼序列(Coding sequence,CDS)、染色體位置等。利用TBtools 軟件分析基因的染色體定位[27]。通過 GSDS2.0(http://gsds.cbi.pku.edu.cn/)在線軟件分析基因結構[28]。
利用軟件MEGA7.0 對陸地棉與擬南芥DUF642 基因編碼的蛋白進行多序列比對,使用相鄰連接法(Neighbor-Joining,NJ)構建系統進化樹[29]。
截取陸地棉DUF642 基因上游1 500 bp DNA 序列,利用 PlantCARE 數據庫(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)預測可能存在的順式作用元件。
從 NCBI SRA(Sequence Read Archive)數據庫下載陸地棉的7 種器官(根、莖、葉、雌蕊、雄蕊、花萼和花瓣)和4 種逆境脅迫(冷、熱、干旱和鹽)處理后的轉錄組數據(基因組測序計劃編號(Genome sequencing project accession):PRJNA 248163)。棉花材料處理和數據獲取過程詳見Zhang 等[21]的研究報道。以 FPKM(Fragments per kilobase of transcript per million fragments mapped)>1 作為基因表達的篩選標準。通過對數據進行log2(1+FPKM)標準化。以表達量倍數變化(Fold change,FC)>1.5 或<0.8 作為基因具有顯著表達差異標準。使用HemI(Heatmap Illustrator,version 1.0) 軟件繪制基因表達熱圖[30]。
供試棉花品種為抗病陸地棉農大601(ND601),由河北農業大學棉花品種創新與產業化團隊提供。棉種先用無菌水浸泡24 h,然后置于濕潤毛巾上于室溫催芽;大約1 d 后,挑選長勢一致(芽長0.5 cm)的發芽種子播種到六棱缽中,于16 h 光照/8 h 黑暗和25 ℃條件下的生長室中進行培養。棉苗生長約7 d 后用于接種黃萎病菌。參考Yang 等[31]的方法進行黃萎病菌孢子懸浮液的制備和棉苗接種處理。每棵棉苗接種懸浮液30 mL (孢子含量 107mL-1)。在接菌 0 h、6 h、12 h、24 h、48 h 時,取棉花根部,用蒸餾水清洗干凈,于液氮速凍后-80 ℃保存備用。每個時間點取3株棉苗,每次取3 個生物學重復。以蒸餾水代替菌液處理的棉苗作為對照(CK)。
按照EASYspin Plant RNA kit 試劑盒操作說明提取棉花根組織總RNA。經1.5%(質量分數)的瓊脂糖凝膠電泳和Nano Drop 2000 分光光度計檢測RNA 樣品的質量和濃度后,使用Rever-Tra AceqPCR RT Master Mix with gDNA Remover(TOBOYO)反轉錄試劑盒合成 cDNA。采用 THUNDERBIRDSYBRqPCR Mix(TOBOYO) 定量試劑盒進行 RT-qPCR。反應于7500 Real Time PCR System(Applied Biosystems)中進行,程序設置:95 ℃預變性 3 min;95 ℃變性 10 s,58 ℃退火 20 s,72 ℃延伸 34 s,40 次循環。所用引物詳見表1,其中GhHis3 作為內參[32]。每個樣品進行 3 次重復檢測,采用 2-ΔΔCT法計算基因的相對表達量[33]。使用GraphPad Prism7 軟件對數據進行Tukey 多重比較測試和繪圖。

表1 本研究所用引物Table 1 Primers used in this study
基于陸地棉基因組數據,通過BLAST 共鑒定到23 個DUF642 基因。根據它們在染色體上的位置依次命名為GhDUF642-01~GhDUF642-23(表2)。其中GhDUF642-18 基因序列不完整,故根據華中農業大學公布的陸地棉基因組信息(HAU version 1.1) 對該基因序列進行了修正[22]。陸地棉DUF642 家族基因開放讀碼框(Open reading frame,ORF)長度為 612~1 245 bp,編碼的蛋白含有203~414 個氨基酸殘基,相對分子質量介于 22.10 ~45.15 kDa,理論等電點在4.37~9.41,不穩定指數為 27.85~41.13,結構相對穩定。除GhDUF642-11 外,家族其他成員都含有信號肽。除 GhDUF642-23 含有 1 個 DUF642結構域外,其他家族成員都含有2 個結構域。蛋白亞細胞定位預測顯示,GhDUF642 中有8 個定位在細胞膜,6 個定位在胞外,5 個定位在葉綠體,2 個定位在細胞質,2 個定位在線粒體。

表2 陸地棉DUF642 基因信息Table 2 The information of Gossypium hirsutum DUF642
23 個GhDUF642 基因分布在陸地棉的14條 染 色 體 (A02、A05、A06、A07、A08、A09、A10、D03、D05、D06、D07、D08、D09、D10)和 1 條 scaffold (scaffold3920_D03) 上。GhDUF642-06 與GhDUF642-07、GhDUF642-11 與GhDUF642-12、GhDUF642-22 與GhDUF642-23 分別串聯分布在A07、A10 和 D10 染色體(圖1)。
根據基因全長和CDS 序列對GhDUF642 進行基因結構分析。如圖2 所示,GhDUF642 大多含有2~4 個外顯子。根據內含子和外顯子的數量與位置,該家族基因可分為3 組,即Ⅰ、Ⅱ和Ⅲ,分別包括10 個、6 個和7 個基因。同組內基因顯示出相似的結構。

圖1 陸地棉DUF642 基因的染色體定位Fig.1 Chromosome location of Gossypium hirsutum DUF642 genes

圖2 GhDUF642 基因結構Fig.2 Gene structure of GhDUF642
利用陸地棉與擬南芥DUF642 家族基因編碼的氨基酸序列構建系統進化樹,結果(圖3)顯示,所有的DUF642 蛋白可分為4 個亞組。At2g41810與 GhDUF642-01、GhDUF642-09、Gh DUF642-13和 GhDUF642-20 這 4 個蛋白位于同一分支。At3g08030 與 GhDUF642-08 和 GhDUF642-19 位于同一分支。At5g11420、At5g25460 和At4g32460與 GhDUF642-02、GhDUF642-05、GhDUF642-14和GhDUF642-17 這4 個蛋白位于同一分支。每個亞組并沒有因為物種差異而單獨分成2 類,表明陸地棉與擬南芥DUF642 家族成員有較近的親緣關系,可能具有相似的生物學功能。

圖3 陸地棉與擬南芥DUF642 家族的系統進化分析Fig.3 Phylogenetic analysis of DUF642 from Gossypium hirsutum and Arabidopsis thaliana
如圖4 所示,陸地棉DUF642 家族基因上游1 500 bp 存在數量不等的響應植物激素和環境脅迫相關順式作用元件。這些激素包括生長素(Indole-3-acetic acid,IAA)、脫落酸(Abscisic acid,ABA)、乙烯(Ethylene,ET)、水楊酸(Salicylic acid,SA)、赤霉素(Gibberellic acid,GA)和茉莉酸甲酯(Methyl jasmonate,MeJA)。環境脅迫相關的順式作用元件有3 種,包括干旱響應元件(MBS)、防御和脅迫響應元件(Defense and stress)和低溫響應元件(LTR)。其中GhDUF642-08 和GhDUF642-21 各含有9 個順式作用元件,是具有調控元件最多的基因;GhDUF642 含有響應ABA 的順式作用元件數量最多,如GhDUF642-01、Gh-DUF642-04 等 8 個基因各含有 3 個; 除了Gh-DUF642-01、GhDUF642-11 和GhDUF642-13 外,其余20 個DUF642 基因中都具有1 個響應ET的順式作用元件。由此可見,每個GhDUF642 啟動子含有不同數量和種類的順式作用元件,表明它們可能通過不同的信號通路參與多種環境脅迫反應。

圖4 GhDUF642 順式作用元件分析Fig.4 cis-acting elements analysis of GhDUF642 genes
對GhDUF642 基因在棉花根、莖、葉、雌蕊、雄蕊、花萼和花瓣7 個組織中的表達模式分析結果顯示,23 個GhDUF642 基因中有14 個具有組織表達特異性(圖5)。可分為5 種組織表達模式:模式Ⅰ只包含1 個基因GhDUF642-02,其主要在副萼和根中表達;模式Ⅱ包括GhDUF642-03、Gh-DUF642-09 、GhDUF642-15 、GhDUF642-20 和GhDUF642-22,它們在7 種組織中都具有較低表達量;模式Ⅲ包括GhDUF642-08、GhDUF642-10、GhDUF642-19 和GhDUF642-21,它們在根、莖、葉和雌蕊中具有較高表達量; 模式Ⅳ包括Gh-DUF642-04、GhDUF642-14 和GhDUF642-16,它們除在莖和葉中低表達,在其余5 種組織中都高表達;模式Ⅴ只有GhDUF642-17,其主要在副萼、花瓣和根中表達。

圖5 GhDUF642 基因的組織表達特異性Fig.5 Tissue specificity expression of GhDUF642 genes
對陸地棉DUF642 家族基因在冷、熱、干旱和鹽4 種逆境脅迫處理后的表達分析結果顯示:冷脅迫處理后,14 個GhDUF642 基因的表達發生了顯著變化,其中GhDUF642-09 在處理1 h 時顯著上調表達,隨后轉為顯著下調表達; 而Gh-DUF642-18 在處理1 h 后顯著下調表達,但在處理12 h 時變為顯著上調表達;GhDUF642-20 在處理6 h 時顯著上調表達;其余11 個GhDUF642在冷脅迫處理后均表現為顯著下調表達 (圖6A)。熱脅迫處理后,13 個GhDUF642 基因表達量發生顯著變化,其中GhDUF642-21 在處理1 h時顯著上調表達;GhDUF642-09 和GhDUF642-20在處理6 h 時顯著上調表達,隨后轉為顯著下調表達;GhDUF642-16 和GhDUF642-22 在處理 6 h時顯著下調表達;GhDUF642-02 和Gh-DUF642-14 在處理 12 h 時顯著下調表達 (圖6B)。通過聚乙二醇(Polyethylene glycol,PEG)模擬干旱脅迫效應,導致13 個GhDUF642 基因的表達發生顯著變化,其中GhDUF642-09 和Gh-DUF642-16 在處理1 h 時顯著上調表達,但Gh-DUF642-16 在處理12 h 時又顯著下調表達;Gh-DUF642-22 在處理1 h 后先顯著下調表達,而在處理12 h 時變為顯著上調表達;GhDUF642-10和GhDUF642-20 在處理 3 h 和6 h 時分別發生顯著下調表達;GhDUF642-02、GhDUF642-14 和GhDUF642-17 在處理12 h 時顯著下調表達 (圖6C)。鹽脅迫處理后,12 個GhDUF642 基因的表達量發生了顯著變化,其中GhDUF642-09 和Gh-DUF642-16 在處理1 h 時顯著上調表達,隨后轉為顯著下調表達; 其余10 個基因在鹽脅迫處理后部分時間點表現為顯著下調表達(圖6D)。這些GhDUF642 對于不同脅迫處理表現出不同的表達變化,表明它們可能在棉花應對不同的逆境脅迫時發揮不同的重要作用。

圖6 陸地棉 DUF642 基因在冷(A)、熱(B)、干旱(C)和鹽(D)等 4 種逆境脅迫下的表達Fig.6 Expression profiling of DUF642 genes from Gossypium hirsutum under four stresses, including cold (A), hot(B), drought (C) and salt (D)
根據本研究團隊已獲得的大麗輪枝菌脅迫處理后的棉花根組織轉錄組數據(尚未發表),選擇其中6 個具有潛在表達差異的GhDUF642 基因進行RT-qPCR 分析。結果顯示,在一段時期內,GhDUF642-04、GhDUF642-08、GhDUF642-16、GhDUF642-19 和GhDUF642-21 這 5 個基因受黃萎病菌誘導后顯著下調表達,而Gh-DUF642-10 顯著上調表達(圖7),表明這些基因參與棉花響應黃萎病菌侵染過程。

圖7 黃萎病菌脅迫下陸地棉DUF642 基因表達分析Fig.7 The expression analysis of GhDUF642 genes from upland cotton induced with Verticillium dahliae
近年來,棉花基因組測序工作的不斷完成與更新,為從全基因組水平研究基因功能奠定了基礎。目前,關于棉花DUF642 基因家族的研究還未見報道。本研究首次在陸地棉基因組中鑒定到23 個GhDUF642 基因(表 1),多于擬南芥(10個)和水稻(12 個)中已鑒定的DUF642 基因數量[4-6],這可能是由于棉花基因組加倍的結果。Gh-DUF642-06 與GhDUF642-07、GhDUF642-11 與GhDUF642-12 以及GhDUF642-22 與GhDUF642-23 分別串聯于 A07、A10 和 D10 染色體 (圖1),可能是由于基因串聯復制導致該基因家族的擴張。基因結構分析顯示GhDUF642 家族基因可分為3 組,各組基因具有相似的基因結構,且內含子長度、外顯子數目幾乎一致,但各組之間內含子序列長度不同(圖2)。另外,通過氨基酸序列進行的聚類分析顯示,擬南芥與棉花的DUF642基因發生了聚集效應(圖3)。GhDUF642-01、GhDUF642-09、GhDUF642-13、GhDUF642-20 與At2g41810 位于同一進化分支,而At2g41810 與擬南芥耐鹽相關[34],因此推測這4 個GhDUF642 基因可能參與棉花鹽脅迫響應。轉錄水平上的變化進一步表明了GhDUF642-09 參與棉花抗鹽脅迫(圖6D)。GhDUF642-08、GhDUF642-19 與At3g08030 位于同一進化分支。目前,At3g08030被證明參與種子發育過程[35],尚未見其參與抗逆功能的報道。本研究發現GhDUF642-08 和Gh-DUF642-19 序列上游都有響應 SA、ABA、IAA、ET 和GA 的調控元件(圖4),并且它們在根中高表達(圖5),受黃萎病菌誘導后顯著下調表達(圖7),表明這2 個基因可能參與棉花抗黃萎病菌侵染過程,但具體的抗病信號通路還有待進一步確認。At4g32460 和 At5g11420 編碼的 DUF642 蛋白在擬南芥發育過程中可能是PME 活性的陽性調控因子。在種子萌發過程中過表達這2 個基因,轉基因株系的PME 活性顯著增強,種子萌發性能改善[36]。At5g25460 對根與葉的伸展和生長具有重要的作用[4]。GhDUF642-02、GhDUF642-05、GhDUF642-14 、GhDUF642-17 與 At4g32460 、At5g11420 和At5g25460 位于同一進化分支 (圖3),推測這4 個GhDUF642 基因可能參與調節棉花生長發育過程。目前,關于植物DUF642 基因家族功能的研究還很有限。本研究通過生物信息學鑒定了陸地棉DUF642 基因家族,在轉錄水平上初步探討了它們可能具有的生長發育和抗逆功能,為進一步研究該家族基因奠定了重要的基礎。