瑪依拉·玉素音,陽 妮,徐海江,楊延龍,張大偉,李春平,石必顯,賴成霞
(新疆農業科學院經濟作物研究所,烏魯木齊 830091)
【研究意義】棉鈴蟲(HelicoverpaarmigeraHubner)是鱗翅目,夜蛾科昆蟲,是棉花蕾鈴期中最主要的害蟲之一[1]。棉花受到棉鈴蟲、棉蚜等有害生物時,會產生多種代謝組分來躲避侵害,而這些代謝組分的變化與基因組調控密切相關,同一代謝物質可受一種或多種防御基因調控[2]。挖掘棉花中響應蟲害脅迫的基因并探究其功能對棉花基因工程研究有重要意義。【前人研究進展】糖基轉移酶(glycosyltransferases,GT; EC 2.4.x.y)是生物體內廣泛存在的一種進行糖基化反應的轉移酶,能夠將糖基從核苷酸糖供體轉移到次生代謝物、激素類、蛋白類等化合物上[3],其中最常見的一種糖供體是尿苷二磷酸糖基轉移酶(UGT)[4]。在植物應答蟲害脅迫過程中,糖基轉移酶在調控基因、蛋白、代謝的變化和表達發揮著重要作用[5]。Jing等[6]研究發現,在糖基轉移酶的作用下,順-3-己烯醇能生成順-3-己烯醇糖苷,激活茶樹茉莉酸和乙烯信號通路,并由此提高茶樹對茶尺蠖的直接和間接防御反應。Augustin等[7]報道了在害蟲脅迫下,枸杞UGT73C10~13基因表達上調催化了常春藤皂苷元和皂素齊墩果酸發生3-O-葡萄糖基化,增加了枸杞對害蟲的抗性,并且在基因下調時,其對害蟲的抗性減弱。Zhang等[8]研究報道,糖基轉移酶GmUGT的過表達會改變類黃酮化合物的含量和生物合成、及防御相關基因的表達模式,增加了大豆品種對嚼葉昆蟲的抗性。在水稻中發現的糖基轉移酶UGT707A3的過表達能增加柚皮素轉和尿苷二磷酸葡萄糖化為柚皮素-7-O-β-d-葡萄糖苷的反應,從而阻止了昆蟲的對水稻的攝食[9]。目前,關于棉花中糖基轉移酶的研究主要集中于維持激素平衡,脫毒代謝上,如UGT73C14參與ABA調控,GalT1參與細胞壁果膠合成,UGT41B3和UGT40D1能調控棉子酚的脫毒代謝[10-12]。【本研究切入點】對糖基轉移酶參與棉花蟲害防御反應的研究尚未見報道。目前,對受棉鈴蟲誘導的棉花糖基轉移酶的研究與利用多局限于資源收集,而棉鈴蟲抗性功能方面的研究尚未見報道。【擬解決的關鍵問題】以受棉鈴蟲誘導的5個糖基轉移酶基因UGTG01、UGTG02、UGTGo4、UGTGo6和UGTGo7為研究對象,采用生物信息學手段從基因組水平、進化關系、各家族成員蛋白的理化性質、保守基序以及表達模式對各家族成員及進行分析,為棉花糖基轉移酶UGT基因在抗棉鈴蟲功能研究提供的理論基礎。
從NCBI基因組數據庫下載棉花糖基轉移酶UGT蛋白序列,利用NCBI的(Conserved Domain Search Service(CD Search)分析蛋白結構域。利用Protpararm在線程序(http://au.expasy.org/tools/protparam.html)分析其蛋白質的理化特性。利用在線工具ExPASY(http://www.expasy.org/tools)預測蛋白質的氨基酸數量、相對分子質量、等電點及蛋白的親疏水性。使用Softberry(http://linux1.softberry.com/berry.phtml)預測蛋白質的亞細胞定位。
1.2.1 棉花糖基轉移酶UGT蛋白系統發育樹構建
通過Clustal X 2.0軟件對棉花糖基轉移酶UGT基因家族的氨基酸序列比對;利用MEGA11.0.13軟件對來自擬南芥、水稻、大豆及棉花等作物的糖基轉移酶進行鄰接法(neighbor--joining)構建系統發育樹,重復次數設置為1 000次,其他參數為默認值。
1.2.2 蛋白質二級結構預測
通過在線軟件NCBI使用基因的保守結構域工具CD-search(https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi)快速找到相關基因上的保守結構域,將基因的蛋白質序列以FASTA文件導入,在線軟件NCBI的找到基因保守結構域,利用TBtools V.1098726軟件進行糖基轉移酶基因家族的保守結構預分析。使用MEME在線網站(https://meme-ie,rg/meme/tools/meme)和TBools軟件對糖基轉移酶基因家族蛋白質進行基因結構分析;S0PMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl/page=npsa_sopma.html)分別對基因的蛋白質序列進行二級結構預測。
1.2.3 基因的熒光定量表達
采用實時熒光定量PCR確定棉花中UGT基因的表達模式,利用TaKaRa反轉錄試劑盒將不同棉花組織樣品RNA反轉錄為CDNA。RT-PCR引物使用NCBI Primer-BLAST進行設計,以Histone為內參基因。RT-PCR反應體系如下:cDNA 1 μL,Premix ExTaqTMⅡ 10 μL,ddH2O 7 μL,Rox Reference Dye 0.4 μL,上下引物10 μmol/L各0.8 μL。反應程序設定為:預變性95 ℃,5min;變性95 ℃,1 min;退火56~58.5 ℃,30 s;延伸72 ℃,1 min 30 s,30個循環,每個基因設置3次生物學重復,用2-ΔΔCT法計算糖基轉移酶家族基因的相對表達量,采用Excel統計數據及作圖。表1

表1 定量PCR 引物序列
1.2.4 基因的物種來源及基因登錄號
來自棉花的基因UGTG01(基因登錄號,KX398934)、UGTG02(基因登錄號,KX398935)、UGTGo4(基因登錄號,MN701073)、UGTGo6(基因登錄號,MN812721),UGTGo7(基因登錄號,MN820705);來自山芥的基因BvUGT1(基因登錄號,JQ29161)、BvUGT73C9(基因登錄號,JQ291612)、BvUGT73C10(基因登錄號,JQ291613)、BvUGT73C11(基因登錄號,JQ29161)、BvUGT73C12(基因登錄號,JQ291615)、BvUGT73C13(基因登錄號,JQ291616)、BvUGT73C21(基因登錄號,MF448360)、BvUGT73C22(基因登錄號,MF448363)、BvUGT73C23(基因登錄號,MF448369)、BvUGT73C24(基因登錄號,MF448364)、BvUGT73C25(基因登錄號,MF448366)、BvUGT73C26(MF448353)、山芥BvUGT73C27(基因登錄號,MF448357);來自擬南芥的基因AtUGT73C1( 基因登錄號,NM_129230)、AtUGT73C2(基因登錄號,NM_129231)、AtUGT73C5(基因登錄號,CP002685),AtUGT73C6(基因登錄號,NM_129234)、AtUGT73C7(基因登錄號,NM_115176),大豆GmUGT(基因登錄號,MG846900),水稻UGT707A3(基因登錄號,PF00201.11)。
研究表明,UGTG01、UGTG02、UGTGo4、UGTGo6、UGTGo7的氨基酸數為468~534個,相對分子質量為52 743.1~60 208.62 kDa,其中氨基酸數和分子質量最大的是UGTG01,最小的是UGTGo7;等電點范圍在4.97~5.58,脂溶性指數為84.58~93.75,不穩定系數為40.18~49.85,其中UGTG01、UGTG02、UGTGo7均為不穩定蛋白;并且5個UGTs親疏水性均為負值,5個基因所編碼的蛋白質均為親水性蛋白。表2

表2 棉花糖基轉移酶UGT蛋白基本理化參數
研究表明,基因的長度不同,外顯子和內含子也存在差別。5個基因均無內含子,其中基因UGTG01和UGTGo7均含有1個外顯子和2個上下游;基因UGTG02、UGTGo4、UGTGo6只含1個外顯子,無內含子和上下游。
5個蛋白質主要由α-螺旋、無規則卷曲、延伸鏈和β-轉角組成,順序均是由α-螺旋>無規則卷曲>延伸鏈>β-轉角。α-螺旋在DNA結合基序中發揮重要作用,無規則卷曲易受側鏈相互作用,構成活性部位和功能部位。利用Softberry在線工具對糖基轉移酶UGT基因家族中的5個基因進行亞細胞定位,大多數的蛋白質均被定位在細胞外和質膜上。圖1

注:A:UGT家族基因結構分析;B:UGT家族基因蛋白質二結構預測
研究表明,UGT基因家族的5個基因的氨基酸具有63.23%平均相似性。其中UGTC02的氨基酸序列與UGTCo7的具有最高相似性為84.86%,UGTC02的氨基酸序列與UGTCo6的相似性為79.08%,UGTCo6的氨基酸序和UGTCo7相似性為77.89%。而UGTC01的氨基酸序列與UGTCo4相似性為47.01%,UGTC01的氨基酸序列與UGTCo6相似性最低為24.70%,UGTCo4的氨基酸序列和UGTCo6相似性較低為24.9%。圖2

圖2 棉花糖基轉移酶的氨基酸序列比對
研究表明,3個保守基序分別為Motif1~Motif3。5條序列均含有全部3種Motif,聚在同一組的蛋白成員,3類Motif的保守性較強。其Motif的組成是相同的,同一組成員功能相同,該家族蛋白保守性強,5個UGT蛋白均含有Glycosyltransferase_GTB-type superfamily結構域,且均位于蛋白的N端,棉花糖基轉移酶UGT同源基因對的蛋白長度及結構域位置有很高的相似性。圖3

注:A:UGT家族蛋白質保守基序;B:UGT家族基因保守結構域分析
研究表明,UGTC01在根、莖、子葉、真葉、花、棉桃均為表達量較低;UGTC02在子葉中的表達量顯著高于其他組織,其次是莖、棉 桃、真葉、根和花中幾乎表達;UGTCo7有著相同的組織表達模式,在子葉中的表達量相對較高,其次是莖、真葉、棉桃,在根和花中的表達量相對較低;UGTCo4在莖中的表達量相對比其他組織表達量較明顯;UGTCo6在子葉中的表達量較高于其他組織,其次是真葉、莖、根、花、棉桃中幾乎表達,棉花糖基轉移酶UGT具有明顯的表達特異性,在子葉和莖中的表達量相對較高,其次是真葉和棉桃,在其他組織中的表達量相對較低,在棉花不同組織中可能具有不同的生物學功能。圖4

圖4 5個UGT基因在棉花不同組織的表達
研究表明,不同植物來源糖基轉移酶被聚類分為2個分支,克隆到的棉花糖基轉移酶UGTG01、UGTCo4與枸杞UGT73C基因家族的蛋白相近,棉花的UGTC02、UGTCo6及UGTCo7蛋白與水稻的UGT707A3蛋白和大豆的GmUGT蛋白相鄰分支中,棉花糖基轉移酶的五個蛋白可能具有與UGT73C家族基因,水稻的UGT707A3基因、大豆GmUGT基因具有相似的功能。圖5

注:不同物種UGT不同顏色標記,擬南芥、山芥、水稻、大豆及棉花分別由綠色三角形、藍色菱形、橙色方形、黃色倒三角形及紅色圓形標記。
3.1糖基化是植物次生代謝產物中最為廣泛存在的一種修飾方式。該反應是由糖基轉移酶的催化生物功能實現的。其生物學功能涉及植物到植物多個階段,如參與植物的防御防御,脫毒反應等[13-15]。目前,有關UGT基因家族的研究大多集中于藏紅花[16]、煙草[17]、擬南芥[18]中,而在棉花受棉鈴蟲誘導的反應中研究非常少。
生物信息學在抗性基因研究及新抗性基因鑒定的應用中發揮了重要的作用[19],Huang等[20]利用生物信息學技術,在雷蒙德氏棉(Gossypium raimondii)、亞洲棉(Gossypium arboreum)和陸地棉(Gossypium hirsutum)中分別鑒定出了142、146和196個糖基轉移酶基因。研究利用生物信息學方法從棉花基因組中鑒定出5個受棉鈴蟲誘導的UGT基因家族成員。通過理化性質分析得出,棉花糖基轉移酶UGT基因家族蛋白質基本為堿性氨基酸,且5個蛋白質均為親水性蛋白質,蛋白質長度在468~534,等電點在4.97~5.58,相對分子質量區域為52 743.1~60 208.62。
3.2蛋白質的結構決定其生物學功能,結構相似其功能相似。在研究中,棉花糖基轉移酶UGT基因家族的5個蛋白質主要由α-螺旋、無規則卷曲、延伸鏈和β-轉角構成,位于同一家族成員的結構具有一致性。在亞細胞定位中發現大多數大部分的蛋白質均被定位在細胞外和質膜上,表明這些基因合成生長素基本是在細胞外和質膜中完成的,與翟瓊等[21]的研究結果一致。結構域和Motif的種類和數量可以從側面反應該基因的生物功能多樣性,具有相同種類和數量Motif的基因功能可能相似[22]。研究通過分析棉花糖基轉移酶UGT基因家族蛋白質保守基序發現,5個蛋白質有3個motif,基因家族的功能具有相似性。在彭洪嫻等[23]的研究中也同樣發現了位于同一亞族的基因含有大致相同的Motif,并證實了這些含有相同Motif的基因成員可能具有類似的功能。
3.3與糖基轉移有關的酶類或蛋白的表達豐度與寄主抗性機制有關,Wang等[24]的研究發現2種糖基轉移酶的過量表達參與了大麥對麥蚜抗性的形成。李健英[25]在研究棉花響應煙粉虱脅迫的分子機制中發現,糖基轉移酶基因在煙粉虱脅迫后表達發生上調變化。研究中,受棉鈴蟲誘導的5個棉花糖基轉移酶具有明顯的表達特異性,在子葉和莖中的相對表達量較高,在其他組織中的相對表達量較低,5個棉花糖基轉移酶中UGTC02在組織中的表達大于其他基因,不同棉花組織對棉鈴蟲的抗性具有差異,與前人的研究一致[26]。
3.4系統進化樹種聚集在一起的亞組具有相似的進化源和基因功能[27]。在研究中,通過構建系統進化樹發現棉花糖基轉移酶UGTG01、UGTCo4與枸杞UGT73C基因家族的蛋白相近,棉花的UGTC02、UGTCo6及UGTCo7蛋白與水稻的UGT707A3蛋白和大豆的GmUGT蛋白相鄰分支中,同一分支中的基因可能具有相同的生物學功能。UGT73C基因家族成員、GmUGT、UGT707A3在植物抗蟲脅迫中發揮著重要的作用,其中UGT73C基因家族成員能通過調控皂苷元等物質來增加枸杞對害蟲的抗性[7],GmUGT可以通過改變類黃酮的變化,參與賦予了大豆對昆蟲的抗性[8],UGT707A3通過調控柚皮素糖基化減少昆蟲對水稻的攝食[9]。5個蛋白質能通過調控皂苷元、類黃酮、柚皮素等物質響應棉花的抗蟲性。
獲得5個棉花糖基轉移酶基因,UGTG01、UGTG02、UGTGo4、UGTGo6、UGTGo7的蛋白質長度在468~534,等電點在4.97~5.58,相對分子質量區域為52 743.1~60 208.62,亞細胞定位在細胞質外,均為親水性蛋白質。基因結構均含有1個外顯子,二級結構主要由α-螺旋、無規則卷曲為主,均含3個Motif基序和有Glycosyltransferase_GTB-type superfamily結構域。5個基因具有明顯的組織表達差異性,不同棉花組織對棉鈴蟲的抗性具有差異。進化樹構建5個基因具有與UGT73C家族基因,水稻的UGT707A3基因、大豆的GmUGT基因具有相似的抗蟲功能,能通過調控皂苷、類黃酮、柚皮素等物質響應棉花的抗蟲性。