侯麗媛,賈舉慶,姜曉東,王育川,趙菁,陳禺懷,黃勝雄,吳慎杰*,董艷輝*
(1.山西農(nóng)業(yè)大學(xué)生命科學(xué)學(xué)院,山西 太原 030031;2.山西農(nóng)業(yè)大學(xué)農(nóng)學(xué)院,山西 晉中 030801;3.華中師范大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,湖北 武漢 430079;4.合肥工業(yè)大學(xué)食品與生物工程學(xué)院,安徽 合肥 230009)
藜麥(Chenopodium quinoa),莧科藜亞科藜屬,為異源四倍體真雙子葉植物。全基因組測(cè)序表明藜麥起源于擁有A基因組的蒼白莖藜(Chenopodium pallidicaule)和B基因組的瑞典藜(Chenopodium suecicum),由這兩個(gè)祖先二倍體雜交而來[1]。藜麥在安第斯山脈區(qū)域的玻利維亞、秘魯、厄瓜多爾等國(guó)家有5000~7000年的種植歷史[1],富含膳食纖維、礦物質(zhì)、各種維生素和人體必需的氨基酸,特別是賴氨酸和蛋氨酸[2-4],被稱為“母親糧食”,更被聯(lián)合國(guó)糧食及農(nóng)業(yè)組織(Food and Agriculture Organization of the United Nations,F(xiàn)AO)評(píng)選為21世紀(jì)與食品安全相關(guān)的最有前景的作物之一,抗寒抗旱,有著比其他糧食作物更強(qiáng)地適應(yīng)惡劣氣候和貧瘠土壤的能力[5]。
WRKY是植物轉(zhuǎn)錄因子中成員數(shù)目龐大的家族之一,特征在于其DNA結(jié)合域:WRKY結(jié)構(gòu)域[6-8]。WRKY結(jié)構(gòu)域包括一個(gè)非常保守的七肽WRKYGQK和位于其C端的C2H2或C2HC類型的鋅指結(jié)構(gòu)。基于WRKY結(jié)構(gòu)域數(shù)目和鋅指結(jié)構(gòu)類型,WRKY家族成員可以被劃分為3組[6-9]:Ⅰ組成員含有2個(gè)WRKY結(jié)構(gòu)域,Ⅱ和Ⅲ組成員分別只有1個(gè)WRKY結(jié)構(gòu)域。Ⅰ組與Ⅱ組成員都具有C2H2類型的鋅指結(jié)構(gòu);而Ⅲ組成員的鋅指結(jié)構(gòu)為C2HC。基于WRKY結(jié)構(gòu)域中氨基酸保守位點(diǎn)的不同,Ⅱ組成員進(jìn)一步劃分為5個(gè)亞組:Ⅱ-a、Ⅱ-b、Ⅱ-c、Ⅱ-d和Ⅱ-e[9]。
WRKY轉(zhuǎn)錄因子廣泛參與了植物對(duì)各種生物和非生物脅迫的應(yīng)答反應(yīng),是一種重要的抗逆調(diào)節(jié)基因[10-12]。鑒于其重要性,目前該基因在抗逆方面的功能研究在糧食油料作物和蔬菜水果類園藝植物中被廣泛開展。基于干旱轉(zhuǎn)錄組數(shù)據(jù),從玉米(Zea mays)中鑒定得到一個(gè)受干旱誘導(dǎo)表達(dá)的WRKY基因,ZmWRKY106[13]。ZmWRKY106的表達(dá)水平受干旱、高溫和外源脫落酸(abscisic acid,ABA)的誘導(dǎo)。異源過表達(dá)該基因的擬南芥(Arabidopsis thaliana)植株表現(xiàn)出對(duì)干旱和高溫脅迫的耐受性增強(qiáng)[13]。大豆(Glycine max)的GmWRKY12在正常條件下,其表達(dá)維持在低水平;干旱和鹽脅迫條件下,顯著地被誘導(dǎo)高表達(dá)。干旱和鹽脅迫下,GmWRKY12轉(zhuǎn)基因大豆植株表現(xiàn)出耐受性增強(qiáng);同時(shí)轉(zhuǎn)基因大豆中脯氨酸(proline,Pro)含量大幅增加[14]。過表達(dá)番茄(Lycopersicon esculentum)SlWRKY8的轉(zhuǎn)基因番茄植株顯示出對(duì)丁香假單胞桿菌番茄治病變種(Pseudomonas syringaepv.tomato,Pst)Pst.DC3000的抗性顯著增強(qiáng)。抗病基因SlPR1a1和SlPR7在轉(zhuǎn)基因植株中的表達(dá)水平顯著上調(diào)。同時(shí),轉(zhuǎn)基因番茄植株表現(xiàn)出對(duì)干旱和鹽的耐受性[15]。小麥(Triticum aestivum)的TaWRKY46在聚乙二醇(polythylene glycol,PEG)處理下上調(diào)表達(dá)[16]。過表達(dá)TaWRKY46的擬南芥植株在含有甘露醇的1/2 MS培養(yǎng)基上具有更快的萌發(fā)速度和更長(zhǎng)的根長(zhǎng),表現(xiàn)出更強(qiáng)的耐滲透脅迫能力[16]。
藜麥基因組測(cè)序研究完成時(shí)間較晚[1],WRKY基因的功能研究相對(duì)很少。高溫脅迫條件下,部分藜麥WRKY基因表現(xiàn)出顯著差異的表達(dá)水平[17]。部分藜麥WRKY基因被推測(cè)可能是cqu-miR156b的靶基因,通過小分子RNA的調(diào)控,參與了植物的發(fā)育和抗逆調(diào)控[18]。本研究利用生物信息學(xué)方法,在全基因組水平對(duì)藜麥WRKY基因家族進(jìn)行系統(tǒng)地研究和分析,包括家族成員分類、WRKY結(jié)構(gòu)域的氨基酸保守位點(diǎn)比較、系統(tǒng)進(jìn)化樹構(gòu)建、不同脅迫條件下WRKY基因表達(dá)模式解析,以及WRKY家族成員數(shù)目擴(kuò)增的動(dòng)力分析。本研究結(jié)果可為藜麥進(jìn)一步的遺傳改良提供基礎(chǔ)資料。
從藜麥基因組數(shù)據(jù)庫(www.cbrc.kaust.edu.sa/chenopodiumdb)下載藜麥、藜麥祖先二倍體蒼白莖藜和瑞典藜的基因組和全部編碼蛋白序列。利用HMMER 3.0軟件[19],基于從Pfam數(shù)據(jù)庫[20](pfam.xfam.org)下載的WRKY結(jié)構(gòu)域文件(編號(hào):PF03106),對(duì)藜麥基因組編碼的蛋白序列進(jìn)行WRKY蛋白序列的比對(duì)。比對(duì)得到的WRKY蛋白序列中的WRKY結(jié)構(gòu)域,在InterPro數(shù)據(jù)庫[21](www.ebi.ac.uk/interpro)中進(jìn)行WRKY結(jié)構(gòu)域的確認(rèn),確認(rèn)后的序列即為準(zhǔn)確的藜麥WRKY轉(zhuǎn)錄因子。
參考已發(fā)表物種的WRKY轉(zhuǎn)錄因子的研究數(shù)據(jù)和InterPro數(shù)據(jù)庫[21]WRKY結(jié)構(gòu)域的確認(rèn)結(jié)果,對(duì)WRKY結(jié)構(gòu)域,結(jié)構(gòu)域大小和邊界進(jìn)行確定。同時(shí),利用InterPro和SMART(smart.embl-heidelberg.de)數(shù)據(jù)庫,對(duì)WRKY結(jié)構(gòu)域以外的其他蛋白保守域進(jìn)行鑒定。
利用MAFFT程序[22]對(duì)藜麥WRKY成員的WRKY結(jié)構(gòu)域的蛋白序列進(jìn)行多序列比對(duì),默認(rèn)參數(shù)。基于比對(duì)結(jié)果,通過IQ-TREE 1.6.12程序[23]構(gòu)建系統(tǒng)進(jìn)化樹,最適合建樹模型由內(nèi)置的ModelFinder[24]檢測(cè)設(shè)定,自展值設(shè)置為1000。
從葡萄(Vitis vinifera)基因組數(shù)據(jù)庫(www.genoscope.cns.fr/externe/GenomeBrowser/Vitis/)下載葡萄的基因組和全部編碼蛋白序列。利用本地BLASTP程序構(gòu)建了藜麥基因組編碼所有蛋白的本地?cái)?shù)據(jù)庫,分別與葡萄(V.vinifera)、祖先二倍體蒼白莖藜(C.pallidicaule)和瑞典藜(C.suecicum)進(jìn)行全基因組范圍的蛋白序列比對(duì),E值≤1E-05。利用JCVI程序[25],提取物種間的同源基因組模塊。將位于同源基因組模塊的WRKY基因利用Circos軟件[26]進(jìn)行可視化,并分析藜麥WRKY基因的擴(kuò)增動(dòng)力。
從NCBI的Bioproject下載藜麥轉(zhuǎn)錄組數(shù)據(jù):1)葉、莖和花簇的轉(zhuǎn)錄組(編號(hào):PRJNA394651);2)干旱、高溫、鹽和低磷脅迫條件下藜麥幼苗的轉(zhuǎn)錄組(編號(hào):PRJNA306026);3)花生(Arachis hypogaea)褪綠扇形斑病毒(groundnut chlorotic fan-spot virus,GCFSV)侵染藜麥幼苗的轉(zhuǎn)錄組(編號(hào):PRJNA349075)。
采用R包Pheatmap,對(duì)藜麥WRKY基因在不同組織葉、莖、花簇中的表達(dá)情況,以及干旱、高溫、鹽、低磷脅迫和GCFSV侵染下轉(zhuǎn)錄組數(shù)據(jù)表達(dá)變化進(jìn)行分析,采用R包Pheatmap軟件,以Euclidean距離衡量標(biāo)準(zhǔn)和Median聚類方法作圖。
通過系統(tǒng)的生物信息學(xué)分析,藜麥WRKY家族成員數(shù)目最終確定為90個(gè)(表1)。依據(jù)WRKY基因在藜麥染色體上的相對(duì)位置,依次對(duì)藜麥WRKY家族成員進(jìn)行編號(hào)。詳細(xì)的藜麥WRKY家族成員信息見表1,包括數(shù)據(jù)庫編號(hào)、染色體定位、蛋白序列長(zhǎng)度、WRKY結(jié)構(gòu)域數(shù)目和成員分組。藜麥WRKY家族成員蛋白序列的平均長(zhǎng)度為367 aa,其中蛋白序列最長(zhǎng)和最短的成員分別為CqWRKY38(1178 aa)和CqWRKY07(84 aa)。

表1 藜麥WRKY家族成員Table 1 The WRKY family members in C.quinoa

續(xù)表Continued Table
藜麥基因組每條染色體上都存在WRKY基因,定位信息顯示基因主要分布在染色體的兩端。藜麥WRKY基因染色體定位呈現(xiàn)出染色體特異的分布;其中1號(hào)染色體上分布多達(dá)12個(gè)WRKY基因;而3、17、11、18號(hào)染色體上分別只有3、3、2、2個(gè)WRKY基因(圖1)。

圖1 藜麥WRKY基因的染色體定位Fig.1 The chromosomal location of C.quinoa WRKY genes
基于WRKY保守域的數(shù)目和鋅指結(jié)構(gòu)類型,將90個(gè)藜麥WRKY轉(zhuǎn)錄因子劃分為3個(gè)大類群:其中18個(gè)含有2個(gè)WRKY結(jié)構(gòu)域,且鋅指結(jié)構(gòu)類型為C2H2的成員被劃分為Ⅰ組;12個(gè)含有1個(gè)WRKY結(jié)構(gòu)域,且鋅指結(jié)構(gòu)類型為C2HC的成員劃分為Ⅲ組;Ⅱ組含有46個(gè)WRKY轉(zhuǎn)錄因子,含有1個(gè)WRKY結(jié)構(gòu)域,且鋅指結(jié)構(gòu)為C2H2類型。此外,還有14個(gè)WRKY轉(zhuǎn)錄因子因WRKYGQK短肽的缺失,以及鋅指結(jié)構(gòu)變異較大而未劃分到任何分組(表1)。
進(jìn)一步提取了Ⅱ組46個(gè)成員的WRKY結(jié)構(gòu)域的蛋白序列。基于多序列比對(duì)結(jié)果中氨基酸保守位點(diǎn)的差異(圖2),Ⅱ組成員進(jìn)一步被劃分為5個(gè)亞組:Ⅱ-a(9個(gè)),Ⅱ-b(4個(gè)),Ⅱ-c(13個(gè)),Ⅱ-d(10個(gè))和Ⅱ-e(10個(gè))(表1和圖2)。分別在藜麥WRKY轉(zhuǎn)錄因 子Ⅱ-c組CqWRKY05和CqWRKY23,Ⅱ-e組CqWRKY67和CqWRKY79的蛋白序列中,發(fā)現(xiàn)了變異的WRKYGQK短肽(圖2)。WRKYGQK的變異短肽為WRKYGKK(CqWRKY05、CqWRKY23)和WRKYGEK(CqWRKY67、CqWRKY79)。CqWRKY19蛋白序列中發(fā)生了WRKYGQK短肽的缺失。此外,CqWRKY45(Ⅱ-a)、CqWRKY12(Ⅱ-c)、CqWRKY42(Ⅱ-c)、CqWRKY51(Ⅱ-c)、CqWRKY65(Ⅱ-d)其鋅指結(jié)構(gòu)存在組氨酸位點(diǎn)的缺失(圖2)。

圖2 藜麥Ⅱ組WRKY成員的WRKY結(jié)構(gòu)域蛋白序列比對(duì)Fig.2 The alignment of WRKY domain peptide sequences in groupⅡC.quinoa WRKYs
本研究提取了能夠分組的76個(gè)藜麥WRKY轉(zhuǎn)錄因子中的84個(gè)完整的WRKY結(jié)構(gòu)域蛋白序列進(jìn)行比對(duì)分析,繼而構(gòu)建了藜麥WRKY基因的系統(tǒng)進(jìn)化樹(圖3)。Ⅰ組成員同一蛋白序列中的兩個(gè)WRKY結(jié)構(gòu)域,依據(jù)其在序列中的相對(duì)位置,分別命名為N端和C端結(jié)構(gòu)域(圖3)。

圖3 藜麥WRKY基因的系統(tǒng)進(jìn)化樹Fig.3 The phylogentic tree of WRKY genes in C.quinoa
進(jìn)化樹中聚類的大分支非常明顯,來自不同組別的藜麥WRKY基因都聚成了組別特異的分支(圖3),包括分支Ⅰ-N(Ⅰ組N端的WRKY結(jié)構(gòu)域)、分支Ⅰ-C(Ⅰ組C端的WRKY結(jié)構(gòu)域)、分支Ⅲ(Ⅲ組成員),這3個(gè)分支都屬于單系群。Ⅱ組的成員主要呈現(xiàn)出兩個(gè)分支聚類,一個(gè)分支包括了Ⅱ-a、Ⅱ-b和Ⅱ-c組的成員,另外的則由Ⅱ-d和Ⅱ-e構(gòu)成。整個(gè)進(jìn)化樹中,來自不同組別的分支進(jìn)一步聚成5個(gè)主要的分支,包括group 1(Ⅱ-d和Ⅱ-e)、group 2(Ⅰ-C)、group 3(Ⅱ-a、Ⅱ-b和Ⅱ-c)、group 4(Ⅰ-N)和group 5(Ⅲ)。進(jìn)化樹中,藜麥WRKY成員的聚類結(jié)果與之前基于結(jié)構(gòu)域特征的分組完全一樣,進(jìn)一步支持了本研究的準(zhǔn)確性。
基于InterPro數(shù)據(jù)庫,對(duì)藜麥WRKY的蛋白序列的保守域組成進(jìn)行分析。在17條WRKY蛋白序列中,發(fā)現(xiàn)了除WRKY結(jié)構(gòu)域以外的其他保守域的存在(圖4)。這17條WRKY蛋白序列主要分布在Ⅱ-d(10條)。另外7條序列分別分布在Ⅰ組(1條)、Ⅱ-a(2條)、Ⅱ-c(2條)和Ⅲ組(2條)。

圖4 藜麥WRKY蛋白序列中保守域的分布Fig.4 The distribution of conserved domains in C.quinoa WRKY protein sequences
保守域分析結(jié)果表明:分組間各自存在著特異的保守域組成,且同一分組中的WRKY成員擁有一致的保守域組成(圖4)。相似的氨基酸保守域組成暗示著可能存在相近的基因功能。Ⅲ組成員的保守域?yàn)閃RKY、NBARC和LRR_8;Ⅱ-a成員的保守域?yàn)閃RKY和UQ_con;Ⅰ組的CqWRKY69的保守域?yàn)閃RKY、DUF4371和Dimer_Tnp_hAT。此外,Ⅱ-c和Ⅱ-d在進(jìn)化關(guān)系上屬于相近的組,兩個(gè)組成員的保守域組成均為WRKY和Plant_zn_clust。
藜麥為異源四倍體植物,來源于分別含有A基因組的蒼白莖藜和B基因組的瑞典藜兩個(gè)祖先二倍體的雜交[1]。如果兩個(gè)親本的所有遺傳物質(zhì)都被繼承,且祖先物種基因組中WRKY基因在后續(xù)進(jìn)化中沒有丟失,那么祖先二倍體A基因組的蒼白莖藜和藜麥、B基因組的瑞典藜和藜麥之間的WRKY同源基因?qū)旧蠎?yīng)均為1對(duì)應(yīng)2的同源關(guān)系:即蒼白莖藜和瑞典藜的1個(gè)WRKY基因分別在藜麥中能找到2個(gè)同源的WRKY基因(在本研究的后續(xù)表示中,將不同對(duì)應(yīng)的同源關(guān)系用Vs符號(hào)表示)。
基于藜麥WRKY基因的鑒定方法,在祖先二倍體蒼白莖藜和瑞典藜的基因組序列中分別鑒定得到46和45個(gè)WRKY基因。運(yùn)用本地BLASTP程序,對(duì)全基因組編碼蛋白序列進(jìn)行兩兩比對(duì),并用JCVI程序分別進(jìn)行了藜麥基因組與兩個(gè)祖先二倍體蒼白莖藜和瑞典藜基因組之間同源基因組模塊和模塊上面同源WRKY基因的鑒定。結(jié)果顯示:蒼白莖藜和藜麥之間,瑞典藜和藜麥之間存在1 Vs 2同源關(guān)系的WRKY基因?qū)Ψ謩e有52和32對(duì)(圖5)。此外,兩個(gè)祖先二倍體蒼白莖藜、瑞典藜和藜麥的同源WRKY基因之間還存在著1 Vs 1同源關(guān)系的WRKY基因分別有10和13對(duì)(圖5),2 Vs 1同源關(guān)系的分別有5和7對(duì)(圖5)。這些復(fù)雜的WRKY同源基因?qū)M(jìn)一步說明藜麥進(jìn)化過程中存在著WRKY基因的丟失與擴(kuò)增。

圖5 蒼白莖藜、瑞典藜和藜麥之間的WRKY基因的保留與丟失Fig.5 Reservation and loss of the WRKY genes between C.pallidicaule,C.suecicum and C.quinoa
本研究將蒼白莖藜和藜麥、瑞典藜和藜麥之間1 Vs 2同源關(guān)系的WRKY基因?qū)M(jìn)行展示(圖6)。藜麥中嚴(yán)格意義上分別遺傳自蒼白莖藜和瑞典藜的1 Vs 2同源關(guān)系的WRKY基因?qū)τ?0對(duì),這些來自祖先種的WRKY基因在藜麥雜交形成后得到了保留(圖6A)。此外,祖先二倍體和藜麥之間存在一些特殊的1 Vs 2同源關(guān)系的WRKY基因?qū)Γ还灿?4對(duì)(圖6B)。這些祖先二倍體的WRKY基因在藜麥中對(duì)應(yīng)的2個(gè)同源WRKY基因只落在了A或B亞基因組。表明這些藜麥WRKY基因所在的基因組區(qū)域發(fā)生了染色體的重組。

圖6 蒼白莖藜、瑞典藜和藜麥之間的WRKY基因的保留與丟失Fig.6 Reservation and loss of the WRKY genes between C.pallidicaule,C.suecicum and C.quinoa
基于干旱、高溫、鹽和低磷脅迫,以及GCFSV侵染下藜麥幼苗的RNA-seq數(shù)據(jù),解析了藜麥WRKY基因的表達(dá)譜(圖7)。在干旱、高溫、鹽和低磷等不同脅迫條件下,25個(gè)WRKY基因明顯地被誘導(dǎo)或抑制表達(dá)(圖中呈現(xiàn)的是在至少一個(gè)脅迫條件下的基因表達(dá)值≥5)(圖7A)。CqWRKY76和CqWRKY83在對(duì)照組和脅迫條件下,都顯現(xiàn)比較高的表達(dá)水平(最低基因表達(dá)值22.53)。鹽和低磷脅迫下,CqWRKY76表達(dá)水平大約只有對(duì)照組的50%;干旱條件下,CqWRKY83表達(dá)水平下降到對(duì)照組的50%,低磷脅迫下上升了1.6倍以上(74.01/46.20)(圖7A)。此外,同樣在對(duì)照組和脅迫條件下呈現(xiàn)出較高表達(dá)水平的CqWRKY26和CqWRKY40,分別在干旱和鹽脅迫、干旱和高溫脅迫條件下的表達(dá)水平與對(duì)照組相比下調(diào)近50%。CqWRKY72和CqWRKY84呈現(xiàn)出脅迫特異性的誘導(dǎo)表達(dá),在高溫條件下,表達(dá)上調(diào)了2~3倍(圖7A)。此外,CqWRKY05、CqWRKY07、CqWRKY20、CqWRKY21、CqWRKY23和CqWRKY48在干旱和高溫條件的表達(dá)幾乎被完全抑制,呈現(xiàn)出極低的表達(dá)水平;CqWRKY21在低磷脅迫下表達(dá)卻被上調(diào)了2倍以上(圖7A)。

圖7 藜麥WRKY基因在干旱、高溫、低磷和鹽脅迫和GCFSV侵染下的基因表達(dá)譜Fig.7 The CqWRKY genes’expression profiles under the stresses of drought,heat,low P and salt and GCFSV infection
在GCFSV侵染藜麥幼苗條件下,42個(gè)WRKY基因表現(xiàn)出明顯地被誘導(dǎo)或抑制表達(dá)(基因表達(dá)值≥10)(圖7B)。在干旱、高溫、低磷和鹽脅迫中顯著上調(diào)或下調(diào)表達(dá)的基因中,CqWRKY05、CqWRKY20、CqWRKY21、CqWRKY23同樣在GCFSV侵染下呈現(xiàn)出強(qiáng)誘導(dǎo)上調(diào)表達(dá)趨勢(shì)(圖7B)。相較對(duì)照,CqWRKY20、CqWRKY21表達(dá)分別被上調(diào)了10和20倍。推測(cè)這2個(gè)WRKY基因可能屬于藜麥中的重要調(diào)控基因,廣泛參與了藜麥生物與非生物脅迫(干旱、高溫和低磷)下的調(diào)控應(yīng)答。此外,CqWRKY36、CqWRKY42、CqWRKY47和CqWRKY78在GCFSV侵染下,也呈現(xiàn)出強(qiáng)誘導(dǎo)上調(diào)表達(dá)趨勢(shì)(圖7B)。
藜麥在進(jìn)化過程中發(fā)生過一次祖先二倍體種間雜交所帶來的全基因組倍增事件[1],藜麥基因組保留了大量祖先種基因組的同源序列。兩個(gè)祖先二倍體蒼白莖藜和瑞典藜的基因組序列在藜麥基因組中分別存在著14.6%和46.5%的同源DNA序列[1]。此外,作為很早分化出來的植物,葡萄基因組中只存在著一次大多數(shù)真雙子葉植物所共有的全基因組倍增,γ倍增事件[27]。然而,葡萄基因組倍增后,其發(fā)生了大規(guī)模的片段丟失和重組。雖然都只經(jīng)歷了一次全基因組倍增,但與葡萄相比,藜麥的基因組進(jìn)化更為保守。
為了比較WRKY基因在上述兩物種間的進(jìn)化差異,在藜麥和葡萄基因組間進(jìn)行了同源基因組模塊的鑒定,對(duì)定位其中的WRKY同源基因?qū)M(jìn)行了統(tǒng)計(jì)。藜麥和葡萄基因組中分別有68和41個(gè)WRKY基因可以定位在兩物種之間的同源基因組模塊中。將上述同源模塊中的WRKY同源基因?qū)M(jìn)行統(tǒng)計(jì),發(fā)現(xiàn)葡萄和藜麥WRKY基因之間存在著1 Vs 1、1 Vs 2、2 Vs 1和多Vs多同源關(guān)系的WRKY基因?qū)Ψ謩e有5、44、2和30對(duì)(圖8)。以上數(shù)據(jù)表明:基因組倍增以后,藜麥基因組保留了相當(dāng)數(shù)目的WRKY同源基因。相反,在葡萄基因組中,大量倍增基因被丟失。

圖8 以葡萄為參照的藜麥WRKY基因的倍增Fig.8 Conservation of the WRKY genes in C.quinoa based on the comparisons to those in V.vinifera
干旱、高溫、鹽、低磷脅迫及GCFSV侵染藜麥幼苗的RNA-seq數(shù)據(jù)揭示了受到這些脅迫誘導(dǎo)而顯著上、下調(diào)表達(dá)的WRKY基因(圖7)。此外,對(duì)藜麥WRKY基因在葉片、花和莖的表達(dá)也進(jìn)行了分析。44個(gè)WRKY基因在上述組織中存在一定的表達(dá)水平(至少一個(gè)組織中表達(dá)值≥10)(圖9)。13個(gè)WRKY基因,包括CqWRKY26、CqWRKY39、CqWRKY40、CqWRKY41、CqWRKY64、CqWRKY66、CqWRKY72、CqWRKY76、CqWRKY80、CqWRKY82、CqWRKY83、CqWRKY84和CqWRKY86在這3個(gè)組織中恒定地高水平表達(dá)(表達(dá)值>40)(圖9)。這些組成型高表達(dá)成員中的6個(gè)WRKY基因,包括CqWRKY26、CqWRKY40、CqWRKY72、CqWRKY76、CqWRKY83和CqWRKY84,在干旱、高溫、鹽、低磷脅迫或GCFSV侵染下顯著誘導(dǎo)或抑制表達(dá)(圖7)。CqWRKY72在擬南芥中的同源基因AtWRKY40被證明是ABA信號(hào)途徑[28](調(diào)控種子萌發(fā)、根長(zhǎng)和幼苗的發(fā)育)和包括白粉病侵染[29]、高鹽[30]、滲透脅迫[30]、強(qiáng)光脅迫[31]等逆境應(yīng)答的轉(zhuǎn)錄抑制因子基因。

圖9 藜麥WRKY基因在花簇、葉和莖中的表達(dá)譜Fig.9 The expression profiles of CqWRKY genes in inflorescence,leaf and stem
此外,部分WRKY基因呈現(xiàn)出組織特異性的表達(dá)。CqWRKY07、CqWRKY48、CqWRKY56、CqWRKY68、CqWRKY87在花和葉片中表達(dá)水平極低,在莖中高表達(dá)(圖9);CqWRKY01和CqWRKY13在葉片中相對(duì)高表達(dá)(圖9);CqWRKY43和CqWRKY59在花中相對(duì)高表達(dá)(圖9)。同時(shí),在莖中高表達(dá)的CqWRKY07和CqWRKY48的表達(dá)水平受到干旱和高溫的抑制(圖7A),以及GCFSV侵染誘導(dǎo)其顯著上調(diào)(圖7B)。CqWRKY48在擬南芥中的同源基因AtWRKY13的突變體促進(jìn)了開花[32],卻影響了莖稈的正常發(fā)育[33],其突變體中大量木質(zhì)素合成相關(guān)基因的表達(dá)被抑制。此外,AtWRKY13可以通過正調(diào)控PDR8[34]和D-CYSTEINE DESULFHYDRASE[35]編碼基因的表達(dá),提高擬南芥對(duì)鎘的耐受性。上述藜麥WRKY基因在藜麥的逆境應(yīng)答和生長(zhǎng)發(fā)育的過程中,推測(cè)屬于關(guān)鍵的調(diào)節(jié)基因。
基于系統(tǒng)的生物信息學(xué)方法,在藜麥基因組中共鑒定得到90個(gè)WRKY基因;劃分為3組:Ⅰ組(18個(gè))、Ⅱ組(46個(gè))和Ⅲ組(12個(gè)),其中Ⅱ組成員進(jìn)一步被劃分為5個(gè)亞組:Ⅱ-a(9個(gè)),Ⅱ-b(4個(gè)),Ⅱ-c(13個(gè)),Ⅱ-d(10個(gè))和Ⅱ-e(10個(gè))。藜麥WRKY基因進(jìn)化樹中家族成員的聚類結(jié)果和分組完全一致,進(jìn)一步支持了成員分組的可靠性。藜麥和祖先二倍體蒼白莖藜、瑞典藜的同源基因組模塊分析表明,藜麥WRKY基因數(shù)目增加主要源于全基因組的倍增。干旱、高溫、鹽、低磷脅迫和GCFSV侵染下,大量WRKY基因的表達(dá)水平被顯著誘導(dǎo)或抑制,這些WRKY基因很可能參與了藜麥逆境應(yīng)答的調(diào)控。