盧 晨,李 寒,王書平,2,張迎新,2,尹軍良,2,馬東方,2,方正武,2
(1.長江大學 農(nóng)學院,主要糧食作物產(chǎn)業(yè)化湖北省協(xié)同創(chuàng)新中心,湖北荊州 434025;2.西北農(nóng)林科技大學,旱區(qū)作物逆境生物學國家重點實驗室,陜西楊陵 712100)
植物特異性轉錄因子(BRI1-EMS-Suppressor,BES1)是油菜素內(nèi)酯(Brassinolide,BR)信號途徑中的關鍵轉錄因子,對調(diào)節(jié)植物的生長發(fā)育和逆境脅迫具有非常重要的作用。植物經(jīng)常遭受一系列生物和非生物脅迫,導致產(chǎn)量和質(zhì)量下降。轉錄因子通過激活或抑制靶基因的轉錄,從而在植物生長發(fā)育和應激反應調(diào)控中發(fā)揮重要作用[1]。BES1是BRs信號通路的重要轉錄因子,通過激活下游基因的轉錄調(diào)控BRs靶基因的表達,最終調(diào)節(jié)植物的生長、發(fā)育和抗逆能力[2-4]。油菜素內(nèi)酯(Brassinosteroids,BRs)是一類重要的植物內(nèi)源激素,在提高作物的抗逆性以及調(diào)節(jié)植物衰老等生理功能方面發(fā)揮了重要作用,被國際上譽為第六激素[2]。已有研究結果表明,在BRs信號轉導過程中,轉錄因子的磷酸化、去磷酸化和蛋白激酶的磷酸化是BRs調(diào)控植物生長發(fā)育以及提高作物抗逆性的內(nèi)在生化機制[3]。
擬南芥的BR信號通路中,BES1和BZR1(Brassinazole Resistant 1)在細胞核內(nèi)參與芥子油苷的生物合成[3]。在擬南芥主根維管束原組織中,BES1可以調(diào)節(jié)BR受體BRL3。Salazar等[5]研究發(fā)現(xiàn),正向調(diào)節(jié)因子BES1在BRI1和BIN2的下游起作用,類固醇受體BRL3處理可以增加BES1基因表達水平和其核積累。相反,BES1蛋白表達受到BIN2激酶的負調(diào)控。基因突變的BES1蛋白在BES1-D中穩(wěn)定且高水平積累[6]。BR信號通路中BES1的作用機理研究對于深入研究植物調(diào)控具有很重要的意義[3]。雖然目前對小麥(TriticumaestivumL.)中大多數(shù)轉錄因子的研究較多,但缺乏對BES1轉錄因子家族的系統(tǒng)研究。為全面解析小麥BES1轉錄因子家族信息,本研究擬通過構建系統(tǒng)發(fā)育樹、蛋白質(zhì)特征、基因結構、啟動子、染色體分布、轉錄組及同源性分析,為利用小麥BES1基因奠定基礎。
烏拉爾圖小麥T.urartu(v1.43),野生二粒麥T.dicoccoides(v1.0.43)和粗山羊草Ae.tauschii(v4.0.43)基因組數(shù)據(jù)從EnsemblPlants(http://plants.ensembl.org/index.html)數(shù)據(jù)庫下載。普通小麥T.aestivum(IWGSC v1.1)來源于小麥研究聯(lián)盟IWGSC(https://wheat-urgi.versailles.inra.fr/Seq-Repository/Assemblies)[7]。從HMMER 3.0下載pfam域PF05687(BES1_N)序列;搜集已鑒定的擬南芥中的8個BES1(AtBES1,TAIR10,http://www.arabidopsis.org/index.jsp)[8],玉米中的11個BES1(ZmBES1,maizeGDB,https://www.maizegdb.org/)[9]和水稻中的6個BES1(OsBES1,RGAP,http://rice.plantbiology.msu.edu/index.shtml)[10]。以上述獲得的序列作為查詢序列,設置閾值E<10-10,BLASTp(Protein-protein Basic Local Alignment Search Tool)搜索4個小麥蛋白質(zhì)數(shù)據(jù)庫,合并結果并刪除冗余序列。利用Pfam(http://pfam.sanger.ac.uk/search)鑒定并刪除不含有PF05687(BES1_N)結構域的序列,最終確定15個小麥BES1基因家族成員。
利用ClustalW2[11]將所有BES1基因的氨基酸序列對齊,然后利用MEGA 7.0最大似然法Maximum Likelihood(ML)生成系統(tǒng)發(fā)育樹[12-13]。通過互動生命之樹網(wǎng)站(IToL,version 3.2.317,http://itol.embl.de)繪制并美化系統(tǒng)發(fā)育樹。
從基因組注釋信息GFF3文件中提取包含各基因染色體起始位置信息的TaBES1的基因注釋文件。然后通過MapInspect軟件繪制物理圖譜[14]。
使用蛋白質(zhì)分析工具ExPASy Server10(SIB Bioinformatics Resource Portal,https://prosite.expasy.org/PS50011)[15]預測TaBES1蛋白質(zhì)長度,分子質(zhì)量(MW),等電點(pI),穩(wěn)定性和親水性的均值(GRAVY)等特征。用SignalP 4.1 (http://www.cbs.dtu.dk/services/SignalP/)預測信號肽的長度,并通過網(wǎng)站W(wǎng)oLF PSORT(http://www.csbio.sjtu.edu.cn/bioinf/plant-multi/)和Plant-mPLoc(https://wolfpsort.hgc.jp/)進行亞細胞定位預測。
使用MEME(v4.9.1,http://meme-suite.org/index.html)[16]和Smart Motif(http://smart.embl-heidelberg.de/)[17]搜索工具鑒定保守的TaBES1蛋白基序。以已知的AtBES1、OsBES1和ZmBES1蛋白序列為參考序列。TaBES1保守蛋白基序通過以下標準識別:(1)每條序列可以包含位置不重疊的多個基序;(2)最多20個不同的基序;(3)基序長度為6~50 aa。TBtools軟件展示保守基序圖。根據(jù)TaBES1基因組注釋信息,使用GSDS 2.0(http://gsds.cbi.pku.edu.cn/index.php)[18-19]繪制基因(外顯子-內(nèi)含子)結構。為鑒定小麥BES1基因啟動子序列中的順式元件,從小麥數(shù)據(jù)庫(IWGSC v1.1)中提取15個TaBES1基因上游序列1 500 bp,使用PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)標識啟動子序列中的cis-elements。然后,用R軟件包的“Pheatmap”展示預測結果。
旱區(qū)作物逆境生物學國家重點實驗室前期從NCBI的SRA數(shù)據(jù)庫收集小麥多條件轉錄組分析的原始RNA-seq,通過sratoolkit子例程fastq-dump,將獲得的SRA格式數(shù)據(jù)轉換為fastq格式,通過Trimmomatic過濾低質(zhì)量數(shù)據(jù),通過Trinity(v2.0.6)進行從頭組裝,通過TransDecoder(v5.3.0)進行開放閱讀框預測,最后通過FPKM計算轉錄本表達水平,所有程序均使用默認參數(shù)進行計算。基因表達水平通過片段按每百萬堿基對外顯子每千克堿基數(shù)(FPKM)模型進行歸一化[20]。然后利用R軟件包pheatmap根據(jù)FPKM值繪制熱圖。
用互相BLASTp(閾值E<10-10,匹配度>80%)鑒定普通小麥,烏拉爾圖小麥,野生二粒麥和粗山羊BES1的同源關系。利用R軟件包“circlize”繪制同源關系圖譜。直系同源的最原始定義為:兩個不同物種中的兩個基因,起源于這兩個物種最后一個共同祖先的同一個基因。旁系同源被定義為:從一個基因組中復制衍生出來的基因[21]。
由圖1可知,通過25個(8個AtBES1、11個ZmBES1和6個OsBES1)已知BES1蛋白序列,最終確定了15個小麥BES1基因家族成員。pfam(PF05687BES1-N)和具有核心基序(E<10-5)的局部BLASTP進一步證實候選序列,去除沒有BES1特異性蛋白活性區(qū)的序列。最后,利用MEGA 7.0最大似然(ML)建立系統(tǒng)發(fā)育樹(圖1)。結果表明,BES1可分為四大類(Group a、Group b、Group c、Group d),TaBES1在Group b中沒有分布。
使用DNAMAN比對15個TaBES1蛋白序列(圖2)。利用網(wǎng)站W(wǎng)ebLogo(http://weblogo.berkeley.edu/logo.cgi)制作出TaBES1家族高保守區(qū)段BES1_N的比對結果(圖3)。由表1可知TaBES1長度的平均值為312 aa,分布范圍178~359 aa;分子質(zhì)量平均值為33.08 ku;分布范圍19.27~37.86 ku,等電點的平均值為8.66,分布范圍8.13~9.4,為堿性蛋白質(zhì);不穩(wěn)定指數(shù)平均值為61.62,分布范圍50.78~ 69.99,屬于不穩(wěn)定蛋白質(zhì)(指數(shù)大于40);脂肪族指數(shù)平均值為55.92,分布范圍48.3~ 71.84;親水性的平均值-0.59,分布范圍-0.751~0.482,基本小于0,說明它們都是親水性蛋白質(zhì)。多網(wǎng)站預測亞細胞定位結果顯示所有的TaBES1蛋白位于細胞 核內(nèi)。

表1 小麥BES1家族的蛋白質(zhì)特征及染色體位置Table 1 Protein characteristics and chromosomal location of wheat BES1 family
外顯子-內(nèi)含子結構顯示:幾乎所有的TaBES1都含有一個內(nèi)含子,大部分TaBES1都在序列兩端具有UTR非編碼區(qū),僅TaBES1a3兩端不具有UTR,TaBES1d5的5′端不具有UTR區(qū)。用MAST在線軟件查詢TaBES1蛋白序列中的20個保守motif,如圖4所示,小麥BES1家族motif分析(b)和基因結構(c)高度的相似性說明TaBES1家族的高保守性。
由圖5可知,15個TaBES1基因均勻地、相似度極高地分布在小麥A、B和D染色體上。TaBES1c2、TaBES1c3和TaBES1c1基因為三聯(lián)體,分別分布在2A、2B和2D染色體的相似位置[21]。TaBES1a3、TaBES1a2和TaBES1a1為三聯(lián)體,分布在3A、3B和3D染色體相似位置。TaBES1d3、TaBES1d2和TaBES1d1為三聯(lián)體,TaBES1d4、TaBES1d5和TaBES1d6為三聯(lián)體,TaBES1d9、TaBES1d7和TaBES1d8為三聯(lián)體。
在小麥BES1基因家族中共找到13組基因重復,TaBES1a2與TaBES1a1、TaBES1a3與TaBES1a1、TaBES1a3與TaBES1a2、TaBES1c3與TaBES1c1、TaBES1c2與TaBES1c1、TaBES1c3與TaBES1c2、TaBES1d2與TaBES1d1、TaBES1d3與TaBES1d1、TaBES1d3與TaBES1d2、TaBES1d6與TaBES1d4、TaBES1d8與TaBES1d7、TaBES1d9與TaBES1d7、TaBES1d9與TaBES1d8(圖5),這13組基因復制都是片段重復,在小麥BES1基因家族中未發(fā)現(xiàn)串聯(lián)重復。
從NCBI網(wǎng)站下載并整理的轉錄組數(shù)據(jù)分為三類,包括生長發(fā)育(圖6)、非生物脅迫(圖7)和生物脅迫(圖8)。由圖6可知,TaBES1a1、TaBES1a2、TaBES1a3、TaBES1d4、TaBES1d5和TaBES1d6基本不表達,所以其功能可能與生長發(fā)育無關。TaBES1d3、TaBES1d2和TaBES1d1基因在苗期、三葉期、分蘗期、孕穗期、抽穗期、開花期、結實期都有較高的表達量,推測其功能可能與生長發(fā)育有關。TaBES1c1、TaBES1c2、TaBES1c3、TaBES1d7、TaBES1d8和TaBES1d9在胚根苗期、葉鞘根頂端三葉期、根分蘗期、穎片孕穗期、抽穗期和根秧苗期高度表達,推測其功能可能與根和葉鞘的生長發(fā)育有關,具體功能有待進一步驗證。
由圖7可知,TaBES1d3、TaBES1d2和TaBES1d1基因在聚乙二醇6000、干旱、高溫、寒冷脅迫下都有較好的表達,其功能可能與小麥抗逆有關。這一推論與已報道的其他物種BES1家族符合。TaBES1a1、TaBES1a2、TaBES1a3、TaBES1d4、TaBES1d5和TaBES1d6基本不表達,推測其功能可能與抗逆無關。TaBES1c1、TaBES1c2、TaBES1c3、TaBES1d7、TaBES1d8和TaBES1d9在中國春磷、饑餓處理下表達良好。
由圖8可知,TaBES1a1、TaBES1a2、TaBES1a3、TaBES1d4、TaBES1d5和TaBES1d6基本不表達,推測其功能可能與抗病無關。TaBES1c1、TaBES1c2、TaBES1c3、TaBES1d1、TaBES1d2和TaBES1d3在條銹病、白粉病和禾谷鐮刀菌的處理下與對照相比有明顯的差異,其功能可能與抗病有關。條銹病病原菌CYR31處理小麥葉片 24 h~7 d后TaBES1d1和TaBES1d3高度表達,推測其功能可能與條銹相關。
由圖9可知,12個、11個和7個調(diào)控因子分別參與生物/非生物脅迫、生長發(fā)育和激素反應。分布最廣的順式元件是脫落酸反應順式作用元件ABRE,核心啟動子元件TATA box和CAAT box都是生長發(fā)育相關的元件。其次最常見的順式元件是茉莉酸甲酯反應元件(CGTCA motif和TGACG motif),幾乎分布在所有基因中 (93.3%),另外,光響應元件(g-box,85%)分布也較為廣泛。
小麥BES1啟動子分析發(fā)現(xiàn),與生長發(fā)育有關相關的11個元件中,有3個與啟動子啟動相關的元件(TATA-box、TCA和CAAT-box),3個順式作用調(diào)節(jié)相關的元件(A-box、box S和TCCC-motif),2個與生長素相關元件(W box和WRE3),2個元件與脫落酸相關元件(ABRE和AC-I),最后一個元件CCGTCC motif為分生組織表達相關的順式作用調(diào)控元件。與生物/非生物脅迫相關的12個元件中,其中4個元件與光響應有關(G-Box、GC-motif、STRE和TCT-motif),3個參與低溫反應的順式元件(MBS、MRE和MYB),3個缺氧特異誘導的增強子元件(GT1-motif、I-box和LTR),2個厭氧誘導所必需的順式作用調(diào)控元件(ARE和as-1)。與激素反應相關的7個元件中,其中5個都為茉莉酸甲酯反應元件(CGTCA-motif、chs、CTAG-motif、DRE core、TGACG-motif和TGA-element),1個與水楊酸反應相關元件Sp1。
小麥BES1啟動子區(qū)域一共含有838 個順式元件,471(56.2%)個與生長發(fā)育有關,201(24%)個與非生物/生物脅迫有關,166(19.8%)個與激素反應有關。
經(jīng)鑒定,普通小麥、烏拉爾圖小麥、野生二粒麥和粗山羊草中分別包含15、13、39和13個TaBES1基因(圖10-a)。BES1蛋白可分為3大類(Group a、Group c和Group d),普通小麥(3、3和9),烏拉爾圖小麥(8、3和2),野生二粒麥(8、9和22),粗山羊草(6、2和5)。如圖10-b所示,共鑒定出90對同源基因。與普通小麥相關的同源物共52對,其中有13對旁系同源物,普通小麥與烏拉爾圖小麥,野生二粒麥和粗山羊草分別有9、18和12對直系同源物。與烏拉爾圖小麥相關的同源物共18對,沒有旁系同源物,烏拉爾圖小麥與普通小麥,野生二粒麥和粗山羊草分別有9、6和3對直系同源物。與野生二粒麥相關的同源物共52對,有21對旁系同源物,野生二粒麥與普通小麥,烏拉爾圖小麥和粗山羊草分別有18、6和8對直系同源物。與粗山羊草相關的同源物共12對,沒有旁系同源物,粗山羊草與普通小麥,烏拉爾圖小麥和野生二粒麥分別有12、3和8對直系同源物。
目前,在149種植物種中發(fā)現(xiàn)BES1轉錄因子,其數(shù)目有2~42個不等,其已有30個轉錄因子被深入研究[22]。吳鵬等[23]在中國白菜中鑒定了15個BES1基因,發(fā)現(xiàn)BES1基因只存在于陸生植物中,且高等植物一般比低等植物的轉錄因子要多,這也表明BES1轉錄因子在植物的進化過程中可能起重要作用。本研究利用生物信息學的方法對小麥BES1轉錄因子家族進行全面的研究,共獲得的15個TaBES1基因與搜集到的8個AtBES1、11個ZmBES1和6個OsBES1共同構建系統(tǒng)發(fā)育樹,TaBES1成員分為Group a、Group c和Group d三組(圖1)。
通過DNAMAN比對獲得的15個TaBES1蛋白序列(圖2),顯示所有TaBES1蛋白都含有BES1_N結構域。外顯子-內(nèi)含子結構顯示TaBES1a3兩端不具有UTR,TaBES1d5的5′端不具有UTR區(qū),TaBES1a3和TaBES1d5在后續(xù)的轉錄組分析中基本都不表達,據(jù)此推測缺失UTR可能導致TaBES1不表達。接下來的研究發(fā)現(xiàn),小麥BES1基因家族中共找到13組基因重復和同源分析13對旁系同源物數(shù)量一致。
關于TaBES1基因的表達模式,不同組的基因表達水平有顯著差異。在生長發(fā)育、生物/非生物脅迫條件下TaBES1a1、TaBES1a2、TaBES1a3、TaBES1d4、TaBES1d5和TaBES1d6,基本不表達,推測其功能可能與生長發(fā)育和非生物脅迫無關。TaBES1c1、TaBES1c2和TaBES1c3基因的表達水平在生物脅迫下表達較好,推測其功能可能與脅迫有關。TaBES1d3、TaBES1d2和TaBES1d1在生長發(fā)育、非生物脅迫和生物脅迫下都高度表達,推測其功能與生長發(fā)育、生物/非生物脅迫相關。
異源六倍體小麥是一種古老的多倍體植物,至少經(jīng)歷兩輪全基因組復制(WGD)事件,這導致小麥基因組包含超過85%的重復基因[24]。重復基因的存在可以通過新功能化,亞功能化和非功能化為基因進化提供更多機會[25]。因此,有必要檢測TaBES1的基因重復,進而初步分析出其進化關系。普通小麥相關的同源物性共52對,有13對旁系同源物(25%)與小麥LSD基因家族中13組基因重復數(shù)量一致。小麥與烏拉爾圖小麥、野生二粒麥和粗山羊草的直系同源物分別有9對(13%)、18對(35%)和12對(32%),共39對(75%)。由此推測,根普通小麥BES1基因的進化關系如下,小部分(13對,25%)來源于自身的進化,大部分(39對 75%)來源于3種亞基因組 供體。