關思靜,高 靜,徐蓉蓉,葛甜甜,王 楠,顏永剛,張 崗,陳 瑩,劉阿萍,程萌格
(1陜西中醫藥大學藥學院/陜西省秦嶺中草藥應用開發工程技術研究中心,陜西西安 712046;2陜西中醫藥大學/陜西中藥資源產業化省部共建協同創新中心,陜西咸陽 712083)
生長素(auxin)是現已報道發現最早、研究最深入的植物激素,在胚胎發生、頂端優勢、維管伸長、開花、果實發育和側根發生等多個生長發育過程中起著中心作用。分子水平分析發現,生長素通過一定的基因控制和應答機制實現對植物生長調控作用,早期的應答基因主要包括Aux/IAA家族、GH3家族和受生長素調控的RNA家族[1]。生長素反應因子(ARFs),作為植物生長中的關鍵轉錄因子,其主要功能為在上游區獲取生長素信號后,尋找位于下游區的生長素響應基因的啟動子序列,與其中的生長元素響應元件相結合,激活或抑制生長素應答基因的表達,進而實現對植物生長發育的控制[2]。研究表明,絕大多數ARF蛋白具有3個保守結構區域,N端為植物特有的B3型DNA結合結構域,該結構域保守性極強,能直接與生長素響應基因啟動子區域的生長素應答元件(AuxRE)結合;中央ARF功能域,其氨基酸組成決定了ARF蛋白是否起激活或抑制作用;以及C端Aux/IAA結構域,具有決定ARF蛋白間的同源聚集或ARF蛋白與生長素應答基因間的異源聚集功能,并用于確定ARF的聚集狀態[3]。
目前,模式植物擬南芥基因組中共23個ARF轉錄因子被鑒定[4],其中部分成員的功能已得到驗證。分析結果表明,AtARF1與AtARF2具有一些共同的功能,可能正向調控植物葉片衰老的發生以及花器官的脫落[5-6];Kelley等[7]研究發現AtARF3與KANADI蛋白質發生物理相互作用,形成蛋白復合物,構成生長素依賴性調節模塊的一部分,是擬南芥中被膜發育和葉極性建成所必需的功能復合物;AtARF2-4和AtARF5之間有重疊和非冗余的功能,并且對擬南芥雌雄配子體的發育至關重要[8];擬南芥生長素轉錄因子AtARF6、AtARF8和AtARF17在調節雌蕊和雄蕊的發育,果實發育、受精,花藥發育和花粉形成中起到重要作用[9-11];AtARF7/AtARF19、AtARF11、AtARF10與AtARF16等轉錄因子則直接或間接介導了擬南芥側根的形成[12-15]。
烏拉爾甘草(GlycyrrhizauralensisFisch.)是豆科甘草屬植物,其根莖是極為重要的常用中藥材。目前甘草的全基因組測序已經完成,這為研究相關基因的功能提供了基礎[16]。本研究利用生物信息學手段對甘草ARF基因家族進行分析鑒定,對其編碼蛋白的理化性質、保守結構域及保守基序、基因結構、順式作用元件、系統進化關系等進行了預測和分析,并利用轉錄組數據研究了不同脅迫條件下的基因表達模式,旨在為深入研究甘草抗逆機理研究提供參考。
實驗于2019年10—12月在陜西中醫藥大學陜西中藥資源產業化省部共建協同創新中心組織培養室進行。甘草種子消毒滅菌后,在恒溫氣候箱中催芽1周,挑選長勢一致的幼苗移至霍格蘭營養液中,放置在培養室水培1月。分別采用15 g/L聚乙二醇(PEG-6000)、150 mmol/L氯化鈉(NaCl)、10 μmol/L磷酸二氫鉀進行干旱、高鹽以及低磷脅迫處理。對照(CK)用營養液培養。在脅迫處理1周后采集甘草幼苗莖葉和根,每個處理3個生物學重復,委托杭州景杰生物科技有限公司進行轉錄組測序。上述處理的甘草種子和幼苗在氣候箱與培養室中的培養條件溫度為(25±2)℃,濕度為60%~70%,光周期為12 h光/12 h暗。
1.2.1 甘草ARF基因的鑒定及序列分析 模式植物擬南芥的ARF序列下載自http://www.UniProt.org/,甘草的全基因組序列數據獲取自http://ngs-data-archive.psc.riken.jp/Gur-genome/。以擬南芥23個ARF家族成員的蛋白序列作為查詢序列,運行TBtools工具的本地檢索程序,篩選閾值設為1×10-5,初步獲得候選序列。將候選ARF蛋白序列提交到NCBI,進行在線blastp比對。去除重復序列后,利用在線網站SMART(http://smart.embl-heidelberg.de/)和 Pfam(https://pfam.xfam.org/)對篩選的甘草ARF蛋白進行結構域驗證,并刪除不含ARF蛋白特征結構域的基因。最后利用ExPASY-ProtParam(https://web.expasy.org/protparam/)對甘草ARF蛋白序列進行氨基酸數目、分子量、等電點等理化性質預測,同時借助Cell-PLoc2.0(http://www.csbio.sjtu.edu.cn/bioinf/Cell-PLoc-2/)進行蛋白亞細胞定位預測。
1.2.2 甘草ARF基因的結構分析 從甘草全基因組序列信息中檢索出甘草ARF基因外顯子-內含子位置信息,利用在線網站GSDS2.0(http://gsds.cbi.pku.edu.cn/)分析甘草ARF基因完整序列得到外顯子-內含子結構。
1.2.3 甘草ARF家族保守基序分析 利用MEME 5.1.1在線工具(http://meme-suite.org/tools/meme)分析甘草ARF蛋白的保守基序,最大基序檢索數值設為10,最適基序長度為6~200個氨基酸。
1.2.4 甘草ARF啟動子順式作用元件分析 提取甘草ARF基因上游2 kb的序列信息,使用在線工具PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)預測基因順式作用元件。
1.2.5 甘草ARF系統進化分析 利用多重序列比對軟件MAFFT 7.0對甘草、擬南芥ARF蛋白進行序列比對計算,比對結果進一步通過MEGA 7.0軟件采用鄰接法構建系統進化樹,其中校驗參數設置為1000,其余均為默認參數。
1.2.6 甘草ARF基因的表達模式分析 利用轉錄組測序數據分析甘草ARF基因的表達特征。轉錄組數據包含對照、甘草干旱、高鹽以及低磷脅迫處理的基因表達數據,以不同實驗條件下的RPKM值為表達水平,通過對數據進行均一化處理,利用TBtools的HeatMap程序做熱圖分析[17]。
利用本地blast比對檢索與在線blastp比對,得到初步候選序列,并進一步利用Pfam和SMART進行結構域驗證,去除不含有ARF保守結構域或結構域不完整的序列,最終鑒定出10個甘草ARF基因序列,將它們命名為GuARF1~GuARF10(表1)。其中除GuARF8和GuARF10含有B3、Auxin_resp和Aux/IAA結構域外,其余8個GuARF蛋白只含有B3和Auxin_resp結構域(圖1)。分析甘草10個ARF蛋白序列,發現編碼ARF蛋白的氨基酸長度在301~945 aa之間,分子量范圍為33.07~104.37 kDa,等電點范圍為5.93~8.50,其中6個GuARF等電點小于7,4個GuARF等電點大于7,且平均等電點小于7,表明GuARF為弱酸性,推測可能在酸性亞細胞環境中發揮作用。不穩定系數分析結果表明10個GuARF的不穩定指數均大于40,為不穩定蛋白。亞細胞定位預測表明所有的GuARF均定位在細胞核(表1)。

表1 甘草ARF基因家族信息

圖1 GuARF基因家族蛋白保守結構域
為了進一步了解甘草ARF基因的特征,使用在線工具GSDS2.0對甘草ARF基因結構進行分析(圖2),結果表明ARF基因家族大多數成員的結構比較復雜,含有外顯子數量6個(GuARF2、GuARF4、GuARF5)到22個(GuARF22)不等。系統進化分析表明,位于同一亞家族的GuARF基因具有相似的外顯子-內含子分布模式(圖2)。

圖2 GuARF基因家族內含子-外顯子結構
利用MEME在線數據庫對甘草ARF蛋白進行保守基序分析,共得到10個保守基序(圖3)。10個GuARF蛋白中均含有motif 4、motif 5和motif 7,除此之外,8個GuARF蛋白含有motif 1和motif 2,7個GuARF蛋白含有motif 8,4個GuARF蛋白含有motif 3、motif 9和motif 10,3個GuARF蛋白含有motif 6。其中GuARF3、GuARF4和GuARF5含有8個基序,GuARF1、GuARF2、GuARF6、GuARF7、GuARF8、GuARF9含有7個基序,GuARF10只含有4個基序。結果表明,出現頻率較高的motif為GuARF蛋白結構域中非常重要的保守基序。

圖3 GuARF蛋白保守基序分析
提取甘草ARF基因上游2 kb的序列進行順式作用元件分析,結果如圖4所示,甘草ARF基因上游存在5類順式作用元件:①光響應類相關元件,如G-box元件、Box4元件等;②植物激素響應相關元件,如響應脫落酸代謝的ABRE元件、響應生長素代謝的TGA-element等;③逆境脅迫響應類元件,如干旱脅迫響應元件MBS、低溫脅迫響應元件LTR等;④植物生長發育響應元件,如調節柵欄葉肉細胞分化的HD-Zip 1元件、分生組織表達相關的CTA-box等;⑤次級代謝產物合成類響應元件,類黃酮生物合成基因調控元件MBSI;其中逆境脅迫響應類元件占比20%。并在GuARF1和GuARF5的啟動子區域檢測到3個生長素響應原件(TGA-element)。

圖4 GuARF基因順式作用元件分析
為了進一步了解甘草ARF基因家族成員的進化關系,構建了甘草、擬南芥基因家族系統進化樹(圖5)。系統發育分析表明甘草和擬南芥共33個ARF蛋白可以分為I、II、III三個家族,其中I家族可以進一步分為Ia和Ib兩個亞家族。GuARF7和GuARF10屬于Class Ia;Class Ib僅為擬南芥 ARF 蛋白;GuARF1、GuARF6、GuARF8和GuARF9屬于Class II;GuARF2、GuARF3、GuARF4、GuARF5屬于Class III。其中ARF蛋白的編碼基因在Class Ia、Class II和Class III各自包含一個自展值為99的直系同源基因對(GuARF9/AtARF4、GuARF2/AtARF17、GuARF7/AtARF1);此外,從圖5中可以看出在Class II和Class III中甘草還含有兩個旁系同源基因對(GuARF1/GuARF6、GuARF3/GuARF5)。

圖5 甘草和擬南芥ARF蛋白系統進化樹
利用甘草在干旱、高鹽和低磷脅迫的RNA-Seq轉錄組數據,得到10個GuARF基因對應轉錄本的RPKM值,做對數值轉換,利用TBtools的HeatMap程序生成熱圖(圖6)。結果顯示,對照處理中GuARF5與GuARF6在莖葉中大量表達,而在根中表達量很低;GuARF2、GuARF3、GuARF8、GuARF9在根中均有表達,且GuARF9的表達量很高,而在莖葉中均未見表達或表達量很低,其余GuARF基因在所檢測的組織中表達量很低或未檢測到。
莖葉和根中的GuARF在不同逆境脅迫下的表達呈現差異性。如圖6-A所示,莖葉中的GuARF基因其表達模式可以分為3類,第1類包含3個GuARF基因(GuARF2、GuARF1、GuARF10),在低磷脅迫下大量表達,在對照和其他脅迫處理下表達量低或未見表達;第2類包含2個GuARF基因(GuARF5、GuARF6),僅在對照中具有較高的表達量;剩下5個GuARF基因在干旱脅迫或鹽脅迫處理下表達量明顯上調,其中GuARF9在干旱脅迫處理中大量表達,GuARF4在鹽脅迫處理中大量表達,GuARF7、GuARF8、GuARF3在干旱和鹽脅迫處理中均上調表達。
脅迫處理下GuARF基因在根中的表達模式可以分為兩類(圖6-B),每一類都包含5個GuARF基因,第1類中,除GuARF9在鹽脅迫處理下表達量沒有明顯變化,其余基因在對照和鹽脅迫處理中均上調表達,而在干旱脅迫和低磷脅迫處理中表達量很低或下調。第2類中5個GuARF基因在鹽脅迫中表達量均上調,除GuARF6在干旱脅迫中上調表達,其余基因在對照、低磷和干旱脅迫處理中表達量很低或下調。

圖6 非生物脅迫下GuARF基因在甘草莖葉(A)和根(B)中的表達
近年來,隨著生物信息技術的不斷進步,越來越多的植物全基因組測序完成。本研究基于甘草全基因組序列數據,最終鑒定出10個ARF基因,比已鑒定出的擬南芥(23個)、水稻(25個)、番茄(22個)和紫苜蓿(24個)的ARF基因家族成員數目少[4,17-19]。保守結構域分析結果表明10個ARF蛋白均含有保守的B3結構域和Auxin_resp結構域,GuARF8和GuARF10含有Aux/IAA結構域。為了進一步研究甘草與擬南芥的ARF同源進化關系,構建了系統進化樹,結果顯示Class Ib均為擬南芥ARF蛋白,這與其他植物番茄[18]、谷子[20]、鷹嘴豆[21]中的Ib家族類似,這些成員包含擬南芥ARF假基因(ARF13)和7個串聯重復基因(AtARF12-AtARF15和AtARF20-AtARF22)[22]。除Ib家族外,大多數甘草ARF蛋白和其他植物一樣,與擬南芥ARF蛋白存在對應關系,表明這些蛋白可能與擬南芥ARF蛋白具有相似的功能。此外,甘草ARF基因家族中還含有旁系同源基因,推測在該基因家族進化過程中,可能出現了基因復制事件。
ARF基因具有較高的保守性,具有相同或相似功能的基因可能聚為一類,為預測該基因家族的功能提供了參考。作為模式植物的擬南芥,目前在基因研究方面研究較為深入,通過基因序列比對與聚類分析,推測與擬南芥ARF基因高度同源、處于較近分支的甘草ARF基因其功能與擬南芥中發揮的作用類似。根據AtARF4的功能推測其同源基因GuARF9在器官發育和營養生長中發揮重要作用[23];GuARF2(AtARF17)可能在miR160的調控下表達,在花藥發育和花粉形成過程中的功能至關重要[11];而Class III中與AtARF10和AtARF16處于較近分支的GuARF3和GuARF4,可能共同調控側根的形成[15]。對甘草ARF基因在不同組織的表達分析中發現,7個GuARF基因在莖葉中或根中均有表達,但存在明顯的差異,表現出組織表達特異性,這可能與基因功能具有一定的聯系。在甘草幼苗的正常發育過程中,GuARF1、GuARF4與GuARF7在莖葉與根的生長發育過程中幾乎沒有表達,推測這些基因可能在甘草的某個特定發育時期或組織中發揮作用。而Class III中的基因在莖葉與根中都有一定的表達(除GuARF4)。甘草ARF基因在不同組織和發育時期的表達差異以及功能有待進一步的研究與實驗驗證。
生長素還參與植物對生物和非生物脅迫的反應[24]。為了進一步了解甘草ARF基因家族在非生物脅迫下的反應,分析了候選的10個甘草ARF基因在不同脅迫處理下的相對表達量(圖6)。結果表明,在高鹽脅迫下,莖葉和根中的ARF基因都具有明顯的變化,尤以Class III中ARF基因表現敏感。低磷脅迫下莖葉中的GuARF1、GuARF2、GuARF10上調表達明顯,推測這些基因可能在甘草低磷脅迫下具有正向協同作用。干旱脅迫處理下,GuARF的基因表達量差異較大,莖葉中的GuARF9、GuARF7、GuARF3上調表達明顯,而根中除GuARF6表達量較高其余均明顯下調表達。在擬南芥干旱響應基因的鑒定中,一些編碼生長素反應蛋白的基因被鑒定為干旱下調基因,這表明生長素可能對干旱脅迫信號產生負調控[25]。另一方面,也有研究結果表明,干旱和高鹽度脅迫均誘導了編碼生長素響應蛋白的基因上調表達[26];例如有研究發現,生長素應答基因(IAA18)在干旱脅迫下被誘導上調[27-28]。因此,植物ARF的時空表達模式較為復雜,且存在物種表達特異性[1]。
本研究從甘草基因組鑒定出10個ARF基因,可分為3大家族,并綜合分析了甘草ARF基因的系統發育關系、保守基序、外顯子/內含子結構和非生物脅迫下的表達譜。結果表明GuARF基因在非生物脅迫下呈現復雜多樣的表達模式,相對于干旱和低磷脅迫,高鹽脅迫下的甘草ARF基因表現更為敏感。雖然利用生物信息學方法對甘草ARF基因家族做了較為系統的分析,但由于分析手段本身存在不同設置參數的影響,且缺乏實驗部分的驗證,其響應高鹽、低磷與干旱脅迫的分子機制還需要深入的探討。