葉 玲,張 潔,郭永正,趙雄偉,王興春
(1.山西農業大學生命科學學院,山西太谷030801;2.山西農業大學文理學院,山西太谷030801)
氮素作為植物生長發育過程中的必要元素之一,是植物體內多種生物大分子的組成成分,如蛋白質、核酸、葉綠素等[1];此外,氮素也是影響作物產量的因素之一[2]。對大多數旱地植物而言,植物吸收利用氮素的主要形式是硝態氮,其吸收和轉運主要由硝酸鹽轉運蛋白來完成[3-4]。植物吸收轉運硝酸鹽的過程主要由4 個基因家族成員介導完成,分別為硝酸鹽轉運蛋白1(Nitrate transporter 1,NRT1)、硝酸鹽轉運蛋白2(Nitrate transporter 2,NRT2)、氯酸鹽通道家族(Chloride channei,CLC)以及慢離子相關通道同系物(Slow anion channel-As-sociated Homologs,SLAC/SLAH)[5]。除此之外,還有許多蛋白酶、激素等也參與其中,它們相互作用構成了錯綜復雜的調控網絡[6-8]。
其中,NRT2 家族是高親和力硝酸鹽轉運蛋白家族,家族成員分為兩大類:NO3-誘導型和NO3-組成型[9]。人們最早在1983 年就于構巢曲霉(Aspergillus nidulans)中發現和鑒定了NRT2[10]。高等植物中NRT2 基因的分子克隆最早報道于大麥[11]。其主要在外源硝態氮濃度較低時(Km為7~50 μmol/L)發揮作用,是植物氮素吸收轉運系統的重要生物大分子之一。其研究多集中在擬南芥中,最具代表性的成員是AtNRT2.1 和AtNRT2.2 基因,二者對NO3-的轉運極為重要,且二者是互相補償的,當其中一個基因表達量上調時,另一個基因的表達量就會相應下調[12]。AtNRT2.3 基因主要在嫩葉中呈周期性表達;AtNRT2.4 基因主要在根部表達;AtNRT2.5 基因主要在根部和嫩葉(主要是根部)中表達,并且其表達受到NO3-供給的抑制[13-14];AtNRT2.6 基因主要在根部和嫩葉中表達[13-14];而AtNRT2.7 基因主要在種子中表達,具有NO3-貯藏的作用[15]。
谷子(Setaria italica)作為一種禾本科植物,在我國的栽培歷史悠久,是我國北方的主要糧食作物之一[16]。谷子為二倍體,基因組小,與水稻、高粱、玉米的共線性較高,因此,成為C4 禾本科基因組研究的模式植物[17]。此外,谷子也是一種傳統的優勢作物,具有較發達的根系、狹長的葉片以及較高的水分利用率,因此,其具有耐瘠薄、耐干旱、耐儲藏、營養豐富、糧草兼收等特征[18]。谷子的全基因組測序已經完成,這為谷子分子生物學研究奠定了良好的基礎[19]。目前,肥料氮素利用率較低,不僅會造成資源的巨大浪費,而且還會引起嚴重的環境問題[20]。關于谷子的NRT2 基因家族作為高親和硝酸鹽轉運子的分子生物學研究相對較少。
本研究利用生物信息學的方法和相關軟件,分析鑒定了谷子的NRT2 基因家族,旨在為谷子氮素吸收利用相關基因的研究提供一定的參考。
從擬南芥(Arabidopsis thaliana)的基因組數據庫TAIR(www.arabidopsis.org)中獲得7 個NRT2 家族各成員(AtNRT2)的蛋白序列,在Phytozome 數據庫(www.phytozome.org)中運用BLASTP 程序搜索水稻、高粱的NRT2 家族成員,篩選條件滿足E-value<10e-10。用上述獲得的擬南芥NRT2 蛋白序列通過本地BLASTP 獲得xiaomi 的NRT2 蛋白序列,并用Pfam 比對得到的蛋白序列進行確定。利用Ex-PASy 在線軟件對谷子NRT2 家族成員蛋白一級結構的理化性質進行預測,包括等電點(pI)、氨基酸數目、脂肪系數、不穩定系數、相對分子質量以及總平均親水性等。
利用SOPMA(https://npsaprabi.ibcp.fr/cgibin/np sa_automat.pl?page=npsa_sopma.html)對谷子NRT2蛋白的二級結構進行分析。
根據xiaomi 基因組注釋信息,利用TBtools 軟件獲得谷子NRT2 基因的染色體位置信息,然后通過Mapinspect 軟件展示NRT2 基因在染色體上的物理位置。以谷子全基因組數據庫為基礎,利用TBtools 獲取谷子NRT2 基因上游1 500 bp 的基因組序列;然后遞交至PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/),進行啟動子順式作用元件分析;最后通過TBtools 對篩選之后常見的功能元件進行可視化操作。
利用ClustalW 工具將谷子、水稻、擬南芥和高粱的NRT2 蛋白序列進行多重比對;將比對結果利用MEGA 7.0 軟件,采用鄰接法(NJ)構建系統進化樹,Bootstrap 參數設置為1 000。
通過MEME 檢測谷子NRT2 家族基因中相似度較高的基序,保守位點寬度設置為≥10 和≤100,最大保守序列鑒定數目設置為10。利用TBtools 繪制Xiaomi NRT2 基因家族基因結構和保守基序圖。
利用PSORT Prediction(http://psort1.hgc.jp/form.html)對谷子NRT2 家族進行亞細胞定位預測,并通過http://www.cbs.dtu.dk/services/TMHMM/對谷子NRT2 家族進行跨膜結構域分析。
為了獲得NRT2 基因在谷子不同組織和不同發育階段的基因表達譜,在http://foxtail-millet.biocloud.net/home 網站獲得8 個谷子NRT2 基因TPM值;在NCBI-SRA 獲得低氮處理后2 周齡的8 個谷子NRT2 基因的TPM值;最后用Tbtools 繪制谷子NRT2 基因家族的表達譜。
通過同源序列比對,在谷子xiaomi 基因組水平上共鑒定到8 個NRT2 基因家族成員,分別命名為:Si1g11820、Si1g11860、Si1g11900、Si1g11910、Si1g11930、Si1g11940、Si5g20720、Si5g29250,其具體位置如表1 所示。
由ProtParam 程序預測谷子NRT2 蛋白的基本理化性質,結果如表1 所示。由表1 可知,谷子NRT2家族各成員的總平均親水性(GRAVY)在0.292~0.585,均為正值,表明它們均為疏水性蛋白。除個別氨基酸外,大多數NRT2家族成員氨基酸的數目越多,NRT2 各家族成員的總平均親水性值越低,表明蛋白序列越長,親水性區域所占比例越低,但NRT2 的親水區的長度可能是相近的。氨基酸等電點結果分析發現,谷子NRT2 蛋白等電點在7.53~9.12,這與AtNRT2.1 的等電點(pI=8.85)[21]接近,又由于NO3-帶負電荷且顯酸性,所以這可能與帶正電荷的質子的共轉運相關。由表1 可知,Si1g11940、Si1g11820 和Si1g11860 的不穩定系數均超過40,則其可能會有較多不穩定二肽結構。

表1 谷子NRT2 各家族成員及理化性質
通過對谷子的9 個NRT2家族成員蛋白的二級結構預測,結果表明,谷子NRT2 家族各成員的二級結構中均含有α-螺旋、β-折疊、直鏈延伸和無規卷曲。其中,α-螺旋和無規卷曲作為谷子NRT2蛋白家族成員二級結構的主要構成元件,占二級結構總量的35%~50%,有利于蛋白質特殊結構構象的形成;β-折疊和直鏈延伸占比則相對較少,分別為6%左右和16%左右(表2)。

表2 谷子NRT2 基因家族成員二級結構占比 %
谷子NRT2 基因家族的染色體分布如圖1 所示,谷子共含有9 對染色體,NRT2 基因家族只分布在1 號和5 號染色體上,其中,Si1g11820、Si1g11860、Si1g11900、Si1g11910、Si1g11930 與Si1g11940 基因位于1 號染色體上,Si5g29250 和Si5g20720 基因位于5 號染色體上。由于1 號染色體上的6 個基因距離很近(表1),進一步對這6 個基因的蛋白序列進行比對,結果發現,Si1g11820 和Si1g11860 蛋白的序列相似性達97.52%,Si1g11900、Si1g11910、Si1g11930和Si1g11940 蛋白的序列相似性達98.29%(圖2)。由此推測,Si1g11820 與Si1g11860 基因,Si1g11900、Si1g11910、Si1g11930 與Si1g11940 基因可能是串聯重復序列。
為揭示谷子NRT2 基因家族的進化關系,將擬南芥(7 個)和水稻(4 個)、高粱(5 個)以及谷子(8 個)NRT2 基因家族共24 個NRT2 蛋白,在MEGA 7.0軟件中采用鄰接法(Neighbor-Joing)構建系統進化樹,結果如圖3 所示。
從圖3 可以看出,谷子的8 個NRT2 蛋白可以分為4 個亞家族,Si5g20720 與Si5g2250 屬于同一個亞家族,Si1g11820 與Si1g11860 屬于同一個亞家族,Si1g11910、Si1g11900 與Si1g11940 屬于同一個亞家族,Si1g11930 單獨屬于一個亞家族;Si5g20720與高粱的Sobic.003G188200、Si5g2250 與高粱的Sobic.003G270800 有直系同源的關系。可以看出,谷子與高粱的親緣關系最近,可能是由于二者均為單子葉C4 植物;谷子與水稻親緣關系較近,可能是因為二者均為禾本科草屬植物;谷子與擬南芥的親緣關系比較遠,可能是由于谷子是C4 單子葉植物、擬南芥是C3 雙子葉植物。
為了進一步了解谷子NRT2 基因家族成員的功能,對谷子NRT2 基因家族成員進行基因結構特性和motif 分析,結果如圖4 所示,在谷子NRT2 基因家族成員的基因結構中,除Si1g11940、Si5g29250這2 個成員均不含非翻譯區(UTR)外,其余6 個成員均同時具有5′端和3′端非翻譯區;除Si1g11940、Si1g11860、Si5g20720 這3 個成員含有內含子外,其余5 個成員均不含有內含子。由此可見,基因Si5g29250 既不含有UTR 又不含有內含子,可能會更快地響應外界環境的變化。
從圖4 還可以看出,除Si1g11940 沒有motif10,Si5g20720 沒有motif 4 和motif 9 外,其余均有motif 1~motif 10;且很明顯地可以看出,motif 1~motif 10 在NRT2 蛋白家族中的排列位置基本一致。因此,NRT2 蛋白家族成員都是相對比較保守的。而這些保守motif 的存在,為NRT2 蛋白家族在硝酸鹽吸收轉運過程中行使功能和發揮作用提供了保障,具有重要意義。
為了更深入地了解谷子NRT2 基因家族各成員的潛在功能,對其啟動子區的順式作用元件進行了分析,結果如圖5 所示,谷子NRT2 基因家族啟動子區所含順式作用元件主要為2 類,一類是與逆境響應相關的元件,另一類是與植物生長發育有關的元件;在6 個NRT2 基因中,都主要存在光響應元件;除Si1g11860 基因啟動子區外,其余都存在脫落酸響應元件;Si1g11820、Si1g11930 基因啟動子區存在水楊酸、生長素響應元件;Si1g11860、Si5g20720基因啟動子區存在生長素響應元件;Si1g11900 基因啟動子區存在水楊酸、生長素、防御應激響應元件;Si5g29250 基因啟動子區存在水楊酸、低溫、干旱響應元件。結合基因結構的分析,推測Si5g29250基因啟動子可能會更快地響應一些逆境條件,極有可能在低氮條件下快速表達、發揮功能,其實際功能還需要進一步試驗驗證。

表3 谷子NRT2 基因家族細胞位置及跨膜結構域數目
為了確定谷子NRT2 家族各基因在細胞中發生功能的部位,進行了亞細胞定位研究,結果如表3所示。
從表3 可以看出,谷子中的8 個NRT2 家族成員均定位到了質膜上;進一步對其跨膜結構域進行了分析,結果發現,只有Si5g29250 基因存在11 個跨膜結構域,其余7 個基因均存在10 個跨膜結構域。推測Si5g29250 基因可能具有更強的硝酸鹽轉運功能。
為了進一步了解NRT2 基因的功能,利用xiaomi在正常生長條件下的13 個不同組織轉錄組數據繪制了一個谷子NRT2 基因家族表達熱圖(圖6-A)。由圖6-A 可知,Si5g20720 基因在苗期整個植株中表達量比較高;Si5g29250 基因在3 d 的萌芽種子以及灌漿期的根中表達量比較高,此外,灌漿期莖中的表達量也略高。為了探究NRT2 基因能否響應低氮脅迫,利用NCBI 上傳數據庫中的低氮條件下的三葉期植株幼苗的表達數據,繪制了表達圖譜(圖6-B)。由圖6-B 可知,低氮與正常相比,除Si1g11900 基因沒有檢測到表達外,其余均有表達,且存在一定差異。其中,Si1g11910、Si1g11820 基因與Si5g20720 基因在正常氮條件下沒有表達,經過低氮誘導,基因開始表達;而Si1g11930、Si1g11940、Si1g11860、Si5g29250 基因經過低氮誘導,基因表達均上調,尤以Si5g29250 基因上調最為顯著,高達92 倍。結合基因結構分析和啟動子區順式作用元件分析的結果可知,在低氮脅迫下,基因Si5g29250會快速表達,提供植物生長發育所需的氮素,將其由根向莖運輸,且在灌漿期的種子合成中也起重要作用,但實際功能仍需進一步試驗驗證。
谷子屬于禾本科狗尾草屬的二倍體作物,且其為典型的C4 作物。2012 年谷子全基因組測序工作完成,其基因組大小僅為500 Mb[22]。由于其基因組較小,且具有光合效率高、耐鹽耐旱、耐瘠薄等特點,谷子逐漸成為C4 植物研究的模式植物。
NRT2 作為一種高親和力硝酸鹽轉運蛋白,在植物硝酸鹽吸收轉運中起著重要的作用。有研究鑒定出谷子中有7 個NRT2 基因[23],但在本研究中,挖掘和鑒定出8 個谷子NRT2 基因,只分布于1 號(6 個)和5 號(2 個)染色體上,在谷子的9 條染色體中分布極不均勻。本研究通過序列比對分析發現,Si1g11820 和Si1g11860 的蛋白序列相似性達97.52%,且二者處于進化樹的同一分支上,Si1g11900、Si1g11910、Si1g11930 和Si1g11940 的蛋白序列相似性達98.29%,且它們在染色體上的距離很近。因此推測,這些基因發生了串聯復制?;驈椭剖腔蚣易宄蓡T增加的重要方式,基因復制事件的發生,保證了在進化過程中,具有相似功能的基因被復制,重要基因的功能被保留。
二級結構分析結果發現,谷子NRT2 家族各成員,中α-螺旋所占比例均最高,而α-螺旋又是跨膜蛋白的主要組成形式之一,所以,谷子的NRT2家族蛋白極有可能與AtNRT2 成員具有相似的跨膜結構。此外,Si1g11940 與Si1g11860 蛋白中的α-螺旋與β-折疊所占比例未超過50%,蛋白結構可能不太穩定;同時,理化性質中的不穩定系數結果顯示,Si1g11940 和Si1g11860 的不穩定系數大于40,也表明這2 個蛋白不穩定,2 種分析結果一致。這些不穩定性與NRT2 蛋白行使硝酸鹽轉運功能緊密相關。
本研究基因結構分析發現,Si5g29250 基因既不含有UTR 又不含有內含子;亞細胞定位結果也表明,Si5g29250 基因在質膜上表達,且Si5g29250基因比谷子NRT2 基因家族中的其他成員多一個跨膜結構域,因此,Si5g29250 基因可能會更快地響應外界環境的變化,有更強的硝酸鹽轉運能力。不同組織中的表達分析結果也顯示,Si5g29250 基因在3 d 的萌芽種子以及灌漿期的根中表達量比較高,在灌漿期莖中的表達量也略高。本研究分析低氮脅迫下谷子8 個NRT2 基因的表達情況可知,Si5g29250 基因表達量上調92 倍。有研究報道,NRT2 基因的表達會受外界氮濃度的誘導,外源氮素濃度較低時,mRNA 的含量迅速提升,并且當內源氮素達到一定水平后受反饋抑制而回到之前水平[21],Si5g29250 基因的表達符合此規律。Si5g29250基因的啟動子區順式作用元件中含有與ABA 應答相關的元件。已有研究表明,良好的氮素營養可以減少植物葉片中的ABA 水平,維持植物的氣孔開度,提高光合作用[24]。Si5g29250 基因是否能提高植物光合作用,還需進一步試驗驗證。因此,推測Si5g29250 基因可能作為一個關鍵基因,在低氮條件下,能快速地響應外部環境的變化,加速表達,吸收硝酸鹽從根部向莖中轉運,從而保證灌漿期種子合成所需的氮素。
由于谷子研究起步較晚,目前在谷子中對NRT2 基因的功能研究遠沒有擬南芥研究的深入清楚。本研究對谷子NRT2 基因家族進行了初步分析,為之后的基因結構和功能研究奠定了基礎,也為揭示該基因家族參與植物氮素吸收利用的調控機制提供了理論依據。