樊武哲,武懿茂,趙文京,陳 強,俞飛越,李雪垠
(山西農業大學生命科學學院,山西太谷030801)
谷子(Setaria italica) 起源于我國北方黃河流域,至今已有7 000 余年的栽培歷史,是我國北方重要的雜糧作物[1-3]。近年來,隨著對植物的深入研究,越來越多與逆境相關的轉錄因子被發現。轉錄因子(transcription factor,TF),也稱反式作用因子,能有序地結合在目標基因啟動子序列中的特殊位點,啟動基因的轉錄和控制基因的轉錄效率,在植物的逆境適應過程中,發揮著重要的調控作用[4-5]。
核轉錄因子Y 是一個與CCAAT- box 順式作用元件結合進而調節靶基因表達的轉錄因子,普遍存在于酵母、動植物等真核生物中,也被稱為CCAAT 盒結合因子(CCAAT- binding factor,CBF)或亞鐵血紅素激活蛋白(heme activator protein,HAP)[6-8]。它是由3 個(NF- YA、NF- YB 和NF- YC)不同的亞家族組裝成的異源三聚體,結合到啟動子CCAAT 盒上,調控眾多基因的表達,在植物胚胎發育、個體生長及逆境脅迫響應等方面發揮重要的作用[9-11]。研究發現,在擬南芥和小麥中,NF- YA 家族均包含10 個成員,NF- YB 家族分別包含13,11 個成員,NF- YC家族分別包含13,14 個成員[12-13],它們在調控胚發育、胚成熟、花發育過程以及非生物脅迫應答中起著重要的作用[14-16]。
NF- YB 家族包含一個與核心組蛋白H2B 中的組蛋白折疊基序保守域極其相似的中心結構域,在蛋白質—DNA,蛋白質—蛋白質的相互作用中發揮著重要的作用[17]。已有研究表明,NF- YB 基因家族能調控非生物脅迫,如干旱、高鹽、冷害、熱害等方面。鑒于NF- YB 基因家族在植物抗逆方面的重要作用,且并未發現谷子NF- YB 基因家族的詳細報道。
本研究利用生物信息學手段鑒定和分析谷子NF- YB 基因家族,預測并統計谷子NF- YB 基因家族各蛋白的理化性質、保守基序、保守結構域、系統進化等,旨在為進一步探索NF- YB 基因家族的功能提供理論基礎。
利用植物轉錄因子數據庫PlantTFDB 在線搜索并下載谷子NF- YB 基因家族的氨基酸序列;選用Phytozome 數據庫下載谷子NF- YB 基因家族成員的基因組序列和CDS 序列。
利用Perl 編程語言,將谷子NF- YB 基因家族成員在染色體上的位置進行整理,通過MapInspect程序顯示每個基因在染色體上的位置,得到各個基因在染色體上的分布情況,并繪制谷子NF- YB 基因家族成員在染色體上的物理分布圖,對谷子NF- YB 家族基因進行可視化分析。
利用谷子基因組Phytozome 數據庫查找NF- YB 基因家族基本信息,并利用EXPASY- Prot-Param 在線工具(https://web.expasy.org/protparam/)分析谷子NF- YB 基因家族等電點和相對分子質量。
為了明確谷子基因組中鑒定出的NF- YB 基因家族成員的進化關系,利用Clustal X2.1 和MEGA 4.0 軟件進行氨基酸序列聚類和進化分析,采用鄰接法(Neighbor- Joining,NJ)構建系統進化樹,進行1 000 次Bootstrap 抽樣自檢,其他參數選擇默認。并利用在線軟件Gene Structure Display Server(GSDS,http://gsds.cbi.pku.edu.cn/)分析谷子NF- YB 基因家族基因的外顯子- 內含子(exon- intron)結構。
利用MEME 軟件(http://meme- suite.org/tools/meme) 對谷子NF- YB 基因家族進行保守基序分析,并利用TBtools 工具繪制谷子NF-YB 基因的Motif示意圖,分析谷子NF-YB 氨基酸序列的保守性。
將谷子抗旱相關蛋白激酶基因的氨基酸序列提交至NCBI- CDD 數據庫(https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi),并利用TBtools工具繪制谷子NF-YB 基因保守結構域。
利用PlantCARE 軟件在線分析谷子NF- YB 基因家族啟動子區順式作用元件,選取鑒定出的谷子NF-YB 基因起始密碼子上游1 500 bp 序列作為啟動子區域,將序列提交到PlantCARE(http://bioinformatics.psb.gent.e/eboolslantcare/html)數據庫,分析啟動子順式作用元件。
從Phytozome 數據庫下載谷子NF- YB 基因家族的表達數據,分析其組織表達特異性,并利用R語言函數繪制基因表達熱圖。
谷子共有9 條染色體,根據谷子NF- YB 基因家族成員所在染色體的信息,對獲得的16 個谷子NF- YB 基因家族成員命名,分別命名為SiNFYB1~SiNF-YB16。基因的染色體分布情況如圖1所示。由圖1 可知,谷子NF- YB 基因家族成員分布在7 條不同染色體上,4 號染色體上最多,9 號染色體上最少,7,8 號染色體上沒有分布。

16 個谷子NF- YB 基因家族成員的基本信息及理化性質列于表1。從表1 可以看出,谷子NF- YB 基因家族成員序列長度在516~3 967 bp,其中,SiNF-YB15 的CDS 序列最長,SiNF-YB7 的CDS 序列最短;蛋白最長有300 個氨基酸,最短的有115 個氨基酸;SiNF-YB11、SiNF-YB15 的外顯子數目較多,而SiNF-YB4、SiNF-YB12、SiNF-YB13、SiNF-YB14、SiNF-YB16 的外顯子數目較少;蛋白質等電點介于5.00(SiNF-YB3)~8.38(SiNF-YB10),其中有3 個基因編碼的蛋白質呈堿性,13 個基因編碼的蛋白質顯酸性;蛋白質相對分子質量在12 589.38~33 890.02 u。

表1 谷子NF-YB 家族基因的基本信息

基于谷子NF- YB 基因家族成員的氨基酸序列構建的系統進化樹和基因結構如圖2 所示,谷子16個NF- YB 基因家族成員可以劃分為3 個亞族,同一亞族內成員親緣關系較近。不同的亞族之間進化關系差距較大,推測谷子NF- YB 基因家族在演化過程中發生了變化,在谷子的生長發育及抗逆過程中起著不同的調控作用。
谷子NF- YB 基因家族成員的結構分析結果如圖3 所示,多數基因包含有外顯子和內含子結構,呈現斷裂基因特征,其中,以SiNF-YB11 和SiNFYB15 基因最為明顯,含有5 個外顯子;而SiNFYB4、SiNF-YB12、SiNF-YB13、SiNF-YB14 和SiNFYB16 基因結構比較簡單,外顯子數目最少,只含有1 個外顯子。

對谷子NF- YB 基因家族成員的氨基酸序列進行保守基序分析,結果如圖4 所示。谷子NF- YB 基因家族共包含5 種保守基序,將其分別命名為Motif 1~5,結果顯示,谷子NF- YB 基因家族都含有Motif1這種保守基序,說明Motif 1 是核心基序。而對于Motif 4、Motif 5 這2 種保守基序來說,分別僅分布于3,2 個家族基因中,說明這2 種基序在進化中分化程度很低。

從圖5 可以看出,谷子NF- YB 基因家族成員共包含2 個保守結構域(CBFD_NFYB_HMF 和H4 superfamily)。每個谷子NF- YB 基因家族成員都含有1 個結構域。SiNF-YB4、SiNF-YB5 和SiNF-YB8、SiNF-YB9 含有相同的保守域,即都含有1 個CBFD_NFYB_HMF 保守結構域,且其位置相似,所以,推測它們可能具有相似的生物學功能。

基于PlantCARE 軟件工具在線分析谷子NFYB 基因啟動子順式作用元件,結果表明,谷子16個NF-YB 基因啟動子中與抗逆相關的順式作用調控元件主要有:ABA 響應元件(ABRE)、低溫誘導響應元件(LTR)、MeJA 響應元件(CGTCA- motif、TGACG- motif) 以及生物與非生物脅迫響應元件(TC- rich repeats)等(表2)。多數谷子NF-YB 基因啟動子區域都含有干旱誘導響應元件,這表明NFYB 基因參與谷子干旱脅迫響應的調控。此外,研究發現不同基因的調控元件種類、數目也不同,另外一些NF-YB 基因還具有水楊酸、生長素、赤霉素、低溫等非生物脅迫響應相關的元件,這也進一步表明了NF- YB 基因家族成員在抵抗逆境過程中的重要作用。

表2 谷子NF-YB 基因家族成員啟動子順式作用元件功能

基于Phytozome 數據庫檢索并鑒定出的16 個谷子NF- YB 基因家族成員,通過Phytozome 數據庫,統計整理出NF- YB 基因家族成員在各個組織中的表達量,并利用R 語言內部的Heatmap 函數繪制熱圖,組織表達情況如圖6 所示,結果發現,SiNF-YB11 基因在根中的表達量最高,在穗中的表達量較高;SiNF-YB15 在根中也有較高的表達量。此外,SiNF-YB1、SiNF-YB2、SiNF-YB7、SiNF-YB8、SiNF-YB9、SiNF-YB10 基因不參與谷子根、莖、葉和穗等組織表達。NF- YB 基因家族不同成員在谷子不同組織中的表達量存在顯著差異。
植物NF- YB 基因家族是植物抗逆境脅迫的關鍵基因,通過生物信息學手段對谷子NF- YB 基因家族進行分析,可為深入研究谷子NF- YB 基因家族抗逆境脅迫奠定基礎。
本研究鑒定了16 個谷子NF-YB 基因,它們分布于除7,8 號染色體外的其余7 條染色體上。聚類分析顯示,它們可以分為3 個亞家族,這與將水稻、擬南芥和大豆中的NF- YB 基因家族分成I、II、III等3 類類似。基因結構分析顯示,多數基因包含有外顯子,卻沒有內含子結構,這是由于NF- YB 基因家族在進化過程中承受較強的選擇壓力,許多基因的內含子丟失[18]。保守基序分析顯示,谷子NF- YB基因家族成員共有5 個保守基序,其中,Motif 1 是核心基序,分布于每一個谷子NF- YB 基因家族內。保守結構域分析表明,谷子NF- YB 基因家族共包含2 個保守結構域。NF- YB 基因家族成員的保守域大多數位于NF-YB 基因的內部,這種位置保守性是依賴于核轉錄因子異源三聚體蛋白空間構象決定的。NF- YB 蛋白與NF- YC 蛋白通過彼此的保守域,采用頭尾相接的方式形成異源二聚體互作平臺,吸引NF- YA 蛋白與其結合形成具有活性的異源三聚體核轉錄因子。核轉錄因子通過NF- YA 亞基上的DNA 結合域結合到靶基因啟動子部分CCAAT 盒,激活或抑制轉錄[19-20]。基因表達分析顯示,SiNF-YB 基因在谷子根、莖、葉和穗中表達量有較大差異,說明不同的NF- YB 基因家族成員在植物的生長發育過程中有各自獨特的作用。上述結果表明,多數親緣關系較近的基因的外顯子- 內含子結構、保守基序、保守結構域較為相似,它們可能具有功能上的相似性,如SiNF-YB8、SiNF-YB9 親緣關系較近,在基因結構、保守基序、保守結構域都表現出較強的相似性,所以,推測它們可能具有相似的生物學功能。
綜上,對谷子NF- YB 基因家族成員的研究將加深對谷子NF- YB 基因家族調控轉錄機制的理解,深入探索NF- YB 基因家族在非生物逆境時發揮的重要作用,可為后續進一步探索NF- YB 基因家族的功能提供理論基礎。