徐珍珍, 季 為, 陳祥龍, 徐 鵬, 郭 琪, 沈新蓮
(江蘇省農業科學院經濟作物研究所/農業農村部長江下游棉花與油菜重點實驗室,江蘇 南京 210014)
核因子Y(Nuclear factor Y,NF-Y)又稱為血紅素激活蛋白(Heme activator protein,HAP)或者CCAAT結合因子(CCAAT-binding factor,CBF),是一類能夠結合基因啟動子特異序列CCAAT的轉錄因子,普遍存在于酵母、植物和動物中[1]。NF-Y由NF-YA(CBF-A或HAP2)、NF-YB(CBF-B或HAP3)和NF-YC(CBF-C或HAP5)3個亞基蛋白組成[2]。各亞基都具有獨特的高度保守核心區,其中NF-YA蛋白具有53個氨基酸組成的保守核心區,包括保守結構域A1和A2。其中A1是NF-YA與NF-YB/NF-YC異源二聚體相互作用的N端,而結構域A2是NF-YA參與DNA結合的C端,在特異識別靶基因啟動子CCAAT序列中發揮重要作用[3]。一般情況下,NF-Y調控下游基因表達的機制有3種。第一,NF-YA、NF-YB和NF-YC構成活性異源三聚體,與下游目標基因的啟動子CCAAT-box區域結合[4];第二,NF-YB和NF-YC形成異源二聚體NF-YB/NF-YC,然后與特定轉錄因子結合形成復合物來調節下游基因表達,而NF-YA能夠阻止NF-YB/NF-YC二聚體與特定轉錄因子結合,從而抑制其功能[5-6];第三,NF-Y亞基通過與其他蛋白復合物相互作用來調控下游基因的轉錄水平[4]。目前NF-YA基因家族在多個物種中已有報道。水稻(Oryzasativa)[7]和擬南芥(Arabidopsisthaliana)[8]基因組中各包含10個NF-YA成員。谷子(Setariaitalica)[9]和玉米(Zeamays)[10]中分別鑒定到10個和14個成員;油菜(Brassicanapus)[11]、大豆(Glycinemax)[12]、鷹嘴豆(Cicerarietinum)[13]、茶樹(Camelliasinensis)[14]和桃(Prunuspersica)[15]基因組中分別鑒定出14個、21個、8個、10個和6個成員。越來越多的研究結果表明,NF-YA基因廣泛參與植物胚胎發育、種子形成和萌發[16-17]、根的形態建成[18]、開花[19]和光合作用[20]等生長發育過程,響應干旱[9]、高溫[21]和高鹽[9,21]等逆境脅迫。
棉花(Gossypiumspp.)是世界上重要的紡織工業原料,是飼料蛋白和食用油的重要來源之一,在中國國民經濟中具有重要地位。近年來,糧棉爭地矛盾的加劇加速了中國棉花生產的區域化,年降水量少、干旱問題十分突出的新疆地區已成為中國棉花主產區。目前廣泛種植的四倍體栽培種陸地棉(G.hirsutum)是在正常環境條件下選育出的,抗旱性弱。二倍體野生種異常棉(G.anomalum)生長于撒哈拉沙漠邊緣和非洲西南部[22],植株矮小且密被茸毛,葉色淺、葉片小,具有較強的抗旱性[23]。因此,利用異常棉抗旱基因改良栽培種陸地棉資源是中國棉花產業發展的重要方向。目前,異常棉基因組數據已在公共數據庫公布[24],但對異常棉抗旱性狀相關的NF-YA家族基因分析未見報道。本研究基于異常棉參考基因組信息,利用生物信息學手段對NF-YA家族基因進行全基因組鑒定,分析該家族基因的系統進化、保守基序、基因結構、順式作用元件、組織特異性表達、干旱脅迫下的表達模式以及該家族基因編碼蛋白質的亞細胞定位、理化性質等,旨在為后續深入研究異常棉NF-YA基因家族在干旱脅迫下的功能提供理論依據。
擬南芥NF-YA家族基因編碼的氨基酸序列來自TAIR(https://www.arabidopsis.org/)網站;異常棉基因組注釋的氨基酸和編碼序列(CDS)來自Cottongen網站(https://www.cottongen.org/)[21];異常棉根、莖、葉和花的轉錄組數據以及干旱脅迫下異常棉葉片的轉錄組數據來自NCBI網站(https://www.ncbi.nlm.nih.gov/)[24-25]。
首先在SMART網站(http://smart.embl-heidelberg.de/)預測擬南芥NF-YA蛋白家族的保守結構域,均含有CBFB_NFYA結構域(PF02045),然后在Pafm網站(https://pfam-legacy.xfam.org/)下載種子文件PF02045.18,利用搜索工具HMMER3.1b1檢索異常棉氨基酸序列,并將獲得的NF-YA蛋白成員在NCBI CDD和SMART蛋白數據庫進行驗證,最終將通過驗證的基因作為異常棉NF-YA家族基因(GoanoNF-YA)并進行命名; GoanoNF-YA蛋白家族成員的等電點和相對分子質量信息利用在線網站(https://web.expasy.org/compute_pi/)進行預測,利用在線軟件Cell-PLoc 2.0(http://www.csbio.sjtu.edu.cn/bioinf/Cell-PLoc-2/)進行異常棉NF-YA蛋白家族成員的亞細胞定位預測;利用TBtools軟件提取GoanoNF-YA家族基因在染色體的位置信息。
利用MEGA11軟件的鄰接法(Neighbor-Joining,NJ)構建擬南芥和異常棉NF-YA家族基因的系統進化樹,并進行1 000次Boot strap抽樣自檢;利用GSDS在線軟件(http://gsds.cbi.pku.edu.cn)分析GoanoNF-YA基因的外顯子和內含子結構;利用MEME軟件(http://meme-suite.org/tools/meme)對GoanoNF-YA基因進行保守基序(motif)分析;利用PlantCARE軟件(http://bioinformatics.psb.ugent.be/webtools/plantcare/html)分析異常棉NF-YA家族基因啟動子順式作用元件。
利用Tophat[26]和Cufflink[27]軟件包分析異常棉根、莖、葉和花及異常棉葉片在干旱脅迫下的轉錄組測序數據Clean data并進行表達量計算,用FPKM(Fragments per kilobase of transcript permillion fragments mapped)表示。提取NF-YA家族基因的表達數據,進行標準化后,利用TBtools繪制GoanoNF-YA基因表達量熱圖。
根據異常棉氨基酸數據庫共鑒定出17個異常棉NF-YA家族基因,根據基因所在的染色體及位置分別命名為GoanoNF-YA1~GoanoNF-YA17。NF-YA家族基因編碼的氨基酸序列長度為190~603 aa,平均315 aa。蛋白質的相對分子質量為21 890.3~66 522.6,平均34 774.3。理論等電點為7.87~10.07,平均8.94,均為堿性。除GoanoNF-YA4定位在葉綠體,其余16個成員均定位于細胞核(表1)。

表1 異常棉NF-YA家族基因的基本信息
異常棉NF-YA家族基因分布在10條染色體上。10號染色體上有3個NF-YA基因;1號、4號、5號、8號和 13號染色體上各有2個NF-YA基因;2號、6號、7號和11號染色體上各有1個NF-YA基因; 3號、9號和12號染色體上沒有NF-YA基因(圖1)。

圖1 異常棉NF-YA家族基因在染色體上的分布
異常棉和擬南芥NF-YA家族基因編碼的氨基酸序列比對后構建的系統進化樹如圖2所示。從系統進化樹可以看出,異常棉和擬南芥NF-YA家族基因可分為6類(圖2)。Ⅰ類中有5個異常棉NF-YA基因(GoanoNF-YA3、GoanoNF-YA2、GoanoNF-YA10、GoanoNF-YA11和GoanoNF-YA16)和2個擬南芥NF-YA基因(AtNF-YA1和AtNF-YA9)。Ⅱ類中有3個異常棉NF-YA基因(GoanoNF-YA15、GoanoNF-YA4和GoanoNF-YA1)和2個擬南芥NF-YA基因(AtNF-YA2和AtNF-YA10)。Ⅲ類中有2個異常棉NF-YA基因(GoanoNF-YA6和GoanoNF-YA12)和2個擬南芥NF-YA基因(AtNF-YA7和AtNF-YA4)。Ⅳ類中僅有3個異常棉NF-YA基因(GoanoNF-YA8、GoanoNF-YA17和GoanoNF-YA9)。Ⅴ類中有4個異常棉NF-YA基因(GoanoNF-YA5、GoanoNF-YA13、GoanoNF-YA7和GoanoNF-YA14)和2個擬南芥NF-YA基因(AtNF-YA5和AtNF-YA6)。Ⅵ類中僅有2個擬南芥NF-YA基因(AtNF-YA8和AtNF-YA3)。

Motif 1~Motif 10分別為保守基序1~保守基序10。
系統進化樹上分支近的NF-YA家族成員具有相同或類似的基序類型、數目和排列順序(圖2)。Ⅰ類中,5個GoanoNF-YA成員(GoanoNF-YA3、GoanoNF-YA2、GoanoNF-YA10、GoanoNF-YA11和GoanoNF-YA16)均具有7個相同類型的保守基序(motif1、motif2、motif3、motif4、motif7、motif9和motif10)且排列順利相同;Ⅱ類中,GoanoNF-YA15和GoanoNF-YA4基因均具有4個相同類型的保守基序(motif1、motif2、motif3和motif7)且排列順序相同,而GoanoNF-YA1基因中多了一個motif9,但其余4個保守基序的類型和排列順序與GoanoNF-YA15和GoanoNF-YA4基因一致;Ⅲ類中,GoanoNF-YA6和GoanoNF-YA12基因均包含5個相同類型的保守基序(motif1、motif2、motif3、motif4和motif10)且排序順序完全一致;Ⅳ類中,GoanoNF-YA17和GoanoNF-YA9基因含有7個相同類型的保守基序(motif1、motif2、motif3、motif4、motif8、motif9和motif10)且排列順序相同,而GoanoNF-YA8基因僅包含與GoanoNF-YA17和GoanoNF-YA9相同類型的motif1、motif3、motif4和motif10 4個保守基序;Ⅴ類中,GoanoNF-YA5、GoanoNF-YA13和GoanoNF-YA7基因含有9個相同類型的保守基序(motif1、motif2、motif3、motif4、motif5、motif6、motif8、motif9和motif10)且排列順序相同,而GoanoNF-YA14僅含有與GoanoNF-YA5、GoanoNF-YA13和GoanoNF-YA7相同類型的4個保守基序(motif1、motif2、motif3和motif5)。
異常棉NF-YA家族基因的結構分析結果表明,除了GoanoNF-YA4含有9個外顯子外,其余16個成員含有3~5個外顯子,系統進化樹上分支近的NF-YA家族成員具有相同或類似的基因結構(圖3)。Ⅰ類中,5個基因GoanoNF-YA3、GoanoNF-YA2、GoanoNF-YA10、GoanoNF-YA11和GoanoNF-YA16均含有5個外顯子,其中GoanoNF-YA2基因的內含子較長。Ⅱ類中,GoanoNF-YA15和GoanoNF-YA1基因均含有5個外顯子,GoanoNF-YA4基因含有9個大小不等的外顯子;GoanoNF-YA15基因具有較長的內含子。Ⅲ類中,GoanoNF-YA6和GoanoNF-YA12基因均含有5個外顯子,第1個外顯子均較短;GoanoNF-YA6內含子較長。Ⅳ類中,GoanoNF-YA17和GoanoNF-YA9基因含有5個外顯子,GoanoNF-YA8僅含有4個外顯子;3個基因的內含子均較短。Ⅴ類中,GoanoNF-YA5、GoanoNF-YA13和GoanoNF-YA7等基因均含有5個外顯子,而GoanoNF-YA14基因僅含有3個外顯子;4個基因成員的內含子均較短(圖3)。

圖3 異常棉NF-YA基因結構特征
異常棉NF-YA家族基因的相關順式作用元件分為5類,包括脅迫、激素響應、生長發育、光反應和其他相關元件(圖4)。脅迫響應順式作用元件包括ARE、DRE-core、GC-motif、LTR、MBS、TC-rich repeats和WUN-motif。GoanoNF-YA2、GoanoNF-YA11、GoanoNF-YA16、GoanoNF-YA15、GoanoNF-YA12、GoanoNF-YA17、GoanoNF-YA9、GoanoNF-YA8和GoanoNF-YA14等9個基因含有1~2個干旱響應順式作用元件MBS。GoanoNF-YA15、GoanoNF-YA1、GoanoNF-YA8和GoanoNF-YA7等4個基因含有1~2個干旱、低溫和鹽脅迫響應順式作用元件DRE-core。17個GoanoNF-YA基因都含有抗氧化順式作用元件ARE,1~7個不等;僅GoanoNF-YA17基因含有GC-motif無氧誘導響應元件。激素響應順式作用元件包括ABRE、AuxRR-core、CGTCA-motif、GARE-motif、P-box、plant_AP-2-like、TATC-box、TCA-element、TGACG-motif和TGA-element。GoanoNF-YA3、GoanoNF-YA12、GoanoNF-YA8和GoanoNF-YA13等4個基因不含有脫落酸響應順式作用元件ABRE,其余13個GoanoNF-YA基因都含有ABRE,1~5個不等。生長發育相關的順式作用元件包括CAT-box、GCN4_motif、HD-Zip、MBSI、Myb-related、O2-site和RY-element。異常棉NF-YA基因啟動子分別包含7個CAT-box、1個GCN4_motif、4個HD-Zip、1個MBSI、127個Myb-related、13個O2-site和4個RY-element,涉及分生組織發育、胚乳發育、柵欄組織分化和種子發育的特異調控。參與光反應的順式作用元件包括AAAC-motif、AE-box、AT1-motif、ATCT-motif、AT-rich sequence、Box 4、CCAAT-box、chs-CMA、circadian、G-Box、GA-motif、GATA-motif、GT1-motif、I-box、MRE、TCCC-motif、TCT-motif和W box。其他順式作用元件包括TATA-box、CAAT-box、Myc_related、AT~TATA-box、AAGAA-motif和ERE等。

表中數字為啟動子區域的結合位點作用元件數目。A1:ARE;A2:DREcore;A3:GC-motif;A4:LTR;A5:MBS;A6:TC-richrepeats;A7:WUN-motif;B1:ABRE;B2:AuxRR-core;B3:CGTCA-motif;B4:GARE-motif;B5:P-box;B6:plant_AP-2-like;B7:TATC-box;B8:TCA-element;B9:TGACG-motif;B10:TGA-element;C1:CAT-box;C2:GCN4_motif;C3:HD-Zip;C4:MBSI;C5:Myb_related;C6:O2-site;C7:RY-element;D1:AAAC-motif;D2:AE-box;D3:AT1-motif;D4:ATCT-motif;D5:AT-rich sequence;D6:Box 4;D7:CCAAT-box;D8:chs-CMA;D9:circadian;D10:G-Box;D11:GA-motif;D12:GATA-motif;D13:GT1-motif;D14:I-box;D15:MRE;D16:TCCC-motif;D17:TCT-motif; D18:W box;E1:3-AF1 binding site;E2:AAGAA-motif;E3:A-box;E4:ACE;E5:as-1;E6:AT~TATA-box;E7:Box III;E8:CAAT-box;E9:CARE;E10:CCGTCC motif;E11:CTAG-motif;E12:dOCT;E13:ERE;E14:GTGGC-motif;E15:Myc_related;E16:Sp1;E17:STRE;E18:TA+G36:G95TA-box;E19:TATA-box;E20:WRE3。
異常棉NF-YA家族基因的組織表達模式如圖5A所示。從圖中可以看出,GoanoNF-YA6、GoanoNF-YA12、GoanoNF-YA11、GoanoNF-YA4和GoanoNF-YA16等基因在根、莖、葉和花中均有較高表達;GoanoNF-YA17、GoanoNF-YA8、GoanoNF-YA13、GoanoNF-YA5、GoanoNF-YA1和GoanoNF-YA7等基因在根、莖和葉中表達量較高,而在花中表達量較低;GoanoNF-YA9、GoanoNF-YA15、GoanoNF-YA10、GoanoNF-YA2和GoanoNF-YA14等基因在葉中表達量最高,根、莖中表達量次之,花中表達量最低;GoanoNF-YA3基因在根、莖、葉和花中幾乎不表達。

A:異常棉不同器官NF-YA家族基因的表達模式;B:異常棉NF-YA家族基因在干旱脅迫過程中的表達變化特征。
不同干旱持續時間(0 d、3 d、5 d、7 d和10 d)下,異常棉葉片GoanoNF-YA家族基因的表達模式如圖5B所示。從圖中可以看出,GoanoNF-YA15、GoanoNF-YA9、GoanoNF-YA16、GoanoNF-YA11、GoanoNF-YA13、GoanoNF-YA12和GoanoNF-YA6共7個基因在干旱脅迫處理下表達量較高,且隨著干旱脅迫時間增加表達量呈現上升的趨勢;GoanoNF-YA17和GoanoNF-YA8等基因在干旱脅迫處理后,表達量先升高后降低;GoanoNF-YA4基因在干旱脅迫處理后表達量沒有明顯的變化;GoanoNF-YA1、GoanoNF-YA2、GoanoNF-YA5和GoanoNF-YA10等基因在干旱脅迫處理下表達量較低,但隨著干旱脅迫時間增加表達量呈現上升的趨勢;GoanoNF-YA14基因在干旱5 d時表達量最高,而在其他時期表達量較低;GoanoNF-YA7基因在干旱脅迫期間表達量均較低,GoanoNF-YA3基因在干旱脅迫期間均不表達。
NF-YA為NF-Y復合體的一個亞基蛋白,雖進化上較為保守,但具有多樣性的生物功能[28-31]。本研究在二倍體野生種異常棉基因組中鑒定到17個GoanoNF-YA成員,同其他單子葉植物水稻、谷子和玉米以及雙子葉植物擬南芥、油菜、大豆、鷹嘴豆、桃、白菜和茶樹等[7-15]一樣,NF-YA基因在異常棉基因組中也發生了擴張。這在一定程度上表明,NF-YA家族成員在進化過程中可能存在功能分化和遺傳冗余,從而幫助植物在長期的進化過程中形成靈活的、復雜的和多功能的轉錄調控系統以適應復雜多變的環境。系統進化分析結果表明,擬南芥和異常棉NF-YA家族成員可分為6類,每類2個物種的基因數目不同,且2個物種都存在單獨聚類的情況。如Ⅳ類中僅有異常棉NF-YA成員,沒有擬南芥相關成員,而Ⅵ類中僅有擬南芥2個成員AtNF-YA8和AtNF-YA3,沒有異常棉NF-YA成員。這說明NF-YA基因在物種進化中發生了適應性進化,這與以往的報道[7-15]是一致的。通過保守基序和基因結構預測,系統進化樹上分支近的NF-YA家族成員具有相同或相似類型和排列順序的基序,推測分支較近的NF-YA家族成員間的功能可能存在著相似性。異常棉GoanoNF-YA家族基因中除GoanoNF-YA4外,其余16個成員均包含3~5個外顯子,與其他作物具有相似的外顯子數目[9-11]。因此,可以認為NF-YA外顯子數目在進化上較為保守。
Zhao等[4]研究結果表明,擬南芥NF-YA基因能調控胚胎發生、根系生長、種子萌發、葉片發育、花期和逆境脅迫等生物學過程,這種基因的多樣性功能與其啟動子的順式作用元件有關。啟動子順式作用元件通過調控目的基因的轉錄進而影響植物的生長發育、非生物脅迫響應和光反應等[28-30]。本研究發現異常棉GoanoNF-YA基因5’上游2 000 bp的序列中存在脅迫、植物激素、生長發育和光響應等相關順式作用元件。與脅迫相關的元件包括干旱脅迫響應元件MBS、脫落酸響應元件ABRE、干旱、低溫和鹽脅迫響應元件DRE和抗氧化作用響應元件GC-motif等;與生長發育相關的元件有CAT-box、GCN4_motif、HD-Zip、RY-element、O2-site和MBSI等,分別響應分生組織發育、胚乳發育、柵欄組織分化、種子發育、玉米醇溶蛋白代謝調節和類黃酮生物合成等過程;與光反應相關的順式作用元件有ATC-motif、ATCT-motif、Box4和MRE等。這些結果表明異常棉GoanoNF-YA基因具有多樣的生物功能。
NF-YA基因在植物體中呈現多樣化的組織表達模式。擬南芥10個NF-YA基因中,有8個基因在胚胎中表達,5個基因(AtNF-YA1、AtNF-YA2、AtNF-YA3、AtNF-YA7和AtNF-YA9)在胚乳中表達[17]。亞洲棉(G.arboretum)的GaNF-YA4基因在種子和纖維發育過程中表達量較高[32]。陸地棉(G.hirsutum)的GhNF-YA18基因在莖、葉、花瓣和雄蕊中表達量較高,而GhNF-YA27基因在莖中表達量較高[33]。小麥中TaNF-YA3、TaNF-YA4、TaNF-YA7和TaNF-YA9等基因優先在胚乳組織中表達[34]。本研究中,異常棉17個GoanoNF-YA家族基因,有5個基因在根、莖、葉和花中均高表達,11個基因在根、莖、葉均較高表達,但在花中表達量較低。這種基因的多樣化組織表達模式說明NF-YA基因參與了較多的生物學過程,具有多樣化的生物功能,在植物的生長發育和逆境響應中扮演著非常重要的角色。擬南芥AtNF-YA5基因在干旱脅迫14 d后表達量上調,其異位表達增強了植株抗旱性[35]。在擬南芥中過表達大豆GmNF-YA3基因可提高植株的抗旱性[36]。本研究中,異常棉GoanoNF-YA基因在干旱脅迫后,除了GoanoNF-YA7和GoanoNF-YA3外,其余15個基因均對干旱脅迫產生了響應。進化樹上與AtNF-YA5同源性較近的GoanoNF-YA13在異常棉干旱脅迫處理下表達量均較高,且隨著干旱脅迫時間增加表達量呈現上升的趨勢。
本研究通過生物信息學手段從棉花野生種異常棉基因組中鑒定出了17個NF-YA家族基因,分布在10條染色體上,編碼的蛋白質長度為190~603個氨基酸,理論等電點為7.87~10.07,16個基因包含3~5個外顯子。異常棉NF-YA基因與擬南芥NF-YA基因在系統進化樹上可分為6類,每類成員具有相似或者相同類型和排列順序的基序。異常棉NF-YA家族基因具有組織特異性表達模式且參與了干旱脅迫響應,與AtNF-YA5同源性較近的GoanoNF-YA13在干旱脅迫處理下表達量較高,推測其在調控干旱脅迫響應中發揮重要作用。本研究結果為進一步開展異常棉NF-YA基因家族功能研究奠定了基礎。