賀金秋,苗敬南,馬 超,樊紫薇,王超麗,李歡歡,趙 月,劉文軒
(河南農業大學生命科學學院,河南鄭州 450002)
SPL(SQUAMOSA promoter binding protein)是植物特有的轉錄因子家族之一,具有高度保守的SBP結構域,該結構域由70~80個氨基酸構成,具有2個鋅指位點(Cys-Cys-His和Cys-Cys-Cys-His)[1-2]。研究表明,SPL家族基因不僅參與植物生長發育[3-6],還參與植物激素和光信號轉導、生物和非生物脅迫響應等過程[7]。
前人已在擬南芥、水稻和玉米中分別鑒定到17、19和31個SPL基因家族成員[8]。在小麥中,多位學者也對SPL家族基因進行了全基因組鑒定,除Li等[9]鑒定到48個SPL基因外,其他學者均鑒定到56個SPL基因[10-13]。部分小麥SPL基因的功能也得到深入研究。Liu等[14]利用基因編輯技術將TaSPL8基因敲除后,發現小麥植株葉片直立,葉枕結構缺失;Li等[11]研究發現,過表達TaSPL13基因會影響小麥的花序結構,導致小花和籽粒數量增加;Cao等[15]研究發現,小麥TaSPL16基因可促進擬南芥早開花,并影響種子大小。SPL基因家族部分成員含有miR156結合位點,在轉錄水平上受miR156負調控[16]。在模式植物擬南芥和水稻中,miR156-SPL模塊參與調控植物開花、株型結構、果實發育以及生物和非生物脅迫響應等過程[17-18];在小麥中,miR156-SPL模塊通過與DWARF53基因相互作用調節小麥植株結構[19]。小麥SPL基因參與小麥不同組織(器官)的生長發育。然而,關于小麥SPL基因家族在缺氮、缺磷、高鹽、低溫、干旱、高溫等逆境條件下的研究卻鮮有報道。
本研究利用最新的中國春小麥參考基因組信息,基于全基因組搜索的方法鑒定小麥SPL基因家族成員,并根據轉錄組數據對其在逆境脅迫條件下的表達模式進行系統分析,以期為研究小麥SPL基因家族在響應非生物脅迫過程中的功能提供參考。
從Pfam數據庫(http: //pfam.xfam.org/)下載SBP結構域的隱馬爾可夫模型(HMM)文件(Pfam ID: PF03110),用HMMER 3.1軟件從小麥族多組學數據庫WheatOmics 1.0(http://202.194.139.32/)下載最新的小麥基因組文件(IWGSC RefSeq v2.1)[20],從中篩選獲得所有包含小麥SBP結構域的蛋白序列,利用DNAMAN軟件和SMART在線軟件(http://smart.embl-heidelberg.de/)對所有候選序列進行分析,去除不完整讀碼框序列和冗余序列。從TAIR數據庫(https://www.arabidopsis.org)下載擬南芥SPL蛋白序列,從水稻基因組注釋工程(http://rice.plantbiology.msu.edu/)下載水稻SPL蛋白序列。
用ClustalX軟件對小麥、擬南芥和水稻SPL蛋白的氨基酸序列進行多序列比對,參數為默認值。用MEGA 8.0軟件采用鄰接法構建系統發育樹,bootstrap值設置為1 000。
從miRBase數據庫(https://www.mirbase.org/)檢索小麥所有miR156序列,將miR156和SPL基因家族所有成員的轉錄本序列上傳到psRNATarget在線軟件(https://www.zhaolab.org/psRNATarget/analysis),對miR156靶位點進行預測。
從小麥族多組學數據庫WheatOmics 1.0下載小麥SPL基因在缺氮、缺磷、高鹽、低溫、干旱、高溫脅迫以及熱旱共脅迫下的表達譜數據。每個基因的相對表達量用TPM(transcript per million)值來表示,用Excel對數據進行log2轉換,用基迪奧生物云工具(https://www.omicshare.com/tools/)中的熱圖工具繪制熱圖。與對照相比,表達量變化倍數大于2,被認為是脅迫響應基因。隨機挑選4個SPL基因,進一步對缺磷、高鹽(200 mmol·L-1NaCl)、低溫(4 ℃)、干旱和高溫(42 ℃)脅迫條件下這些基因的表達模式進行qRT-PCR驗證,具體處理方法:挑選大小均勻的中國春小麥種子,用75%的酒精消毒3 min,無菌水沖洗4~5次后將種子擺放于含有霍格蘭營養液的水培盒中,置于光照培養箱(24 ℃光照16 h,18 ℃黑暗8 h)中進行培養,每隔兩天換一次營養液。正常生長一周后,將其分別進行脅迫處理,以未處理的樣品作為對照(CK)。缺磷和高鹽脅迫處理時,先倒掉營養液,然后分別加入缺磷霍格蘭營養液及高鹽霍格蘭營養液繼續培養;干旱脅迫是將正常生長一周的幼苗從營養液中移出,置于濾紙上,在室溫條件下脫水干旱。將未處理和處理不同時間的葉片取樣后用液氮冷凍保存。每個處理進行3次重復。
用Trizol試劑(天根,北京)提取RNA,用HiScript II 1st Strand cDNA Synthesis Kit (+gDNA wiper)試劑盒(諾唯贊,南京)將RNA反轉錄為cDNA第一條鏈,以小麥Actin基因為內參,以cDNA為模板,用SYBR Green Realtime PCR Master Mix(Takara,大連)在CFX96定量PCR儀(Bio-Rad,美國)上進行qRT-PCR。PCR擴增體系參照試劑盒說明書進行,PCR擴增程序:95 ℃ 3 min;95 ℃ 5 s,60 ℃ 20 s,72 ℃ 20 s,40個循環。用2-ΔΔCT法計算基因的相對表達量,每個樣品3個技術重復。qRT-PCR所用引物序列如表1所示。

表1 qRT-PCR所用的引物Table 1 Primers used in this study for qRT-PCR
從最新小麥基因組(IWGSC RefSeq v2.1)對用SBP結構域(Pfam ID:PF03110)進行檢索,共發現73個蛋白含有SBP結構域。用DNAMAN和SMART軟件進行結構域分析,同時去除重復蛋白序列,最終獲得56個含有SBP結構域的SPL基因家族成員。
利用MEGA 8.0軟件對小麥(56個)、水稻(19個)和擬南芥(17個)SPL蛋白進行系統進化分析。結果表明,SPL蛋白被劃分為7個亞家族(圖1)。Class III亞家族中含有的SPL蛋白最多,有23個,其中小麥12個;其次為Class VII亞家族,有21個SPL蛋白,其中小麥17個;Class V和Class VI亞家族中的SPL蛋白最少,均不含擬南芥SPL蛋白。

黑圓點表示這些基因含有miR156靶位點。Black dots indicate the genes containing the miR156 target sites.圖1 小麥、擬南芥和水稻SPL蛋白的系統進化樹Fig.1 Phylogenetic tree of SPL proteins in wheat, Arabidopsis and rice
從miRBase數據庫中檢索小麥miR156序列(UGACAGAAGAGAGUGAGCACA),并將該序列和56個小麥SPL基因的轉錄本序列上傳到psRNATarget在線軟件,對包含miR156靶位點的小麥、擬南芥和水稻SPL基因進行預測,發現這些基因主要分布在Class I、Class II、Class IV、Class V和Class VI亞家族中(圖1),說明miR156調控SPL基因表達的分子調控機制在不同物種之間具有較高的保守性。小麥有27個SPL基因含有miR156靶位點,除了Class V亞家族中3個基因的miR156靶位點位于3’UTR區外,其余24個基因均位于CDS區(圖2)。序列比對發現,Class II和Class IV亞家族中15個小麥SPL基因的miR156靶位點與tae-miR156序列之間只有第8個堿基不互補,其他堿基均互補;Class V亞家族3個小麥SPL基因不互補堿基對最多,在第1、2、8位均不互補。

圖2 27個小麥SPL基因miR156靶位點的序列比對分析Fig.2 Multiple alignment of tae-miR156 target sites of the 27 wheat SPL genes
2.4.1 缺氮、缺磷和高鹽脅迫下的表達模式
從小麥族多組學數據庫中獲得56個小麥SPL基因在缺氮(材料為生長15 d的小麥幼苗,處理后取葉片)、缺磷(材料為生長14 d的小麥幼苗,處理后分別取葉片和根部)、高鹽脅迫(材料為生長9 d的小麥幼苗,處理后取根部)的RNA-seq數據,并分析這些基因的表達模式。結果(圖3)發現,葉片中有12個小麥SPL基因響應缺氮脅迫,其中在缺氮脅迫處理1 h后,有2個基因下調表達,分別是TraesCS5B02G286000和TraesCS7A02G208000,后者的下調幅度最大;復氮培養24 h后,僅TraesCS2A02G232400上調表達,有9個基因下調表達。

NS-1 h:缺氮處理1 h的葉片;NR-1 h:復氮處理1 h的葉片;NR-24 h:復氮處理24 h的葉片;P-R-10 d:缺磷處理10 d的根;P-S-10 d:缺磷處理10 d的葉片;S-6 h:高鹽處理6h的根部;S-12 h:高鹽處理12 h的根部;S-24 h:高鹽處理24 h的根部;S-48 h:高鹽處理48h的根部。圖中每個單元格對應的數據為脅迫處理樣品與對照樣品中基因表達水平差異倍數的對數值。NS-1 h: Leaves treated with nitrogen deficiency for 1 h; NR-1 h: Leaves treated with nitrogen recovery for 1 h; NR-24 h: Leaves treated with nitrogen recovery for 24 h; P-R-10 d: Roots treated with phosphorus deficiency for 10 d; P-S-10 d: Leaves treated with phosphorus deficiency for 10 d; S-6 h: Roots treated with high salt for 6 h; S-12 h: Roots treated with high salt for 12 h; S-24 h: Roots treated with high salt for 24 h; S-48 h: Roots treated with high salt for 48 h. The data corresponding to each cell in the figure is logarithmic value of fold change in gene expression level between stress treatment and CK.圖3 小麥SPL基因在缺氮、缺磷和高鹽脅迫下的表達模式Fig.3 Expression profiles of wheat SPL genes under nitrogen deficiency, phosphorus deficiency and high salt stresses
缺磷脅迫處理10 d后,共有16個小麥SPL基因表達量變化顯著。根中有1個SPL基因(TraesCS7A02G208000)下調表達,10個SPL基因上調表達,其中TraesCS7B02G158500上調幅度最大;葉片中有13個基因上調表達,其中TraesCS6B02G183400上調幅度最大,僅TraesCS2B02G250900下調表達。
在高鹽脅迫處理后6、12、24和48 h四個不同時間點,根部共有22個SPL基因表達量發生變化,且多數為上調表達,其中TraesCS5D02G294400上調表達幅度最高,在處理24 h時表達量最高。進一步分析發現,在缺氮、缺磷、高鹽脅迫下表達量發生顯著變化的SPL基因主要分布在Class I~Class Ⅳ亞家族。
2.4.2 低溫、高溫、干旱脅迫以及熱旱共脅迫下的表達模式
從小麥族多組學數據庫獲得56個小麥SPL基因在低溫(材料為生長14 d的小麥幼苗,處理后取葉片)、高溫、干旱脅迫以及熱旱共脅迫下的RNA-seq數據,并分析這些基因的表達模式。結果(圖4)表明,低溫脅迫處理后,小麥幼苗葉片中有6個SPL基因顯著上調表達,其中TraesCS3A02G432500和TraesCS3D02G425800上調幅度最大;高溫脅迫處理下,有14個小麥SPL基因的表達量變化顯著,其中根中有3個,葉片中有1個,籽粒中有12個,除TraesCS6B02G183400在根中上調表達外,其余基因均下調表達,其中TraesCS6A02G110100下調幅度最大;干旱脅迫處理下,有13個小麥SPL基因的表達量變化顯著,相較于葉片和籽粒,小麥根中響應干旱脅迫的SPL基因較多,其中9個上調表達,1個下調表達;熱旱共脅迫處理下,小麥的根、葉片及籽粒中共有21個SPL基因響應熱旱共脅迫,其中TraesCS3B02G468400在葉片中上調幅度最大。響應熱旱共脅迫的SPL基因主要分布于Class Ⅰ、Class Ⅲ和Class Ⅳ亞家族。
對響應不同脅迫的小麥SPL基因進行歸類,共發現36個基因響應脅迫處理(表達量變化倍數大于2)。除TraesCS1B02G266100、TraesCS1D02G254700、TraesCS2D02G232800、TraesCS4A02G359500、TraesCS5B02G265600、TraesCS7A02G246500、TraesCS7A02G260500、TraesCS7B02G144900、TraesCS7B02G142200、TraesCS7D02G245200基因外,其余26個基因均響應2種及以上脅迫,其中TraesCS3D02G425800響應7種脅迫(表2)。

表2 26個響應多個非生物脅迫的小麥SPL基因Table 2 26 wheat SPL genes responding to multiple abiotic stresses
進一步分析發現,大部分位于相同亞家族的小麥SPL基因在同一脅迫下表達模式相似,說明小麥SPL基因可能存在功能冗余。如Class I亞家族中的TraesCS6A02G110100、TraesCS6B02G138400和TraesCS6D02G098500在高鹽脅迫條件下均下調表達。但也存在例外,如Class Ⅳ亞家族中的TraesCS5A02G286700、TraesCS5B02G286000和TraesCS5D02G294400屬于部分同源基因,但它們在干旱脅迫條件下分別表現出下調、上調和無變化三種表達模式。
隨機挑選四個響應2種及以上非生物脅迫的小麥SPL基因(TraesCS7A02G208000、TraesCS6B0G138400、TraesCS6D02G145200和TraesCS7A02G249100),利用qRT-PCR驗證它們在不同脅迫下的表達模式。從表3可以看出,缺磷脅迫處理下,TraesCS7A02G208000和TraesCS6B02G138400的表達量均呈先升后降的變化趨勢,在處理9 d時表達量達到峰值;而TraesCS7A02G249100和TraesCS6D02G145200的表達量呈“降-升-降”的變化趨勢,分別在處理6 d和9 d時表達量達到峰值,均與對照差異顯著(圖5)。高鹽脅迫處理下,TraesCS6B02G138400和TraesCS6D02G145200的表達量均顯著低于對照;TraesCS7A02G208000的表達量呈先升后降的變化趨勢,在處理6 h時表達量達到峰值,且與對照差異顯著;TraesCS7A02G249100的表達量無顯著變化。低溫脅迫處理下,TraesCS6B02G138400和TraesCS7A02G208000的表達量變化趨勢相反,分別呈“升-降-升”和“降-升-降”的變化趨勢,在處理1 h和12 h表達量達到峰值,均與對照差異顯著;而其他兩個基因的表達量在各處理時間點均無顯著變化。干旱脅迫和高溫脅迫處理下,4個小麥SPL基因的表達量均有所下降(除高溫脅迫1 h后TraesCA7A02G208000的表達量顯著高于對照外),部分處理時間的表達量與對照差異顯著。qRT-PCR結果與轉錄組數據基本一致。

表3 不同脅迫處理下4個小麥SPL基因的相對表達量Table 3 Expression of the four wheat SPL genes under different stresses
本研究從最新的中國春小麥基因組(IWGSC RefSeq v2.1)中鑒定到56個小麥SPL基因,而擬南芥、水稻和玉米中分別鑒定到17、19和31個SPL基因[8]。說明小麥中SPL基因的數目遠多于其他物種,原因可能是小麥為異源六倍體植物,在進化過程中經歷了兩次天然雜交和染色體加倍。本研究通過系統進化分析將56個小麥SPL基因分成7個亞家族,而Song等[10]、Li等[11]和Zhu等[12]分別將其分成5、8和10個亞家族,盡管每個亞家族中SPL基因的數目不一致,但序列相似的基因都聚在同一分支。本研究發現,Class Ⅴ和Class Ⅵ亞家族中沒有對應的擬南芥SPL基因家族成員,推測Class Ⅴ和Class Ⅵ亞家族可能是在單子葉植物和雙子葉植物分化后在單子葉植物中獨立進化出的分支。
Cui等[21]研究表明,擬南芥AtSPL9基因通過miR156-SPL9-DFR途徑響應高鹽和干旱脅迫。本研究對不同脅迫下小麥SPL基因的表達模式進行分析,發現響應缺氮、缺磷、高鹽、低溫、高溫、干旱脅迫和熱旱共脅迫的小麥SPL基因家族成員主要集中在Class I~Class Ⅴ亞家族,而Class Ⅵ和Class Ⅶ亞家族成員基本上不響應上述脅迫。Zhu等[12]研究發現,大部分小麥SPL基因具有組織表達特異性,其中46個小麥SPL基因主要在穗部表達。本研究進行脅迫處理的樣品取材部位主要為小麥葉片和根部,Class Ⅵ和Class Ⅶ亞家族成員在穗部是否特異表達需進一步試驗驗證。miR156是植物小RNA家族中表達豐度最大的家族,通過靶向SPL基因家族成員參與調控植株開花以及株型建成等過程[18]。在擬南芥中,miR156通過調控AtSPL3/4/5和AtSPL9的表達直接激活下游基因MADS-box,從而促進開花[22];miR156-SPL10通過介導細胞分裂反應,控制根的再生[23]。miR156-SPL模塊也參與植物非生物脅迫,Ding等[24]發現,擬南芥miR156-SPL模塊通過調控下游相關熱響應基因的表達來適應環境溫度變化;Kouhi等[25]發現,紅花miR156-SPL模塊可使紅花幼苗在長期輕度干旱時繼續存活,并提高開花率。本研究發現,27個小麥SPL基因可能受miR156調控,這為進一步探索miR156-SPL模塊在小麥中的功能提供了參考。
本研究鑒定到36個與非生物脅迫響應相關的小麥SPL基因,其中TraesCS3D02G425800響應7種非生物脅迫,后續將通過過表達轉基因技術或CRISPR-Cas9技術對該基因進行驗證,深入研究該基因的功能。