宋夢瑤, 趙 樂,2, 董誠明,2, 朱畇昊,2
(1.河南中醫藥大學藥學院,河南鄭州 450046; 2.呼吸疾病診療與新藥研發河南省協同創新中心,河南鄭州 450046)
轉錄因子是一類參與轉錄調控的蛋白,通過與DNA分子特異性結合激活或抑制靶基因的轉錄活性,從而使目的基因在特定的時間、空間轉錄及表達。SPL(SQUAMOSA promoter-binding protein-like)類轉錄因子為植物所特有,能識別并結合-基因啟動子的SQUAMOSA區域。基因家族所編碼的蛋白質序列具有高度保守的SBP結構域,該結構域大約由78個氨基酸殘基組成,包含2個鋅指位點(Zinc finger motif,Zn-1/Zn-2)和1個核定位信號(nuclear localization signal,簡稱NLS)。目前,越來越多的基因家族研究被相繼報道,如擬南芥、水稻、丹參等。研究表明,基因參與植物生長和發育的調節,包括植物花和植物表皮毛的發育、植物脅迫反應和次生代謝物的合成等。
紅花(L.)為菊科紅花屬植物,其干燥的管狀花序入藥稱為紅花,廣泛應用于中醫臨床,具有活血通經、祛瘀止痛的功效。紅花的籽粒中富含多不飽和脂肪酸——亞油酸和油酸,在食品及中醫藥有廣泛應用。紅花中分離出的羥基紅花黃色素A,是其特有的黃酮類化合物,對心血管類疾病具有顯著的治療效果。近年來,隨著紅花高質量參考基因組的公布,利用基因組和生物信息學手段深入挖掘紅花生長發育、亞油酸和黃酮的調控機制、抵抗生物及非生物脅迫基因,將成為紅花功能基因組學研究的一個重要方向。基因家族在植物生長發育調控網絡中起著關鍵作用,對其進行分析具有重要意義。本研究通過對紅花基因家族成員的鑒定以及系統進化分析,結合其在不同組織器官中的表達模式以及在茉莉酸甲酯(methyl jasmonate,簡稱MeJA)和2,4-表油菜素內酯(2,4-epibrassinolide,簡稱EBR)誘導過程中的表達差異分析,以期深入解析該基因家族的作用機制,為紅花功能基因組的研究提供候選基因資源。
從紅花基因組數據庫(http://safflower.scuec.edu.cn)下載紅花基因組、蛋白序列和注釋文件,從PFAM數據庫下載SBP結構域的HMMER文件,從紅花基因組中提取具有SBP結構域的蛋白序列。利用 NCBI CDD在線預測 SBP蛋白結構域,除去無典型結構域、結構不完整和冗余序列。進而利用ProtParam (http://us.expasy.org/tools/protparam.html)進行紅花SPL蛋白理化性質分析,利用SOPMA (https://prabi.ibcp.fr/htm/site/web/home)預測二級結構,用WoLF PSORT (https://wolfpsort.hgc.jp/)分析亞細胞定位。
使用DNAMAN9.0軟件對紅花SBP保守結構域進行多序列比對分析,并將21個紅花CtSPL蛋白序列和下載于TAIR數據庫(https://www.arabidopsis.org/)的擬南芥AtSPL蛋白序列以及下載于PlantTFDB數據庫(http://planttfdb.gao-lab.org/)的毛果楊PtSPL蛋白序列用于系統進化分析。使用MEGA7采用鄰近法構建系統發育樹,Bootstrap設置為10000,其余參數為默認值。使用Evolview (https://www.evolgenius.info/evolview/)在線軟件進行后期美化。
運用MapChart2.32軟件根據紅花基因組注釋文件繪制紅花基因的染色體定位圖。從基因組注釋文件中獲取紅花的基因結構注釋信息,同時通過MEME在線軟件(http://meme-suite.org/tools/meme)分析家族成員的保守序列。最后用TBtools軟件將結果可視化。
利用TBTools軟件,從紅花基因組數據庫中提取紅花基因起始密碼子上游1.5 kb作為啟動子區域,將所有紅花基因的啟動子序列提交到PlantCARE數據庫(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)預測順式作用元件。使用 MCScanX軟件對紅花基因組內的基因以及紅花與擬南芥、向日葵基因組之間的基因進行共線性分析,用Circos 軟件(http://circos.ca)繪制基因組內和基因組間的共線性圖譜。
在PmiREN數據庫(https://www.pmiren.com/)中下載紅花全部的miRNA成熟序列,使用psRNATarget (http://plantgrn.noble.org/)對紅花基因編碼區的miRNA結合位點進行預測,利用Cytoscape軟件將預測結果可視化。
從NCBI數據庫(https://www.ncbi.nlm.nih.gov)分別下載紅花3個組織:種子、葉、花瓣(PRJNA76135)上傳于2011年10月29日以及茉莉酸甲酯處理(PRJNA561476) 上傳于2019年8月22日、表油菜素內酯處理(PRJNA628030)上傳于2020年4月25日的高通量測序原始數據,利用NCBI SRA Toolkit將測序數據sra文件轉換為fastq文件,利用轉錄組定量工具Kallisto計算TPM值,將其作為基因表達量。
根據紅花基因在11條染色體上的位置分布,將其分別命名為~。對21個CtSPL蛋白進行理化性質分析(表1),結果表明CtSPL蛋白序列長度介于147~1 078 aa之間;相對分子量范圍為16.58~118.74 ku;等電點為 6.43~10.74,其中有19個CtSPL蛋白的等電點大于7,為典型的堿性蛋白;亞細胞定位結果顯示,CtSPL蛋白大多定位于細胞核;二級結構預測結果表明,CtSPL蛋白組成結構相似,以無規則卷曲、α螺旋為主要組成部分。
使用DNAMAN軟件對21個CtSPL蛋白的保守結構域進行多序列比對分析,結果見圖1,大部分CtSPL蛋白均具有完整且保守的SBP結構域,該結構域一般具有2個鋅指結構(Zn-1和Zn-2)和1個核定位信號(NLS),N端Zn-1結構除CtSPL20蛋白外其他成員均為 Cys-Cys-Cys-His (C3H)型,CtSPL20蛋白Zn-1結構為Cys-Cys-Cys-Cys (C4)型;C 端Zn-2結構為 Cys-Cys-His-Cys (C2HC)型,CtSPL1、CtSPL8、CtSPL10、CtSPL19、CtSPL21蛋白Zn-2結構有部分缺失或突變;核定位信號與Zn-2結構有4個氨基酸殘基重合,CtSPL1、CtSPL16蛋白核定位信號末端變異。
為了解紅花基因家族各成員的進化關系,選取紅花、擬南芥、毛果楊基因家族各蛋白序列進行聚類分析,如圖2所示,62個SPL蛋白可分為6個亞家族。Ⅰ亞家族包含的SPL成員最多,為21個,其中CtSPL蛋白8個,其次是Ⅳ亞家族共有SPL成員12個,CtSPL蛋白2個,Ⅴ亞家族共有SPL成員9個,CtSPL蛋白3個,Ⅱ亞家族共有SPL成員8個,CtSPL蛋白2個, Ⅲ亞家族共有SPL成員8個,CtSPL蛋白5個,Ⅵ亞家族共有SPL成員4個,CtSPL蛋白1個。

表1 紅花CtSPL基因家族蛋白的理化性質

根據紅花基因組信息,繪制基因在紅花染色體上的位置信息,由圖3可知,21個基因不均勻分布在11條染色體上,其中4號染色體上基因數目最多,為5個;其次是2、9號染色體均有3個;6、7、11號染色體均有2個;而1、5、10、12號染色體只有1個。

TBtools可視化結果顯示,親緣關系較為相近的成員具有相似的保守基序和基因結構(圖4)。基因家族的保守SBP結構域含有2個鋅指結構、1個核定位信號,除CtSPL1、CtSPL8、CtSPL10、CtSPL16、CtSPL21外,其余成員均含有完整的SBP結構域motif1 (Zn-1)、motif2 (Zn-2)、motif3 (NLS)且位置較為固定。紅花SPL蛋白還存在其他基序,如motif4、motif8、motif10僅存在于I亞家族,motif5僅存在于Ⅳ、Ⅴ亞家族,motif9僅存在于Ⅳ亞家族,motif6存在于Ⅰ亞家族的CtSPL2、CtSPL8、CtSPL10、CtSPL13、CtSPL17、CtSPL21,Ⅲ亞家族的CtSPL7以及V亞家族CtSPL11,motif7存在于Ⅱ、Ⅴ亞家族以及Ⅰ亞家族的CtSPL2、CtSPL8、CtSPL12、CtSPL13、CtSPL17、CtSPL21。
基因結構圖顯示,所有基因都至少含有2個外顯子, 外顯子數目分布在2~12個之間,內含子數目分布在1~12個之間。不同亞家族所含的外顯子數量差異較大,同一亞家族的外顯子數量較為穩定。CtSPL4所具有的外顯子、內含子數量最多,均為12個,、、、具有的外顯子、內含子數量最少,具有2個外顯子和1個內含子。


對基因啟動子區段順式作用元件進行預測分析發現,啟動子區順式作用元件主要可分為4個大類:光響應元件、脅迫響應元件、激素應答元件、生長發育響應元件(圖5)。其中光響應元件最多,共有17種,包括G-Box、Box 4、GT1-motif、TCT-motif、I-box等。脅迫響應元件主要有厭氧誘導(ARE)、防御與應激(TC-rich repeats)、干旱誘導(MBS)、低溫響應(LTR)、損傷響應(WUN-motif)等6種。激素應答元件有8種,其中脫落酸響應元件(ABRE)共有75個,除、、、外均有分布,說明大部分基因可能響應了紅花體內的脫落酸信號。其他激素相關的順式作用元件,如茉莉酸甲酯(CGTCA-motif和TGACG-motif)、生長素(TGA-element)、水楊酸(TCA-element)等也廣泛分布。生長發育響應元件有7種,包括分生組織表達調控(CAT-box)、晝夜節律調控(Circadian)、胚乳表達調控(GCN4-motif)等。

為了闡明紅花基因家族的潛在進化機制,筆者所在課題組研究了它的復制事件,但沒有發現串聯重復和大片段復制(圖6-A)。
為了進一步研究紅花基因家族的系統進化機制,筆者所在課題組構建了紅花與向日葵、擬南芥基因組之間基因的共線性圖譜(圖6-B),共鑒定出10個基因與向日葵存在共線性關系:、、、、、、、、、。5個基因與擬南芥存在共線性關系:、、、、。研究結果表明,紅花與擬南芥之間的直系同源基因對遠小于紅花與向日葵之間,這可能與紅花與向日葵親緣關系更近有關,基因在同科植物之間的保守性較高。通過共線性分析可以從已知擬南芥的基因功能,推斷紅花中相應基因的功能。
利用psRNATarget在線軟件對下載的紅花miRNA成熟序列和的cDNA序列進行分析,預測可能調控基因的miRNA, 期望值設置為3.5,其他為默認參數(圖7)。中有15個基因受miRNA調控,參與調控的miRNA主要是miR156家族,其次是miR157家族,而miRN525、miRN560、miRN566分別只調控、、基因的表達。


利用NCBI公開的轉錄組數據,分析基因在不同組織、不同激素誘導下的表達特性。如圖8-A所示,大多數基因均存在組織特異性表達差異。、的表達量在3個組織中均較高,在葉片中的表達量最高。部分基因僅在1個或2個組織中特異表達,如、基因只在葉片中表達;、、基因只在花瓣中表達。總之家族基因具有多樣化組織表達。
經茉莉酸甲酯處理后(圖8-B),基因的表達被誘導,其他還有11個基因的表達量上調,其中、、、表達量的上調最為明顯,分別為對照組的101.71、45.20、19.19、15.25倍。共有9個基因在茉莉酸甲酯處理后表達量下調,其中處理后的表達量僅為對照組的8.85%。
前人收集紅花種子在MS 培養基(對照)和包含1 μmol/L EBR處理的MS 培養基上生長2周后幼苗的葉,用于后續轉錄組測序。如圖8-C所示,表油菜素內酯處理后大部分基因的表達量都呈現上升趨勢,其中4個基因的表達量均上調為對照組5倍以上,分別為、、、。然而,、在表油菜素內酯處理后表達量均下調。
綜上所述,基因的組織特異性表達可能和各個基因在不同組織中發揮的功能有關。、、、、、、等基因可能參與茉莉酸甲酯、表油菜素內酯等激素的調控,從而發揮多種生物學功能。
隨著高通量測序技術的飛速發展, 目前已完成了紅花基因組的全長測序,為紅花的分子生物學研究奠定了基礎。本研究從紅花基因組中鑒定出21個基因家族成員,比棉花(59個)、煙草(32個)、白菜(29個)數目少,比水稻(19個)、高粱(19個)、擬南芥(16個)等數目多,表明基因家族成員在不同的物種中具有一定的數目變異,從而導致了基因功能的多樣化。對CtSPL蛋白結構域進行分析,發現有部分CtSPL在進化過程中發生變異或缺失,導致鋅指結構或核定位信號保守性不高。筆者所在課題組將紅花與向日葵、擬南芥基因組進行基因共線性分析,結果顯示,紅花基因與擬南芥、向日葵基因之間分別存在5、10個共線性基因對,、分別在與向日葵、擬南芥共線性組間均鏈鎖了2個基因對,表明、可能是家族中較為保守的基因,其在進化過程中發揮著重要作用。通過共線性分析可以從已知擬南芥的基因功能,推斷紅花中相鏈鎖的基因的功能。
對家族成員的miRNA靶基因預測結果顯示,其主要受miR156家族的調控。miR156 是植物小RNA家族中表達豐度最大的家族,也是開花植物發育轉變的主要調節因子。在擬南芥中,miR156-SPL10通過介導細胞分裂素反應,控制根分生組織活性和根源新生芽再生。Ding等認為,miR156-可以通過抑制下游相關熱響應基因來適應環境溫度變化。Zhang等發現,茶樹中miR156的2個靶基因、對低溫敏感,可能參與低溫脅迫響應過程。Kouhi等結果表明,miR156的表達量在干旱脅迫的植株葉片中降低,因此推測,紅花幼苗在長期受到輕度干旱脅迫時,miR156-可以使植株繼續存活并提高開花率。熱脅迫導致miR156表達增加,而葉片和根中基因下調,表明miR156可通過加速基因的裂解,從而調節紅花中的應激反應。miR156-不僅參與植物的開花調控,同時具有介導植物生育階段轉變、調節植物次生代謝、參與植物光信號轉導和脅迫響應等作用。本研究發現,共有12個基因可能受到不同的miR156成員調控,這為進一步探索miR156-SPL模塊在紅花中的功能提供了參考。

基因的組織表達模式可能與其功能特征相關,而基因在不同植物組織中表達差異顯著。桃多數成員在幼果中表達量較高;不同龍眼成員在體胚發育不同階段表達量有明顯差異。本研究對基因在紅花不同組織表達特性進行分析發現,成員具有不同的表達特性,同一亞家族表達模式相似。其中Ⅳ亞家族的、的表達量在3個組織中均較高,且在花瓣中最高。Ⅰ亞家族的、基因只在花瓣中表達,而同一亞家族的擬南芥和被證明參與擬南芥開花過程的調控,因此,推測紅花中的這些同源基因,可能參與了紅花花器官調控的相關功能。MeJA在植物脅迫響應、生長發育以及次生代謝中發揮著重要的作用。本研究中,、、、等4個成員的表達量經MeJA處理后均大幅度上調,且在順式作用原件分析中發現,、均含有MeJA的應答元件,進一步說明能夠應答MeJA信號。表油菜素內酯對提高植物的抗逆性:抗旱性、抗冷抗寒性、抗熱性、抗鹽性、抗藥性、抗毒性以及對植物衰老的調節具有重要的作用。本研究發現,EBR處理后部分基因的表達量發生了顯著的變化,說明其能響應油菜素內酯信號途徑,從而參與EBR介導的植物抗逆性的調節等生理功能。