魏娜,李艷鵬,馬藝桐,劉文獻
(蘭州大學草地農業生態系統國家重點實驗室,蘭州大學農業農村部草牧業創新重點實驗室,蘭州大學草地農業教育部工程研究中心,蘭州大學草地農業科技學院,甘肅 蘭州 730020)
轉錄因子是一類具有特殊結構、行使調控功能的蛋白質分子,能夠通過激活或抑制基因轉錄從而在植物發育和對外部環境的響應中起重要作用[1]。TCP轉錄因子家族的命名最初是在1999年根據4種已知蛋白而來[2]:玉米(Zea mays)的teosinte branched1(TB1),參 與 頂 端 優 勢調控[3];金魚草(Antirrhinum majus)的環花 青 素(cycloidea,CYC),可控制花不對稱性[4];水稻(Oryza sativa)的增殖細胞因子(PCF1和PCF2),參與調控分生組織特異性表達[5]。該家族蛋白質序列包含由約59個氨基酸殘基組成的非典型bHLH(basic-helix-loop-helix)保守域,是植物特有的一類調控生長發育和逆境脅迫的重要轉錄因子。根據TCP保守域的序列和系統發育關系,TCP基因家族成員可以分為兩個大分支:TCP-P(由PCF亞家族組成)和TCP-C(由CIN和CYC/TB1亞家族組成)[6—7];這兩個分支之間,結構上最大的區別是TCP-C比TCP-P在結構域上多4個氨基酸。迄今為止,TCP基因已經在多種植物物種中被鑒定。例如,在擬南芥(Arabidopsisthaliana)基因組中發現了24個TCP成員[8],在柳枝稷(Panicum virgatum)基因組鑒定有42個TCP成員[9],番茄(Solanum lycopersicum)基因組中有21個TCP成員[10]。
TCP蛋白在植物生長、發育以及對生物、非生物脅迫的響應中具有重要的調控作用[7]。TCP-P分支與激素信號轉導途徑中關鍵蛋白的互作,參與調節赤霉素、細胞分裂素、脫落酸、茉莉酸、生長素等激素信號;TCP-C分支調控植物細胞增殖、休眠、衰老以及與外側器官的發育有關[4,9]。在擬南芥中,AtTCP14和AtTCP15在調節節間長度、葉片形狀、種子發芽等方面具有一定功能[11]。AtTCP9、AtTCP19及AtTCP20能夠通過調控茉莉酸傳導信號途徑調節葉片衰老[12]。另外,TCP家族在響應干旱脅迫過程中也具有重要生物學功能,例如,水稻OsTCP19基因在干旱和脫水條件下上調表達[13],并通過干擾生長素和茉莉酸途徑以及操縱ABA信號傳導網絡,最終減少細胞死亡和水分流失[14]。水曲柳(Fraxinus mandshurica)FmTCP4基因參與非生物脅迫和植物激素ABA的響應,進而調控植物正常生長發育,并能作為干旱脅迫響應的節點而發揮作用[15]。木薯(Manihot esculenta)MeTCP4基因在響應抗旱脅迫過程中也發揮重要生物學功能[16]。
紫花苜蓿(Medicago sativa)是種植最廣泛的豆科牧草,也是世界上最具經濟價值的作物之一[17]。在中國,苜蓿種植區分布在北部地區的14個省,缺水和干旱是影響苜蓿生長并限制其在整個地區的生產力和生存的主要因素。因此,解析紫花苜蓿響應干旱脅迫的分子機制,進而培育較高抗旱性的苜蓿種質對中國北方畜牧業的發展具有重要意義。在紫花苜蓿響應干旱脅迫過程中,轉錄因子發揮著重要的調控作用。目前,在全基因組水平對紫花苜蓿WRKY、ERF、NAC等轉錄因子基因家族已進行了較為系統的鑒定及功能分析[18—20],但紫花苜蓿MsTCP基因家族尚未被鑒定,其響應干旱脅迫的功能仍不清楚。本研究利用生物信息學方法在全基因組水平對該紫花苜蓿TCP基因家族進行了鑒定,并對其系統進化、基因結構以及響應干旱脅迫的表達模式進行了系統分析。該研究結果可為后期深入解析紫花苜蓿響應干旱脅迫理論以及通過基因工程技術創制高抗旱紫花苜蓿新種質奠定基礎。
為了鑒定紫花苜蓿TCP基因家族,在植物全基因組數據庫phytozome v12.1(https://phytozome.jgi.doe.gov/pz/portal.html)中通過搜索PF03634編號,下載模式植物擬南芥和水稻的TCP蛋白序列。本實驗所用的紫花苜蓿基因組數據、蛋白核酸序列下載于紫花苜蓿基因組網站(https://figshare.com/projects/whole_genome_sequencing_and_assembly_of_Medicago_sativa/66380)[21],并用于紫花苜蓿本地數據庫構建。以AtTCP家族和OsTCP家族的基因序列為參考序列,通過TBLASTn比對篩選紫花苜蓿同源序列,e-value值設置為0.00001。使用Expasy[22]在線數據庫(https://web.expasy.org/decrease_redundancy)對獲得的MsTCP蛋白序列進行去冗余,所有參數均為默認值。為了驗證去除冗余后MsTCP蛋白的準確性,對MsTCP蛋白序列在Pfam網站(http://pfam.xfam.org/search#tabview=tab1)和NCBI-CD Search(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)進行TCP結構域的進一步鑒定[23]。利用在線網絡ProtParam(https://web.expasy.org/protparam/)工具對MsTCP蛋白分子量(molecular weight,Mw),理論等電點(isoelectric point,pI)等理化性質進行分析。根據基因所對應的染色體上的位置信息,依次對預測的基因命名為MsTCP1~MsTCP40[9]。為了分析MsTCP蛋白之間的進化關系,利用MEGA 7.0[24]軟件對MsTCP,AtTCP,OsTCP蛋白序列進行系統進化分析,并基于NJ(neighbor-joining)法構建系統進化樹,bootstrapping重復算法設置為1000,其他參數默認。
利用Clustal W[25]對預測出的MsTCP家族蛋白序列進行多序列比對,比對過程參數設置為默認值;比對結果導入BioEdit軟件[26]進行著色處理。使用在線工具MEME Suit 5.3.3(https://meme-suite.org/meme/tools/meme)對MsTCP蛋白保守基序進行鑒定,基序數目設置為10[27]。
利用TBtools[28]從紫花苜蓿基因組文件獲得所有MsTCP基因所對應的CDS序列和基因序列,利用GSDS 2.0(gene structure display server)(http://gsds.gao-lab.org/)在線網址對MsTCP基因內含子和外顯子結構進行預測分析。通過紫花苜蓿基因組GFF3數據,獲得MsTCP基因在染色體上所對應的位置[21],利用MCScanX[29]和TBtools[28]完成基因在染色體上的定位及基因復制共線性分析內容。
為了研究MsTCP基因在干旱脅迫下的表達水平,參照紫花苜蓿轉錄組測序結果(SRR7160313)[30],將MsTCP基因與干旱轉錄組數據進行了BLASTn比對,獲得的數據使用TBtools軟件[28]進行聚類分析和表達量熱圖繪制,數據處理以log2 FPKM的計算結果來表示表達量的高低[31]。
紫花苜蓿種子用砂紙打磨種皮后擺入培養皿中,于4℃冰箱黑暗條件下春化3 d后移入20℃組培間進行萌發。萌發的種子待兩片子葉都展開時移入裝有(1/2 MS,p H=5.8)營養液的塑料培養盒中進行水培生長,并定期對營養液進行更換。28 d后將長大的紫花苜蓿幼苗轉入1/2 MS營養液(含有濃度為15%的PEG-6000)中進行干旱脅迫處理,設置處理時間點為0、3、6和12 h。為了避免晝夜節律對植物生長和植物基因表達的影響,在12 h后統一采樣,樣品經液氮冷凍處理后存放于—80℃冰箱備用。
使用UNIQ-10色譜柱Trizol裂解法對不同處理時間下的紫花苜蓿根和葉組織進行總RNA提取,利用cDNA合成試劑盒(FastKing gDNA Dispelling RT SuperMix,tiangen biotech)進行反轉錄,去除基因組后獲得第一鏈cDNA,用NanoDrop 2000紫外分光光度計(ND-8000,西安)檢測cDNA的濃度后統一稀釋為100 ng·μL—1用于qRT—PCR反應模板。qRT—PCR分析的基因特異性引物用NCBI Primer-BLAST設計(表1)。使用7500快速實時PCR系統(applied biosystems,美國)對qRT—PCR分析,3次技術重復。qRT—PCR反應體系包括5μL 2 SG Fast qPCR Master Mix(B639271-0005,上海),0.5μL正向和反向引物,1μL DNF Buffer,1μL稀釋的cDNA溶液和2μL dd H2O。qRT—PCR的反應體系如下:反應變性(95℃持續30 s);95℃持續5 s;60℃持續30 s下40個循環。Ms-Actin(AES78237.1)作為內參基因用于ΔCt方法計算相對倍數差異,基因表達水平使用FC=2—ΔΔCt[20]方法計算。

表1 引物信息及序列Table 1 The information of the primer and sequences used in this study
實時熒光定量數據通過Excel 2003進行整理,借助R語言進行繪圖,利用SPSS 11.0軟件進行顯著性分析。
為了在全基因組水平系統鑒定MsTCP基因家族成員,通過使用該家族的隱馬爾可夫模型(PF03634)從Phytozome v12.1數據庫下載了十字花科模式植物擬南芥和禾本科模式植物水稻的TCP基因家族的蛋白序列。通過本地blast(BLASTn)同源序列比對的方法,在紫花苜蓿本地數據庫中共篩選出50條潛在的MsTCP蛋白序列,去冗余后共保留了具有TCP結構域的40條MsTCP蛋白序列(圖1)。

圖1 MsTCP基因結構域鑒定Fig.1 MsTCP gene domain identification
選擇水稻、擬南芥的TCP蛋白與本研究中鑒定到的紫花苜蓿MsTCP蛋白共同構建系統進化樹,進一步研究紫花苜蓿MsTCP基因家族的進化關系。TCP基因家族明顯被分為兩個大的分支和3個亞家族,其中PCF亞家族包含了13個擬南芥基因、10個水稻基因和22個紫花苜蓿基因。CIN亞家族包含了8個擬南芥基因、8個水稻基因和14個紫花苜蓿基因。CYC/TB1亞家族包含了3個擬南芥基因、3個水稻基因和4個紫花苜蓿基因(圖2)。

圖2 基于紫花苜蓿、擬南芥和水稻TCP氨基酸序列構建系統進化樹Fig.2 Construction of phylogenetic tree based on TCP amino acid sequences of alfalfa,Arabidopsis and rice
按照基因在染色體上相應的分布位置對40個MsTCP基因依次按照從小到大的順序進行命名。根據序列信息進行理化性質分析,基因名稱、基因ID號、氨基酸數目、分子量、等電點和亞組分類等特征見表2。結果表明,這些基因所具有的氨基酸數目、分子量和等電點之間存在較大的差異,MsTCP12含有520個氨基酸,是該家族中編碼氨基酸數目最多的基因,分子量為55104.71 Da。MsTCP25是該家族中編碼氨基酸數目最少的基因,編碼107個氨基酸,分子量為11418.15 Da。其次為MsTCP19和MsTCP21,編碼119個氨基酸,對應的分子量分別為12818.73 Da和12797.68 Da。MsTCP家族的理論等電點在4.84(MsTCP3)~11.55(MsTCP2)之間不等。40個MsTCP蛋白的親水性變化范圍為—1.135(MsTCP31)~—0.351(MsTCP3)。對該家族的基因進行亞細胞定位預測,除了MsTCP29和MsTCP35定位在細胞質,其余38個MsTCP基因均為細胞核定位的基因。

表2 紫花苜蓿TCP家族成員基本信息Table 2 Basic information of TCP family members in alfalfa
根據序列比對結果可以看出(圖3),所有的MsTCP蛋白都包含了一個保守的基本螺旋—環螺旋(bHLH)結構域。40個MsTCP蛋白序列根據TCP結構域內部差異被區分為兩個分支,含55個氨基酸的為TCP-P分支,總共有22個MsTCP基因;59個氨基酸組成的為TCP-C分支,包含18個MsTCP基因,和系統進化發育分類結果一致。對40個紫花苜蓿TCP基因編碼氨基酸進行序列保守性分析發現(圖4),CIN亞家族的MsTCP基因編碼的氨基酸共有的Motif數量和種類最多,CYC/TB1亞家族最少。同時,Motif 3,Motif 6,Motif 9,Motif 10只存在于CIN亞家族中,而Motif 4只存在于TCP-C分支。相對于TCP-C分支,TCP-P分支中的MsTCP基因所包含的Motif數目和種類則相對保守。另外,所有的MsTCP基因都包含Motif 1基序,說明Motif 1是TCP家族中的重要結構,MsTCP基因家族內3個亞家族之間也具有一定保守性。

圖3 紫花苜蓿40個MsTCPs保守TCP結構域氨基酸序列比對Fig.3 Amino acid sequence alignment results of 40 conserved TCP domains of MsTCPs in alfalfa

圖4 MsTCPs保守Motif的分布及特征分析Fig.4 The distribution and characteristics of conserved Motifs in MsTCPs
為了進一步確定MsTCP基因間的結構差異,對MsTCP家族進行了基因結構分析。如圖5顯示,31個MsTCP基因不含內含子,9個基因(MsTCP1,MsTCP16,MsTCP24,MsTCP26,MsTCP31,MsTCP34,MsTCP37,MsTCP39,MsTCP35)含1~2個內含子。其中,TCP-C分支所有的基因都含有一個內含子,只有MsTCP29和MsTCP27兩個基因包含UTR(untranslated region)結構。為進一步研究紫花苜蓿MsTCP基因之間是否存在旁系同源基因對關系,本研究對所有鑒定到的MsTCP基因染色體位置進行了鑒定并作圖(圖6)。結果顯示,40個MsTCP基因不均勻的分布在20條染色體上。染色體6.3上定位4個基因,其中MsTCP25和MsTCP26形成基因簇,MsTCP27和MsTCP28單獨分布,染色體2.4、6.2、8.1和8.2上各定位到3個基因,染色體6.1上定位的基因都形成基因簇,染色體6.2上的3個基因中有一個基因單獨分布,其余兩個形成基因簇。此外,為了鑒定MsTCP基因家族內是否存在基因復制現象[32],通過MCScanX共線性分析一共鑒定出17對發生基因復制事件的基因對,即圖6中紅色標注的基因對。其中,MsTCP3和MsTCP6、MsTCP5和MsTCP7、MsTCP9和MsTCP11、MsTCP28和MsTCP34、MsTCP33和MsTCP35發生的是兩兩基因片段復制,MsTCP20、MsTCP23、MsTCP26和MsTCP29;MsTCP32、MsTCP36、MsTCP38和MsTCP40發生的是4個基因之間的基因片段復制。

圖5 MsTCP基因家族成員結構Fig.5 The gene structure of MsTCP gene family members

圖6 MsTCP基因染色體定位及共線性分析Fig.6 The analysis of the chromosome location and collinearity of MsTCP genes
為了鑒定干旱脅迫下40個MsTCP基因的表達模式,利用干旱轉錄組數據對40個MsTCP基因進行了BLASTN比對,獲得不同基因的表達量。選擇ABA和甘露醇處理0、3、6和12 h數據,以0 h處理為對照進行熱圖展示(圖7)。其中,6個基因(MsTCP38,MsTCP33,MsTCP27,MsTCP26,MsTCP23,MsTCP35)在ABA處理下都被誘導上調表達,MsTCP29在ABA和甘露醇處理下都具有上調表達趨勢,推測這些基因可能在紫花苜蓿響應干旱脅迫過程中發揮重要功能。

圖7 MsTCP基因在ABA和甘露醇處理下的表達模式Fig.7 The expression patterns of MsTCP genes under ABA and mannitol treatment
根據上一步分析結果,為了進一步確認MsTCP基因在干旱脅迫下的表達模式,選取4個MsTCP進行qRT—PCR實驗驗證。在葉片組織中(圖8A),MsTCP27基因3 h時表達量開始上調,MsTCP23、MsTCP29、MsTCP33處理6 h表達量開始上調,MsTCP27在6 h的表達量與0 h比較上調達150倍。在根組織中(圖8B),MsTCP33基因在處理3 h時表達量開始上調,MsTCP23、MsTCP27、MsTCP29處理6 h表達量開始上調并且3個基因之間表達趨勢比較一致。比較分析發現,qRT—PCR試驗結果與熱圖分析結果一致,進一步確定了這些基因響應干旱脅迫的表達模式。

圖8 MsTCP基因響應干旱脅迫的表達模式Fig.8 Expression patterns of MsTCP genes in response to drought stressA:葉片;B:根。數據是三個重復的平均值,不同小寫字母表示0.05水平存在顯著性差異。A:Leaf;B:Root.The data is the average of three repetitions,the differernt lowercase letters indicate significant differences at the 0.05 level.
TCP基因家族是一類植物特有的轉錄因子,在植物生長、發育和脅迫響應中起著關鍵作用。紫花苜蓿作為世界上最重要的豆科牧草之一,干旱和缺水已經成為影響其產量和地理分布的關鍵瓶頸。近年來,隨著植物物種的基因組被大量測序,TCP基因家族全基因組水平下鑒定工作在許多植物物種中都相繼展開,其中包括禾本科[33]、豆科[34]、十字花科[35]。關于TCP基因家族和植物非生物脅迫之間的關系已有相關報道:TCP轉錄因子在植物發育過程中與MYB,SAP11等多種參與植物激素信號轉導途徑的蛋白相互作用[36],暗示著TCP轉錄因子可能在植物抵抗生物和非生物脅迫等方面發揮著重要作用。
本研究利用紫花苜蓿全基因組數據完成了MsTCP基因家族的鑒定和分析工作。對鑒定出的40個MsTCP蛋白進行親水性分析,結果表明(表2)該家族蛋白都具有良好的親水性,推測與環狀區域主要包含親水氨基酸(甘氨酸)有關[37]。亞細胞預測結果表明,該家族基因定位大多數都位于細胞核,與芥菜(Brassica juncea)[35]、蒺藜苜蓿(Medicago truncatula)[12]以及其他物種中報道的亞細胞定位結果一致,推測TCP基因可能在細胞核中發揮調控基因表達的功能[38]。通過與水稻和擬南芥TCP家族基因的系統進化分析,40個MsTCP基因可以分為3個亞組,其中PCF亞組包含MsTCP基因數目最多,CYC/TB1亞組包含MsTCP基因數目最少(圖2),該結果與水稻、擬南芥[8]TCP基因家族系統進化結果相類似。在多序列比對結果中(圖3),可以看出MsTCP被分為兩個大的分支,它們都具有螺旋—環螺旋(bHLH)保守域,不同的是TCP-P分支的TCP結構域存在4個氨基酸的缺失。根據大豆(Glycine max)基因家族分析報道,這兩個分支中的基因分別在植物生長的不同時期發揮不同的功能:位于TCP-C分支的GmTCP基因主要分布在分生組織,與植物體的分裂密切相關,TCP-P分支的GmTCP基因大部分分布在根、莖、葉等營養器官中,少數分布在分生組織中[34]。此外,之前也有相關報道:AtTCP4是CIN亞組的成員,AtTCP4可以激活次級細胞壁生物合成和程序性細胞死亡,對擬南芥花器官至關重要[39];PCF1和PCF2參與DNA復制和修復,通過結合水稻啟動子來維持染色質結構,染色體分離和細胞周期進程[3];TB1是調節玉米頂端優勢的主要因素[3]。Motif分析結果(圖4)表明3個亞家族之間所含的Motif種類數量之間存在明顯差異,猜測這可能是決定3個亞族之間功能差異的主要原因[40]。MsTCP基因大多不含有內含子,少數基因含有1~2個內含子(圖5),這與在構樹(Broussonetia papyrifera)[41]、葡萄(Vitis vinifera)[42]中的報道一致,說明TCP家族的基因結構相對簡單。基因復制被認為是一種在進化過程中擴展并獲得功能多樣性的重要手段[43],MsTCP基因家族中的基因重復分析顯示片段重復對TCP基因的影響更大,這一結果與在水稻和擬南芥中觀察到的結果一致[8],表明TCP家族在植物基因組中的復制事件可能是一種普遍的進化機制。
通過之前的研究,了解到TCP基因家族在多種植物響應干旱脅迫中具有重要調控功能,可作為優異基因資源用于分子抗旱育種[13—16]。因此,為了挖掘紫花苜蓿中具有響應及調控干旱脅迫相關功能的MsTCP基因,本研究在生物信息學分析技術的基礎之上與轉錄組數據相結合,將已經鑒定出的MsTCP基因通過與已知的轉錄組數據進行比對,初步選出在ABA和甘露醇處理下表達量上調的基因(圖7),將其作為響應干旱脅迫的TCP候選基因。隨后對紫花苜蓿幼苗進行15%PEG-6000處理來模擬干旱,然后通過qRT—PCR對其表達模式進行實驗驗證。結果表明MsTCP23、MsTCP29、MsTCP33和MsTCP27的表達量都呈現上調趨勢(圖8)。葉組織中,MsTCP23基因在干旱脅迫12 h后表達量上升,其余基因則在干旱脅迫6 h左右表達量就已經上升。根組織中除MsTCP33基因在3 h脅迫時表達量上升外,其余基因的表達模式都比較相似,在6 h時表達量達到最高。在水稻中也有TCP家族類似的報道:OsTCP19基因在鹽和干旱脅迫下顯著上調[14],將OsTCP19基因在擬南芥中過表達后,顯著提高了轉基因擬南芥植物在非生物脅迫下的耐受性[3],進一步證實了TCP基因家族在響應干旱脅迫中具有重要作用。后續本研究也將對篩選出的MsTCP基因進行擬南芥的遺傳轉化和紫花苜蓿遺傳轉化,進一步確定這些基因的生物學功能。因此,基于本研究結果,在全基因組水平下研究紫花苜蓿TCP基因家族可為挖掘紫花苜蓿抗旱優異基因,進而為深入解析紫花苜蓿響應干旱脅迫理論以及通過基因工程技術創制高抗旱紫花苜蓿新種質奠定基礎。
在全基因組水平對紫花苜蓿TCP基因家族進行了鑒定,并對該家族內基因的基本理化性質進行了描述以及亞細胞定位進行了預測,研究了該家族基因之間的系統發育關系、基因結構、染色體定位、基因內部旁系同源基因以及響應干旱脅迫的表達模式進行了系統分析。共鑒定出40個MsTCP基因,這些基因在系統發育上分為兩個分支3個亞家族,共包含了17對旁系同源基因對以及對它們之間發生的片段復制事件進行了分析。在此基礎上與紫花苜蓿轉錄組數據比對篩選出具有一定潛在抗旱功能的基因作為候選基因,通過qRT—PCR對候選基因的表達模式進行分析,確定了MsTCP23、MsTCP27、MsTCP29、MsTCP33對于干旱脅迫具有一定的響應作用。后期本研究將對這4個基因展開擬南芥和紫花苜蓿的遺傳轉化進行功能驗證和抗旱評價分析,研究結果可為后期深入解析紫花苜蓿響應干旱脅迫理論以及通過基因工程技術創制高抗旱紫花苜蓿新種質奠定基礎。