劉嘉欣 陳志陽



摘?要:植物LEAFY(LFY)基因編碼植物特有的一類轉錄因子,在顯花植物營養生長向生殖生長的轉變中起了重要作用。本研究采用同源性檢索、系統進化分析和正選擇作用檢測等方法對植物LEAFY基因進行了系統的進化分析,結果發現植物LEAFY基因最早起源于輪藻,并在陸生植物基因組中穩定遺傳下來;不同陸生植物基因組的LEAFY基因具有相似的基因結構;單子葉植物的LEAFY基因經歷了明顯的正選擇作用,而玉米和油棕中分別具有2個LEAFY基因,且其中的一個經歷了正選擇作用,可能與新功能的形成及功能分化有關。
關鍵詞:植物;LEAFY基因;系統進化;正選擇作用
The origin and evolution of the plant LEAFY gene
Liu Jiaxin?Chen Zhiyang
Jiangsu Key Laboratory of Crop Genetics and Physiology/Key Laboratory of Plant Functional Genomics
of the Ministry of Education/Jiangsu Key Laboratory of Crop Genomics and Molecular Breeding,
Agricultural College of Yangzhou University?JiangsuYangzhou?225009
Abstract:The plant LEAFY(LFY) gene encodes a type of plant-specific transcription factors,which plays an important role in the transformation of vegetative to reproductive growth in flowering plants.In this study,a comprehensive analysis of sequence similarity,phylogenetic analysis and positive selection was performed to investigate the molecular evolution of LEAFY genes in plants.The results revealed that the plant LEAFY genes have first emerged in the streptophyte algae,and then were stably inherited in land plant genomes.Gene structure analysis suggested that plant LEAFY genes shared similar gene structure in different genomes of land plants.In addition,LEAFY genes have undergone positive selection in monocots,whereas only one of both two LEAFY genes in Zea mays and Elaeis guineensis were detected under positive selection,respectively,which might be associated with the formation of novel function and functional divergence.
Key words:Plant;LEAFY gene;Phylogenenetic analysis;Positive selection
植物在由營養生長向生殖生長的轉變過程中,需要多個基因協同調控。其中LEAFY基因在該過程中具有至關重要的作用[1]。LEAFY基因編碼植物特有的一類轉錄因子,在金魚草中克隆的LEAFY基因FLORICAULA具有啟動植物開花過程并調控花生長發育的作用。擬南芥LEAFY基因的突變體具有與金魚草同源基因相似的功能,而過表達該基因則使得植株花期提前,并且側枝均被單一花器官所替代。除了調控花的生長發育之外,LEAFY基因還具有調控煙草頂端分生組織發育、番茄復葉發育和水稻花序分枝等功能[3,4]。
在大部分顯花植物中,LEAFY基因只具有一個拷貝[5],并且每一LEAFY基因通常具有2個內含子,其第二個內含子經常被用來作為被子植物系統發育分析的參考序列。在玉米基因組中,具有2個LEAFY基因,分別是Zfl1和Zfl2,其突變體具有與其他植物相似的調控花器官生長發育的作用,并且在不同的玉米雜種優勢群中,具有明顯人工選擇的信號[6]。本文擬基于在基因組水平上對LEAFY基因的鑒定,通過系統進化樹分析該基因在植物中的進化規律,并通過正選擇作用的分析,闡明其在禾本科植物進化過程中經歷的選擇壓力。
1 材料與方法
1.1 植物LEAFY基因的鑒定
利用擬南芥(AtLFY)和玉米的LEAFY基因(Zfl1和Zfl2)編碼的蛋白質序列作為檢索序列,采用BLASTP檢索Phytozome[9]和NCBI的nr和ref_seq序列數據庫,獲得植物代表性物種基因組中的LEAFY同源基因,并下載相應的編碼區序列和基因組序列。
1.2 植物LEAFY基因序列分析與系統進化樹構建
通過Cluster X[7]對所有代表性物種LEAFY蛋白序列進行比對,將比對結果輸入MEGA[8]軟件中,分別采用極大似然法(ML)法和鄰接法(NJ)構建系統進化樹。極大似然法和鄰接法參數設置都為JTT模型,bootstrap重抽樣100次以獲取每一分枝的支持率。系統進化樹的顯示利用MEGA軟件。
1.3 正選擇作用檢測
利用PAML[9]中的CODEML軟件包對所有單子葉植物LEAFY基因的dN/dS(ω)值進行計算。使用PAL2NAL軟件[10]對代表性物種蛋白質和與之對應的核苷酸序列進行轉換,得到對齊的核苷酸序列,將該序列輸入CODEML程序進行分析。
利用“位點特異性”模型中的M3/M0和M8/M7進行似然比檢驗(LRT)。其中M3/M0模型用來檢測編碼位點之間選擇壓力的差異,而M8/M7模型用來對正選擇作用位點進行估計。在每個似然比檢驗中,對兩對模型的對數似然值差數的2倍(2ΔlnL)進行卡方(χ2)測驗,自由度為模型中參數個數的差值。其中M3/M0模型LRT的自由度為3,M8/M7模型LRT的自由度為2。
利用“分枝-位點”模型檢測正選擇對單子葉植物LEAFY基因在植物的固定中起到的作用。分別設定單子葉植物基因簇中的每個基因為前景枝,剩余為背景枝,進行正選擇作用檢測。通過比較備擇假設和無效假設對9個單子葉植物LEAFY基因受到的選擇壓力進行適應性分析。在似然比測驗為顯著的前提下,進一步利用貝葉斯經驗貝葉斯(BEB)方法計算前景枝中每個位點經歷的正選擇作用后驗概率值。
2 結果與分析
2.1 植物LEAFY基因的鑒定
本研究分別以擬南芥和水稻的LEAFY基因作為檢索序列,在NCBI的nr數據庫中進行了檢索,結果發現LEAFY基因僅存在于植物中,在其他物種中沒有發現同源基因。進一步分析發現在綠藻中也不存在同源基因,但在輪藻Klebsormidium nitens基因組中具有同源基因。除此之外,雖然沒有獲得輪藻Chara vulgaris基因組中的全長基因序列,但在該基因組中也有部分同源序列。而在陸生植物基因組中則普遍具有同源基因。由此表明,LEAFY基因最早起源于輪藻,并傳遞到所有陸生植物中。
為進一步闡明該基因在植物中的起源和進化模式,本研究篩選了陸生植物18個代表性物種對該基因的進化進行分析。LEAFY基因在這些物種的基因組中分布不均衡,其中玉米、油棕、小立碗蘚和江南卷柏中具有2個LEAFY基因,而在其他植物的基因組中只具有1個LEAFY基因。
2.2 植物LEAFY基因的系統進化分析
對18個代表性植物的22個LEAFY基因分別采用極大似然法和鄰接法構建了系統進化樹,兩種方法構建的系統進化樹具有相似的拓撲結構,并且系統進化關系與植物系譜進化關系比較一致。此外,4個物種中具有的LEAFY旁系同源基因均位于進化樹的末端或相對末端,表明這些旁系同源基因是其物種基因組與其他主要系譜分化之后通過復制形成的。進一步分析了不同物種LEAFY基因的外顯子/內含子結構,結果發現除了輪藻Klebsormidium nitens的KnLFY基因之外(6個內含子),植物LEAFY普遍具有2-3個內含子,并且內含子所在的位置是非常保守的。
2.3 單子葉植物LEAFY基因的選擇壓力分析
正選擇檢測的“位點特異性”模型能有效估算一組同源基因的正選擇效應,本研究基于該模型對單子葉植物LEAFY基因進行了正選擇檢測。在該模型下,每個位點的dN/dS(ω)值不同,當ω>1時,認為位點經歷了正選擇作用。首先通過比較M0和M3模型估算每個氨基酸位點的ω值,從而判斷同源基因在進化過程中是否存在不同的選擇壓力。結果發現M0模型下ω估計值為0.0752,表明純化選擇是單子葉植物LEAFY基因進化過程中受到的主要選擇壓力。然而基于M3/M0的似然比測驗發現達到了顯著水平,表明不同氨基酸位點存在選擇壓力的差異。進一步通過M8/M7模型的似然比測驗鑒定受到正選擇作用的氨基酸位點,結果發現該基因在單子葉植物中的進化受到了正選擇作用的影響。在M8模型下進行了貝葉斯后驗概率估計,發現了5個氨基酸位點存在明顯的正選擇作用。
進一步利用“分枝-位點”模型檢測9個單子葉植物LEAFY基因的正選擇作用位點,通過比較備擇假設和無效假設對這些基因受到的選擇壓力進行適應性分析,并通過貝葉斯方法對前景枝每個位點受到的正選擇作用的后驗概率進行估計(表2)。玉米Zfl1和Zfl2的LRT結果為一個顯著一個不顯著,說明正選擇在玉米Zfl1的進化中起了重要作用。其中在玉米Zfl1中檢測到2個平均后驗概率大于50%的正選擇位點143K和274A,油棕中兩個LEAFY基因的LRT結果也為一個顯著一個不顯著,同樣在EgLFY1基因中檢測出了正選擇位點166T和331A。說明在玉米和油棕的進化過程中,Zfl1和EgLFY1經歷了正選擇,進化出了新的功能,而Zfl2和EgLFY2經歷了純化選擇,保留了其原始的功能。其中正選擇位點143K和274A、166T和331A分別對Zfl1和EgLFY1基因功能的固定起到了關鍵作用。其余單子葉植物單拷貝LEAFY基因的LRT結果均未達到顯著。
3 討論
對植物LEAFY基因在主要代表性植物物種中的分布進行分析,發現其同源基因只存在于植物中,并且在綠藻中沒有同源基因,但在輪藻中存在同源基因,由此表明LEAFY基因起源于鏈形植物(包括輪藻和陸生植物)的祖先物種。直系同源基因是指起源于共同祖先但存在于不同物種之間的基因,基因復制則是在同一物種中發生的。在所有已測序的基因組中都存在大量的基因復制現象,通過重復基因之間的功能冗余,可以保持遺傳系統的穩定[11]。本研究對植物LEAFY基因的起源以及進化模式進行分析,發現該基因在大部分代表性植物物種中僅存在單拷貝,在部分物種,如玉米、油棕、江南卷柏和小立碗蘚中存在基因復制現象,但也只存在2個拷貝。
選擇壓力(用ω值表示)作為進化驅動力,對基因功能多樣性的形成起到了關鍵作用,ω<1、ω=1和ω>1分別代表了純化選擇、中性進化和正選擇,其中正選擇是物種適應環境的表現,有利于獲得新的基因和功能,而純化選擇有助于基因保留有利的功能[12,13]。對單子葉植物LEAFY基因的選擇壓力進行分析,發現純化選擇是單子葉植物LEAFY基因在進化過程中受到的主要選擇壓力,但是在不同基因上存在差異。基因重復是遺傳創新的重要來源,新功能化和亞功能化都是基因家族中重復基因的進化模式[14],在遺傳變異過程中可以使作物獲得新的功能從而應對環境的變化。FLO/LFY在植物從營養生長向生殖生長的轉變中起著重要的作用,其玉米中的同源基因Zfl1和Zfl2在生殖發育中的功能很大程度上是非常保守的[15]。本研究發現,玉米的兩個LEAFY基因中,只有Zfl1基因經歷了正選擇作用。正選擇作用往往與新功能的產生或功能分化有關,由此說明玉米的Zfl1和Zfl2基因具有功能分化。這兩個重復基因的功能分化已經通過數量性狀位點(QTL)定位的方法得到了證實,Zfl1主要行使與開花時間相關的功能,而Zfl2主要調控分枝和花序的結構[16]。由此表明,單拷貝基因往往具有保守的功能,而重復基因往往由于正選擇作用等產生功能分化。
參考文獻:
[1]Coen E S,Romero J M,Doyle S,et al.floricaula:a homeotic gene required for flower development in antirrhinum majus[J].Cell 1990,63(6):1311-1322.
[2]張亞萍,習珺珺,于麗霞,等.LEAFY(LFY)基因在花發育網絡調控中的研究進展[J].現代農業科技,2012,9:11-13.
[3]馮延芝,李芳東,王璐,等.LEAFY同源基因系統進化及研究進展[J].中南林業科技大學學報,2016,36(2):25-32.
[4]Van de Peer Y,Mizrachi E,Marchal K.The evolutionary significance of polyploidy[J].Nature Reviews Genetics,2017,18(7):411-424.
[5]Bomblies K,Wang R L,Ambrose B A,et al.Duplicate FLORICAULA/LEAFY homologs zfl1 and zfl2 control inflorescence architecture and flower patterning in maize[J].Development,2003,130(11):2385-2395.
[6]Goodstein D M,Shu S,Howson R,et al.Phytozome:a comparative platform for green plant genomics[J].Nucleic acids research,2012,40(D1):D1178-1186.
[7]Tuimala J.Using ClustalX for multiple sequence alignment[J].Methods Enzymol,2004,226:383-402.
[8]Kumar S,Stecher G,Tamura K.MEGA7:Molecular Evolutionary Genetics Analysis Version 7.0 for Bigger Datasets[J].Molecular biology and evolution,2016,33(7):1870-1874.
[9]Yang Z.PAML:a program package for phylogenetic analysis by maximum likelihood[J].Bioinformatics,1997,13(5):555-556.
[10]Suyama M,Torrents D,Bork P.PAL2NAL:robust conversion of protein sequence alignments into the corresponding codon alignments[J].Nucleic acids research,2006,34(suppl_2):W609-W612.
[11]Lynch M,Conery J S.The evolutionary fate and consequences of duplicate genes[J].Science,2000,290(5494):1151-1155.
[12]Klassen J L.Pathway evolution by horizontal transfer and positive selection is accommodated by relaxed negative selection upon upstream pathway genes in purple bacterial carotenoid biosynthesis[J].Journal of bacteriology,2009,191(24):7500-7508.
[13]Kosiol C,Vinarˇ T,da Fonseca R R,et al.Patterns of positive selection in six mammalian genomes[J].PLoS genetics,2008,4(8):e1000144.
[14]Sandve S R,Rohlfs R V,Hvidsten T R.Subfunctionalization versus neofunctionalization after whole-genome duplication[J].Nature genetics,2018,50(7):908-909.
[15]Hofer J,Turner L,Hellens R,et al.UNIFOLIATA regulates leaf and flower morphogenesis in pea[J].Current Biology,1997,7(8):581-587.
[16]Bomblies K,Doebley J F.Pleiotropic effects of the duplicate maize FLORICAULA/LEAFY genes zfl1 and zfl2 on traits under selection during maize domestication[J].Genetics,2006,172(1):519-531.
作者簡介:劉嘉欣(1995-),女,江蘇常州人,揚州大學農學院碩士碩士,主要從事作物遺傳育種研究。