張宇鑫,李惠,張夢,宋翔,余游,余馬,陳華
(1.西南科技大學生命科學與工程學院,四川 綿陽 621010;2.綿陽市農畜產品質量安全檢驗檢測中心,四川 綿陽 621000)
月季(Rosa chinensis)是世界上最受歡迎的觀賞花之一,具有重要觀賞價值和經濟價值。花瓣的形狀及顏色決定了月季的五彩斑斕,因而花瓣的發育對月季的美觀起著重要作用。Squamosa promoter binding protein like(SPL)基因家族作為植物特有的轉錄因子,其家族成員能夠與SQUAMOSA啟動子結合,被稱為SQUA啟動子結合蛋白[1]。SPL基因編碼一個高度保守的SBP結構域。該結構域約含76個氨基酸殘基,包括Cys-Cys-His-Cys和Cys-Cys-Cys-His兩個串聯鋅指,并在C端具有核定位信號[2]。研究表明,SPL調控植物從營養生長到生殖生長的轉化,調節葉片形態發生,參與環境信號的響應對植物生長發育發揮著重要作用[3]。此外,SPL基因參與調節花器官的形成及其后期發育[4]。
SPL基因最初從金魚草的cDNA文庫中分離出來[5],隨著植物基因組數據的不斷發表,許多物種相繼進行了SPL基因的全基因組鑒定與分析。擬南芥的基因組共鑒定出16個SPL基因[6],隨后SPL家族在番茄、苦蕎、白樺樹、綠藻、苔蘚、玉米、葡萄、蘋果、甜瓜、丹參、蓖麻、棉花、梅花、矮牽牛花、柑橘、小麥、菊花、辣椒等[7-24]中相繼被分離鑒定出來,但目前月季的SPL基因尚未被鑒定。
本研究通過生物信息學的方法對月季RcSPL基因家族進行了全面分析,包括基因結構、染色體位置和共線性分析等,旨在探究RcSPL基因在月季花瓣發育中所行使的功能,為調控月季花瓣發育提供分子基礎。
從已公布的轉錄組數據中挖掘月季轉錄組數據,月季轉錄組材料為花蕾期、開花期、凋謝期的近軸與遠軸端月季花瓣。
1.2.1 月季SPL基因序列的鑒定 月季的基因組序列和注釋文件下載于月季Rosa chinensis‘Old Blush’基因組網站(https://lipm-browsers.toulouse.inra.fr//pub/RchiOBHm-V2/)[25]。擬 南 芥 的16條SPL基 因下載于擬南芥數據庫(https://www.arabidopsis.org)。SPL基因家族的SBP-box結構域(PF03110)下載于Pfam(http://pfam.xfam.org)數據庫。16條擬南芥的SPL基因的蛋白序列被作為query序列進行比對,利用BLASTP(E<10-5)在月季蛋白質數據庫進行比對搜索,并除去重復序列。采用HMMER 3.0軟件的隱馬爾可夫模型(HMM)對SBP結構域[26]再次進行比對搜索,將2次搜索得到的序列取交集,最終確認為月季的RcSPL家族基因數目。
1.2.2 月季SPL基因家族分類及蛋白結構域、順式作用元件分析 利用ClustalX 1.83將鑒定到的月季RcSPL家族蛋白序列和擬南芥SPL家族蛋白序列進行多重序列比對[27],隨后利用MEGA5采用鄰接法(neighbor-joining,NJ)構建系統進化樹[28],Bootstrap method設置為1 000。利用在線軟件GSDS 2.0(http://gsds.cbi.pku.edu.cn)繪制基因結構圖[29]。利用 在 線 軟 件MEME 5.0.2(http://meme-suite.org)[30]對SPL蛋白家族的保守基序進行預測,預測數目設置為10,其他參數為默認值。利用plantcare(http://bioinformatics.psb.ugent.be)網站預測月季RcSPL基因上游2 000 bp的順勢作用元件。
1.2.3 染色體定位以及共線性分析 使用MapChart 2.2軟件繪制月季RcSPL家族在染色體每條染色體的位置[31]。利用MCscanX軟件分析月季RcSPL基因家族在基因組中的共線性以及復制事件[32]。
1.2.4 月季SPL基因的表達分析 根據已發表NCBI的SRA數據庫中月季轉錄組數據(https://www.ncbi.nlm.nih.gov/bioproject)提取出RcSPL基因的相關表達量,利用pheatmap軟件包繪制相關熱圖[33]。
通過blast和hmmer在月季的基因組中共檢索出17個RcSPL基因,分別命名為RcSPL1至RcSPL17(表1)。系統發育樹將擬南芥與月季的RcSPL基因分成8個亞組(圖1),RcSPL6為Ⅰ組,RcSPL7、RcSPL8、RcSPL17為Ⅱ組,RcSPL1為Ⅲ組,RcSPL11、RcSPL14、RcSPL15為Ⅳ組,RcSPL2、RcSPL10為Ⅴ組,RcSPL3、RcSPL12、RcSPL13為Ⅵ組,RcSPL4、RcSPL9、RcSPL16為Ⅶ組,RcSPL5為Ⅷ組,Ⅳ組與Ⅶ組處于同一進化分支,Ⅲ組、Ⅷ組、Ⅴ組處于同一分支且親緣關系更近。RcSPL基因蛋白序列長度為156~1 075 aa,分子量為17.7~118.62 kDa,等電點除RcSPL7均超過7,顯弱堿性。

表1 月季SPL基因的起始位置、終止位置、相對分子質量、蛋白序列長度和等電點

圖1 擬南芥和月季的SPL基因的系統發育樹
多序列比對分析結果表明,RcSPL基因中SBP結構域非常保守(圖2),其包含兩個鋅指結構,Zn-1、Zn-2和一個高度保守的核定位信號。比較RcSPL基因外顯子和內含子數量和位置(圖3),RcSPL基因含有2~10個外顯子,各亞組間成員所含外顯子差異較大,Ⅱ亞組中含有最多的外顯子,其中RcSPL7包含10個外顯子,Ⅵ亞組成員所含外顯子最少,均為2~3個;各亞組內成員間外顯子數目相似。

圖2 月季SPL蛋白序列關鍵部位的多序列比對結果

圖3 月季SPL基因的基因結構
保守基序分析預測到10個保守基序(圖4),將這10個保守基序按順序命名為Motif 1~Motif 10,分析發現所有蛋白序列均含有Motif 1。Ⅱ亞組成員具有最多的保守基序,并且所含種類也最多,Ⅲ、Ⅴ、Ⅵ、Ⅶ亞組成員均只含有Motif 1。

圖4 月季SPL基因的進化關系和motif的預測
預測月季SPL基因上游2 000 bp的順勢作用元件(圖5),定向分析了MYB與MYC的作用位點,發現其上游2 000 bp中含有2~13個MYB與MYC作用位點,除RcSPL2、RcSPL5均含有5個及以上的作用位點。

圖5 月季SPL基因部分順式作用元件分布情況
染色體定位分析表明,RcSPL基因在除6號染色體外的其余6條染色體上均有分布(圖6)。RcSPL的復制事件分析結果表明,該家族在月季中有兩對串聯復制基因,分別為1號染色體的RcSPL1和Rc-SPL2,2號染 色體的RcSPL7和RcSPL8。RcSPL1和RcSPL2分別為Ⅲ亞組和Ⅴ亞組,RcSPL7和RcSPL8均為Ⅱ亞組。共線性分析發現,月季中RcSPL基因有四個共線性塊(圖7)。

圖6 月季SPL基因在染色體上的分布情況

圖7 月季SPL基因的共線性分析
通過NCBI轉錄組數據分析發現月季花蕾期(FB)、開花期(OF)、凋花期(SF)花瓣的近軸(AD)與遠軸(AB)RcSPL基因表達相關,大多數月季SPL基因的表達模式具有相似性,RcSPL3與RcSPL5顯著正相關為0.9,且與其他基因具有相反的表達模式(圖8)。基因表達分析表明月季的RcSPL基因在開花后期表達相對較高,RcSPL3、RcSPL5、RcSPL16在花蕾期表達相對較高,RcSPL1、RcSPL13、RcSPL9、RcSPL12在花凋謝時期表達相對較高,RcSPL2、Rc-SPL14、RcSPL4、RcSPL15在開花期和花蕾期表達相對較 高,RcSPL10、RcSPL11、RcSPL17、RcSPL6、Rc-SPL7、RcSPL8在花蕾期表達相對較高(圖9)。

圖8 月季SPL基因表達模式的相關性

圖9 月季花瓣近軸與遠軸RcSPL基因花蕾期、開花期、凋謝期的表達量
SPL基因在植株的生長發育過程行使著重要的功能,研究在月季的基因組中共發掘出17個RcSPL成員,系統發育樹分析將其分成8個亞組,每個亞組具有較為相似的基因結構且外顯子數目基本相同,這與前人研究結果相符[34,35]。通過RcSPL蛋白序列的保守基序分析發現,每條RcSPL均具有Motif 1。此外,Ⅱ亞組具有最多的保守基序,最多的外顯子,具有較高水平的表達,推測其在月季花開過程行使重要的功能。
RcSPL基因上游2 000 bp的順式作用元件分析發現,該段區域具有2~13個MYB與MYC轉錄因子的作用位點,MYB是一種調控花色的轉錄因子,MYB與MYC在花青素的合成中起著重要的作用。有研究表明SPL基因與花青素的含量和花香有關[36],因此推測SPL基因很可能與MYB和MYC相互作用調控月季花青素的含量,共同調控花的生長發育。
分析基因表達模式的相關性發現,大多數月季RcSPL基因的表達模式具有相似性,RcSPL3、RcSPL5的表達模式與其他基因相反,推測這兩個基因可能發揮與其他RcSPL基因相反的功能。轉錄因子通常在控制組織特異性基因的表達中起著關鍵性作用[37]。根據RcSPL家族表達量的分析,發現RcSPL成員間表達差異明顯。研究表明,擬南芥SPL8能夠影響花粉的發育[38],GbSBP6基因在銀杏胚珠中顯著表達且與擬南芥SPL8位于同一亞組,可能參與了銀杏的花發育[39],RcSPL1也位于該亞組,推測RcSPL1可能參與月季花粉形成的調控。前人研究表明擬南芥SPL3、SPL4、SPL5編碼的轉錄因子能夠調控開花時間和成花轉變,該亞組的多數SPL成員與植物生殖器官的生長發育有關,野生葡萄的VvSBP11參與了 成 花 轉 變 過 程[40]。RcSPL3與 擬 南 芥 的SPL3、SPL4、SPL5處于同一亞組且在花蕾期有相對的高表達,因此推測RcSPL3可能參與月季開花時間的調控。