劉江娜,張西英,李榮霞,張小偉,白云鳳,張愛萍
(新疆生產建設兵團第六師農業科學研究所,新疆五家渠 831300)
番茄紅素(Lycopene)含量與番茄果色相關,也是衡量番茄營養品質的重要指標。番茄紅素是一種功能性天然色素,在各種類胡蘿卜素中抗氧化能力最強,能助于人體細胞免受氧自由基的傷害,保護生物膜,對于提高人體免疫力和延遲機體細胞衰老及預防癌癥具有重要作用[1]。人體不能自主合成番茄紅素,只能通過膳食攝取。番茄(Solanum lycopersicum)則是人們通過日常飲食補充番茄紅素的重要來源。
滯綠蛋白STAY-GREEN(SGR)最初是在草甸羊茅(Festuca pratensisi)中發現的[2],隨后也在多種植物中被發現,該蛋白位于葉綠體中,主要參與調控葉綠素的降解代謝[3]。1999年有學者發現成熟過程中仍保留葉綠素的gf突變體番茄,該突變體葉片完全滯綠,果實在成熟過程中由于仍含有相當數量的葉綠素,導致果實出現褐色或鐵銹色的表型[4]。直至2008年番茄中的SGR1基因首次由康奈爾大學從gf突變體中克隆出來,并且將其命名為SlSGR1[5]。目前關于番茄滯綠基因SGR1的研宄主要集中在葉片及葉綠素降解途徑中,有研究表明SGR1通過影響葉綠素合成途徑中關鍵基因PAO酶的活性來發揮其作用[6]。Sakuraba等[7]發現SGR1在葉綠素降解過程中具有招募作用,可能招募葉綠素分解代謝酶,同時與捕光復合體結合形成SGR-CCEs-LHCII復合體,從而調節葉綠素的降解;在非生物脅迫下,過表達SGRL的呢喃屆出現早期葉片變黃,SGRL-1突變體在鹽脅迫下出現滯綠表型[8];然而針對滯綠突變體在番茄果實色素積累方面的研究較少,有研究發現八氫番茄紅素是合成番茄紅素的前體,其合成量直接影響番茄紅素的形成[5]。八氫番茄紅素合成酶(phytoene synthase,PSY)催化兩個GGPP(geranylgeranyl pyrophosphate,牻牛兒基牻牛兒基焦磷酸)分子聚合生成八氫番茄紅素,是番茄紅素合成途徑中第一個也是最為關鍵的限速酶。番茄中過表達SlPSY1基因,可顯著提高果實中番茄紅素含量[9]。番茄SlSGR1蛋白能與八氫番茄紅素合成酶SlPSY1互作,抑制SlPSY1在番茄果實成熟期的活性,RNAi沉默SlSGR1基因,可提高SlPSY1的活性,增加番茄果實的番茄紅素含量[10-12]。
近年來以多種新型高效的DNA靶向內切酶為基礎建立的基因編輯技術[13],可以對植物靶基因進行定點突變或替換,不必再通過外來轉基因調控靶基因功能[14]。在各種基因編輯技術中,CRISPR/Cas9技術操作較為簡單、效率高,應用更為廣泛,它通過特異性RNA(Guide RNA,gRNA)與靶基因堿基互補配對,將Cas9核酸酶引導至靶基因特定位點,將DNA雙鏈切斷。斷裂后的DNA修復主要有兩種機制,一是非同源末端連接(Nonhomologous end joining,NHEJ),在連接過程中會在斷裂位置產生少量核苷酸的插入或刪除,造成移碼,使基因功能失活;二是同源重組(Homologous recombination,HR),會產生精確的定點替換或者插入突變[15]。利用CRISPR/Cas9技術已對番茄的多個基因,如轉錄因子RIN、RNA編輯因子SlORRM4[16]及生長相關的DELLA基因[17]進行了編輯,也為提高番茄紅素含量提供了新思路[18]。
本文分析番茄SISGR1的特征,設計和篩選該基因編碼區及其上游啟動子區的sg RNAs,以期為利用CRISPR/Cas9技術調控SISGR1表達及提高番茄果實中的番茄紅素含量提供參考。
利用NCBI搜索番茄SlSGR1蛋白質序列及其保守結構域,BlastP比較SGR1家族的多態性。
利用NCBI核酸數據庫查詢獲得SlSGR1的cDNA,以此作query,搜索番茄基因組數據庫得到相應的gDNA序列和所在染色體信息,序列比對確定SlSGR1的基因組結構以及外顯子所在染色體位置。
以番茄功能基因組數據庫網站(http://ted.bti.cornell.edu/cgi-bin/)中RNA-seq data的數據作基礎,建立SlSGR1基于RNA-seq的數字表達譜。
根據CRISPR-Cas9靶點設計原則,利用CRISPRdirect(https://crispr.dbcls.jp/)[19]篩選SlSGR1及其啟動子區域的sg RNA序列,即3′端有PAM元件的20個連續的堿基序列,PAM元件設定為NGG,sgRNA的結構為5′-(N)20NGG-3′,N為任意核苷酸。
根據SlSGR1gDNA所在染色體信息,獲取SlSGR1基因上游1 500 bp的啟動子序列。利用PlantCare服務器(http://bioinformatics.psb.ugent/webtools/plantcare/html/search_CARE.html)[20]對SlSGR1啟動子序列進行順式作用元件分析。
從GenBank搜 索 到番茄SlSGR1的蛋白質序列(Gen Bank Accession:AAY98500.1),該蛋白由272個氨基酸組成,平均分子質量30 532.49 u,摩爾消光系數40 540 m L/(mg·cm),理論等電點pI為8.65,GRAVY(疏水性算術平均值)為-0.34,屬于親水蛋白,沒有跨膜結構域、信號肽和核定位序列。該蛋白的48~200 aa具備典型的staygreen superfamily保守結構域。序列比對表明,不同物種氨基酸序列多態性主要發生在staygreen結構域的下游(圖1)。

圖1 番茄SlSGR1的保守結構域及與其他物種序列比對Fig.1 Conserved domain and multiple alighnment analysis of SlSGR1 in tomato
以SlSGR1序 列(GenBank Accession:AAY98500.1)作querry在番茄的基因組數據庫進行Blast,結果表明SlSGR1位于番茄的第8號染色體(CP023764.1),起始密碼子至終止密碼子的位置在63 418 923~63 416 720 nt,長2 204 nt,由4個外顯子、3個內含子組成,外顯子總長819 nt,內含子總長1 385 nt,外顯子的長度在117~360 nt,內含子的長度變化較大,在100~1 118 nt(圖2)。
以番茄功能基因組RNA-seq數據庫為基礎,分析SlSGR1基因(ID TC119167)在番茄不同組織以及不同生長時期的的表達譜(圖3)。結果顯示,SlSGR1基因在成熟的紅果中大量表達,在破色期的果實和開放的花中有少量表達,而在種子、胚根、頂端分生組織、不同時期的幼苗、根系、葉片、花蕾、綠果中均無表達,驗證SlSGR1基因是與果實中番茄紅素合成和代謝相關的基因。

圖3 基于RNA-seq的SlSGR1數字表達譜Fig.3 Digital expression profile of SlSGR1 based on RNA-sequence
設定PAM為NGG,CRISPRdirect在線分析表明SlSGR1序列分布76條sgRNA(圖4),其中正鏈分布46條,負鏈分布30條,其中12條橫跨兩個外顯子鄰接處,不適合進行編輯,另有16條含有TTTTs序列,使用pol III啟動子時應盡量避免選用。在其余的58條sg RNA中,有1條其鄰近PAM 12 nt的種子序列在番茄全基因組上是唯一序列,特異性最好,位于681~703 nt,另有5條sgRNA的鄰近PAM 12 nt的種子序列除了靶位點外,在基因組的其他位置只有1條與其完全匹配的序列,可作為候選序列。

圖4 sgRNAs在SlSGR1的分布Fig.4 Position of sgRNAs in SlSGR1
基因表達主要受其上游的啟動子上分布的順式作用元件調控。利用在線工具PlantCare分析SlSGR1上游1 500 bp的啟動子序列。結果顯示,該序列除了含有典型的TATA-box和CAAT-box核心啟動子元件外,還分布有ABRE3a、ABRE4、AE-box、AP-1、ARE、AT~TATA-box、CAAT-box、ERE、G-Box、MYC、Myb、STRE、TATA-box、TC-rich repeats等眾多順式作用元件,其中一些誘導型元件的分布見表1。

表1 SlSGR1啟動子順式作用元件分析Table 1 Predicted cis-regulatory elements in SlSGR1 promoter
搜尋SlSGR1啟動子序列分布的sg RNA,發現含有86條(圖5),其中正鏈分布44條,負鏈分布42條,剔除15條含有TTTTs的序列,尚有71條可供選擇,其中在啟動子上游有2條特異性較高,分別位于107~85(負鏈)和215~193 nt(負鏈),其鄰近PAM 12 nt的種子序列在番茄全基因組上是唯一序列,特異性較好。有2條sg RNA(分別位于305~327nt和306~308)包含了AEbox元件,有5條sgRNA(分別位于625~647 nt、634~656 nt、635~657 nt、1 032~1 054 nt和1 033~1 055 nt)包含ABRE和G-box元件,位于1 119~1 231 nt的sgRNA則含TAC-element元件,意味著選用這些sgRNA進行基因編輯,有可能使所含的啟動子元件序列發生突變致使功能變化。

圖5 SlSGR1啟動子包含的誘導型順式作用元件和sgRNAsFig.5 Position of cis-acting elements and sgRNAs in promoter of SlSGR1
番茄果實成熟時,隨著葉綠素逐步降解和有色體合成,呈現不同果色[21]。番茄滯綠基因SlSGR1突變[5],使得果實中葉綠素降解不完全而“滯綠”。番茄滯綠突變多為點突變,有不同的突變體[22],表現不同的滯綠程度,使果色深淺不一。番茄滯綠突變是非功能型突變,葉綠素降解過程受到抑制,但不影響植株衰老進程中的其他環節[23]。SlSGR1蛋白可與PlPSY互作并影響其活性,調控果實中番茄紅素的含量[10]。近年來以多種新型高效的DNA靶向內切酶為基礎建立的基因組編輯技術[13],因具有高效準確、制作簡單的特點,已被廣泛應用到植物基因功能研究和定向改良植物性狀方面[24],該技術可以在不同物種中對目標基因進行定點敲除、單核苷酸或多核苷酸片段置換、添加等靶向修飾,不必通過導入反義基因或RNAi基因抑制靶基因功能。本研究中CRISPRdirect在線分析表明SlSGR1序列分布76條sg RNA序列,其中6條sgRNA可作為后續種子序列,為利用CRISPR/Cas9基因編輯獲得不同位點、不同類型的突變、提高PlPSY活性提供了可能。另外,其中的一些sg RNA序列具有較高的序列特異性,基因編輯時有可能規避脫靶效應,可作為優先選用序列。
基因表達產物取決于編碼序列,表達的時空量則由啟動子調控。利用CRISPR/Cas9突變相關基因的啟動子而不是這些基因本身,能夠實現對數量性狀的精細調節,微調基因表達而不是剔除或滅活它們編碼的蛋白[25]。Rodriguez等[26]利用CRISPR/Cas9技術對啟動子區域進行基因組編輯,實現對番茄產量性狀(果實大小、花序分枝和株型)的精細調控。對水稻Wx基因啟動子上的關鍵順式作用元件進行基因編輯,創制了多個可微調直鏈淀粉含量和蒸煮食味品質的新Wx等位基因[27],這些研究表明對啟動子進行基因編輯可以適度調節目的基因的表達。
利用在線工具PlantCare分析番茄SlSGR1上游1 500 bp的啟動子序列,發現SlSGR1啟動子區分布多條順式作用元件,如脫落酸應答元件ABRE、水楊酸應答原件TCA-element,光應答原件AE-box、G-Box、逆境脅迫響應元件TC-rich repeats等,可能預示SlSGR1的表達受光照、激素及逆境脅迫的調控,為通過調節日長、使用激素或脅迫刺激等途徑調節SlSGR1的表達特性提供了可能。利用CRISPR/Cas9基因編輯可使番茄SLCLV3基因的啟動子區產生多組突變,誘導番茄的花序、果實、株型發生廣泛變異[26],實現對基因表達的微調和數量性狀的調控。另外,選用2條sg RNA進行雙編輯,將有可能定點刪除2條sg RNA之間的啟動子片段及順式元件序列,對番茄SlSGR1啟動子序列進行分析,發現該序列含有86條sgRNA,其中2條特異性較高且位于序列上游,其鄰近PAM 12 nt的種子序列在番茄全基因組上是唯一序列,可有效降低脫靶效益,二者的間隔距離為108 nt,可作為后續基因編輯載體構建的首選sg RNA。其中7條sg RNA還包含順式作用元件序列,預示如選用這些sgRNA進行基因編輯將使所含的順式元件序列發生突變,為原位探明這些元件的功能,進而調節啟動子表達特性、提高番茄果實的番茄紅素含量探索一條新途徑。
在進行基因編輯時,核酸內切酶切割導致產生DNA雙鏈斷裂,然后細胞通過非同源末端連接或同源重組修復斷裂。同源重組可產生精確的定點替換或者插入突變,但發生頻率較低,也有研究報道,借助雙生病毒的復制元件能夠提高番茄細胞中的同源重組模板DNA的表達量,提高重組效率[28]。本研究分析表明,番茄SlSGR1基因及其啟動子區分布諸多g RNA,為通過同源重組修復在SlSGR1基因及其啟動子區插入或替換特定序列、創造新的等位基因提供了基礎。