孫燕 王金剛 臧丹丹 趙恒田 劉淑華
(1.東北農(nóng)業(yè)大學(xué)園藝園林學(xué)院,哈爾濱 150030;2.中國(guó)科學(xué)院東北地理與農(nóng)業(yè)生態(tài)研究所黑土區(qū)農(nóng)業(yè)生態(tài)重點(diǎn)實(shí)驗(yàn)室,哈爾濱 150081)
藍(lán)果忍冬(Lonicera caeruleaL.)為忍冬科忍冬屬植物,原產(chǎn)于北半球溫帶地區(qū),現(xiàn)廣泛分布于我國(guó)各地,是我國(guó)重要的野生果樹(shù)資源[1-3]。藍(lán)果忍冬果實(shí)出汁率高,有香氣,營(yíng)養(yǎng)價(jià)值豐富,具有調(diào)節(jié)血壓、減緩衰老等作用[4-5],因其富含花青素、氨基酸、維生素、類黃酮等多種活性物質(zhì),被譽(yù)為“飲料之王”[6]。‘中科藍(lán)1 號(hào)’是我國(guó)第一個(gè)具有自主知識(shí)產(chǎn)權(quán)和國(guó)家備案的藍(lán)果忍冬新品種,植株健壯,豐產(chǎn)性強(qiáng),果實(shí)為長(zhǎng)橢圓形,口感酸甜無(wú)苦味,是優(yōu)良的鮮果品種,適宜東北寒區(qū)廣泛種植[7]。
花青素是植物體內(nèi)一類重要的次生代謝物質(zhì),屬于類黃酮類化合物,在賦予植物色彩時(shí)起主要作用[8-9]。在果實(shí)生長(zhǎng)發(fā)育過(guò)程中,果皮中色素會(huì)發(fā)生一系列變化,隨著果實(shí)的成熟,葉綠素在水解酶的作用下逐漸分解消失,類胡蘿卜素略有增加;花青素在細(xì)胞質(zhì)中合成,以苯丙氨酸為直接前體,由一系列結(jié)構(gòu)基因編碼的合成酶催化形成,并經(jīng)過(guò)一系列的運(yùn)輸后貯存于液泡中;漿果的大小、色澤、硬度均會(huì)隨著果實(shí)的成熟發(fā)生顯著變化[10-11]。近年來(lái),關(guān)于藍(lán)果忍冬果實(shí)花青素的研究受到廣泛關(guān)注,Zhou 等[12]對(duì)藍(lán)果忍冬品種‘蓓蕾’果實(shí)中的花青素提取并純化,發(fā)現(xiàn)提取的花青素ABL-2 的主要成分是花青素-3-葡萄糖苷、花青素-3,5-二葡萄糖苷、花青素-3-蘆丁糖苷和芍藥-3-葡萄糖苷,且能夠顯著抑制細(xì)胞生長(zhǎng),誘導(dǎo)DNA 損傷,殺死腫瘤細(xì)胞,改善小鼠的生存狀態(tài);Paereckait 等[13]利用分光光度法對(duì)11 種藍(lán)果忍冬果實(shí)中的酚類化合物和花青素含量等進(jìn)行提取研究并比較不同藍(lán)果忍冬品種的抗菌活性。然而,目前有關(guān)藍(lán)果忍冬基因信息尚不明確,對(duì)藍(lán)果忍冬果實(shí)轉(zhuǎn)錄組的相關(guān)研究少有報(bào)道,嚴(yán)重限制了藍(lán)果忍冬的開(kāi)發(fā)和利用。
本研究以藍(lán)果忍冬‘中科藍(lán)1 號(hào)’果實(shí)為試驗(yàn)材料,使用高通量測(cè)序平臺(tái)對(duì)綠熟期果實(shí)和成熟期藍(lán)果忍冬果實(shí)進(jìn)行轉(zhuǎn)錄組測(cè)序分析,通過(guò)組裝建立藍(lán)果忍冬轉(zhuǎn)錄組數(shù)據(jù)庫(kù),探究藍(lán)果忍冬果實(shí)不同發(fā)育時(shí)期的功能基因和調(diào)控網(wǎng)絡(luò),旨在為后續(xù)了解藍(lán)果忍冬果實(shí)發(fā)育提供理論參考。
試驗(yàn)材料為藍(lán)果忍冬‘中科藍(lán)1 號(hào)’品種,由中國(guó)科學(xué)院東北地理與農(nóng)業(yè)生態(tài)研究所培育,分別采取綠熟期(花后28 d,果實(shí)成長(zhǎng)到體積不再發(fā)生變化,果皮顏色為綠色)和成熟期(花后38 d,果皮顏色全部變?yōu)樗{(lán)紫色,果實(shí)未軟化)兩個(gè)時(shí)期的果實(shí)(果皮和果肉),各取3 個(gè)生物學(xué)重復(fù),用液氮速凍后保存在-80℃冰箱中用于后續(xù)轉(zhuǎn)錄組測(cè)序和花色苷含量的測(cè)定(圖1)。

圖1 不同發(fā)育時(shí)期的‘中科藍(lán)1 號(hào)’果實(shí)Fig.1 Fruits of ‘Zhongkelan No.1’ at different developmental stages
1.2.1 不同時(shí)期的花色苷總量測(cè)定 參照高效液相色譜法(high performance liquid chromatography,HPLC)[14],利用安捷倫液相色譜系統(tǒng)(Agilent Technologies 1260 Infinity Ⅱ Prime,US)檢測(cè)花青素種類及含量,流動(dòng)相A 為含3% 甲酸的雙蒸水,流動(dòng)相B 為100% 乙腈。洗脫程序?yàn)? min 90%A,10% B;16 min 86% A,14% B;20 min 90% A,10% B;流速為1 mL/min,柱溫為30℃,檢測(cè)波長(zhǎng)為520 nm,每個(gè)樣品設(shè)3 個(gè)重復(fù);分別以矢車菊素-3,5-雙葡萄糖苷、飛燕草素-3-O-葡萄糖苷、飛燕草素-3-O-蕓香糖苷、矢車菊素-3-O-葡萄糖苷、矢車菊素-3-O-蕓香糖苷、天竺葵素-3-O-葡萄糖苷、芍藥素-3-O-葡萄糖苷、芍藥素-3-O-蕓香糖苷標(biāo)準(zhǔn)品繪制標(biāo)準(zhǔn)曲線,含量由峰面積計(jì)算方法得出,單位為mg/100 g FW。
1.2.2 RNA 提取 采用CTAB 法提取藍(lán)果忍冬不同發(fā)育時(shí)期的總RNA,經(jīng)PrimeScript One Step RT-PCR Kit Ver.2(TaKaRa)反轉(zhuǎn)錄為cDNA 并將cDNA 稀釋10 倍用于后續(xù)RT-qPCR 實(shí)驗(yàn)。樣品總RNA 經(jīng)檢測(cè)合格后送至北京百邁客生物技術(shù)有限公司運(yùn)用高通量平臺(tái)進(jìn)行RNA-Seq 測(cè)序。轉(zhuǎn)錄組樣品編碼為G:“綠熟期”,B:“成熟期”。
1.2.3 轉(zhuǎn)錄組測(cè)序與分析 為了獲得高質(zhì)量的轉(zhuǎn)錄組數(shù)據(jù),采用illumina novaseq 6000 平臺(tái)進(jìn)行雙末端測(cè)序,截除掉原始序列接頭和引物序列,對(duì)低質(zhì)量的序列進(jìn)行過(guò)濾處理,并利用Trinity 軟件對(duì)生成的高質(zhì)量測(cè)序數(shù)據(jù)進(jìn)行組裝,得到轉(zhuǎn)錄本序列Unigene;利用BLAST 軟件在NR、GO、Swiss-Prot、COG、KEGG 和eggNOG4.5 數(shù)據(jù)庫(kù)中進(jìn)行比較分析并預(yù)測(cè)Unigene 的氨基酸序列,使用HMMER軟件將Unigene 序列在Pfam 數(shù)據(jù)庫(kù)比對(duì)從而獲得Unigene 的功能信息,并使用 TBtools 軟件繪制熱圖。
1.2.4 差異表達(dá)基因的篩選和富集分析 用DESeq2軟件對(duì)藍(lán)果忍冬綠熟期和成熟期果實(shí)的轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行組間差異表達(dá)分析,篩選標(biāo)準(zhǔn)為FDR(False Discovery Rate)<0.01 且FC(Fold Change)≥2,并利用Goatools 軟件對(duì)篩選出的差異表達(dá)基因進(jìn)行COG 注釋分析、GO 功能富集分析和KEGG 富集分析。
1.2.5 差異表達(dá)基因的RT-qPCR 驗(yàn)證 根據(jù)藍(lán)果忍冬轉(zhuǎn)錄組數(shù)據(jù)隨機(jī)篩選出10 個(gè)差異基因,在NCBI數(shù)據(jù)庫(kù)中比對(duì)并設(shè)計(jì)定量引物(表1)。選用LcACT1(MT344113)、LcTUB1(MT344114)作為內(nèi)參基因,利用Agilent AriaMx 實(shí)時(shí)熒光定量PCR 儀(Agilent Stratagene,USA)對(duì)其進(jìn)行實(shí)時(shí)熒光定量PCR 反應(yīng),程序?yàn)?4℃預(yù)變性30 s,94℃變性15 s,57℃退火30 s,72℃延伸35 s,共44 個(gè)循環(huán)結(jié)束,65-95℃熔解曲線讀取,用2-ΔΔCT算法計(jì)算處理。

表1 轉(zhuǎn)錄組數(shù)據(jù)RT-qPCR 驗(yàn)證引物序列Table 1 Primer sequences used in RT-qPCR validation of transcriptome data
利用高效液相色譜(high performance liquid chromatography,HPLC)檢測(cè)技術(shù)和紫外檢測(cè)器對(duì)520 nm 波長(zhǎng)下進(jìn)行掃描,檢測(cè)到的峰圖如圖2所示,可以看出,藍(lán)果忍冬‘中科’綠熟期果實(shí)未檢測(cè)出花色苷成分(圖2-a),成熟期果實(shí)中檢測(cè)到的花青素種類共有8 種(A1-A8)(圖2-b),總花色苷含量為598.55 mg/100 g FW。其中,矢車菊素-3-O-葡萄糖苷含量最高,占總花色苷的86.28%,是藍(lán)果忍冬‘中科’果實(shí)中主要的花色苷(表2),說(shuō)明不同發(fā)育階段藍(lán)果忍冬‘中科’果實(shí)中花色苷類化合物組成和含量有較大差異。

表2 ‘中科藍(lán)1 號(hào)’成熟期果實(shí)中花色苷含量Table 2 Anthocyanins contents in the ripening stage fruits of ‘Zhongkelan No.1’

圖2 ‘中科藍(lán)1 號(hào)’不同發(fā)育時(shí)期果實(shí)高效液相色譜Fig.2 HPLC of ‘Zhongkelan No.1’ fruit at different developmental stages
選擇藍(lán)果忍冬綠熟期果實(shí)和成熟期果實(shí)各3 次生物學(xué)重復(fù),共6 個(gè)樣品,轉(zhuǎn)錄組測(cè)序共得到40.32 Gb Clean Data,每個(gè)樣品Clean Data 均大于6.07 Gb,GC 含量為46.32%-49.38%,Q30 均值在93.89%及以上,表明測(cè)序數(shù)據(jù)較好,可用于后續(xù)分析(表3)。

表3 測(cè)序數(shù)據(jù)統(tǒng)計(jì)結(jié)果Table 3 Statistics of sequencing data
6 個(gè)藍(lán)果忍冬果實(shí)的轉(zhuǎn)錄組數(shù)據(jù)經(jīng)過(guò)質(zhì)量分析處理后共得到236 033 條轉(zhuǎn)錄本序列,平均長(zhǎng)度為1 371.99 bp,N50 長(zhǎng)2 186 bp;組裝后獲得81 777個(gè)單基因序列,且長(zhǎng)度大于1 kb 的Unigene 共有17 339 個(gè)(表4),對(duì)所獲得的單基因序列與NR、Swiss-Prot、KEGG、COG、KOG、GO 和Pfam 數(shù)據(jù)庫(kù)進(jìn)行功能注釋比對(duì),注釋成功的Unigene 共有28 992 條,占全部Unigene 的35.45%(表5)。

表4 組裝結(jié)果統(tǒng)計(jì)Table 4 Assembly result statistics

表5 單基因功能注釋統(tǒng)計(jì)Table 5 Single-gene function annotation statistics
根據(jù)評(píng)估標(biāo)準(zhǔn)FDR(False Discovery Rate)<0.01 且FC(Fold Change)≥2,共篩選出3 247 個(gè)差異表達(dá)基因,其中有1 642 個(gè)基因在上調(diào)表達(dá),1 605 個(gè)基因在下調(diào)表達(dá),從圖3可以清楚地看出,在兩個(gè)生長(zhǎng)時(shí)期藍(lán)果忍冬果實(shí)中基因表達(dá)水平存在較大差異。

圖3 差異表達(dá)基因的火山圖Fig.3 Volcano map of differentially expressed genes
利用COG 數(shù)據(jù)庫(kù)對(duì)藍(lán)果忍冬果實(shí)兩個(gè)發(fā)育時(shí)期的差異表達(dá)基因進(jìn)行對(duì)比分析(圖4)發(fā)現(xiàn),注釋到COG 通路中的差異表達(dá)基因有1 081 個(gè),分布在23 條途徑中,占全部差異基因的37.88%,其中,碳水化合物運(yùn)輸和代謝(carbohydrate transport and metabolism)是最大通路,所占數(shù)量最多,其次是一般功能預(yù)測(cè)(general function prediction only),差異基因在脂質(zhì)運(yùn)輸和代謝(lipid transport and metabolism)通路和次級(jí)代謝物生物合成、運(yùn)輸和分解代謝(secondary metabolites biosynthesis,transport and catabolism)通路占比也較高,說(shuō)明在果實(shí)成熟發(fā)育過(guò)程中代謝物質(zhì)變化較大。

圖4 不同發(fā)育時(shí)期差異表達(dá)基因COG 注釋分類統(tǒng)計(jì)圖Fig.4 COG annotation classification of differentially expressed genes at different developmental stages
對(duì)藍(lán)果忍冬果實(shí)兩個(gè)發(fā)育時(shí)期的差異表達(dá)基因進(jìn)行對(duì)比分析,發(fā)現(xiàn)注釋到GO 通路中的差異表達(dá)基因有1 908 個(gè),分別映射到51 個(gè)代謝通路中(圖5),在生物過(guò)程(biological process)中,主要富集在代謝過(guò)程(metabolic process)和細(xì)胞過(guò)程(cellular process),其次是單個(gè)有機(jī)體過(guò)程(single-organism process);在細(xì)胞組分(cellula component)通路中,膜部分(membrane)占比最多、其次是細(xì)胞(cell)和細(xì)胞部分(cell part);在分子功能(molecular function)通路中,催化活性(catalytic activity)和結(jié)合功能(binding)較其他通路顯著富集。花青素是植物次生代謝產(chǎn)物,糖苷衍生物。推測(cè)可能歸類于代謝過(guò)程(metabolic process)和催化活性(catalytic activity)的Unigenes 中,可能有參與藍(lán)果忍冬花青素生物合成積累差異相關(guān)的良好候選基因。

圖5 不同發(fā)育時(shí)期差異表達(dá)基因GO 功能富集結(jié)果Fig.5 Gene ontology annotation of differentially expressed genes at different developmental stages
以q-value<0.05 作為篩選差異表達(dá)基因在KEGG數(shù)據(jù)庫(kù)通路的標(biāo)準(zhǔn),由圖6可知,2 854 個(gè)差異基因中共有1 034 個(gè)DEGs 注釋到KEGG 通路中,其中植物激素信號(hào)轉(zhuǎn)導(dǎo)(plant hormone signal transduction)途徑是最大通路,有55 個(gè),占比10.07%;其次是氨基酸生物合成(biosynthesis of amino acid)和碳代謝(carbon metabolism)途徑,均為46 個(gè),占比為8.42%;此外,淀粉和蔗糖代謝(starch and sucrose metabolism)通路與果實(shí)的發(fā)育也顯著富集,有37 個(gè),占比6.78%。

圖6 不同發(fā)育時(shí)期差異表達(dá)基因KEGG 分類圖Fig.6 KEGG classification of differentially expressed gene at different developmental stages
花青素是類黃酮化合物,且與苯丙氨酸代謝途徑有關(guān)。對(duì)KEGG 代謝通路進(jìn)行富集顯著性篩選,得出富集最顯著的20 條代謝通路(圖7),其中,苯丙氨酸,酪氨酸和色氨酸的生物合成(phenylalanine,tyrosine and tryptophan biosynthesis)、類黃酮生物合成(flavonoid biosynthesis)、半胱氨酸和蛋氨酸代謝(cysteine and methionine metabolism)這3 條代謝途徑被顯著富集,說(shuō)明可能存在大量與藍(lán)果忍冬花青素生物合成積累相關(guān)的差異基因。

圖7 不同發(fā)育時(shí)期差異表達(dá)基因KEGG 功能富集結(jié)果Fig.7 KEGG analysis of differentially expressed genes at different developmental stages
為了驗(yàn)證RNA-seq 的結(jié)果,對(duì)測(cè)序結(jié)果隨機(jī)挑選了10 個(gè)差異表達(dá)基因進(jìn)行RT-qPCR 驗(yàn)證,分析RT-qPCR 與RNA-seq 結(jié)果之間的相關(guān)性,每個(gè)基因進(jìn)行3 次生物學(xué)重復(fù)。結(jié)果顯示(圖8),隨機(jī)挑選的10 個(gè)差異表達(dá)基因的表達(dá)量變化與轉(zhuǎn)錄組基因的變化完全一致,說(shuō)明轉(zhuǎn)錄組的測(cè)序數(shù)據(jù)和RT-qPCR的數(shù)據(jù)之間具有良好的一致性,表明本研究RNAseq 數(shù)據(jù)具有較高的可靠性。

圖8 轉(zhuǎn)錄組測(cè)序數(shù)據(jù)的RT-qPCR 驗(yàn)證Fig.8 Validation of transcriptome sequencing data by RT-qPCR
近年來(lái),隨著分子生物學(xué)技術(shù)的發(fā)展,新一代高通量測(cè)序技術(shù)已被廣泛應(yīng)用于生物分析和醫(yī)學(xué)研究等領(lǐng)域,因其具有成本低,測(cè)序速度快,能夠估計(jì)不同發(fā)育時(shí)期和不同組織中的整體基因的表達(dá)量等特點(diǎn),是當(dāng)前無(wú)參考基因組的非模式生物的經(jīng)濟(jì)有效的選擇[15-18]。目前,已有研究表明在藍(lán)果忍冬果實(shí)或種子中分離和鑒定出酚類物質(zhì)、抗氧化成分和揮發(fā)性物質(zhì)等多種生物活性成分,包括黃酮類化合物、花青素、脂肪酸、甘油三酯和總甾醇等化合物,并證實(shí)花青素-3-葡萄糖苷為其主要的抗氧化成分[19-22]。本研究基于RNA-seq 測(cè)序技術(shù),對(duì)‘中科藍(lán)1 號(hào)’藍(lán)果忍冬兩個(gè)發(fā)育時(shí)期的果實(shí)進(jìn)行轉(zhuǎn)錄組分析,序列經(jīng)過(guò)組裝之后,共獲得81 777 條平均長(zhǎng)度為763.35 nt 的Unigene,與前人報(bào)道的‘蓓蕾’品種果實(shí)發(fā)育階段的基因數(shù)目相近[23],比馬尾松、枇杷、荔枝等木本植物組裝的Unigene 多[24-26],結(jié)果表明,組裝的質(zhì)量以及片段長(zhǎng)度可以滿足轉(zhuǎn)錄組數(shù)據(jù)分析的需要。有28 992 條Unigene 得到注釋,占比35.45%,雖然比大葉女貞(50.20%)和藍(lán)莓(73.60%)的注釋率低,但與文冠果(36.15%)和紅掌(38.87%)相近[27-30],造成注釋率低的原因可能是缺乏近緣物種的參考基因組信息,未得到注釋的基因也可能是藍(lán)果忍冬果實(shí)特異性新基因,有待進(jìn)一步分析研究。
對(duì)比兩個(gè)測(cè)序樣本檢測(cè)到的差異表達(dá)基因發(fā)現(xiàn),表達(dá)量上調(diào)的基因數(shù)目多于下調(diào)基因數(shù)目,這表明成熟期果實(shí)相對(duì)于綠熟期果實(shí)的樣本有更多的基因表達(dá)量。對(duì)這些基因進(jìn)行KEGG 分析后發(fā)現(xiàn)有大量的色素形成相關(guān)途徑被顯著富集,包括與花青素代謝直接相關(guān)的苯丙氨酸、酪氨酸和色氨酸的生物合成途徑、類黃酮生物合成途徑和氨基酸生物合成途徑,表明藍(lán)果忍冬果實(shí)色澤調(diào)控的復(fù)雜性。GO 富集分析發(fā)現(xiàn)在果實(shí)綠熟期到轉(zhuǎn)色期果實(shí)成熟過(guò)程中,參與細(xì)胞過(guò)程和代謝的基因較多,同時(shí)涉及到的功能最多的基因?yàn)榻Y(jié)合和催化功能,從分子水平說(shuō)明了這一過(guò)程中代謝旺盛。藍(lán)果忍冬不同發(fā)育時(shí)期的差異表達(dá)基因在植物激素信號(hào)轉(zhuǎn)導(dǎo)、碳代謝、氨基酸生物合成、脂肪代謝等多條代謝途徑中富集,與類黃酮合成緊密相關(guān),具體受哪些基因控制還需要做進(jìn)一步信息學(xué)分析。
園藝產(chǎn)品品質(zhì)形成的調(diào)控包括多個(gè)方面,在植物激素相關(guān)研究中,表明GA 對(duì)果實(shí)成熟軟化[31]、有機(jī)酸及糖分積累[32]、果實(shí)著色[33]、果實(shí)大小和形狀[34]等方面都有一定影響。比如,趙榮華等[35]研究表明GA 水平的調(diào)控可同時(shí)影響葡萄果實(shí)的形態(tài)和品質(zhì),另有研究發(fā)現(xiàn)生長(zhǎng)素和赤霉素的相互作用在辣椒的生長(zhǎng)發(fā)育過(guò)程中能平衡細(xì)胞分裂和細(xì)胞擴(kuò)張[36]。在轉(zhuǎn)錄因子相關(guān)研究中,Medina-Puche等[37]研究表明YB9/FaMYB11、FabHLH3 和FaTTG1 在調(diào)控草莓花青苷合成過(guò)程中起關(guān)鍵作用,調(diào)控果皮花青苷的生物合成[38]。本研究發(fā)現(xiàn)藍(lán)果忍冬‘中科藍(lán)1 號(hào)’成熟期果實(shí)含有8 種花色苷成分,其中含量最高的花色苷為矢車菊素-3-O-葡萄糖苷,占總花色苷含量的86.28%,而綠熟期果實(shí)未檢測(cè)出花色苷成分,推測(cè)在果實(shí)成熟過(guò)程中存在調(diào)控花色苷含量的轉(zhuǎn)錄因子,還需進(jìn)一步研究。
本研究對(duì)‘中科藍(lán)1 號(hào)’藍(lán)果忍冬綠熟期和成熟期果實(shí)進(jìn)行了轉(zhuǎn)錄組測(cè)序,共有40.32 Gb Clean Data,每個(gè)樣品Clean Data 均大于6.07 Gb,Q30 堿基百分比均在93.89%及以上,GC 含量為46.32%-49.38%;共篩選出3 247 個(gè)差異表達(dá)基因,包含1 642 個(gè)上調(diào)基因和1 605 個(gè)下調(diào)基因,為研究藍(lán)果忍冬果實(shí)轉(zhuǎn)色過(guò)程的的分子調(diào)控機(jī)制提供了參考。