尹桂芳 段 迎 楊曉琳 蔡蘇云 王艷青盧文潔 孫道旺 賀潤麗 王莉花
(1云南省農業科學院生物技術與種質資源研究所/云南省農業生物技術重點實驗室/農業農村部西南作物基因資源與種質創制重點實驗室,650205,云南昆明;2山西中醫藥大學中藥與食品工程學院,030619,山西太原)
苦蕎[Fagopyrum tataricum (L.) Gaertn],別名韃靼蕎麥,是一種藥食兼用的傳統作物。我國苦蕎栽培面積約30萬hm2,每年總產量約30萬t,云南、貴州、四川和山西等省是苦蕎的主產區,占全國產量的80%左右[1]。早在兩千年以前的古書著作《詩經》、《神農書》和《齊民要術》中就有苦蕎的栽培和食用記載[2]。苦蕎有著極高的黃酮含量,含量遠高于甜蕎[3]。黃酮具有降血糖[4-5]、抗氧化[6]、防癌[7]、降血壓[8]以及抗炎[9]的作用。
肉桂酸-4-羥基化酶(C4H)也稱反式肉桂酸-4-單氧化酶,由Russell和Conn首次從豌豆芽中發現[10]。迄今為止,已從擬南芥[Arabidopsis thaliana(L.) Heynh.][11]、當歸[Angelica sinensis (Oliv.)Diels][12]、茶花(Camellia japonica L.)[13]、桂花[Osmanthus fragrans (Thunb.) Lour.][14]和碭山酥梨(Pyrus bretschneideri Rehd.)[15]等植物中克隆了C4H基因。C4H被鑒定為P450單加氧酶類,屬于CYP73亞家族,是苯丙素類化合物生物合成途徑中繼苯丙氨酸脫氨酶(PAL)之后的第2個關鍵酶。研究[16]表明,C4H在轉錄水平上的豐度以及蛋白質水平上的活性可以有效影響植物中黃酮類化合物和木質素的生物合成量。Baek等[17]通過對黑霉的研究發現,C4H表達量與黃酮積累量在果實發育不同時期的變化趨勢一致。Liu等[18]發現,K+缺乏時菊花中黃酮含量的降低是由CmC4H等基因的表達量減少導致的。銀杏中 C4H的表達水平與木質素的合成呈正相關[19]。黃利娜等[20]對蓮霧果實的研究發現,在其貯藏期間,C4H基因的表達水平和木質素含量均逐漸上升,且二者呈極顯著正相關。
目前,關于苦蕎 C4H基因克隆及生物信息學分析的研究報道較少。陳鴻翰等[21]采用RT-PCR和RACE技術,從苦蕎花蕾中克隆得到1個C4H基因的全長cDNA,發現UV-B脅迫顯著提高了FtC4H的表達量與總黃酮含量。劉榮華等[22]通過RT-PCR技術從苦蕎中克隆到2個FtC4H基因,系統進化分析發現FtC4H1與萵苣親緣關系較近,FtC4H2與丹參親緣關系較近。為進一步研究 C4H基因在苦蕎苯丙烷合成途徑中的調控作用,本研究以云蕎1號和小米蕎為試驗材料,根據前期苦蕎轉錄組數據,從中篩選克隆到1個苦蕎FtC4H基因,對其進行生物信息學分析以及實時熒光定量 PCR驗證,為探究FtC4H基因功能及遺傳改良提供理論依據。
試驗材料云蕎1號和小米蕎種植于昆明市安寧市甸心村大田,自然生長。前期通過果殼轉錄組測序獲得C4H基因的序列,為了克隆到相應的基因序列,2020年7月15日剝離果實授粉膨大期、灌漿前期、灌漿后期和成熟期4個發育時期的果殼,將剝離的果殼混合作為基因克隆的材料;同時采集云蕎1號和小米蕎開花15d時植株的葉、花、莖、果殼和種子樣品,放入液氮中保存備用,用于熒光定量PCR分析,每個樣品3次生物學重復。
1.2.1 RNA提取與cDNA第1鏈合成 根據Trizol提取試劑盒的說明提取 RNA,提取的總 RNA用1.5%瓊脂糖(1×TAE電泳緩沖液)電泳檢測,在紫外透射光下觀察。cDNA第1鏈合成:在0.2mL PCR管中加入5μL總RNA、1μL隨機引物和1μL ddH2O,70°C溫浴 5min,冰浴 2min;離心,加入2.0μL 5×第 1鏈緩沖液、0.5μL 10mmol/L dNTP、0.25μL RNA酶抑制劑和0.25μL反轉錄酶,總體系10.0μL,42°C溫浴60min,72°C溫浴10min。
1.2.2 苦蕎FtC4H基因的克隆 從轉錄組數據庫中檢索篩選出苦蕎肉桂酸-4-羥基化酶(FtC4H)基因,根據基因核苷酸序列設計2條特異引物(表1)。RT-PCR反應體系為:cDNA 模板 1μL、dNTPs(10mmol/L)0.2μL、2×GC Buffer I 12.5μL、TaqDNA聚合酶(5U/μL)0.2μL、ddH2O 10.1μL、FtC4H-F(10μmol/L)0.5μL、FtC4H-R(10μmol/L)0.5μL。PCR反應條件為:95°C預變性3min,94℃變性30s、58°C 退火 30s、72℃延伸 90s、72℃修復延伸 7min,循環33次。PCR產物用1%的瓊脂糖凝膠進行電泳檢測,按試劑盒 B518131說明回收符合要求的條帶,送生工生物工程(上海)股份有限公司測序。

表1 引物序列及用途Table 1 Primer sequences and their applications
1.2.3 克隆基因的生物信息學分析 利用NCBI的ORF finder在線程序及Conserved domains數據庫對測序獲得的 cDNA序列的開放閱讀框(open reading frame,ORF)及保守功能結構域進行分析。通過 ProtParam對蛋白理化性質進行分析;利用ProtScale分析蛋白的親疏水性。采用 TMHMM Server v. 2.0分析編碼氨基酸的跨膜結構域;利用SignalP 5.0 Server預測信號肽;利用 NetPhos 3.1 Server預測磷酸化位點;由 Psort分析亞細胞定位情況。通過SOPMA及SWISS-MODEL預測蛋白質的二級結構和三級結構;用DNAMAN軟件比對編碼蛋白多重序列;用 MEGA6.0構建 Neighborjoining系統進化樹。
1.2.4 實時熒光定量PCR(qRT-PCR)分析 采用Trizol總RNA抽提試劑盒分別提取云蕎1號和小米蕎葉、花、莖、果殼和種子的總RNA,并反轉錄得到第1鏈cDNA,以其為模板,進行qRT-PCR分析,每個樣品3次重復。熒光定量PCR總反應體系包含 10μL 的 2× SG Fast qPCR Master Mix、2μL的 cDNA模板、上、下引物各 0.4μL以及 ddH2O 7.2μL。擴增程序為 95°C 3min;95°C 5s,60°C 30s,循環45次。以內參基因H3(JF769134.1)為對照,采用 2-ΔΔCt法計算FtC4H的相對表達量,設計的qRT-PCR引物如表1所示。
利用SPSS 23軟件分析數據的顯著性水平,用GraphPad Prism 8軟件作圖。
利用 RT-PCR克隆獲得云蕎 1號和小米蕎的FtC4H基因(Genebank登錄號:MZ020784),產物經1%瓊脂糖凝膠電泳分析,結果如圖1所示。對RT-PCR產物進行測序,序列比對發現從2種苦蕎材料克隆得到的C4H基因序列完全一致,命名為FtC4H。ORF finder分析表明,FtC4H的ORF長度為1299bp,編碼432個氨基酸。利用DNAMAN將該核苷酸序列翻譯成氨基酸序列,如圖2所示。

圖1 FtC4H克隆片段的PCR電泳圖Fig.1 The electrophoresis results of FtC4H fragments

圖2 FtC4H的核苷酸序列及氨基酸序列Fig.2 Nucleotide sequence and amino acid sequence of FtC4H
2.2.1 理化性質、亞細胞定位與保守域分析 理化性質預測結果顯示,FtC4H蛋白分子式為C2233H3536N624O634S13,理論分子量為49 685.22Da,親水性平均系數(GRAVY)為-0.331,不穩定系數(II)為48.69,為不穩定蛋白,脂溶指數為95.39,負電荷殘基54個,正電荷殘基58個,理論等電點為8.73,偏堿性。推測該蛋白為親水性不穩定堿性蛋白。亞細胞定位結果顯示,FtC4H主要分布于細胞質和葉綠體中。通過Conserved domains數據庫,對FtC4H的保守結構域(conserved domains)進行分析,發現FtC4H有1個P450結合域(圖3)。

圖3 苦蕎FtC4H蛋白保守結構域分析Fig.3 Conservative structural domain analysis of FtC4H protein in tartary buckwheat
2.2.2 蛋白質疏水性分析及氨基酸翻譯后修飾的預測和分析 利用Protscale程序,以Hphob./Kyte&Dodittle為標度,對苦蕎FtC4H編碼的蛋白質進行分析,以氨基酸標度為縱坐標,氨基酸序列為橫坐標,親水性越強,則分值越小。FtC4H最高分值2.489出現在多肽鏈中的第381、382、383位氨基酸,該3個位點氨基酸疏水性最強;最低分值-2.656出現在多肽鏈中的第124位氨基酸,該位點氨基酸親水性最強。FtC4H整條多肽鏈中分值在閾值0.5以上的氨基酸位點共26個,其中蘇氨酸(Thr)8個、酪氨酸(Tyr)6個、絲氨酸(Ser)12個。
2.2.3 跨膜結構域的預測分析及信號肽預測 跨膜區連接胞內和胞外的部分,主要功能為固定蛋白,部分還有介導信號傳遞的作用[23]。對于能夠在細胞膜或質膜上發揮作用的蛋白質,通過了解多肽鏈中疏水氨基酸區的數目和位置,可以知道蛋白質的穿膜情況[23]。TMHMM Seruer v.2.0結果圖顯示,FtC4H不具有跨膜結構域。通過SignalP 5.0 Server在線軟件對蛋白的信號肽進行預測,結果顯示FtC4H不具有信號肽,屬于非分泌蛋白。
2.2.4 蛋白質二級結構及三級結構的預測和分析
通過對蛋白質的二級結構進行在線預測(圖4),發現 FtC4H具有豐富的二級結構,無規則卷曲占32.64%,α-螺旋占47.69%,β-折疊占5.55%,延伸鏈占14.12%。利用SWISS-MODEL對蛋白質的三級結構進行預測(圖5),其與數據庫目標蛋白6vby.1.A的序列相似度為 77.46%,QMEAN值是-1.00,GMQE值是0.91,表明建模可信度高。

圖4 苦蕎FtC4H蛋白質二級結構預測Fig.4 Secondary structure prediction of FtC4H protein in tartary buckwheat

圖5 苦蕎FtC4H蛋白質三級結構預測Fig.5 Tertiary structure prediction of FtC4H protein in tartary buckwheat
2.2.5 氨基酸結構及系統進化樹分析 與已報道的苦蕎C4H基因進行多重序列比對(圖6),發現克隆到的基因與已報道的不同(黑色核苷酸全部相同為相同)。與已報道的苦蕎C4H氨基酸序列進行多重序列比對,發現本研究克隆序列與已克隆序列相似度為 79.17%,且包含血紅素結合域保守區“FGVGRRSCPG”(圖7)。采用NCBI中的blastp在線程序,查找FtC4H的同源氨基酸序列,比對發現苦蕎的FtC4H與蓖麻(Ricinus communis L.)、莫洛海芽(Corchorus olitorius L.)、茶[Camellia sinensis(L.) O. Ktze.]、蓮(Nelumbo nucifera Gaertn.)、黃麻(Corchorus capsularis L.)和雷公藤(Tripterygium wilfordii Hook. f.)的C4H氨基酸序列相似性較高,分別為83.80%、83.33%、83.33%、83.29%、83.10%和83.06%。

圖6 FtC4H與已克隆苦蕎C4H基因的多序列比對Fig.6 Multiple sequence alignment of FtC4H with C4H genes cloned from tartary buckwheat
運用 MEGA 6.0軟件,將本研究克隆的苦蕎FtC4H與其他已克隆的苦蕎C4H蛋白及其他植物的 C4H蛋白序列采用鄰接法構建系統進化樹,結果(圖8)發現,本研究克隆的苦蕎FtC4H單獨聚為一支,其余4條苦蕎FtC4H聚為一小簇,并與蓮、蓖麻等6種植物C4H蛋白聚為一大簇,可見本研究克隆的苦蕎 FtC4H與其他已克隆的苦蕎FtC4H有差異,可能是1個新基因(圖7)。

圖7 FtC4H與已克隆苦蕎C4H蛋白的多序列比對Fig.7 Multiple sequence alignment of FtC4H with C4H proteins cloned from tartary buckwheat

圖8 FtC4H與其他植物來源C4H基于蛋白質序列的系統進化樹Fig.8 Phylogenetic trees based on protein sequences of FtC4H and other plant sources C4H
2.2.6 FtC4H基因相對定量分析 用qRT-PCR分析FtC4H在云蕎1號和小米蕎不同部位的表達水平,結果(圖9)發現,FtC4H的相對表達量在不同苦蕎的不同部位表達不同,其中在種子中表達最高,且遠遠高于其他部位。FtC4H在小米蕎的葉中相對表達量極顯著高于云蕎1號,小米蕎葉中的表達量是云蕎1號中的9倍多;在花中相對表達量差異顯著,在小米蕎中的表達量約是云蕎1號中的2倍。FtC4H在種子中表達量高的原因可能是取樣時間處于結實期,是種子快速生長期和黃酮類物質合成期,C4H基因較活躍。

圖9 FtC4H基因在苦蕎不同器官的相對表達量Fig.9 Relative expression of FtC4H gene in different organs of tartary buckwheat
黃酮類化合物作為苦蕎重要的基礎藥效物質之一,具有顯著的藥理活性,C4H作為苯丙素類化合物生物合成途徑中的關鍵調節酶,在植物細胞中的表達量可以影響木質素和黃酮類物質合成等多條代謝支路[24]。C4H作為細胞色素 P450超家族(CYP73)的成員之一,包含C4H/CYP73A5的5個保守特征性底物結合位點基序(SRS)及細胞色素 P450保守域[25]。本研究克隆了苦蕎 FtC4H基因,序列比對發現從云蕎 1號和小米蕎中克隆的FtC4H序列完全相同,但是不同于已報道的苦蕎FtC4H基因。陳鴻翰等[21]的克隆材料為西蕎2號苦蕎(AFU54390);劉榮華等[22]的克隆材料為黑豐1號苦蕎(AUT31007.1、AUT77170.1),推測C4H基因在云蕎1號和小米蕎中的功能相似,而不同于黑豐1號和西蕎2號苦蕎的C4H功能。經氨基酸多重比對發現,本研究克隆的FtC4H的SRS2基序與其他已報道的苦蕎C4H氨基酸相比有1個氨基酸的改變(A-S);SRS5基序中亦發現1個氨基酸改變(G-P);SRS1基序中FtC4H與AUT77170.1相比有D-G這1個氨基酸的改變,與AFU54390.1相比有R-Q這1個氨基酸的改變;在SRS3基序中,與 AEF30417.1相比有 A-T這個氨基酸的改變;SRS4基序及血紅素結合域無氨基酸改變。本研究克隆的FtC4H亞細胞定位于細胞質。而陳鴻翰等[21]及劉榮華等[22]克隆的 FtC4H亞細胞均定位于內質網外膜,推測是由于本研究克隆的FtC4H不含有富含脯氨酸的鉸鏈結構 P34PGPIPVP41,該結構對FtC4H形成正確的折疊和錨定于內質網外膜具有重要意義。系統進化樹結果表明,FtC4H單獨為一支,與苦蕎其他C4H的親緣關系較遠。可以進一步為FtC4H與已發表的苦蕎C4H基因功能有區別的推測提供論據。
在番茄中同源正義超表達 C4H基因降低了番茄莖中木質素的含量,卻增加了番茄果實中黃酮類化合物的含量[16]。Yan等[26]在煙草植株中過表達大豆GmC4H基因,結果煙草的木質素積累增加,并且對寄生疫霉以及黃萎病的抗性增強。馮藝川等[27]的研究首次明確了膜莢黃芪的毛蕊異黃酮及其糖苷化合物的生物合成可能直接受到 AmC4H2基因的調控作用。qRT-PCR表明FtC4H在小米蕎的花和葉中相對表達量顯著高于云蕎1號。在果殼和莖部也有表達,由此推測FtC4H可能參與了多種物質(黃酮、木質素)的生物合成,具體功能有待進一步挖掘。
從云蕎1號和小米蕎中克隆得到了FtC4H基因,通過分析發現與前人已克隆的苦蕎 C4H基因不同,且其表達具有組織特異性。該結果豐富了C4H基因資源,也為探討苦蕎苯丙烷類次生代謝途徑奠定了一定的基礎。