邢丙聰 ,蘇立樣 ,萬思琦 ,邵清松 *
1.浙江省特色中藥資源保護與創新利用重點實驗室,浙江 杭州 311300
2.浙江農林大學中藥學科,浙江 杭州 311300
金線蓮Anoectochilus roxburghii(Wall.) Lindl.為蘭科開唇蘭屬多年生草本植物,是我國傳統珍貴藥材,全草可入藥,具有清熱涼血、祛風利濕等功效[1]。在自然條件下,金線蓮生長緩慢、結實率低、種子敗育現象嚴重、幼苗存活率低等原因導致野生金線蓮種群規模急劇收縮,瀕臨滅絕[2-3]。金線蓮種子自然繁殖率極低,種子細小且種胚形態結構不健全,并且種子必須與菌根真菌共生,將種子胚細胞中的淀粉轉化為糖,才能萌芽生長[4-6]。近年來,許多學者對金線蓮人工栽培進行研究,在種苗培育、組培苗移栽、設施栽培等關鍵技術上取得突破性進展,但是關于生殖發育分子生物學方面研究較少報道。
WRKY轉錄因子是植物中最大的轉錄因子家族之一。WRKY轉錄因子因具有保守的“WRKYGQK”序列而被簡稱為“WRKY”[7]。WRKY已經被證實在調控植物種子的形成、發育及萌發等方面具有重要作用。研究發現,AtWRKY34與其同源蛋白AtWRKY2是擬南芥花粉發育所必需的。若WRKY34在花粉發育的早期階段沒有被蛋白激酶MPK3和 MPK6磷酸化,擬南芥花粉發育和花粉管生長等功能都會受到損害[8]。編碼AtWRKY10的MINI3和編碼LRR受體激酶的IKU2共同正調控了擬南芥種子的大小和胚乳的發育[9]。AtWRKY43能促進擬南芥種子內脂肪物質轉化為糖類從而供給發芽所需的能量消耗,增強種子的發芽能力[10]。AtTTG2則能調控擬南芥種皮的發育[11]。葡萄中的VvWRKY20對葡萄胚珠的發育至關重要,VvWRKY20的缺失會導致種子前體——胚珠的敗育[12]。Xiang等[13]研究發現,在谷子中編碼一種第一亞族WRKY轉錄因子的lp1基因突變會導致谷子種子變大。水稻中的OsWRKY78也與水稻種子大小的發育有關,抑制OsWRKY78的表達會引起細胞長度減小從而使種子變小[14]。棉花中GhWRKY22能通過調節JAZ基因的表達來影響雄性花粉的發育[15];而GhWRKY17調控了棉花種子的發芽能力[16]。人參中的PgWRKY3參與種子的后熟過程[17]。金釵石斛中的DnWRKY11則可增強其種子的抗逆性[18]。目前,在金線蓮中WRKY轉錄因子的調控作用尚未見報道。
本研究利用Illumina結合PacBio技術對金線蓮轉錄組進行測序,首次篩選得到23條ArWRKY序列,分別命名為ArWRKY1~ArWRKY23。通過qRT-PCR檢測分析,發現ArWRKY5與ArWRKY20在金線蓮花中顯著高表達,推測兩者在花的發育過程中扮演了重要的角色。最后,本課題組克隆得到2條基因的CDS序列,為其功能進一步驗證奠定了基礎。
材料購自浙江金華市農業科學研究院,經浙江農林大學胡潤淮教授鑒定為金線蓮A.roxburghii(Wall.) Lindl.組培苗。
RNAprep Pure多糖多酚植物總RNA提取試劑盒購自天根生化科技(北京)有限公司;AxyPrepTM DNA凝膠回收試劑盒購自愛思進生物技術(杭州)有限公司;SYBR?Premix Ex TaqTM II(Tli RNaseH Plus)熒光定量試劑盒、反轉錄PrimeScriptTM II 1st strand cDNA Synthesis Kit試劑盒、pMD19-T載體、PrimeSTAR Max DNA Polymerase試劑盒、DNA Marke均購自TaKaRa公司(日本);胰蛋白胨、酵母提取物、氯化鈉、氨芐青霉素均購自生工生物工程(上海)股份有限公司;瓊脂粉購自北京鼎國昌盛生物技術有限責任公司。
將已馴化過的金線蓮組培苗洗凈培養基,移栽至浙江農林大學百草園試驗基地,栽培基質為泥炭-河沙-花生殼4∶2∶2(體積比)[19]。待生長穩定后隨機采摘5~6株分為根、莖、葉3部分迅速放入液氮速凍,并送往上海派森諾生物科技股份有限公司進行轉錄組測序,3次生物學重復。
利用 MEME在線網站(http://meme-suite.org/tools/meme)預測蛋白功能結構域,得到結構域蛋白序列,并拼接得到ArWRKY核心序列;利用Clustal W對核心序列進行多序列比對;使用MEGA7 NJ法(bootstrap 1000)構建系統進化樹。利用ProtParam(http://web.expasy.org/protparam/)預測編碼蛋白的相對分子質量、等電點等理化特性。
按照TIANGEN的RNAprep Pure多糖多酚植物總RNA提取試劑盒的說明書提取金線蓮總RNA,并檢測RNA的完整性與濃度,合格后用于后續實驗。按照PrimeScriptTM II 1st strand cDNA Synthesis Kit試劑盒的說明書合成cDNA第1鏈。
分別收集金線蓮葉芽期和花芽期的花及開花期的花、根、莖和葉提取金線蓮總RNA,反轉錄后用做測量基因表達量的模板。以金線蓮Actin(ArActin)為內參基因,利用qRT-PCR檢測ArWRKY1、ArWRKY5、ArWRKY6、ArWRKY8、ArWRKY9、ArWRKY11、ArWRKY13、ArWRKY19、ArWRKY20與ArWRKY23的時空表達模式(引物序列見表1)。qRT-PCR反應體系見表2。

表1 金線蓮ArWRKY和ArActin的qRT-PCR引物序列Table 1 qRT-PCR primer sequences of ArWRKY and ArActin

表2 熒光定量PCR反應液Table 2 RT-qPCR reaction liquid
以開花期的根為對照,采用相對定量法2?△△Ct計算基因相對表達量。使用SPSS 23軟件對數據進行處理,Duncan與LSD分析法檢測進行顯著性分析,字母標記法進行標記。
根據轉錄組數據Unigenes序列設計上下游引物(序列見表3)。以金線蓮cDNA為模板進行序列擴增。ArWRKY5序列擴增反應程序為98 ℃、3min,98 ℃、10 s,55 ℃、5 s,72 ℃、1.2 min,30個循環。ArWRKY20序列擴增反應程序為98 ℃、3 min,98 ℃、10 s,55 ℃、5 s,72 ℃、0.7 min,30個循環。用1%瓊脂糖凝膠電泳檢測PCR產物,選擇正確大小的凝膠片段進行切膠回收。

表3 基因克隆引物Table 3 Cloning primers of genes
將膠回收產物連接為pMD19-T載體,轉化大腸桿菌DH5α中,并在含有氨芐青霉素(Amp)的LB固體培養基平板上倒置培養12~16 h,挑選陽性菌落送往浙江有康生物科技有限公司測序。
利用在線網站(https://www.detaibio.com/tools/signal- peptide.html)預測信號肽;利用NetPhos 3.1 Server(http://www.cbs.dtu.dk/services/ NetNGlyc/)預測蛋白的糖基化位點、磷酸化位點和蛋白激酶結合位點;利用ExPasy-ProtScale(https:// web.expasy.org/ protscale/)分析蛋白親/疏水性。分別采用GOR4(https://npsa-prabi.ibcp.fr/cgi- bin/npsa_automat.pl?page=npsa_gor4.html)和SWISSMODEL(https://swissmodel.expasy.org/)預測蛋白的二、三級結構。
從金線蓮中篩選得到23條ArWRKY序列,分別命名為ArWRKY1~ArWRKY23。根據WRKY轉錄因子的蛋白結構特征將23條ArWRKY分為3類:其中ArWRKY6和ArWRKY11具有2個WRKY域,屬于第I類;ArWRKY8、ArWRKY14和ArWRKY23具有1個WRKY域,所含的鋅指結構為C2-HC(C-X7-C-X23-H-X-C),屬于第III類;其他18個家族成員具有一個WRKY域,所含鋅指結構為C2-H2(C-X4-5-C-X22-23-HXH),屬于第II類(圖1)。ArWRKY蛋白序列氨基酸長度從100個到623個不等,蛋白大小最小為11 445.87,最大為66 584.31。ArWRKY所含的保守結構域基序除了常見的WRKYGQK,還含有WRKYGKK、WRKYGRV或WRKYGEK(表4)。

表4 ArWRKY蛋白信息Table 4 ArWRKY protein information

圖1 ArWRKY核心序列比對圖Fig.1 ArWRKY core sequence alignment diagram
為了解ArWRKY的保守結構域信息,運用MEME在線網站預測保守基序,設置了5個保守域(Motif)為條件進行分析,結果見圖2。Motif 1與Motif 3雖屬于不同的保守基序,但均含有“WRKY”4個氨基酸殘基,且所有ArWRKY中均含Motif 1或Motif 3,說明在ArWRKY中,色氨酸(W)、精氨酸(R)、賴氨酸(K)和酪氨酸(Y)是核心序列中必不可少的,這也符合WRKY轉錄因子的結構特征與命名規則。Motif 1和Motif 3屬于不同結構域暗示著在含有2個WRKY域的第一類ArWRKY中,2者可能具有不同的功能。通過分析可以發現Motif 2與Motif 4屬于鋅指結構,大部分ArWRKY中Motif 2與Motif 4共同存在,且Motif 4在Motif 2的下游,也符合WRKY轉錄因子中鋅指結構的構造。Motif 5同樣是鋅指結構,但只在ArWRKY6與ArWRKY11這2個第I類WRKY中出現,且分布在Motif 3的下游,說明在ArWRKY中每一段保守序列WRKY的下游可能都存在一個鋅指結構與之對應。但在ArWRKY2、ArWRKY10、ArWRKY18和ArWRKY21中只存在WRKY保守序列卻沒出現鋅指結構,可能是由于蛋白序列不完整造成的。另外,ArWRKY14所含有的鋅指結構為C-X7-C- X24-H-X-C,與文獻報道的C2-HC類型為C-X7-C-X23-H-X-C構造相差1個氨基酸殘基。

圖2 ArWRKY保守域預測Fig.2 ArWRKY conservative domain prediction
為了進一步篩選可能參與金線蓮胚胎發育的ArWRKY,利用NCBI數據庫下載得到其他物種中已經報道的對種子形成、發育或萌發等方面具有調控作用的WRKY蛋白:AtWRKY2(NP_200438.1)、AtWRKY34(NP_194374.1)、AtWRKY43(AEC10646.1)、AtWRKY30(NP_568439.1)、AtWRKY10(NP_175956.1)、TTG_X1(NP_181263.2)、TTG_X2( NP_001078015.1)、 TTG_X3(NP_001323504.1);GhWRKY22(AIE43820.1)、GhWRKY17_X1(AIE43818.1)、GhWRKY17_X2(AJT43302.1)、GhWRKY17_X3(ADW82100.1);VvWRKY20_X1(XP_010647039.1)、VvWRKY20_X2( XP_019074038.1) 、 VvWRKY20_X3( XP_019074039.1) 、 VvWRKY20_X4(XP_010647041.1)、VvWRKY30(ALM96663.1);OsWRKY78( DAA05640.1); ThWRKY7(AFS64072.1);CsWRKY71(NP_001292668.1);TaWRKY71( ABN43177.1); PcWRKY33(AYN74370.1)。
采用MAGA 7.0軟件NJ法構建系統進化樹(圖3)。結果發現ArWRKY可以聚為3大類,第1大類為ArWRKY2、ArWRKY12、ArWRKY14、ArWRKY18與ArWRKY22;第2大類為ArWRKY3、ArWRKY4、ArWRKY6、ArWRKY8、ArWRKY11、ArWRKY15與ArWRKY20,其余ArWRKY為第3類。同時大部分ArWRKY與已報道的WRKY轉錄因子在基因家族的進化起源和基因重復上比較相近,具有相近起源的蛋白往往具有較為相似的結構與較為相近的功能作用,因此,綜合考慮了系統進化樹的分支情況及ArWRKY基因CDS序列的完整性,篩選得到ArWRKY1、ArWRKY5、ArWRKY6、ArWRKY8、ArWRKY9、ArWRKY11、ArWRKY13、ArWRKY19、ArWRKY20與ArWRKY23用于后續的研究。

圖3 ArWRKY系統進化樹Fig.3 ArWRKY phylogenetic tree
利用qRT-PCR對ArWRKY1、ArWRKY5、ArWRKY6、ArWRKY8、ArWRKY9、ArWRKY11、ArWRKY13、ArWRKY19、ArWRKY20與ArWRKY23基因在金線蓮不同發育時期、不同組織部位的表達量進行檢測(圖4),進一步確定ArWRKY可能存在的功能,以篩選與金線蓮胚胎發育相關的基因。通過時空特異性表達分析可以發現,10條ArWRKY在金線蓮不同部位及不同時期的花中均有表達,但表達模式不盡相同。ArWRKY1、ArWRKY6、ArWRKY9、ArWRKY11與ArWRKY20的表達量隨著金線蓮花的發育呈下降趨勢;ArWRKY5、ArWRKY8與ArWRKY23的表達量隨著花的發育先上升后下降;ArWRKY13呈上升趨勢;ArWRKY19先下降再上升。結合金線蓮開花期不同組織表達分析顯示,ArWRKY5與ArWRKY20在不同時期的花中表達量均顯著高于開花期的根、莖、葉,而ArWRKY13與ArWRKY23在不同時期的花中表達量均低于開花期的根、莖、葉。說明ArWRKY5與ArWRKY20對金線蓮的花的形成及發育可能具有重要的調控作用。ArWRKY13與ArWRKY23與金線蓮開花呈負相關,說明它們也可能參與了金線蓮花的形成與發育。

圖4 ArWRKY基因在不同組織的表達Fig.4 Expression of ArWRKY gene in different tissues
時空表達模式結果顯示,ArWRKY5與ArWRKY20在金線蓮花中的表達量顯著高于根、莖和葉,暗示它們可能參與了金線蓮的花形成及發育過程。為進一步研究ArWRKY5與ArWRKY20的功能,本課題組以金線蓮轉錄組測序拼接得到的CDS序列設計引物,成功從金線蓮中克隆得到ArWRKY5與ArWRKY20(圖5)。測序結果顯示ArWRKY5為1149 bp(圖6),與轉錄組數據中的序列一致;而ArWRKY20的CDS序列為600 bp(圖7),雖然編碼的蛋白包含了WRKY基本的結構域,但是與轉錄組數據的序列相比中間部分丟失了一段60 bp的核苷酸序列,猜測可能是轉錄組測序的結果拼接過程出錯或者發生mRNA可變剪接。

圖5 ArWRKY5和ArWRKY20 PCR產物電泳圖Fig.5 Electrophoresis of ArWRKY5 and ArWRKY20 PCR products

圖6 ArWRKY5 CDS序列及其對應的氨基酸圖Fig.6 ArWRKY5 CDS sequence and its corresponding amino acid map

圖7 ArWRKY20 CDS序列及其對應的氨基酸圖Fig.7 ArWRKY20 CDS sequence and its corresponding amino acid map
利用在線網站對ArWRKY5與ArWRKY20信號肽、蛋白的糖基化位點、磷酸化位點、蛋白激酶結合位點和蛋白親/疏水性進行預測(圖8、9)。發現ArWRKY5蛋白不存在信號肽,雖然預測圖上出現可能存在的2個糖基化位點,但是因為沒有信號肽的蛋白質不太可能暴露于N-糖基化機制下,因此ArWRKY5應不存在糖基化位點;ArWRKY5呈親水性,存在37個磷酸化位點,其中27個是絲氨酸,10個是酪氨酸。預測結果發現ArWRKY20同樣不存在信號肽和糖基化位點,且為親水性蛋白,存在18個磷酸化位點,其中11絲氨酸、3個酪氨酸、4個蘇氨酸。

圖8 ArWRKY5蛋白信號肽 (A)、糖基化位點 (B)、親水性/疏水性 (C) 及磷酸化位點 (D) 預測Fig.8 ArWRKY5 protein signal peptide (A), glycosylation site (B), hydrophilicity/hydrophobicity (C) and phosphorylation site (D) prediction

圖9 ArWRKY20蛋白信號肽 (A)、糖基化位點 (B)、親水性/疏水性 (C) 及磷酸化位點 (D) 預測Fig.9 ArWRKY20 protein signal peptide (A), glycosylation site (B), hydrophilicity/hydrophobicity (C) and phosphorylation site (D) prediction
利用GOR4進行蛋白的二級結構預測,結果如圖10、11所示,可以發現ArWRKY5和ArWRKY20均由α-螺旋(alpha helix)、延伸鏈(extended strand)、無規則卷曲(random coil)所組成的,并且分布于整個蛋白。其中ArWRKY5中α-螺旋占30.89%,延伸鏈占14.14%,無規則卷曲占54.97%;ArWRKY20中α-螺旋占22.16%,延伸鏈占13.07%,無規則卷曲占64.32%。蛋白三級結構預測見圖11。

圖10 ArWRKY5和ArWRKY20二級結構預測Fig.10 Predicted secondary structure of ArWRKY5 and ArWRKY20

圖11 ArWRKY5和ArWRKY20三級結構預測Fig.11 Prediction of tertiary structure of ArWRKY5 and ArWRKY20
金線蓮自然結實率低、種子敗育率高和幼苗死亡率高等原因是導致野生金線蓮資源匱乏的重要因素。金線蓮的種胚結構不健全且不含胚乳,由于長期的無性繁殖,引起了金線蓮種質退化、抗逆性差等現象,導致產量和品質下降,最終影響金線蓮的藥材質量[5]。因此解決金線蓮胚胎發育問題是金線蓮優良品種選育的目標之一。篩選對金線蓮胚胎發育具有調控作用的ArWRKY轉錄因子對于明確金線蓮種子胚胎發育的分子機制具有重要意義。
為從金線蓮中篩選調控胚胎發育相關的WRKY轉錄因子,本研究利用Illumina結合PacBio技術對金線蓮進行轉錄組測序,首次從金線蓮轉錄組數據庫中篩選得到23條ArWRKY序列。根據ArWRKY核心序列比對結果與WRKY蛋白結構類型將ArWRKY分為3大類[20]。將ArWRKY與其他物種中已知功能的WRKY一同構建進化樹,發現:ArWRKY6與AtWRKY10和AtTTG2_X1相距最近;ArWRKY8與AtTTG2_X1相距最近。已報道AtWRKY10能促進擬南芥種子的胚乳發育,并且通過調控種子腔的發育來影響擬南芥種子的大小[21];AtTTG2則能調控擬南芥種子種皮中單寧物質和粘液的生成,從而影響種皮發育[11]。這說明ArWRKY6和ArWRKY8可能與金線蓮種子大小、胚乳發育和種皮發育相關。除此之外,ArWRKY9與ArWRKY13和VvWRKY20_X2相距最近;ArWRKY11與AtWRKY43相距最近。VvWRKY20參與了葡萄胚珠發育過程,缺少VvWRKY20的調控作用會導致葡萄胚珠敗育[12];AtWRKY43可以調控擬南芥種子中的脂肪動員過程,促進糖類的積累,從而增強種子的發芽能力[10]。這些結果也暗示ArWRKY9、ArWRKY11和ArWRKY13可能具有同樣或類似的功能。另外,ArWRKY1與GhWRKY17_X2的分支相距最近;ArWRKY5與GhWRKY17_X3相距最近;ArWRKY19與AtWRKY34和GhWRKY22相距較近;ArWRKY20與VvWRKY20_X3相距較近;ArWRKY23與GhWRKY17_X2和ThWRKY7相距最近。聚類越近的蛋白可能在遺傳關系上越密切,進化樹的聚類分析結果為進一步篩選調控金線蓮胚胎發育的ArWRKY提供了一定參考依據。
本研究對ArWRKY1、ArWRKY5、ArWRKY6、
ArWRKY8、ArWRKY9、ArWRKY11、ArWRKY13、ArWRKY19、ArWRKY20與ArWRKY23在金線蓮的不同組織部位及金線蓮不同時期花中的表達量進行檢測。發現23條ArWRKY在金線蓮的不同組織與不同花期中表達模式不盡相同。其中,ArWRKY5和ArWRKY20在金線蓮不同時期的花中都顯著高于根、莖、葉,因此進一步確定了ArWRKY5和ArWRKY20可能存在調控金線蓮花發育的功能,進而影響金線蓮的胚胎形成及種子發育。為驗證ArWRKY5和ArWRKY20的功能,本課題組利用金線蓮轉錄組數據庫的Unigenes克隆得到ArWRKY5和ArWRKY20的CDS序列,其中ArWRKY20與轉錄組數據庫相比中間減少了60 bp大小的序列,猜測是由于轉錄組數據拼接時出錯,功能上是否存在差異還有待進一步研究。本研究首次對金線蓮ArWRKY蛋白家族的組成、分類、進化、基序特點及結構特征進行了分析,并篩選到在花中顯著高表達的ArWRKY5和ArWRKY20,成功克隆得到ArWRKY5與ArWRKY20的CDS序列,為后續的功能研究奠定基礎。
利益沖突所有作者均聲明不存在利益沖突