周軍輝,鬲曉敏,李莎莎,陳 塵,賈 蕓,張明英,柏國清*
1. 陜西省西安植物園(陜西省植物研究所),陜西植物資源保護與利用工程技術研究中心,陜西 西安 710061
2. 陜西中醫藥大學藥學院,陜西省中醫藥管理局“秦藥”研發重點實驗室,陜西 西安 712046
華細辛(細辛)AsarumsieboldiiMiq.隸屬于馬兜鈴科(Aristolochiaceae)細辛屬AsarumL.,為一年生或多年生草本,主要分布于我國的山東、安徽、浙江、江西、河南、湖北、陜西、四川、遼寧等省,以及俄羅斯、日本等地,生于山坡林下、山溝土質肥沃而陰濕地[1]。細辛作為傳統中藥用于治療多種疾病[2],全草皆可入藥,最早出現于東漢(公元25~220 年)編纂的《神農本草經》[3]。細辛藥材含有豐富的化學成分,主要包括:甲基丁香酚、黃樟腦和其他揮發性成分(雌二醇、桉樹腦和α-松油醇等)[4]。臨床多用于治療咳嗽、呼吸困難、頭痛、風濕關節痛、鼻竇炎和牙痛等疾病[5-8]。現代藥理學研究發現細辛在鎮靜催眠、鎮痛、麻醉、解熱、強心及解痙抑菌等方面具有重要的作用[9]。
華細辛A.sieboldiiMiq. 和遼細辛A.heterotropoidesFr. Schmidt var.mandshuricum(Maxim.) Kitag. 為中藥細辛的基源植物[10],前者主產于我國陜西、河南、四川等地,后者主要分布于黑龍江、遼寧等地區[11]。目前,關于細辛的研究主要集中于化學成分[12-13]、無機元素[14]以及藥理活性[15]等方面。研究表明,華細辛和遼細辛在上述方面均存在差異性[13]。然而,關于細辛植物葉綠體基因組組裝、基因組特征和系統進化分析等相關研究報道較少。
葉綠體是綠色植物和真核藻類特有的一種亞細胞器,在光合作用過程中起重要作用[16],同時也是光合作用的主要場所,在這一過程中,葉綠素可以搜捕太陽中的能量,并將其轉化并儲蓄在ATP 和NADPH分子中,然后從水中釋放氧氣[17]。隨后,ATP 和NADPH 被用來從二氧化碳中合成有機分子[18]。此外,葉綠體還在氨基酸、脂質、脂肪酸、維生素植物激素的生物合成中發揮重要作用[19]。葉綠體基因組(chloroplas genome,cp genome)一般為環狀DNA少數為線性分子[20];在細胞中以多拷貝的形式存在,其長度是120~170 kb。葉綠體在絕大多數被子植物中是高度保守的母系遺傳細胞器,不參與重組。因此,在植物系統進化關系和遺傳多樣性等研究方面具有重要的意義[21]。
近年來,隨著測序技術的不斷改進,測序平臺的不斷升級, 一系列組裝和注釋軟件如NOVOPlasty[22]、GetOrganelle[23]等的開發與更新,很多珍稀瀕危藥用植物葉綠體基因組已分析公布,如紅豆杉Taxuswallichianavar.chinensis(Pilger)Florin[24]、人參PanaxginsengC. A. Meyer[25]、紫斑牡丹Paeoniarockii(S. G. Haw & Lauener) T. Hong &J. J. Li[26]、石斛DendrobiumnobileLindl.[27]、銀杏GinkgobilobaLinnaeus[28]和三葉崖爬藤Tetrastigma hemsleyanumDiels et Gilg[29]等。本研究以華細辛和遼細辛為研究對象,采用高通量測序和生物信息學技術組裝完整的葉綠體基因組序列。明確細辛葉綠體基因組結構特征,反向重復區(inverted repeat region,IR)邊界特征;基于完整的質體基因組和蛋白編碼數據集構建馬兜鈴科的系統發育關系,驗證該物種在科級系統發育中的親緣關系,為細辛種質資源的鑒定、開發和利用提供理論基礎。
用于本研究的遼細辛和華細辛鮮葉樣品分別采集于遼寧省本溪和陜西省華陰市金巖溝(124°12′3.410″E,41°06′53.660″N;109°57′32. 8758″E,34°24′21.5478″N),由張明英副教授鑒定為華細辛A.sieboldiiMiq.和遼細辛A.heterotropoidesFr. Schmidt var.mandshuricum(Maxim.) Kitag.的葉。材料憑證標本現存放在陜西省植物研究所標本館,標本編號分別為XBGH-19-BGQ136 和XBGH-19-BGQ317。
葉片帶回實驗室用清水沖洗,液氮速凍后置于?80 ℃冰箱備用。細辛及其近緣物種葉綠體基因組信息和核苷酸序列數據來自NCBI 數據庫,見表1。采用改良的十六烷基三甲基溴化銨(CTAB)方法從硅膠干燥的葉組織中提取總基因組DNA[30],并通過瓊脂糖凝膠電泳評估以確認DNA 的質量。質檢合格后使用Illumina Novaseq 6000 平臺進行測序。由北京諾禾致源科技股份有限公司完成相關建庫測序。

表1 物種基本信息Table 1 Plant samples used in this study
首先,本研究使用NGSQCToolkit_v2.3.3[26]工具對Illumina 原始讀數進行過濾,以去除短于50 bp的序列和適配器序列。隨后以完整的庫頁細辛葉綠體基因組(MW526993)作為參考,使用GetOrganelle(https://github.com/Kinggerm/GetOrganelle)[23]過濾配對末端讀數并組裝成完整的質體基因組。使用Perl 腳本質體基因組注釋器PGA[32]和DOGAM(http://dogma.ccbb.utexas.edu/)[33]對基因組進行了自動注釋,并手動檢查和校正。最后,葉綠體基因組物理圖譜使用在線工具Chloroplot[34](https://irscope.shinyapps.io/Chloroplot/)生成。
IR 區是葉綠體基因組中最保守的區域,但IR區邊界區域仍存在細微的變化,其邊界處的收縮和擴張是常見的進化事件,是影響葉綠體基因組大小的主要因素之一[35]。在植物進化過程中,IR/SC 邊界不同程度的擴張和收縮導致了邊界和基因組長度的多樣性[36]。本研究根據注釋的信息,使用IRscope(https://irscope.shinyapps.io/irapp/)對15 個馬兜鈴科物種葉綠體基因組的大單拷貝區(large single copy region,LSC)/反向重復區b(inverted repeat region b, IRb)/小單拷貝區(small single copy,SSC)/反向重復區a(inverted repeat region,IRa)連接區域進行比較分析。
為確定細辛在馬兜鈴科的系統發育位置,從NCBI 細胞器基因組資源數據庫下載馬蹄香屬SarumaOliv.、馬兜鈴屬AristolochiaL.和細辛屬AsarumL.的完整質體基因組序列。共計11 個物種, 分別是馬蹄香SarumahenryiOliver( MG520100 )、 馬兜鈴AristolochiadebilisSiebold & Zuccarini(NC_036153)、北馬兜鈴AristolochiacontortaBunge(NC_036152)、海南馬兜鈴Aristolochiahainanensis(Merr.) X. X. Zhu, S.Liao & J. S. Ma(NC_061937)、廣西馬兜鈴Aristolochiakwangsiensis(Chun & F. C. How ex C.F. Liang) X. X. Zhu, S. Liao & J. S. Ma(NC_052833)、庫頁細辛AsarumheterotropoidesF.Schmidt(MW526993)、AsarummaculatumJ. D.Hooker ( NC_058740 )、 長毛細辛Asarum pulchellumHemsley(MZ440306)、漢城細辛Asarumsieboldiif.seoulense(NC_037190)、AristolochiabracteolataLam.(MT130705)和AsarummisandrumB. U. Oh & J. G. Kim( NC_058739 )。 此外, 竹葉胡椒Piper bambusifoliumY. C. Tseng (NC_062129)和假蒟PipersarmentosumRoxburgh(MZ958833)被用作外群(表1)。使用軟件MAFFT(https://mafft.cbrc.jp/ alignment/server/)進行質體基因組序列比對。通過在線軟件CIPRES(https://www.phylo. org/portal2/login!input.action ) 構建具有 1000 個Bootstrap 的最大似然法(maximum likelihood,ML)系統發育樹。最后使用FigTree 軟件對結果進行可視化及編輯。
華細辛和遼細辛葉綠體基因組經測序分別獲得17 064 512 和17 118 521 raw reads,經過數據過濾、組裝拼接后均獲得完整的環狀四分體結構葉綠體基因組,序列總長度分別為160 521 bp 和160 555 bp,由LSC 區(長度分別為89 359、89 353 bp)、SSC 區(16 729、16 728 bp)以及2 個反向IRs(27 209、27 237 bp)組成(圖1)。華細辛和遼細辛葉綠體基因組的 GC 含量均為38.5%,其LSC、SSC、IRs 區域的GC 含量依次分別為36.8%、33.3%、43.1%和36.7%、33.4%、43.0%(表2)。

圖1 細辛葉綠體基因組圖譜Fig. 1 Map of Asari Radix et Rhizoma chloroplast genome

表2 細辛葉綠體基因組信息統計Table 2 Chloroplast genome information statistics of Asari Radix et Rhizoma
華細辛和遼細辛葉綠體基因組均注釋到128 個基因,包括85 個蛋白編碼基因(PCGs)、34 個轉運RNA(tRNA)以及8 個核糖體RNA(rRNA)(表2)。LSC 包括55 個PCGs 和19 個tRNA,SSC 包括11 個PCGs 和1 個tRNA。另外,7 個PCGs(rpl2、rpl23、ycf2、ycf15、ndhB、rps7和rps12),7 個tRNA(trnI-CAU、trnL-CAA、trnV-GAC、trnI-GAU、trnA-UGC、trnR-ACG和trnN-GUU)以及所有的rRNA均分布于IRs 區域(表2)。
植物葉綠體基因組主要編碼3 類基因:與光合作用有關的基因,與轉錄翻譯有關的遺傳系統基因以及與生物合成有關的基因。其中,蛋白質編碼基因中與自我復制相關基因rRNA 基因和tRNA 基因外(表3),還包括11 個核糖體小亞基基因、9 個核糖體大亞基基因和3 個RNA 聚合酶亞基基因;與光合作用相關的基因41 個;此外,還包括4 個其他功能基因及5 個未知功能基因(表3)。

表3 細辛植物葉綠體基因組中存在的基因Table 3 List of genes present in chloroplast genomes of Asari Radix et Rhizoma
通過比較13 個馬兜鈴科葉綠體基因組中的IR/SC 邊界信息(圖2),結果顯示,馬兜鈴科各物種邊界具有較為明顯的差異,A.pulchellum、A.misandrum、A.maculatum和A.sieboldii的LSC 和IRb 區向rpl16擴張,A.hainanensis和S.henryi的LSC 和IRb 區向rps19擴張。同時SSC 區域與兩側IR 區交界處有部分跨界基因,IR/SSC 邊界上A.pulchellum的ndhF基因發生了跨界,SSC/IR 邊界上除了S.henryi、A.pulchellum、A.misandrum、A.maculatum和A.sieboldivar.seoulense,其他物種的ycf1基因均發生了跨界。IR/LSC 邊界上物種A.debilis、A.kwangsiensis和A.contorta的trnH-GUG基因發生了跨界,A.sieboldii的rpl23基因發生了跨界,其他物種均無跨界基因。

圖2 15 個馬兜鈴科植物葉綠體基因組LSC、SSC 和IR 邊界比較Fig. 2 Comparison of LSC, SSC and IR borders among 15 chloroplast genome of Aristolochiaceae
細辛及11 種近緣物種植物葉綠體基因組的大小介于158 234~193 356 bp,其中A.bracteolata的葉綠體基因組序列最短(158 851 bp),A.sieboldiivar.seoulense的葉綠體基因組序列最長(193 356 bp)(表4)。華細辛和遼細辛葉綠體基因組序列長度為160 521~160 555 bp,介于13 個馬兜鈴科植物的葉綠體基因組長度范圍之內。細辛及13 種近緣物種植物葉綠體基因組的GC 含量在30.8%~43.5%,其中P.bambusifolium的GC 含量最低(30.8%),A.hainanensis的GC 含量最高(43.5%)。華細辛和遼細辛葉綠體基因組的GC 含量均為38.5,介于13 個馬兜鈴科植物的葉綠體基因組GC 含量之內。同時,利用Geneious 軟件分別獲得華細辛和遼細辛及馬兜鈴科13 種近緣植物的LSC 區、SSC 區及IR 區序列信息,結果顯示,LSC 區的序列長介于88 643~96 554 bp,S.henryiLSC 區最短(88 643 bp),A.sieboldiivar.seoulenseLSC 區最長(96 554 bp),2 個細辛樣本LSC 區的序列長度分別為89 359 bp 和89 353 bp。SSC 區的序列長度介于8921~21 118 bp。其中,A.pulchellum的SSC 區最短(8921 bp),A.contorta最長為(21 118 bp)。華細辛和遼細辛SSC 區的序列長度分別為16 729 bp 和16 728 bp。IR 區的序列長度介于25 175~48 403 bp,其中,華細辛和遼細辛IR 區的序列長度分別為27 224 bp 和27 237 bp(表4)。

表4 質體基因組的特征Table 4 Characteristics of plastid genome
本研究以假蒟和竹葉胡椒作為外類群,選取馬兜鈴科13 個物種的葉綠體全基因組序列及蛋白編碼序列,通過ML 對其進行系統發育分析(圖3、圖4)。基于2 個不同的數據集獲得的系統發育結果一致,表明馬兜鈴科的物種可以分為2 個大的亞支系,分別對應于馬兜鈴屬、細辛屬和馬蹄香屬且具有100%支持率。馬蹄香屬和細辛屬系統發育關系近緣,構成一個單系。廣西馬兜鈴、海南馬兜鈴、A.bracteolata、北馬兜鈴和馬兜鈴聚為一支。庫頁細辛、遼細辛和華細辛聚為一支,并與漢城細辛、A.maculatum、A.misandrum和長毛細辛構成的分支互為姐妹關系。

圖3 基于葉綠體全基因組構建的系統發育樹Fig. 3 Phylogenetic tree constructed based on complete chloroplast genomes

圖4 基于蛋白編碼序列構建的系統發育樹Fig. 4 Phylogenetic tree constructed based on protein coding sequences
細辛是一種傳統藥材,在許多國家已被廣泛用于治療牙痛、頭痛、局部麻醉和口瘡性口炎等疾病,具有重要的經濟和藥用價值。本研究完成了藥用植物細辛葉綠體基因組的測序、組裝和注釋,并對其結構、GC 含量等進行了分析。結果顯示,新測序的華細辛和遼細辛在序列長度上基本一致,總長度分別為160 521 bp 和160 555 bp,均介于已發表的細辛屬植物的序列長度之間[37]。華細辛和遼細辛葉綠體基因組均具有典型的四分體結構,包括一對IR 區域(27 209~27 237 bp)、LSC 區域(89 353~89 359 bp)和SSC 區域(16 728~16 729 bp)。已有研究表明,在大多數被子植物中,葉綠體基因組長度通常介于120~180 kb,但是一些藻類的葉綠體基因組的大小差異較大,如寄生性綠藻Helicosporidiumsp. ex Simulium jonesi 葉綠體基因組序列僅有37.5 kb,是目前發現最小的葉綠體基因組[38]。大多數植物的葉綠體基因組結構和序列相當保守,重復片段較少,除部分列當科和蘭科寄生植物的葉綠體基因組部分基因發生丟失,且具有較快的進化速率[39]。
華細辛和遼細辛均注釋到128 基因,與已公開報道的細辛屬葉綠體基因結果相似[37]。兩者GC 含量均為38.5%,較高于大多數被子植物葉綠體基因組的GC 含量(31.0%~38.0%)[40],IR 區域的GC含量最高,其原因可能由于rRNA 基因中較少出現A/T 核苷酸[41]。華細辛和遼細辛葉綠體基因組序列整體上高度相似,但與馬兜鈴科其他13 個物種的葉綠體基因組IR 邊界仍存在明顯差異,主要表現為LSC/IRb 邊界(JLB),SSC/IRb 邊界(JSB)、SSC/IRa 邊界(JSA)和LSC/IRa 邊界(JLA)的側翼基因不同。該現象是由于馬兜鈴科內物種之間葉綠體基因組中基因數量不同所造成,因此,推測邊界區域的擴張和收縮可能造成葉綠體基因組序列長度的變化[42]。
近年來,許多完整的質體基因組序列已測序,以解決相關類群之間的分類問題。質體基因組為陸生植物的分類和重建系統發育提供了寶貴的信息。在大多數被子植物中,質體基因是母系遺傳的(通過種子轉移),而核基因是雙親遺傳的(通過種子和花粉轉移)[43]。因此,利用葉綠體基因組可為解決細辛屬內植物的分類問題提供參考,但是已發表的細辛屬植物葉綠體基因組數據依然有限。在本研究中,根據完整的質體基因組和蛋白編碼序列,重建了馬兜鈴科物種系統發育關系。RAxML 分析結果顯示,基于2 個不同的數據集獲得相同的拓撲樹,所有的節點都具有很高的自舉值(圖3、4)。這些結果表明,馬兜鈴科的物種可以分為2 個大的亞支系,且細辛屬與馬蹄香屬具有較緊密的親緣關系。細辛屬聚成一個支持率非常高的單系類群,庫頁細辛、遼細辛和華細辛聚為一支,并與漢城細辛、A.maculatum、A.misandrum和長毛細辛分支構成姐妹關系。本研究首次對華細辛和遼細辛進行了比較完整葉綠體基因組分析,不僅豐富了細辛屬植物遺傳資源,同時為該屬物種分子鑒定、系統發育以及野生資源保護與開發利用等研究提供理論基礎。
利益沖突所有作者均聲明不存在利益沖突