李卓蔚,邱 遷,郎佳琪,吳應梅*,杜慧慧,周 濃*
尖刀唇石斛和翅梗石斛葉綠體全基因組分析
李卓蔚1, 2,邱 遷1,郎佳琪1, 2,吳應梅1*,杜慧慧1,周 濃1, 2*
1. 重慶三峽學院 生物與食品工程學院,重慶 404120 2. 三峽庫區道地藥材綠色種植與深加工重慶市工程實驗室,重慶 404120
測定尖刀唇石斛和翅梗石斛葉綠體基因組,分析其序列特征并鑒定石斛屬植物物種間親緣關系。利用Illumina Hisep 2 500測序平臺對尖刀唇石斛和翅梗石斛進行二代測序,經組裝、注釋后得到2條完整的葉綠體全基因組序列,采用生物信息學方法分析其序列結構及石斛屬的系統發育關系。尖刀唇石斛的葉綠體全基因組總長為159 786 bp,總GC含量為37.2%,共注釋得到131個基因,包括88個蛋白編碼基因、37個tRNA基因和6個rRNA基因;翅梗石斛的葉綠體全基因組總長為159 652 bp,總GC含量為37.1%,共注釋得到131個基因,包括88個蛋白編碼基因、37個tRNA基因和6個rRNA基因。尖刀唇石斛和翅梗石斛分別檢測到112和127個簡單重復序列(SSR),二者編碼亮氨酸的密碼子數量最多,編碼色氨酸的密碼子數量最少。系統發育樹顯示,尖刀唇石斛、反瓣石斛、翅梗石斛、梳唇石斛和長距石斛聚為一支,翅梗石斛與梳唇石斛和長距石斛的親緣關系十分相近,支持率達到100%。對石斛屬2種植物的葉綠體基因組結構和系統發育關系進行了分析,該研究結果將為石斛屬藥用植物的準確鑒定、開發利用及其資源保護提供科學依據。
尖刀唇石斛;翅梗石斛;藥用植物;葉綠體全基因組;親緣關系
石斛屬Sw.為多年生草本植物,作為蘭科(Orchidaceae)第2大屬,在全球有1 500多個原生種,廣泛分布于亞洲熱帶及亞熱帶地區[1]。產于中國的石斛屬植物共有76種,包含2個變種,主要分布于西南和華南地區,尤其以云南省南部地區居多[2]。大部分石斛屬植物具有極高的藥用價值,主要以莖入藥,作為傳統滋補中藥在中國和印度已有上千年的藥用歷史[3]。石斛主要含有多糖、酚類、萜類、生物堿等100多種化合物[4-5],通過對其藥理活性的研究,證明了藥材石斛具有增強免疫、降血糖、厚腸胃、護肝、抗腫瘤、抗氧化衰老、抗炎抑菌、抗血小板凝集、抗誘變、生津止渴、保護神經系統等功效[6-12]。此外,由于花色鮮艷、花枝優雅、花期長等特點,石斛常被作為一種觀賞花卉,被喻為“四大觀賞洋花”之一[13-14]。尖刀唇石斛Lindl.主要分布于云南騰沖、勐臘等地區[2],花色鮮艷,極具觀賞價值,其莖常被作為藥材使用,具有調脂、抗炎、抗氧化等功效[15-16];翅梗石斛Rchb. f主要分布于云南騰沖、思茅等地區[2],是一種藥食同源的植物,具有抗腫瘤、抗凝血等功效[17-18]。近些年來,由于石斛的市場需求量劇增,大量尖刀唇石斛和翅梗石斛被采挖,導致其野生資源逐漸稀缺,目前已被列入《國家一級保護植物名錄》和《世界自然保護聯盟瀕危物種紅色名錄》。雖然,不同種類的石斛作為藥材時,常常被相互替代使用,但不同基原物種間的藥用成分含量、藥理活性及功效上仍具有很大的差異性。因此,能否對不同石斛植物正品和混淆品進行準確的鑒定,保證合理規范用藥,該問題還有待解決。
石斛屬植物種系間關系復雜,目前有關該屬植物的分類和進化研究還存在較大爭議,僅憑形態和解剖學特征分析已經難以滿足屬內物種的分類需求[19]。DNA條形碼技術是一種常用的物種鑒定方法,采用保守的DNA片段,快速準確地對物種進行分析鑒定,此法在物種鑒定方面已被廣泛采用[12, 20]。DNA通用條形碼(ITS、K、L、H-A)雖然可以有效鑒定大部分石斛屬植物[21-24],但基于目標基因的選擇與數量等問題的影響,其分析結果往往存在較大分歧。隨著測序技術的更新換代,葉綠體全基因序列的測定和比對為物種鑒定提供了新的參考[25]。葉綠體是多數自養生物特有的器官,具有獨立的遺傳物質,葉綠體基因組與核基因組和線粒體基因組相比,基因組較小,序列容易獲得,且葉綠體基因組依賴于母系遺傳,基因組成和結構比較保守[26]。與DNA通用條形碼相比,葉綠體基因組具有更加豐富的遺傳變異信息和更高的物種分辨能力,因此,以葉綠體全基因組為條形碼將為石斛屬這類親緣關系復雜的物種提供更加準確有效的鑒定手段。目前,已有大量學者對不同石斛屬植物葉綠體基因組的全長序列進行測定,并將多種石斛的葉綠體基因序列進行比對,探究其物種進化及其種間親緣關系[25,27]。但對于尖刀唇石斛和翅梗石斛的葉綠體基因測定還未見報道。
本研究采用二代高通量測序技術對尖刀唇石斛和翅梗石斛的葉綠體全基因組進行測序、組裝及注釋,獲得其葉綠體基因組的全長序列信息。采用生物信息學方法分析其序列特征,并與其他近緣物種的葉綠體基因序列進行比對,探討石斛屬物種間的親緣關系,這也將為我國石斛藥材正品和混淆品基原植物的分子鑒定提供參考依據。
本研究中用于分子材料研究的尖刀唇石斛和翅梗石斛新鮮葉片均采自海拔為1 640 m的云南省保山市騰沖市(25°02′05.3″ N,98°49′09.7″ E)。樣本保存于重慶三峽學院植物標本館,樣本憑證號為ZN15124、ZN15125,經重慶三峽學院周濃教授分類學鑒定為尖刀唇石斛Lindl.和翅梗石斛Rchb. f.。
將尖刀唇石斛和翅梗石斛新鮮葉片采用改良的CTAB法提取總DNA,具體參照江媛等[28]方法進行,通過瓊脂糖凝膠電泳檢測DNA質量,采用Illumina Hiseq 2500平臺對檢測合格的總DNA進行二代測序,測序工作由上海元莘生物醫藥科技有限公司完成。
使用Trimmomatic v.0.32將序列中的低質量數據過濾掉,再使用GetOrganelle v1.6.4軟件對過濾后的reads進行組裝,得到高質量的contigs,并使用Circlator(V.2.0.1)軟件檢測reads映射的覆蓋度和contigs各連接處,以檢測組裝的正確性。檢測無誤后,使用Cpgavas2軟件對組裝好的葉綠體全基因組進行注釋,然后將注釋完成的序列提交到GenBank數據庫,獲得尖刀唇石斛和翅梗石斛的登錄號分別為OM049526和OL891650。使用在線工具OGDRAW(https:// chlorobox.mpimp-golm. mpg. de/OGDraw.html)繪制葉綠體全基因組的環狀示意圖。
采用MISA在線工具(https://webblast. ipk-gatersleben.de/misa/)對葉綠體全基因組樣本的簡單重復序列位點(simple sequence repeat,SSR)進行檢測,將參數設置為:單核苷酸重復次數≥10,二核苷酸重復次數≥5,三核苷酸、四核苷酸、五核苷酸、六核苷酸重復次數≥3,2個SSR之間的距離≥100 bp。采用CodonW軟件對葉綠體全基因組樣本進行密碼子使用偏好性分析(relative synonymous codon usage,RSCU),參數參考系統默認值。
從NCBI(https://www.ncbi.nim.nih.gov)中下載8種分屬于不同組的石斛屬葉綠體全基因組序列,分別為長距石斛、束花石斛、梳唇石斛、反瓣石斛、景洪石斛、西疇石斛、重唇石斛和竹枝石斛,與尖刀唇石斛和翅梗石斛的葉綠體基因序列進行比較,分析不同石斛之間的序列差異性。使用在線軟件IRscope(https://irscope.shinyapps.Io/irapp/)進行SC/IR邊界收縮和擴張分析;使用DnaSP軟件進行核苷酸變異性分析,窗口長度設置為600 bp,步長設置為200 bp,篩選出高變異位點;使用基因組在線分析軟件mVISTA(http://genome.lbl. gov/vista/mvista)中的Shuffle-LAGAN模式,以尖刀唇石斛序列為參照進行全長序列分析。
選擇尖刀唇石斛及翅梗石斛在內的22條石斛屬葉綠體全基因組序列,以蘭屬Sw.的碧玉蘭Rchb. f.和虎頭蘭Rchb. f.作為外類群,使用MAFFT軟件進行比對,將比對結果采用RaxML軟件,基于最大似然法構建ML樹,設置1000次重復以保證進化樹穩定性,進而揭示石斛屬植物物種間的親緣關系[29]。
此次測序得到的尖刀唇石斛和翅梗石斛的葉綠體全基因組均為典型的雙鏈環狀四分體結構,如圖1所示,由1個大單拷貝序列(large single copy,LSC),1個小單拷貝序列((small single copy,SSC)和一對反向重復序列(inverted repeat regions,IRs)組成。其中尖刀唇石斛序列全長為159 786 bp,LSC長度為87 477 bp,SSC長度為17 089 bp,IRs長度為27 610 bp,總GC含量為37.2%。翅梗石斛序列全長為159 652 bp,LSC長度為87 083 bp,SSC長度為18 451 bp,IRs長度為27 059 bp,總GC含量為37.1%(表1)。此外,尖刀唇石斛和翅梗石斛的LSC、SSC和IRs區的GC含量均存在差異,2種石斛GC含量均為IRs>LSC>SSC,其原因可能是在IRs區域存在含有高GC含量的核糖體RNA(rRNA)和轉運RNA(tRNA)(表2)。
由表3可知,尖刀唇石斛和翅梗石斛均編碼131個基因,包含88個蛋白質編碼基因(CDS),37個tRNA和6個rRNA。除去IRs區重復基因,其中尖刀唇石斛有11個CDS基因(2、16、16、12、12、C1、F、B、A、D、B)和5個tRNA基因(E-UUCA-UGCV-UACL-UAAS-CGA)含有1個內含子,2個CDS基因(P3)含有2個內含子。翅梗石斛有9個CDS基因(2、16、16、C1、F、B、A、B、1)和5個tRNA基因(E-UUC、A-UGC、V-UAC、L-UAA、S-CGA)含有1個內含子,2個CDS基因(P和3)含有2個內含子。
SSR的分析結果表明(表4):尖刀唇石斛葉綠體基因組中共含有112個SSR位點,分別包含20個單核苷酸、11個二核苷酸、70個三核苷酸、7個四核苷酸和4個五核苷酸,重復次數最多的為三核苷酸,其次為單核苷酸,二者共占比80.36%;翅梗石斛葉綠體基因組中共含有127個SSR位點,包含28個單核苷酸、14個二核苷酸、76個三核苷酸、6個四核苷酸、1個五核苷酸和2個六核苷酸,重復次數最多的為三核苷酸,其次為單核苷酸,二者占比為81.89%??偟膩砜?,翅梗石斛的SSR位點多于尖刀唇石斛,但二者均以三核苷酸和單核苷酸重復居多,單核苷酸主要由A/T組成,其他重復序列也大都以A和T組成,表明二者在堿基組成過程中偏向使用堿基A和T。
圖1 尖刀唇石斛、翅梗石斛的葉綠體基因組圖譜
Fig. 1 Gene map of D. heterocarpum and D. trigonopus chloroplast genomes
表1 石斛屬植物葉綠體基因組序列信息
Table 1 Chloroplast genome sequence information of Dendrobium
物種拉丁名GenBank登錄號基因組大小/bpLSC/bpIRs/bpSSC/bp總基因數總GC含量/% 尖刀唇石斛D. heterocarpum Lindl.OM049526159 78687 47727 61017 08913137.2 翅梗石斛D. trigonopus Rchb. f.OL891650159 65287 08327 05918 45113137.1 報春石斛D. primulinum Lindl.NC_035321150 76784 44226 17513 97513237.6 杯鞘石斛D. gratiosissimum Rchb. f.LC192958151 82984 89026 29014 35913237.6 羅河石斛D. lohohense T. Tang et F. T. WangLC193516151 81284 87626 29214 35213237.6 長蘇石斛D. brymerianum Rchb. f.LC192954151 83084 85526 29914 37713237.6 紫瓣石斛D. parishiiRchb. f.LC193518151 68984 70326 29514 39613237.6 束花石斛D. chrysanthumLindl.LC193514151 79084 75726 29614 44113237.6 腫節石斛D. pendulumRoxb.NC_029705153 24885 85226 39814 60012937.5 兜唇石斛D. aphyllum(Roxb.) C. E. FischerLC192953151 52484 58826 30814 32013237.6 大苞鞘石斛D. wardianumWarnerLC192961151 78884 83526 29614 36113137.6 長距石斛D. longicornuLindl.MN227146160 02487 47726 28919 96913237.1 反瓣石斛D. ellipsophyllumT. Tang et F. T. WangLC193519152 02684 93026 30414 48813237.5 景洪石斛D. exileSchltr.LC193522151 29484 36326 30814 31513237.7 球花石斛D. thyrsiflorumRchb. f.NC_047439151 68684 74926 29314 31512537.5 少花石斛D. parciflorumRchb. f. ex Lindl.LC193512150 07383 70826 27213 82113137.7 梳唇石斛D. strongylanthumRchb. f.NC_027691153 05985 83626 31614 59113037.6 西疇石斛D. xichouenseS. J. Cheng et C. Z. TangLC193520152 05284 98026 29314 48613237.5 小黃花石斛D. jenkinsiiLindl.LC193515151 71784 73426 28514 41313237.6 針葉石斛D. pseudotenellumGuillaum.NC_045854149 11484 26126 03312 78612537.4 重唇石斛D. hercoglossumRchb. f.LC192959151 93984 92426 30914 39713237.6 竹枝石斛D. salaccense(Bl.) Lindl.LC193510151 10484 27326 25814 31513237.3 碧玉蘭Cymbidium lowianumRchb. f.NC_050990155 44784 18426 71017 84311936.8 虎頭蘭C. hookerianumRchb. f.NC_053268155 44784 18626 71117 83913536.8
表2 尖刀唇石斛、翅梗石斛葉綠體基因組堿基組成
Table 2 Base composition of chloroplast genome of D. heterocarpum and D. trigonopus
區域尖刀唇石斛翅梗石斛 堿基長度A/%T/%G/%C/%GC/%堿基長度A/%T/%G/%C/%GC/% LSC 87 47731.833.217.117.935.0 87 08331.833.417.017.834.8 SSC 17 08934.335.214.715.830.5 20 55534.134.815.016.231.1 IRa 27 61028.728.422.220.742.9 26 00728.328.320.922.443.4 IRb 27 61028.428.720.722.242.9 26 00728.328.320.922.443.4 總量159 78630.931.818.318.937.2159 65231.031.918.218.937.1
表3 尖刀唇石斛、翅梗石斛葉綠體基因組注釋信息
Table 3 Annotation information of chloroplast genomes of D. heterocarpum and D. trigonopus
基因類別基因群基因代碼基因名稱 尖刀唇石斛翅梗石斛 遺傳系統基因核糖體蛋白大亞基rplrpl2ab, rpl23a, rpl32, rpl22, rpl16b, rpl14, rpl36 , rpl20 , rpl33rpl2ab, rpl23a, rpl32, rpl22, rpl16b, rpl14, rpl36 , rpl20 , rpl33 核糖體蛋白小亞基rpsrps19a , rps7a, rps12b, rps12b, rps15, rps3 , rps8, rps11, rps18, rps4, rps14 , rps2, rps16brps19a , rps7a, rps12b, rps12b, rps15, rps3 , rps8, rps11, rps18, rps4, rps14 , rps2, rps16b RNA聚合酶rporpoA, rpoB , rpoC1b, rpoC2r rpoA, rpoB , rpoC1b, rpoC2 轉運RNAtrntrnH-GUGa, trnM-CAUa, trnL-CAAa, trnV-GACa, trnE-UUCab, trnA-UGCab, trnR-ACGa, trnN-GUUa, trnL-UAG, trnP-UGG, trnW-CCA, trnM-CAU, trnV-UACb, trnF-GAA, trnL-UAAb, trnT-UGU, trnS-GGA, trnM-CAU, trnG-GCC, trnS-UGA, trnT-GGU, trnE-UUC, trnY-GUA, trnD-GUC, trnC-GCA, trnR-UCU, trnS-CGAb, trnS-GCU, trnQ-UUGtrnH-GUGa, trnM-CAUa, trnL-CAAa, trnV-GACa, trnE-UUCab, trnA-UGCab, trnR-ACGa, trnN-GUUa, trnL-UAG, trnP-UGG, trnW-CCA, trnM-CAU, trnV-UACb, trnF-GAA, trnL-UAAb, trnT-UGU, trnS-GGA, trnM-CAU, trnG-GCC, trnS-UGA, trnT-GGU, trnE-UUC, trnY-GUA, trnD-GUC, trnC-GCA, trnR-UCU, trnS-CGAb, trnS-GCU, trnQ-UUG 核糖體RNArrnrrn16Sa , rrn23Sa , rrn5Sarrn16Sa , rrn23Sa , rrn5Sa 光合系統基因光系統IpsapsaC, psaJ, psaI, psaA, psaBpsaC, psaJ, psaI, psaA, psaB 光系統IIpsbpsbH, psbN, psbT, psbB, psbE, psbF, psbL, psbJ, psbZ, psbC, psbD, psbM, psbI, psbK, psbApsbH, psbN, psbT, psbB, psbE, psbF, psbL, psbJ, psbZ, psbC, psbD, psbM, psbI, psbK, psbA ATP合成酶atpatpB , atpE, atpI, atpH, atpFb, atpAatpB , atpE, atpI, atpH, atpFb, atpA NADH脫氫酶ndhndhBab, ndhH, ndhAb, ndhI, ndhG, ndhE, ndhD, ndhF, ndhC, ndhK,ndhJndhBab, ndhH, ndhAb, ndhI, ndhG, ndhE, ndhD, ndhF, ndhC, ndhK,ndhJ 細胞色素b/f復合體petpetDb , petBb, petG, petL, petA , petNpetD , petBb, petG, petL, petA , petN Rubisco亞基rbcrbcLrbcL 其他基因成熟酶matmatKmatK 蛋白酶clpclpPcclpPc 翻譯起始因子infinfAinfA 細胞色素c合成酶ccsccsAccsA 包膜蛋白cemcemAcemA 乙酰輔酶A羧化酶accaccDaccD 未知功能蛋白ycfycf2a , ycf15a , ycf1, ycf4 , ycf3cycf2a , ycf15a , ycf1b, ycf4 , ycf3c
a代表該基因位于反向重復區,b代表該基因含有1個內含子,c代表該基因含有2個內含子
ameans that the gene is located in the inverted repeat region,bmeans that the gene contains one intron, andcmeans that the gene contains two introns
表4 尖刀唇石斛、翅梗石斛葉綠體基因組SSR信息統計
Table 4 SSR information statistics of chloroplast genomes of D. heterocarpum and D. trigonopus
核苷酸類型重復序列尖刀唇石斛翅梗石斛 數量占比/%數量占比/% 單核苷酸A/T2017.862620.47 C/G??21.57 二核苷酸AG/CTAT/AT291.798.042121.579.45 三核苷酸AAC/GTTAAG/CTTAAT/ATTACT/AGTAGC/CTGAGG/CCTATC/ATGACC/GGT1029134347?8.9325.8911.613.572.683.576.25?103116334727.8724.4112.602.362.363.155.511.57 四核苷酸AAAG/CTTTAAAT/ATTTAATT/AATTACAG/CTGTAGAT/ATCT221111.791.790.890.890.89121110.791.570.790.790.79 五核苷酸AAAAT/ATTTTAAATC/ATTTGAAATT/AATTT2111.790.890.89?1??0.79? 六核苷酸AAGTAG/ACTTCTAGATGG/ATCTCC????110.790.79
密碼子使用偏好性又稱相對同義密碼子使用度,表示對于某一特定密碼子在編碼對應氨基酸的同義密碼子之間的使用頻率。當RSCU>1時,表示該密碼子使用頻率較高;當RSCU=1時,表示該密碼子沒有偏好性;當RSCU<1時,表示該密碼子使用頻率較低。由表5可知,尖刀唇石斛共編碼53 262個氨基酸,其中編碼亮氨酸(Leu)的密碼子數量最多,達到5592個,占比10.50%,編碼色氨酸(Trp)的密碼子數量最少,僅有733個,占比1.38%;翅梗石斛共編碼53 217個氨基酸,數量最多為編碼亮氨酸的密碼子,達到5560個,占比10.45%,數量最少為編碼色氨酸密碼子,僅有718個,占比1.35%。RSCU分析結果表明,在尖刀唇石斛的64種密碼子中,RSCU大于1的密碼子有31種,其中28種以A/U結尾,3種以G/C結尾,RSCU最大值為2.19,為編碼精氨酸(Arg)的AGA,最小值為0.42,為編碼精氨酸的CGC。在翅梗石斛的64種密碼子中,RSCU大于1的密碼子有31種,其中28種以A/U結尾,3種以G/C結尾,RSCU最大值為2.18,為編碼精氨酸的AGA,最小值為0.44,為編碼精氨酸的CGC。二者比較分析可以看出,尖刀唇石斛和翅梗石斛的密碼子使用偏好性有細微的差別,但總體上大致相同。二者均以編碼亮氨酸的密碼子數量最多,編碼色氨酸的密碼子數量最少,偏好性最強的密碼子均為AGA,最弱的均為CGC,且RSCU大于1的密碼子幾乎都已A/U結尾,表明2種石斛屬植物均偏好使用A/U結尾的密碼子,這與SSR分析結果一致。
將尖刀唇石斛、翅梗石斛、長距石斛、束花石斛、梳唇石斛、反瓣石斛、景洪石斛、西疇石斛、重唇石斛和竹枝石斛在內的10種石斛屬植物的葉綠體基因序列的SC/IR邊界進行分析(圖2)。結果顯示,石斛屬植物葉綠體全基因組均存在4個邊界,即為LSC-IRb、SSC-IRb、SSC-IRa、LSC-IRa。其中LSC-IRb邊界較為保守,大部分位于22基因編碼區內,僅尖刀唇石斛位于22基因右側非編碼區;SSC-IRb邊界存在較大的分化,尖刀唇石斛和翅梗石斛位于F基因編碼區內,左側缺失1基因,梳唇石斛和重唇石斛均位于F基因左側非編碼區內,且梳唇石斛邊界左側缺失1基因,長距石斛的1和F基因均缺失,邊界位于N基因右側非編碼區,景洪石斛邊界位于1和F基因交界處,其余石斛均位于1基因和F基因重疊區,且向F基因編碼區內擴展;SSC-IRa邊界大部分位于1基因內側,只有長距石斛1基因缺失,邊界位于15和N基因交界處;LSC-IRa邊界大部分位于22基因和A基因之間的非編碼區,并偏向于靠近22基因,尖刀唇石斛、翅梗石斛和梳唇石斛缺少22基因,邊界位于19和A基因之間的非編碼區。總體上看,石斛屬植物葉綠體全基因序列的4個邊界中,SSC-IR邊界變化較大,LSC-IR邊界則較為保守。尖刀唇石斛和翅梗石斛的邊界變化相似,長距石斛邊界區域變化較大。
以尖刀唇石斛葉綠體全基因組為參考序列,使用mVISTA在線工具將10種石斛的葉綠體基因組進行全長序列比對(圖3)。結果表明:長距石斛葉綠體基因的變異性大,而其余石斛的基因序列則較為保守。整體上看,變異多發生在LSC區和SSC區,而且在相鄰基因的間隔區,發生變異的機率更大,而IR區的變異程度整體較低,絕大部分基因序列的相似度均保持在較高水平。
表5 尖刀唇石斛、翅梗石斛葉綠體基因組密碼子使用情況
Table 5 Codon usage in chloroplast genome of D. heterocarpum and D. trigonopus
氨基酸密碼子尖刀唇石斛翅梗石斛氨基酸密碼子尖刀唇石斛翅梗石斛 數量RSCU數量RSCU數量RSCU數量RSCU AlaGCA4651.194871.22ProCCA7641.287451.26 GCC3490.893690.93CCC5880.995770.97 GCG2370.612400.60CCG3660.613750.63 GCU5151.324971.25CCU6681.126761.14 CysUGC3900.704400.81GlnCAA10681.3611021.38 UGU7291.306511.19CAG4970.644990.62 AspGAC4350.554270.54ArgAGA12342.1912132.18 GAU11341.4511641.46AGG6001.065711.03 GluGAA14751.4014261.39CGA5791.035661.02 GAG6260.606330.61CGC2350.422470.44 PheUUC15820.7416030.84CGG3630.643620.65 UUU21591.1522051.16CGU3710.663820.69 GlyGGA8421.507971.43SerAGC4390.524020.50 GGC3180.573620.65AGU7340.876690.84 GGG5571.005310.96UCA9951.189691.21 GGU5210.935340.96UCC9331.118981.12 HisCAC3950.584010.59UCG5780.695750.72 CAU9571.429581.41UCU13801.6412921.61 IleAUA15461.0216321.06ThrACA6861.236781.19 AUC12120.8011560.75ACC5280.945410.95 AUU18041.1918351.19ACG3640.653590.63 LysAAA20851.2921151.30ACU6601.187001.23 AAG11360.7111310.70ValGUA7271.287501.27 LeuCUA8870.958910.96GUC4200.744120.70 CUC7120.766830.74GUG4070.724370.74 CUG5430.585480.59GUU7211.277671.30 CUU12201.3112331.33TrpUGG7331.007181.00 UUA11161.2011001.19TyrUAC6950.626950.60 UUG11141.2011051.19UAU15351.3816081.40 MetAUG8741.009251.00TerminaterUAA10731.0810581.09 AsnAAC6910.566890.56UAG8640.878230.85 AAU17831.4417601.44UGA10481.0510231.06

圖2 10種石斛屬植物葉綠體基因組的IR/SC邊界變化情況

圖3 石斛屬植物葉綠體基因組全局比對分析
使用DnaSP6軟件對10種石斛屬藥用植物葉綠體基因組高變異位點進行篩選分析(圖4)。結果表明:LSC區的變異性整體較高,IR區的核苷酸變異性顯著低于LSC區和SSC區,表明IR區為葉綠體基因組中最為保守的區域,且變異較多發生在相鄰基因間隔區,這與全長序列比對分析結果保持一致。此外,還篩選出來4個高變異片段,分別為:J-V-UAC、P-B、16、32-L-UAG。
以碧玉蘭和虎頭蘭為外類群,使用MAFFT軟件對22條石斛屬植物的葉綠體基因序列進行多重比對,基于比對結果建立ML系統發育樹(圖5),分支節點上的數字代表該分支的可信度。結果表明,在石斛屬這一大類分支中,尖刀唇石斛、反瓣石斛、翅梗石斛、梳唇石斛和長距石斛聚為一支,且支持率高達96%,其次才與其他石斛相聚,其中翅梗石斛與梳唇石斛和長距石斛的親緣關系十分相近,支持率達到100%,竹枝石斛與其他石斛的親緣關系相對較遠。

圖4 10種石斛屬植物葉綠體基因組核苷酸變異性分析

圖5 基于葉綠體基因組構建石斛屬及其他植物的ML樹
對比尖刀唇石斛和翅梗石斛的葉綠體全基因組發現,二者同為石斛屬植株,在序列構成上差異不大,翅梗石斛的序列全長稍短于尖刀唇石斛,可能是由基因缺失所引起,二者在遺傳系統基因組成上差異較小,其他功能基因組成也相對保守。將二者與石斛屬其它葉綠體基因序列比較可以看出,大多數石斛葉綠體基因在總基因數、總GC含量等方面都與尖刀唇石斛和翅梗石斛相近,且較為保守。有研究表明,葉綠體基因組IR/SC邊界區域的變異是葉綠體基因組結構變異的主要驅動力[30],其邊界的收縮與擴張對葉綠體基因組的演化影響深遠[31-32]。從對10種石斛屬植物的葉綠體基因組IR/SC邊界分析結果可以看出,SSC/IR邊界區域差異性較大,而在通常認為比較保守的LSC/IR區域也存在細微的差異,其中長距石斛的差異性尤其明顯。
大多數植物的葉綠體全基因組都富含SSR位點,SSR位點具有可穩定遺傳、多態性廣泛、豐度高、分布廣等特點,因此常被用作物種鑒定、遺傳多樣性分析及分子標記輔助育種等方面[33-35]。通過對尖刀唇石斛和翅梗石斛的SSR位點檢測結果可以看出,翅梗石斛的SSR位點多于尖刀唇石斛,且二者的重復序列存在較大的變化,因此可以看出石斛屬種間葉綠體基因組的SSR多態信息含量豐富,可為石斛屬植物種間鑒別提供參考依據[27]??傮w上對尖刀唇石斛和翅梗石斛的SSR位點信息和密碼子偏好性信息進行分析可以看出:二者均以三核苷酸重復居多,其次為單核苷酸,且具有堿基偏好性,偏好使用A/T堿基。偏好性最大的密碼子均為AGA,且RSCU大于1的大都以A/U結尾,這與二者葉綠體全基因組富含A/T堿基的結果相一致,這與杜致輝等[25]及朱斌等[27]對黑喉石斛和球花石斛的分析結果相符,這種現象還可能廣泛存在與其他石斛屬植物中。McCoy等[36]和Niu等[37]研究表明,A/T堿基中氮原子含量明顯少于G/C堿基,因此,在堿基突變過程中,A/T堿基消耗的能量比G/C少,這種優勢就導致了SSR和密碼子中A/T堿基偏好性的結果。此外,Mukhopadhyay等[38]證明了這種堿基偏好性還與葉綠體基因組各分區的變異程度相關聯。從對10種石斛屬植物的核苷酸變異性結果分析可以發現,GC含量較高的IR區變異程度顯著低于GC含量較低的LSC區和SSC區,因此可以推斷,堿基偏好性可能與序列的變異程度呈正相關。
石斛屬植物在全球約有1500個種,產于中國的共有76種[39],大部分石斛種間表型較為相似,在相同生境中,不同種類的石斛之間可以相互雜交[40],因此,造成石斛屬植株之間親緣關系較為復雜,難以依據簡單的形態和解剖學特征將其準確區分。葉綠體基因序列與線粒體基因序列和核基因序列相比,基因組小且結構較為保守,更加適合作為物種鑒定的依據,與DNA通用條形碼相比,葉綠體基因全長序列具有更加豐富的遺傳信息,可以更加準確地鑒定物種。隨著測序技術的飛躍發展,葉綠體基因測序技術逐漸成熟,測序成本也在不斷降低,因此,以葉綠體全基因組對物種進行分析的手段已被廣泛采用,目前,已有大量的石斛屬植物葉綠體全基因序列被測得,這也使得基于葉綠體基因組探究石斛親緣關系成為可能。本研究以2種蘭屬植物作為外類群,將其與22種石斛屬植物的葉綠體全基因序列結合,構建ML樹。建樹結果可以看出:石斛屬種間近緣關系的支持率較高,石斛組的尖刀唇石斛與心葉組的反瓣石斛、黑毛組的翅梗石斛和長距石斛以及草葉組的梳唇石斛聚為一支,表明這五者親緣關系較近,這與形態學分類的結果相違背[2],因此,對于石斛屬這類種系關系復雜的物種而言,僅憑簡單宏觀的形態特征,還無法將其準確分類,還應在分子水平上對它們進行更加準確地定義。
本研究采用生物信息學方法對已注釋完成的尖刀唇石斛和翅梗石斛葉綠體全基因組進行了全方位比對分析??傮w上看,尖刀唇石斛和翅梗石斛與其他石斛的葉綠體全基因序列相似度較高,通過基因組成、IR邊界比對、全長序列比對及ML建樹所得的結果可以看出,石斛屬植株葉綠體基因序列大體相似,但不同種類的葉綠體基因序列之間都會存在微小的變化,而這些變化將作為物種鑒定強有力的依據。通過對尖刀唇石斛和翅梗石斛的葉綠體基因序列進行比較分析,揭示了石斛屬間物種親緣關系,為石斛屬藥用植物的準確鑒定、開發利用及其資源保護提供了科學依據。
利益沖突 所有作者均聲明不存在利益沖突
[1] Cakova V, Bonte F, Lobstein A.:Sources of active ingredients to treat age-related pathologies [J]., 2017, 8(6): 827-849.
[2] 張志耘. 中國植物志(第19卷) [M]. 北京:科學出版社, 1990: 125.
[3] 張雪琴, 趙庭梅, 劉靜, 等. 石斛化學成分及藥理作用研究進展 [J]. 中草藥, 2018, 49(13): 3174-3182.
[4] Lam Y, Ng T B, Yao R M,. Evaluation of chemical constituents and important mechanism of pharmacological biology inplants [J]., 2015, 2015: 841752.
[5] 王憲楷, 趙同芳. 石斛屬植物的化學成分與中藥石斛 [J]. 中國藥學雜志, 1986, 21(11): 666-669.
[6] Teixeira da Silva J A, Ng T B. The medicinal and pharmaceutical importance ofspecies [J]., 2017, 101(6): 2227-2239.
[7] Ng T B, Liu J Y, Wong J H,. Review of research on, a prized folk medicine [J]., 2012, 93(5): 1795-1803.
[8] Yoo S R, Jeong S J, Lee N R,. Simultaneous determination and anti-inflammatory effects of four phenolic compounds in[J]., 2017, 31(24): 2923-2926.
[9] 令狐楚, 谷榮輝, 秦禮康. 金釵石斛的化學成分及藥理作用研究進展[J]. 中草藥, 2021, 52(24): 7693-7708.
[10] 宋廣青, 劉新民, 王瓊, 等. 石斛藥理作用研究進展 [J]. 中草藥, 2014, 45(17): 2576-2580.
[11] 顏美秋, 陳素紅, 呂圭源. 石斛“厚腸胃”相關功效藥理學研究及應用進展 [J]. 中草藥, 2016, 47(21): 3918-3924.
[12] 稅小紅, 稅璘, 牛曼思, 等. 金釵石斛破壁粉對環磷酰胺致免疫低下小鼠免疫功能的調節作用[J]. 藥物評價研究, 2018, 41(12): 2189-2194.
[13] 黃海, 李勁松, 符岸軍, 等. 石斛屬植物DNA條形碼序列的篩選 [J]. 熱帶作物學報, 2010, 31(10): 1769-1777.
[14] 任羽, 尹俊梅, 楊光穗. 海南石斛屬植物親緣關系的SRAP分析 [J]. 熱帶作物學報, 2008, 29(6): 767-770.
[15] 顏莎. 尖刀唇石斛化學成分及降脂活性天然產物研究 [D]. 昆明: 云南大學, 2019.
[16] 楊曉蓓, 顏莎, 胡江苗, 等. 尖刀唇石斛化學成分研究 [J]. 天然產物研究與開發, 2019, 31(10): 1745-1752.
[17] 張婷, 張朝鳳, 王崢濤, 等. 翅梗石斛的化學成分研究 [J]. 中國天然藥物, 2005, 3(1): 28-30.
[18] 王彥兵, 周侯光, 尹紅星, 等. 黑毛組6種石斛藥效成分分析及營養價值評價 [J]. 天然產物研究與開發, 2020, 32(1): 95-102.
[19] Freudenstein J V, Rasmussen F N. What does morphology tell us about orchid relationships? —A cladistic analysis [J]., 1999, 86(2): 225-248.
[20] 鐘志敏. 石斛DNA條形碼鑒定及系統分類研究 [D]. 廣州: 廣州中醫藥大學, 2018.
[21] 栗丹, 李振堅, 毛萍, 等. 基于ITS序列石斛材料的鑒定及系統進化分析 [J]. 園藝學報, 2012, 39(8): 1539-1550.
[22] 劉靜, 何濤, 淳澤. 藥用石斛的葉綠體matK基因序列分析及鑒別 [J]. 藥學學報, 2009, 44(9): 1051-1055.
[23] 袁佐清, 張建勇, 劉濤. 石斛屬植物rbcL基因序列變異和系統發育初步研究 [J]. 時珍國醫國藥, 2009, 20(7): 1836-1837.
[24] 邵世光, 韓麗, 馬艷紅, 等. 楓斗類石斛cpDNA psbA-trnH的序列分析與鑒別 [J]. 藥學學報, 2009, 44(10): 1173-1178.
[25] 杜致輝, 楊瀾, 張朝君, 等. 黑喉石斛葉綠體基因組特征及比較分析 [J]. 熱帶作物學報, 2021, 42(11): 3111-3119.
[26] Wicke S, Schneeweiss G M, dePamphilis C W,. The evolution of the plastid chromosome in land plants: Gene content, gene order, gene function [J]., 2011, 76(3/4/5): 273-297.
[27] 朱斌, 甘晨晨, 王洪程. 球花石斛()葉綠體基因組特征及親緣關系解析 [J]. 生物技術通報, 2021, 37(5): 38-47.
[28] 江媛, 楊青淑, 王婧, 等. 毛重樓葉綠體基因組序列特征及其系統發育分析 [J]. 中草藥, 2021, 52(13): 4014-4022.
[29] 胡海粟, 張德全. 幾種滇產龍膽屬藥用植物的DNA超級條形碼研究 [J]. 中國中藥雜志, 2021, 46(20): 5260-5269.
[30] Kim K J, Lee H L. Complete chloroplast genome sequences from Korean ginseng (Nees) and comparative analysis of sequence evolution among 17 vascular plants [J]., 2004, 11(4): 247-261.
[31] Wang W C, Chen S Y, Zhang X Z. Whole-genome comparison reveals divergent IR borders and mutation hotspots in chloroplast genomes of herbaceous bamboos (Bambusoideae: Olyreae) [J]., 2018, 23(7): 1537.
[32] Park S, An B, Park S. Reconfiguration of the plastid genome in: IR boundary shifting, inversion, and intraspecific variation [J]., 2018, 8(1): 13568.
[33] 丁鴿, 張代臻, 丁小余. 石斛資源分子水平研究進展 [J]. 中國實驗方劑學雜志, 2018, 24(4): 208-215.
[34] Powell W, Morgante M, McDevitt R,. Polymorphic simple sequence repeat regions in chloroplast genomes: Applications to the population genetics of pines [J]., 1995, 92(17): 7759-7763.
[35] Pugh T, Fouet O, Risterucci A M,. A new cacao linkage map based on codominant markers: Development and integration of 201 new microsatellite markers [J]., 2004, 108(6): 1151-1161.
[36] McCoy S R, Kuehl J V, Boore J L,. The complete plastid genome sequence of: An unusually compact plastome with accelerated divergence rates [J]., 2008, 8: 130.
[37] Niu Z T, Xue Q Y, Wang H,. Mutational biases and GC-biased gene conversion affect GC content in the plastomes ofgenus [J]., 2017, 18(11): E2307.
[38] Mukhopadhyay P, Basak S, Ghosh T C. Nature of selective constraints on synonymous Codon usage of rice differs in GC-poor and GC-rich genes [J]., 2007, 400(1/2): 71-81.
[39] 李清, 李標, 郭順星. 蘭科石斛屬植物分子生物學研究進展 [J]. 中國中藥雜志, 2016, 41(15): 2753-2761.
[40] 黃捷. 石斛屬植物交配親和性研究 [D]. 廣州: 華南農業大學, 2016.
Sequence analysis of complete chloroplast genome of Dendrobium heterocarpum and
LI Zhuo-wei1, 2, QIU Qian1, LANG Jia-qi1, 2, WU Ying-mei1, DU Hui-hui1, ZHOU Nong1, 2
1. School of Biology and Food Engineering, Chongqing Three Gorges University, Chongqing 404120, China 2. Chongqing Engineering Laboratory for Green Planting and Deep Processing of Authentic Medicinal Materials in the Three Gorges Reservoir Area, Chongqing 404120, China
To determine the chloroplast genomes ofand, analyze their sequence characteristics, and identify the relationship betweenspecies.In this study, the next-generation sequencing ofandwas performed on the Illumina Hisep 2 500 sequencing platform. Two complete chloroplast genome sequences were obtained after assemblying and annotationing,. Then, the two sequence structure and the phylogenetic relationship ofwere analysed by bioinformatics methods.The study found that the total length of the chloroplast genome ofwas 159 786 bp and the total GC content was 37.2%. The whole genes annotated were 131, including 88 protein-coding genes, 37 tRNA genes and six rRNA genes. Similarly, the total length of the chloroplast genome ofwas 159 652 bp and the total GC content was 37.1%. A total of 131 genes were annotated, which including 88 protein-coding genes, 37 tRNA genes and six rRNA genes in all. There were 112 and 227 simple repeat sequences were detected fromandrespectively, and they both had the largest number of codons encoding leucine and the least number of codons encoding tryptophan. The phylogenetic tree showed that,,,andwere clustered together into one family.was very similar toand, and the support rate reached 100%.The chloroplast genome structure and phylogenetic relationship of two species ofwere analysed. The results of this study will provide a scientific basis for the accurate identification, development and utilization ofmedicinal plants and resource protection.
Lindl.;Rchb. f.; medicinal plants; complete chloroplast genome; genetic relationship
R286.12
A
0253 - 2670(2022)16 - 5159 - 11
10.7501/j.issn.0253-2670.2022.16.025
2022-02-15
重慶市自然科學基金資助項目(cstc2018jcyjAX0267)
李卓蔚(1997—),碩士,主要從事環境微生物研究。Tel: 15808197965 E-mail: lizhuowei0@126.com
吳應梅(1981—),實驗師,博士,主要從事食品藥品功能研究。Tel: (023)58102522 E-mail: wuyingmei0927@126.com
周 濃(1978—),教授,碩士生導師,主要從事中藥炮制與資源研究。Tel: (023)58576130 E-mail: erhaizn@126.com
[責任編輯 時圣明]