999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于高通量測序組裝‘赤霞珠’葉綠體基因組及其特征分析

2017-06-05 14:16:19謝海坤焦健樊秀彩張穎姜建福孫海生劉崇懷
中國農(nóng)業(yè)科學(xué) 2017年9期
關(guān)鍵詞:植物

謝海坤,焦健,樊秀彩,張穎,姜建福,孫海生,劉崇懷

(中國農(nóng)業(yè)科學(xué)院鄭州果樹研究所,鄭州450009)

基于高通量測序組裝‘赤霞珠’葉綠體基因組及其特征分析

謝海坤,焦健,樊秀彩,張穎,姜建福,孫海生,劉崇懷

(中國農(nóng)業(yè)科學(xué)院鄭州果樹研究所,鄭州450009)

【目的】以歐亞種葡萄‘赤霞珠’(Cabernet Sauvignon)為試材,建立適于葡萄屬(Vitis)植物完整葉綠體基因組組裝及其特征分析的方法,為研究葡萄屬植物的進(jìn)化和系統(tǒng)發(fā)育提供方法指導(dǎo)。【方法】采用Illumina HiSeq PE150雙末端測序策略對(duì)其全基因組DNA建庫測序,建庫類型為350 bp DNA小片段文庫,測序深度為10倍。以已發(fā)表的擬南芥(Arabidopsis thaliana)和歐亞種葡萄‘黑比諾’(Pinot Noir)的葉綠體基因組序列為參考,通過BLASTN比對(duì)提取葡萄葉綠體基因組序列,并用SOAPdenovo軟件進(jìn)行組裝,得到‘赤霞珠’完整的葉綠體基因組并對(duì)其進(jìn)行特征分析。【結(jié)果】基于高通量Illumina測序,共獲得5.2 G的全基因組原始數(shù)據(jù),其中,葡萄葉綠體基因組序列為0.42 G,約占全基因組序列的8%。用抽提出來的葡萄葉綠體基因組序列成功組裝出‘赤霞珠’完整葉綠體基因組。特征分析表明,葉綠體基因組序列全長160 676 bp,包括大單拷貝區(qū)(large single copy,LSC)、小單拷貝區(qū)(small single copy,SSC)和2個(gè)反向重復(fù)序列(inverted repeat,IRA和IRB),長度分別為89 134、19 072和26 235 bp,具有典型被子植物葉綠體基因組環(huán)狀四分體結(jié)構(gòu);共注釋得到154個(gè)基因,包括99個(gè)蛋白編碼基因、47個(gè)tRNA基因和8個(gè)rRNA基因;其葉綠體基因組的GC含量為37.43%;共檢測到37個(gè)串聯(lián)重復(fù)序列(tandem repeat sequence)和53個(gè)散在重復(fù)序列(dispersed repeats),其中,絕大部分串聯(lián)重復(fù)序列的長度為11—42 bp,占葉綠體基因組序列的0.83%,而散在重復(fù)序列占葉綠體基因組序列的5.33%;此外,還檢測到50個(gè)簡單重復(fù)序列(simple sequence repeats,SSR)位點(diǎn),大部分的SSRs均由A或T組成,同時(shí)SSRs在‘赤霞珠’葉綠體基因組上的分布是不均勻的,LSC區(qū)段含有39個(gè)SSRs,而SSC區(qū)段和IR區(qū)段分別僅有7個(gè)和4個(gè)SSRs;與蛋白編碼基因?qū)?yīng)的密碼子偏好使用A/T堿基,并且編碼亮氨酸(L)的密碼子使用頻率最高,而編碼半胱氨酸(C)的密碼子使用頻率最低;系統(tǒng)發(fā)育分析表明‘赤霞珠’與‘黑比諾’、夏葡萄(Vitis aestivalis)、圓葉葡萄(Vitis rotundifolia)親緣關(guān)系最近。【結(jié)論】基于全基因組高通量測序的方法,成功組裝出‘赤霞珠’完整的葉綠體基因組,與傳統(tǒng)獲得葉綠體基因組的方法相比,此方法不需要分離葉綠體和提取cpDNA,縮短了試驗(yàn)時(shí)間、降低了勞動(dòng)強(qiáng)度,并且極大地提高了試驗(yàn)的可行性。‘赤霞珠’葉綠體基因組的基因結(jié)構(gòu)、基因順序、GC含量和密碼子偏好性均與典型的被子植物葉綠體基因組類似。

‘赤霞珠’;葉綠體基因組;高通量測序;特征分析;系統(tǒng)發(fā)育分析

0 引言

【研究意義】葉綠體是植物進(jìn)行光合作用的關(guān)鍵場所,是細(xì)胞內(nèi)具有自主遺傳信息的重要細(xì)胞器,普遍存在于陸地植物、藻類和部分原生生物中[1]。與核基因組相比,葉綠體基因組較小,結(jié)構(gòu)穩(wěn)定,序列高度保守[2],遺傳重組率低,且屬于母系遺傳,后代遺傳穩(wěn)定[3-4],其結(jié)構(gòu)和序列信息在揭示物種起源、進(jìn)化演變及不同物種之間親緣關(guān)系等方面具有重要價(jià)值[1]。因此,可從葉綠體的角度對(duì)葡萄屬(Vitis)植物進(jìn)行系統(tǒng)發(fā)育研究,而尋找一個(gè)快速、高效、便捷獲得葡萄屬植物葉綠體基因組的方法,是展開其研究的前提。【前人研究進(jìn)展】自1986年煙草(Nicotiana tabacum)[5]和地錢(Marchantia polymorpha)[6]的葉綠體基因組序列公布以來,科研工作者對(duì)不同物種葉綠體基因組結(jié)構(gòu)及其變異規(guī)律越來越關(guān)注。傳統(tǒng)上多采用先分離葉綠體并提取cpDNA,再通過Sanger測序或高通量測序的方法,最終拼接、組裝得到植物的葉綠體基因組[7-9],但是此種方法多受葉綠體分離及cpDNA提取困難的限制,應(yīng)用范圍很狹小;另一種傳統(tǒng)方法是利用葉綠體基因組保守序列設(shè)計(jì)特異引物,并對(duì)其全基因組DNA進(jìn)行PCR擴(kuò)增,對(duì)擴(kuò)增產(chǎn)物進(jìn)行Sanger測序,最終拼接、組裝得到完整的葉綠體基因組[10-12],此方法不僅耗時(shí)長、操作繁瑣、費(fèi)用高,而且組裝得到的葉綠體基因組序列不一定完整。近年來,隨著高通量測序和生物信息技術(shù)的飛速發(fā)展,對(duì)植物全基因組 DNA進(jìn)行重測序,并對(duì)其數(shù)據(jù)進(jìn)行相關(guān)分析,可快速、高效、便捷地得到植物葉綠體基因組全序列。利用此方法已成功組裝出丹參(Salvia miltiorrhiza)[13]、人參(Panax ginseng)[14]、朝鮮薊(Globe artichoke)[15]等的葉綠體基因組。葡萄屬于葡萄科(Vitaceae)葡萄屬(Vitis),是起源最古老的植物之一,也是中國重要的栽培果樹,其營養(yǎng)價(jià)值高,經(jīng)濟(jì)效益好,具有重要的研究與開發(fā)利用價(jià)值[16]。葡萄屬植物集中分布在3個(gè)起源中心,即歐洲-西亞分布中心、北美分布中心和東亞分布中心[17]。按照地理起源又分為3個(gè)種群,即美洲種群、東亞種群和歐亞種群。近年來,人們采用RAPD分子標(biāo)記[18]、SRAP分子標(biāo)記[19]、ISSR分子標(biāo)記和葉綠體部分片段[20]等方法對(duì)葡萄的起源演化進(jìn)行了研究,但是迄今為止仍有諸多問題尚未闡明,如野生葡萄與栽培種之間的進(jìn)化關(guān)系[21],東亞種群中各個(gè)種之間的親緣關(guān)系[22]等。科研人員發(fā)現(xiàn)葉綠體基因組的結(jié)構(gòu)和序列信息可應(yīng)用于高等植物復(fù)雜進(jìn)化關(guān)系的系統(tǒng)發(fā)育研究。如HUANG等[23]利用葉綠體全基因組研究了山茶屬(Camellia)13個(gè)種之間的親緣關(guān)系;NIE等[7]基于葉綠體全基因組研究了菊科(Asteraceae)中假藿香薊屬(Ageratina)中的紫荊澤蘭(Ageratina adenophora)與其他5個(gè)屬植物之間的親緣關(guān)系;JANSEN等[24]通過‘黑比諾’的葉綠體基因組研究了葡萄科(Vitaceae)植物與薔薇類植物的系統(tǒng)發(fā)育關(guān)系,組裝得到了‘黑比諾’的葉綠體基因組,并對(duì)其基因結(jié)構(gòu)、基因順序、GC含量和重復(fù)序列(正向重復(fù)序列和反向重復(fù)序列)進(jìn)行了分析,但是并未對(duì)葉綠體基因組的其他特征,如串聯(lián)重復(fù)序列、散在重復(fù)序列、SSRs和密碼子偏好性進(jìn)行分析,因此歐亞種葡萄葉綠體基因組的特征還有待補(bǔ)充。此外,獲得‘黑比諾’葉綠體基因組序列的過程繁瑣,而隨著高通量測序技術(shù)的迅猛發(fā)展,可建立一種快速、高效獲得植物葉綠體基因組的方法,為后續(xù)植物葉綠體基因組的特征分析奠定基礎(chǔ)。葉綠體基因組可為解決葡萄屬植物的物種起源、進(jìn)化演變及親緣關(guān)系等問題提供新的切入點(diǎn)。目前,葡萄屬植物葉綠體基因組的相關(guān)研究多集中在rbcL和trnH-psbA等部分序列上[25-27],而如何得到葡萄的葉綠體全基因組,從葉綠體全基因組角度研究葡萄屬植物的進(jìn)化和系統(tǒng)發(fā)育成為大家關(guān)注的焦點(diǎn)。【本研究切入點(diǎn)】歐亞種葡萄‘赤霞珠’是釀造紅葡萄酒的優(yōu)良傳統(tǒng)品種,在中國的栽培面積大,具有重要的經(jīng)濟(jì)價(jià)值,目前,在其生理生化方面已有諸多的研究報(bào)道,但關(guān)于其分子遺傳機(jī)制的研究相對(duì)較少。因此,對(duì)‘赤霞珠’葉綠體基因組的研究可為其分子遺傳機(jī)制提供信息。然而葡萄葉片中含有各種色素及單寧類物質(zhì)[28]其葉綠體的分離及 cpDNA的提取就非常困難,且根據(jù)葉綠體基因組保守序列設(shè)計(jì)特異引物,進(jìn)行 PCR擴(kuò)增,對(duì)擴(kuò)增產(chǎn)物進(jìn)行Sanger測序的方法,耗時(shí)長、操作繁瑣、費(fèi)用高。因此,傳統(tǒng)獲得葉綠體基因組的方法并不適用于葡萄屬植物。JANSEN等[24]利用已發(fā)表‘黑比諾’的公共BAC文庫信息,首次得到其葉綠體基因組序列,但是此研究并未直接利用高通量測序技術(shù),也未建立適于葡萄屬植物葉綠體基因組組裝及特征分析的方法流程。【擬解決的關(guān)鍵問題】本研究旨在摸索得到一套適用于葡萄屬植物完整葉綠體基因組組裝及特征分析的方法,補(bǔ)充歐亞種葡萄葉綠體基因組特征分析中缺失的部分,為葡萄屬植物的進(jìn)化和系統(tǒng)發(fā)育研究提供方法指導(dǎo)。

1 材料與方法

1.1 試驗(yàn)時(shí)間、地點(diǎn)

試驗(yàn)于2016年4月—8月在中國農(nóng)業(yè)科學(xué)院鄭州果樹研究所農(nóng)業(yè)部果樹育種技術(shù)重點(diǎn)實(shí)驗(yàn)室完成。

1.2 試驗(yàn)材料

‘赤霞珠’嫩梢上幼葉采自中國農(nóng)業(yè)科學(xué)院鄭州果樹研究所國家果樹種質(zhì)鄭州葡萄圃。用錫箔紙包裹,經(jīng)液氮速凍后-80℃保存?zhèn)溆谩?/p>

1.3 全基因組DNA的提取及測序

用植物基因組 DNA提取試劑盒(TIANGEN Beijing China)提取‘赤霞珠’全基因組DNA,并送樣測序。樣品經(jīng)北京諾和致源生物信息科技有限公司檢測合格后,采用Illumina HiSeq PE150雙末端測序策略進(jìn)行建庫測序,建庫類型為350 bp DNA小片段文庫,測序深度為 10倍,樣品所出數(shù)據(jù)量是5.2 G。

1.4 葉綠體基因組組裝

通過HiSeq PE150測序平臺(tái)對(duì)樣品進(jìn)行測序,產(chǎn)生的原始數(shù)據(jù)(Raw Data)存在一定比例低質(zhì)量短序列(reads),為了提高后續(xù)分析的可靠性,對(duì)Raw Data進(jìn)行如下處理:(1)過濾某個(gè)位點(diǎn) N含量≥80%的tile里的所有reads;(2)截取read1、read2中高質(zhì)量區(qū)域序列,具體為:正常GC數(shù)據(jù)保留質(zhì)量值>20且堿基含量>40%的cycle,異常GC數(shù)據(jù)保留質(zhì)量值>2且堿基含量>40%的cycle;(3)過濾低質(zhì)量的reads,具體為:正常GC數(shù)據(jù)保留質(zhì)量值>20且堿基含量>40%的reads,異常GC數(shù)據(jù)保留質(zhì)量值>2且堿基含量>40%的reads;(4)過濾N值含量大于10%的reads;(5)當(dāng)adapter序列與reads比對(duì)上15 bp或以上,錯(cuò)配數(shù)≤3時(shí),濾掉此對(duì)reads;(6)當(dāng)一對(duì)reads完全比對(duì)上其他的reads,則過濾冗余的reads,從而得到全基因組的有效數(shù)據(jù)(Clean Data)。以發(fā)表的擬南芥(NC 000932)和‘黑比諾’(DQ 424856)葉綠體基因組序列為參考,從Clean Data中抽提葡萄葉綠體reads,并用 SOAPdenovo[29]2.04軟件(http://soap.genomics.org.cn/soap denovo.html)進(jìn)行組裝,經(jīng)多次調(diào)整參數(shù)后獲得最優(yōu)組裝結(jié)果。使用 GapCloser[29]1.12軟件(http://so ap.genomics.org.cn/ soapdenovo.html)對(duì)組裝結(jié)果進(jìn)行內(nèi)洞修補(bǔ),最后去除冗余的短序列得到最后的組裝結(jié)果。

1.5 葉綠體基因組特征分析

用DOGMA[30]軟件(http://dogma.ccbb.utexas.edu/)預(yù)測編碼基因和非編碼 RNA,其中編碼蛋白預(yù)測Identity閾值設(shè)置為 40,其他參數(shù)為默認(rèn)值;用BLAST[31]局部比對(duì)軟件結(jié)合NR(http://www. ncbi. nlm.nih.gov/)、KEGG(http://www.genome.jp/kegg/)、COG(http://www.ncbi.nlm.nih.gov/COG/)、GO(http:// geneontology.org/)和 Swiss-Prot(http://www.ebi. ac.uk/uniprot/)數(shù)據(jù)庫對(duì)基因進(jìn)行功能注釋;用RepeatMasker[32]3-3-0(http://www.repeatmasker.org/)軟件預(yù)測散在重復(fù)序列,TRF[33]4.04(http://tandem.bu. edu/trf/trf.html)軟件預(yù)測串聯(lián)重復(fù)序列;用OGDRAW[34]軟件呈現(xiàn)‘赤霞珠’葉綠體基因組序列圖;用MISA[35](MIcroSAtellite identification tool)軟件分析SSR;用EMBOSS 6.4.0(http://emboss.open-bio.org/)分析蛋白編碼基因密碼子偏好性;用MEGA[36]6.0軟件構(gòu)建進(jìn)化樹。

2 結(jié)果

2.1 全基因組測序與葉綠體基因組組裝

基于高通量測序技術(shù)得到全基因組Raw data 5.2 G,去掉低質(zhì)量reads后,得到Clean data 5.1 G,全基因組的GC(%)含量為38.62%,有效數(shù)據(jù)的Q20(%)為95.88,有效數(shù)據(jù)的Q30(%)為90.68。以擬南芥和‘黑比諾’葉綠體基因組為參考,并用BLASTN軟件同全基因組的Clean data進(jìn)行比對(duì),從中抽提葡萄葉綠體reads。基于Phred/Phrap軟件更適用于小基因組片段(如,BAC等),而SOAPdenovo軟件更適用于 Illumina測序數(shù)據(jù),也適用于組裝各種大小的基因組,且對(duì)測序錯(cuò)誤率較為敏感的特點(diǎn),采用SOAPdenovo短序列軟件對(duì)抽提出的葉綠體reads進(jìn)行初步組裝,共得到6條Scaffolds(表1)。6條Scaffold去掉重疊區(qū)域(overlap)后,初步得到1條Scaffold,將全基因組reads比對(duì)回完整的Scaffold上,再根據(jù)reads的paired-end和overlap關(guān)系,對(duì)組裝結(jié)果進(jìn)行局部組裝和優(yōu)化,最后使用GapCloser軟件對(duì)組裝結(jié)果進(jìn)行補(bǔ)洞得到1條完整Scaffold,即葉綠體基因組序列(圖1)。

表1 ‘赤霞珠’葉綠體reads組裝結(jié)果Table 1 Assembly results of chloroplast reads in Cabernet Sauvignon

將抽提的葡萄葉綠體 reads比對(duì)到組裝好的‘赤霞珠’葉綠體基因組序列上,統(tǒng)計(jì)組裝序列的GC含量和 reads覆蓋深度,判斷組裝結(jié)果是否正常。理想情況下,GC-depth分布均呈泊松分布。分析結(jié)果表明覆蓋度達(dá)99.99%,平均測序深度是1 700倍,可見組裝效果非常好。

2.2 葉綠體基因組結(jié)構(gòu)分析

‘赤霞珠’葉綠體基因組是共價(jià)閉合的雙鏈環(huán)狀分子,包含LSC、SSC、IRA和IRB 4個(gè)區(qū)段(圖1)。序列全長160 676 bp,其中LSC區(qū)段長89 134 bp,SSC區(qū)段長19 072 bp,2個(gè)IR區(qū)段均為26 236 bp,且GC含量為37.43%。

注釋結(jié)果(表 2)表明,‘赤霞珠’葉綠體基因組共有154個(gè)基因,包括99個(gè)蛋白編碼基因,47個(gè)tRNA基因和8個(gè)rRNA基因。其中,20個(gè)基因含有2個(gè)拷貝,包括12個(gè)蛋白編碼基因(psaB、ycf1、orf56、orf42、ycf68、rps12_3end、rps7、ndhB、ycf15、ycf2、rpl23和rpl2)、4個(gè)tRNA基因(tRNA-Lys、tRNA-Gly、tRNA-Pro和tRNA-Asn)和4個(gè)rRNA基因(rrn4.5、rrn5、rrn16和rrn23);3個(gè)tRNA基因(tRNA-Arg、tRNA-Ser和tRNA-Thr)含有3個(gè)拷貝;另外tRNA-Val、tRNA-Ile和 tRNA-Ala含有 4個(gè)拷貝;tRNA-Met和tRNA-Leu含有5個(gè)拷貝。蛋白編碼基因序列總長89 574 bp,占葉綠體基因組序列的55.75%,GC含量為38.44%;tRNA基因序列總長2 960 bp,占葉綠體基因組序列的1.84%,GC含量為51.81%;rRNA基因序列總長9 036 bp,占葉綠體基因組序列的5.63%,GC含量為55.51%。在蛋白編碼基因中,8個(gè)基因含有內(nèi)含子(intron),其中6個(gè)基因(atpF、rpoC1、psaA、rpl2、ndhB和ndhA)僅含有1個(gè)內(nèi)含子,另外2個(gè)基因(ycf3和clpP)則含有2個(gè)內(nèi)含子。

按功能分類的基因在葉綠體基因組上的分布各異。蛋白編碼基因在葉綠體基因組的 4個(gè)區(qū)段上均有分布;tRNA和rRNA基因的分布是不均勻的,其中,28個(gè)tRNA基因分布在LSC區(qū)段,18個(gè)tRNA基因分布在IR區(qū)段,僅有1個(gè)tRNA基因分布在SSC區(qū)段;所有的rRNA基因均分布在IR區(qū)段。

圖1 ‘赤霞珠’葉綠體基因組序列圖Fig. 1 Sequence map of the Cabernet Sauvignon chloroplast genome

2.3 葉綠體基因組重復(fù)序列分析

重復(fù)序列包括串聯(lián)重復(fù)序列(tandem repeat sequences)和散在重復(fù)序列(dispersed repeats)兩大類。在‘赤霞珠’葉綠體基因組中共預(yù)測得到37個(gè)串聯(lián)重復(fù)序列和53個(gè)散在重復(fù)序列。其中串聯(lián)重復(fù)序列長度均在9—42 bp,絕大部分(35個(gè))在11—42 bp,占葉綠體基因組序列的0.83%;散在重復(fù)序列包括19個(gè)長末端重復(fù)序列(LTR)、13個(gè)DNA轉(zhuǎn)座子(DNA transposons)和4個(gè)長散在重復(fù)序列(LINE),它們的平均長度分別為142、115和64 bp,剩余的為未知重復(fù)序列,占葉綠體基因組序列的5.33%。這些重復(fù)序列可以開發(fā)成標(biāo)記為種群的進(jìn)化研究提供指導(dǎo)。

2.4 葉綠體基因組SSRs開發(fā)

對(duì)‘赤霞珠’葉綠體基因組 SSRs開發(fā)的參數(shù)設(shè)置如下:(1)1-10, 2-6, 3-5, 4-5, 5-5和6-5,即1個(gè)堿基重復(fù)≥10次;2個(gè)堿基重復(fù)≥6次;3個(gè)堿基重復(fù)≥5次;4個(gè)堿基重復(fù)≥5次;5個(gè)堿基重復(fù)≥5次;6個(gè)堿基重復(fù)≥5次。(2)2個(gè)SSR之間的最小距離設(shè)置為100 bp,若距離小于100 bp,則2個(gè)SSRs序列組成一個(gè)復(fù)合微衛(wèi)星。

表2 ‘赤霞珠’葉綠體基因組的基因列表Table 2 List of genes found in Cabernet Sauvignon chloroplast genome

結(jié)果表明,‘赤霞珠’葉綠體基因組含有 50個(gè)SSR位點(diǎn),其中,49個(gè)SSRs均由A或T組成,僅有一個(gè)SSR由C組成,這表明SSRs的堿基組成偏向使用A/T堿基。從SSRs的分布區(qū)段上看,39個(gè)SSRs位于LSC區(qū)段,7個(gè)SSRs位于SSC區(qū)段,而IR區(qū)域僅有4個(gè)SSRs,這表明SSRs在葉綠體基因組上的分布是不均勻的;從 SSRs類型上看,除了大多數(shù)普通SSRs外,還得到6個(gè)復(fù)合微衛(wèi)星,最大的是(TA)6有118 bp;從SSRs的堿基組成上看,有1個(gè)3堿基重復(fù)的SSR、1個(gè)2堿基重復(fù)的SSR和48個(gè)單堿基重復(fù)SSRs。

2.5 葉綠體基因組密碼子偏好性

‘赤霞珠’葉綠體基因組中蛋白編碼基因所對(duì)應(yīng)的密碼子偏好使用A/T堿基,其中第一個(gè)、第二個(gè)和第三個(gè)堿基為A/T堿基的密碼子分別占總密碼子數(shù)的53.90%、61.34%和69.43%。編碼亮氨酸(L)的密碼子使用頻率最高,其次為異亮氨酸(I)和絲氨酸(S),而編碼半胱氨酸(C)的密碼子使用頻率最低。

2.6 系統(tǒng)發(fā)育分析

先前的科研工作者利用單基因和多基因?qū)λN薇類植物進(jìn)行系統(tǒng)發(fā)育研究,得到7個(gè)主要分支,但是這些分支之間的關(guān)系仍未解決[37-40],其中就包括葡萄科。葡萄科的系統(tǒng)分類地位已爭議多年,《克朗奎斯特分類法》[41]將其歸在鼠李目(Rhamnales)下,而《APG分類法》[42]將其單列為不屬于任何目的獨(dú)立科。因此本研究從 GenBank下載前人已發(fā)表的鼠李目(Vitales)、桃金娘目(Myrtales)、葫蘆目(Cucurbitales)和豆目(Fabales)共 24個(gè)物種的葉綠體基因組,同本研究的‘赤霞珠’葉綠體基因組序列進(jìn)行比對(duì)。將蛋白編碼序列比對(duì)結(jié)果導(dǎo)出至MEGA 6.0軟件,采用鄰接法(Neighbor-Joining Method)構(gòu)建系統(tǒng)發(fā)育樹(圖2)。自舉值(Bootstrap value)是基于500次抽樣重復(fù)。結(jié)果表明,‘赤霞珠’與‘黑比諾’、夏葡萄和圓葉葡萄的親緣關(guān)系最近,并與葡萄科的蛇葡萄(Ampelopsis glandulosa)和三葉青(Tetrastigma hemsleyanum)在同一分支。

圖2 基于蛋白編碼基因用鄰接法構(gòu)建25個(gè)物種的系統(tǒng)進(jìn)化樹Fig. 2 Phylogenetic tree of 25 species based on chloroplast protein-coding genes using neighbor-joining method (NJ)

2.7 葡萄科內(nèi)6種植物葉綠體基因組特征差異

表3表明,葡萄科內(nèi)6種植物的葉綠體基因組序列長度為159 889—161 090 bp,它們的葉綠體基因組均表現(xiàn)為典型的環(huán)狀四分體結(jié)構(gòu),且6種植物所對(duì)應(yīng)的大單拷貝區(qū)和小單拷貝區(qū)的長度差異不大,而反向重復(fù)序列的長度差異較大,這可能是 6種植物葉綠體基因組長度存在差異的原因。從葉綠體基因組的基因數(shù)目上看,‘赤霞珠’葉綠體基因組中的蛋白編碼基因和tRNA基因總數(shù)最多,基因的拷貝數(shù)也最多。與‘黑比諾’、夏葡萄、圓葉葡萄、蛇葡萄和三葉青相比,在‘赤霞珠’葉綠體基因組中組裝得到額外的10個(gè)葉綠體蛋白編碼基因,它們是1hbA、rbcLr、ycf10、psi_psbT、rps12_3end、ycf15、ycf68、orf42、orf56和orf574。此外,葡萄科內(nèi)6種植物葉綠體基因組中的基因結(jié)構(gòu)、基因順序和GC含量(%)是高度相似的,這與大多數(shù)已測被子植物葉綠體基因組類似,表明了葉綠體基因組序列的高度保守性[43-44]。

表3 葡萄科內(nèi)6種植物葉綠體基因組特征Table 3 Characteristic analysis of six kinds of plants in Vitaceae

3 討論

本研究采用高通量測序技術(shù)對(duì)‘赤霞珠’全基因組DNA進(jìn)行重測序,并以擬南芥以及親緣關(guān)系很近的歐亞種葡萄‘黑比諾’葉綠體基因組為參考,成功組裝出其完整的葉綠體基因組。傳統(tǒng)上植物葉綠體基因組的獲取,如鐵線蕨(Adiantum capillus-veneris L.)[45]、紅藻(Cyanidioschyzon merolae)[46]、菝葜(Smilax china L.)[9]和紫荊澤蘭(Ageratina adenophora)[7]等植物,是采用先分離葉綠體再提取cpDNA,并結(jié)合Sanger測序或高通量測序技術(shù)的方法,最終拼接、組裝得到完整植物葉綠體基因組序列,但是此方法并不適于大范圍使用,這是因?yàn)楦叩戎参锶~片往往含有較高含量的色素及單寧類物質(zhì),使得其葉綠體分離及 cpDNA的提取較為困難[28]。另一種獲得植物葉綠體基因組的傳統(tǒng)方法是利用葉綠體基因組保守序列設(shè)計(jì)特異引物,并對(duì)其全基因組DNA進(jìn)行PCR擴(kuò)增,對(duì)擴(kuò)增產(chǎn)物進(jìn)行Sanger測序,最終拼接、組裝得到完整的葉綠體基因組[10-12],但此方法不僅耗時(shí)長、操作繁瑣、費(fèi)用高,而且組裝得到的葉綠體基因組序列不一定完整。而本研究采用高通量測序技術(shù)對(duì)植物全基因組DNA進(jìn)行重測序的方法,克服了以上缺點(diǎn),不需要分離植物葉綠體和提取 cpDNA,只需提取其全基因組 DNA,進(jìn)行高通量測序,選取合適的葉綠體參考基因組,將所測得的全基因組序列與葉綠體參考基因組BLASTN比對(duì),提取出相關(guān)的葉綠體reads,再用SOAPdenovo短序列軟件對(duì)這些序列組裝,根據(jù)序列的雙末端和重疊序列的關(guān)系,進(jìn)一步對(duì)組裝結(jié)果進(jìn)行局部組裝和優(yōu)化,最后使用GapCloser軟件對(duì)組裝結(jié)果進(jìn)行補(bǔ)洞得到完整的葉綠體基因組。利用此方法已成功組裝出長春花(Catharanthus roseus)[47]、鳳梨(Ananas comosus)[48]和稗草(Echinochlon)[49]等的葉綠體基因組。與傳統(tǒng)方法相比,此方法不需分離葉綠體和提取cpDNA,縮短了試驗(yàn)時(shí)間、降低了勞動(dòng)強(qiáng)度和縮減了費(fèi)用,并且極大的提高了試驗(yàn)的可行性。

在成功組裝出‘赤霞珠’葉綠體基因組后,本研究又從GenBank下載前人已發(fā)表的鼠李目(Vitales)、桃金娘目(Myrtales)、葫蘆目(Cucurbitales)和豆目(Fabales)共 24個(gè)物種的葉綠體基因組,同‘赤霞珠’葉綠體基因組做系統(tǒng)發(fā)育研究。結(jié)果表明,‘赤霞珠’與‘黑比諾’的親緣關(guān)系最近,但是它們?nèi)~綠體基因組序列長度仍存在差異,造成這些長度差異的原因可能是:(1)全基因組數(shù)據(jù)來源不同,‘赤霞珠’全基因組數(shù)據(jù)是通過高通量測序得到的,‘黑比諾’全基因組數(shù)據(jù)來源于在線的 BAC文庫,這是用鳥槍法得到的;(2)組裝二者葉綠體基因組的軟件不同,‘赤霞珠’葉綠體基因組組裝用的是主流的SOAPdenovo軟件,而‘黑比諾’用的是現(xiàn)在不常用的 Phred/Phrap 軟件。此外,二者葉綠體基因組的基因種類和數(shù)量也存在差異,可能是因?yàn)樵谶M(jìn)行葉綠體基因組基因注釋時(shí),二者所用的數(shù)據(jù)庫不同,‘赤霞珠’葉綠體基因組注釋時(shí)用的是 Swiss-Prot、NR、KEGG、COG、GO共5個(gè)數(shù)據(jù)庫,‘黑比諾’葉綠體基因組注釋時(shí)只用了自定義數(shù)據(jù)庫(custom database)。本研究組裝得到‘赤霞珠’葉綠體基因組的同時(shí)也補(bǔ)充了歐亞種葡萄‘黑比諾’葉綠體基因組研究中所缺少的密碼子偏好性、重復(fù)序列和 SSRs特征分析部分,可為歐亞種葡萄葉綠體基因組的研究提供更為詳細(xì)、完善的數(shù)據(jù)。

本研究通過采用高通量測序的方法得到植物全基因組DNA數(shù)據(jù),并以擬南芥和‘黑比諾’葉綠體基因組為參考,利用BLASTN序列比對(duì)抽提得到的葡萄葉綠體基因組序列占全基因組序列的 8%。雖然葉綠體基因組序列只占全基因組序列的 8%,但是已足夠用以組裝葉綠體基因組。此方法簡單、高效,但是應(yīng)用此方法要注意以下幾點(diǎn):(1)在該物種的科內(nèi)外或?qū)賰?nèi)外選擇合適的參考基因組,以便從全基因組序列中得到相關(guān)的葉綠體基因組序列;(2)所選的參考基因組必須與所研究物種的親緣關(guān)系很近;(3)在高等植物中,一些葉綠體基因會(huì)轉(zhuǎn)移到細(xì)胞核中,因此在從全基因組序列中提取分離得到的葉綠體序列可能會(huì)來自細(xì)胞核[50]。

4 結(jié)論

采用高通量測序技術(shù)對(duì)植物全基因組DNA進(jìn)行重測序的方法,選擇合適葉綠體參考基因組,并結(jié)合相關(guān)的生物信息技術(shù),成功組裝出‘赤霞珠’的完整葉綠體基因組。與傳統(tǒng)獲得葉綠體基因組的方法相比,此法不需要分離葉綠體和提取cpDNA,大大縮短了試驗(yàn)時(shí)間、降低了勞動(dòng)強(qiáng)度,并且極大的提高了試驗(yàn)的可行性。同葡萄科內(nèi)另5種植物相比,在‘赤霞珠’葉綠體基因組中組裝得到額外的 10個(gè)葉綠體蛋白編碼基因,它們是 1hbA、rbcLr、ycf10、psi_psbT、rps12_3end、ycf15、ycf68、orf42、orf56和 orf574;‘赤霞珠’葉綠體基因組的基因結(jié)構(gòu)、基因順序、GC含量和密碼子偏好性均與典型的被子植物葉綠體基因組類似。

[1] 邢少辰, LIU C J. 葉綠體基因組研究進(jìn)展. 生物化學(xué)與生物物理進(jìn)展, 2008, 35(1): 21-28.

XING S C, LIU C J. Progress in chloroplast genome analysis. Progress in Biochemistry and Biophysics, 2008, 35(1): 21-28. (in Chinese)

[2] 王玲, 董文攀, 周世良. 被子植物葉綠體基因組的結(jié)構(gòu)變異研究進(jìn)展. 西北植物學(xué)報(bào), 2012, 32(6): 1282-1288.

WANG L, DONG W P, ZHOU S L. Structural mutations and reorganizations in chloroplast genomes of flowering plants. Acta Botanica Boreali-Occidentalia Sinica, 2012, 32(6): 1282-1288. (in Chinese)

[3] MCCAULEY D E, RAVEILL J A. The spatial distribution of chloroplast DNA and allozyme polymorphisms within a population of Silene alba (Caryophyllaceae). American Journal of Botany, 1996, 83(6): 727-731.

[4] SMALL R L, CRONN R C, WENDEL J F. Use of nuclear genes for phylogeny reconstruction in plants. Australian Systematic Botany, 2004, 17(2): 145-170.

[5] SHINOZAKI K, OHME M, TANAKA M, WAKASUGI T, HAYASHIDA N, MATSUBAYASHI T, ZAITA N, CHUNWONGSE J, OBOKATA J, YAMAGUCHI-SHINOZAKI K, OHTO C, TORAZAWA K, MENG B Y, SUGITA M, DENO H, KAMOGASHIRA T, YAMADA K, KUSUDA J, TAKAIWA F, KATO A, TOHDOH N, SHIMADA H, SUGIURA M. The complete nucleotide sequence of the tobacco chloroplast genome. Plant Molecular Biology Reporter, 1986, 4(3): 111-148.

[6] OHYAMA, FUKUZAWA H, KOHCHI T, SHIRAI H, SANO T, SANO S, UMESONO K, SHIKI Y, TAKEUCHI M, CHANG Z, AOTA S, INOKUCHI H, OZEKI H. Chloroplast gene organization deduced from complete sequence of liverwort Marchantia polymorpha chloroplast DNA. Nature, 1986, 322(6079): 572-574.

[7] NIE X J, Lü S Z, ZHANG Y X, DU X H, WANG L, BIRADAR S S, TAN X F, WAN F H, SONG W N. Complete chloroplast genome sequence of a major invasive species, Crofton Weed (Ageratina adenophora). PLoS ONE, 2012, 7(5): e36869.

[8] BORTIRI E, COLEMANDERR D, LAZO G R, ANDERSON O D, GU Y Q. The complete chloroplast genome sequence of Brachypodium distachyon: sequence comparison and phylogenetic analysis of eight grass plastomes. BMC Ressearch Notes, 2008, 1(1): 1-3.

[9] LIU J, QI Z C, ZHAO Y P, FU C X, XIANG Q Y. Complete cpDNA genome sequence of Smilax china and phylogenetic placement of Liliales-Influences of gene partitions and taxon sampling. Molecular Phylogenetics and Evolution, 2012, 64(3): 545-562.

[10] MARDANOV A V, RAVIN N V, KUZNETSOV B B, SAMIGULLIN T H, ANTONOV A S, KOLGANOVA T V, SKYABIN K G. Complete sequence of the Duckweed (Lemna minor) chloroplast genome: structural organization and phylogenetic relationships to other angiosperms. Journal of Molecular Evolution, 2008, 66 (6): 555-564.

[11] WU F H, CHAN M T, LIAO D C, HSU C T, LEE Y W, DANIELL H,DUVALL M R, LIN C S. Complete chloroplast genome of Oncidium Gower Ramsey and evaluation of molecular markers for identification and breeding in Oncidiinae. BMC Plant Biology, 2010, 10(1): 1-12.

[12] 馮坤. 棉屬十個(gè)葉綠體基因組分析及其系統(tǒng)發(fā)育研究[D]. 安陽:中國農(nóng)業(yè)科學(xué)院, 2013.

FENG K. Chloroplast genome sequences of ten species of Gossypium: Structural organization and phylogenetic analyses[D]. Anyang: Chinese Academy of Agricultural Sciences, 2013. (in Chinese)

[13] QIAN J, SONG J Y, GAO H H, ZHU Y J, XU J, PANG X H, YAO H, SUN C, LI X E, LI C Y, LIU J Y, XU H B, CHEN S L. The complete chloroplast genome sequence of the medicinal plant Salvia miltiorrhiza. PLoS ONE, 2013, 8(2): e57607.

[14] ZHAO Y B, YIN J L, GUO H Y, ZHANG Y Y, XIAO W, SUN C, WU J Y, QU X B, YU J, WANG X M, XIAO J F. The complete chloroplast genome provides insight into the evolution and polymorphism of Panax ginseng. Frontiers in Plant Science, 2014, 5: 1-12.

[15] CURCI P L, PAOLA D D, DANZI D, VENDRAMIN G G, SONNANTE G. Complete chloroplast genome of the multifunctional crop globe artichoke and comparison with other Asteraceae. PLoS ONE, 2015, 10(3): e0120589.

[16] 王志潤. 葡萄部分品質(zhì)因子定性定量研究[D]. 揚(yáng)州: 揚(yáng)州大學(xué), 2014.

WANG Z R. Qualitative and quantitative research on some quality factor characteristics of grapes[D]. Yangzhou: Yangzhou University, 2014. (in Chinese)

[17] 李朝鑾. 中國植物志(葡萄科). 北京: 科學(xué)出版社, 1998.

LI C L. Flora of China (Vitaceae). Beijing: Science Press, 1998. (in Chinese)

[18] 羅明明. 葡萄品種親緣關(guān)系及分類的 RAPD分析[D]. 雅安: 四川農(nóng)業(yè)大學(xué), 2005.

LUO M M. Studies on the application of RAPD molecular markers to the classification of grape varieties[D]. Ya’an: Sichuan Agricultural University, 2005. (in Chinese)

[19] 張旭彤. 中國野生葡萄種質(zhì)資源的親緣關(guān)系研究[D]. 楊凌: 西北農(nóng)林科技大學(xué), 2012.

ZHANG X T. A genetic research on the relationship of Chinese grape germplasm[D]. Yangling: North West Agriculture and Forestry University, 2012. (in Chinese)

[20] 王蕾, 張娟, 劉林德, 張莉, 魏麗娟, 胡德昌, 鄧世斌. 利用 ISSR和葉綠體trnL-trnF序列變異研究葡萄種質(zhì)資源的遺傳多樣性和系統(tǒng)發(fā)育關(guān)系. 魯東大學(xué)學(xué)報(bào), 2015(1): 32-38.

WANG L, ZHANG J, LIU L D, ZHANG L, WEI L J, HU D C, DENG S B. Genetic diversity and phylogenetic relationships of grape germplasm (Vitis vinifera): evidence from nuclear ISSR markers and chloroplast trnL-trnF sequence variations. Journal of Ludong University, 2015(1): 32-38. (in Chinese)

[21] THIS P, LACOMBE T, THOMAS M R. Historical origins and genetic diversity of wine grapes. Trends in Genetics, 2006, 22(22): 511-519.

[22] 張永輝, 劉崇懷, 樊秀彩, 張穎, 孫海生, 彭斌, 姜建福. ISSR標(biāo)記在中國野生葡萄分類中的應(yīng)用. 果樹學(xué)報(bào), 2011, 28(3): 406 -412.

ZHANG Y H, LIU C H, FAN X C, ZHANG Y, SUN H S, PENG B, JIANG J F. Application of ISSR markers in taxonomy of Chinese wild grapes. Journal of Fruit Science, 2011, 28(3): 406-412. (in Chinese)

[23] HUANG H, SHI C, LIU Y, MAO S Y, GAO L Z. Thirteen Camellia chloroplast genome sequences determined by high-throughput sequencing: Genome structure and phylogenetic relationships. BMC Evolutionary Biology, 2014, 14(26): 4302-4315.

[24] JANSEN R K, KAITTANIS C, SASKI C, LEE S B, TOMKINS J, ALVERSON A J, DANIELL H. Phylogenetic analyses of Vitis (Vitaceae) based on complete chloroplast genome sequences: effects of taxon sampling and phylogenetic methods on resolving relationships among rosids. BMC Evolutionary Biology, 2006, 6(1589): 32.

[25] INGROUILLE M J, FLS M W C, FLS M F F, BOWMAN D, BANK M V D, BRUIJN A D E. Systematics of Vitaceae from the viewpoint of plastid rbcL DNA sequence data. Botanical Journal of the Linnean Society, 2002, 138(4): 421-432.

[26] TR?NDLE D, SCHR?DER S, KASSEMEYER H H, KIEFER C, KOCH M A, NICK P. Molecular phylogeny of the genus Vitis (Vitaceae) based on plastid markers. American Journal of Botany, 2010, 97(7): 1168-1178.

[27] ZECCA G, ABBOTT J R, SUN W B, SPADA A, SALA F, GRASSI F. The timing and the mode of evolution of wild grapes (Vitis). Molecular Phylogenetics and Evolution, 2012, 62(2): 736-747.

[28] 吳俊輝, 舒煦, 李朝鑾. 中國葡萄屬植物葉綠體 DNA的提取、純化及分子量測定. 植物分類與資源學(xué)報(bào), 1994(2): 178-186.

WU J H, SHU X, LI C L. Isolation, purification and measure of molecular weight of cpDNA from Vitis species in Chinese. Acta Botanica Yunnanica, 1994(2): 178-186. (in Chinese)

[29] LUO R, LIU B H, XIE Y L, LI Z Y, HUANG W H, YUAN J Y, HE G Z, CHEN Y X, PAN Q, LIU Y J, TANG J B, WU G X, ZHANG H, SHI Y J, LIU Y, YU C, WANG B, LU Y, HAN C L, CHEUNG D W, YIU S M, PENG S L, ZHU X Q, LIU G M, LIAO X K, LI Y R, YANG H M, WANG J, LAM T W, WANG J. SOAPdenovo2: An empirically improved memory-efficient short-read de novo assembler. Gigascience, 2012, 1(1): 1-6.

[30] WYMAN S K, JANSEN R K, BOORE J L. Automatic annotation oforganellar genomes with DOGMA. Bioinformatics, 2004, 20(17): 3252-3255.

[31] ALTSCHUL S F, GISH W, MILLER W, MYERS E W, LIPMAN D J. Basic local alignment search tool. Journal of Molecular Biology, 1990, 215(3): 403-410.

[32] SAHA S, BRIDGES S, MAGBANUA Z V, PETERSON D G. Empirical comparison of ab initio repeat finding programs. Nucleic Acids Research, 2008, 36(7): 2284-94.

[33] BENSON G. Tandem repeats finder: A program to analyze DNA sequences. Nucleic Acids Research, 1999, 27(2): 573-580.

[34] LOHSE M, DRECHSEL O, BOCK R. OrganellarGenomeDRAW (OGDRAW): A tool for the easy generation of high-quality custom graphical maps of plastid and mitochondrial genomes. Current Genetics, 2007, 52(5/6): 267-274.

[35] THIEL T, MICHANLEK W, WARSHNEY R K, GRANER A. Exploiting EST databases for the development and characterization of gene-derived SSR-markers in barley (Hordeum vulgare L.). Theoretical and Applied Genetics, 2010, 106(3): 411-422.

[36] TAMURA K, STECHER G, PETERSON D, FILIPSKI A. MEGA6: Molecular evolutionary genetics analysis version 6.0. Molecular Biology and Evolution, 2013, 30(12): 2725-2729.

[37] SAVOLAINEN V, FAY M F, ALBACH D C, BACKLUND A, BANK M, CAMERON K M, JOHNSON S A, LLEDó M D, PINTAUD J C, POWELL M, SHEAHAN M C, SOLTIS D E, SOLTIS P S, WESTON P, WHITTON W M, WURDACK K J, CHASE M W. Phylogeny of the eudicots: A nearly complete familial analysis based on rbcL gene sequences. Kew Bulletin, 2000, 55(2): 257-309.

[38] SAVOLAINEN V, CHASE M W, HOOR S B, MORTON C M, SOLTIS D E, BAYER C, FAY M F, DEBRUIJN A Y, SULLIVAN S, QIU Y L. Phylogenetics of flowering plants based upon a combined analysis of plastid atpB and rbcL gene sequences. Systematic Biology, 2000, 49(2): 306-362.

[39] SOLTIS D E, SOLTIS P S, CHASE M W, MORT M E, ALBACH D C, ZANIS M, SAVOLAINEN V, HAHN W H, HOOT S B, FAY M F, AXTELL M, SWENSEN S M, PRINCE L M, KRESS W J, NIXON K C, FARRIS J S. Angiosperm phylogeny inferred from 18S rDNA, rbcL, and atpB se’quences. Botanical Journal of The Linnean Society, 2000, 133(4): 381-461.

[40] SOLTIS D E, SENTERS A E, ZANIS M J, KIM S, THOMPSON J D, SOLTIS P S, RONSE D E, CRAENE L P, ENDRESS P K, FARRIS J S. Gunnerales are sister to other core eudicots: Implications for the evolution of pentamery. American Journal of Botany, 2003, 90(3): 461-470.

[41] CRONQUIST A. An Integrated System of classification of Flowering Plants. Boston Massachusetts: Columbia University Press, 1981.

[42] Tapg. An update of the angiosperm phylogeny group classification for the orders and families of flowering plants: APG Ⅲ. Botanical Journal of the Linnean Society, 2016, 161(2): 105-121.

[43] WICKE S, SCHNEEWEISS G M, DEPAMPHILIS C W, KAI F M, QUANDT D. The evolution of the plastid chromosome in land plants: Gene content, gene order, gene function. Plant Molecular Biology, 2011, 76(3/5): 273-297.

[44] 金桂花, 陳斯云, 伊廷雙, 張書東. 蘋果葉綠體基因組特征分析.植物分類與資源學(xué)報(bào), 2014, 36(4): 468-484.

JIN G H, CHEN S Y, YI T S, ZHANG S D. Characterization of the complete chloroplast genome of apple (Malus × domestica Rosaceae). Plant Diversity and Resources, 2014, 36(4): 468-484. (in Chinese)

[45] HASEBE M, LWATSUKI K. Chloroplast DNA from Adiantum capillus-veneris L., a fern species (Adiantaceae); clone bank, physical map and unusual gene localization in comparison with angiosperm chloroplast DNA. Current Genetics, 1990, 17(4): 359-364.

[46] OHTA N, MATSUZAKI M, MISUMI O, MIYAGISHIMA S Y, NOZAKI H, TANAKA K, TADASU S I, KOHARA Y, KUROIWA T. Complete Sequence and Analysis of the plastid genome of the unicellular red alga Cyanidioschyzon merolae. DNA Research, 2003, 10(2): 67-77.

[47] KU C, CHUNG W C, CHEN L L, KUO C H. The complete plastid genome sequence of Madagascar Periwinkle Catharanthus roseus (L.) G. Don: Plastid genome evolution, molecular marker identification, and phylogenetic implications in Asterids. PLoS ONE, 2013, 8(6): e68518.

[48] NASHIMA K, TERAKAMI S, NISHITANI C, KUNIHISA M, SHODA M, TAKEUCHI M, URASAKI N, TARORA K, YAMAMOTO T, KATAYAMA H. Complete chloroplast genome sequence of pineapple (Ananas comosus). Tress Genetics and Genomes, 2015, 11(3): 1-11.

[49] 林張翔. 稗草葉綠體基因組測序及其分子標(biāo)記開發(fā)與利用[D]. 杭州: 浙江大學(xué), 2015.

LIN Z X. Echinochlon chloroplast genome sequencing and development of molecular markers[D]. Hangzhou: Zhejiang University, 2015. (in Chinese)

[50] LIN Z X, WANG Y Y, FU F, YE C Y, FAN L J. Complete chloroplast genome of Dongxiang wild rice and its application in phylogenetic analysis. Journal of Zhejiang University, 2014, 40(4): 397-403.

(責(zé)任編輯 李莉)

Assembling and Characteristic Analysis of the Complete Chloroplast Genome of Vitis vinifera cv. Cabernet Sauvignon from High-Throughput Sequencing Data

XIE HaiKun, JIAO Jian, FAN XiuCai, ZHANG Ying, JIANG JianFu, SUN HaiSheng, LIU ChongHuai
(Zhengzhou Fruit Research Institute, Chinese Academy of Agricultural Sciences, Zhengzhou 450009)

【Objective】 A method was built to assemble complete chloroplast (cp) genome of Vitis and analyze itscharacteristics with Vitis vinifera cv. Cabernet Sauvignon, which will provide a methodological guidance for evolution and phylogenetic analysis of Vitis in the future.【Method】Total genomic DNA was extracted from young leaves of Cabernet Sauvignon using plant genomic DNA kit. The small fragments (350 bp) of DNA libraries were constructed according to the manufacturer’s manual for the Illumina HiSeq PE150, and the sequencing depth was 10 fold. Grape cp reads were extracted by BLASTN software according to cp genome sequence of Arabidopsis thaliana (NC000932) and Pinot Noir (DQ424856). SOAPdenovo 2.04 assembled the extracted cp reads into complete chloroplast genome of Cabernet Sauvignon. Then its basic characteristics were analyzed using some bioinformatic softwares. 【Result】 This research obtained total of 5.2 G raw data after high-throughput sequencing. Among them, 0.42 G clean data of grape cp reads were extracted, and it accounted for about 8%. These extracted grape cp reads assembled the complete cp genome successfully. The characteristic analysis of grape cp genome showed that it was a circular molecule of 160 676 bp in length with a typical quadripartite structure, including a pair of inverted repeats (IRA and IRB) of 26 235 bp that were separated by large and small single copy regions (LSC and SSC) of 89 134 bp and 19 072 bp, respectively. A total of 154 predicted genes, including 99 protein-coding genes, 47 tRNA genes and 8 rRNA genes were identified. And the GC content of cp genome was 37.43%. Furthermore, the cp genome of Cabernet Sauvignon contained 37 tandem repeat sequences and 53 dispersed repeats. The length of most tandem repeat sequences was 11-42 bp. They accounted for 0.83% of whole cp genome, and the dispersed repeats accounted for 5.33%. Additionally, fifty short simple repeats (SSRs) loci of cp genome were detected. And most SSR loci were composed of A or T contributing to an obvious bias in base composition. Distribution of cp SSRs was non-uniform because the regions of LSC, SSC, and IR were located by 39, 7, and 4 SSRs, respectively. The codon usage of protein-coding genes was biased to use A/T bases. And among these codons, leucine (L) and cysteine (C) were the most and least used amino acids, respectively. The phylogenetic analysis showed that Cabernet Sauvignon had a closer genetic relationship with Pinot Noir, V. aestivalis and V. rotundifolia.【Conclusion】Based on high-throughput sequencing, the complete cp genome of Cabernet Sauvignon was obtained successfully. Cp and cpDNA were not required to isolate and extract in this method which shortened the experiment time, reduced the labor intensity and improved the feasibility. The subsequent characteristic analysis showed that gene structure, gene order, GC content and codon usage were identical with typical angiosperm. This research provided perfect and detailed data for the study of cp genome of Vitis vinifera, which also supplemented many deficiencies of characteristic analysis of cp genome of Vitis, such as repeat sequences, codon bias and SSRs.

Cabernet Sauvignon; chloroplast genome; high-throughput sequencing; characteristic analysis; phylogenetic analysis

2016-09-29;接受日期:2016-12-08

國家現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)技術(shù)體系建設(shè)專項(xiàng)資金(CARS-30-yz-1)、中國農(nóng)業(yè)科學(xué)院科技創(chuàng)新工程專項(xiàng)(CAAS-ASTIP-2015-ZFRI)、農(nóng)業(yè)部物種保護(hù)項(xiàng)目(2130135-34)

聯(lián)系方式:謝海坤,Tel:15290850630;E-mail:1379226793@qq.com。通信作者劉崇懷,Tel:13703939601;E-mail:liuchonghuai@caas.cn

猜你喜歡
植物
誰是最好的植物?
為什么植物也要睡覺
長得最快的植物
各種有趣的植物
植物也會(huì)感到痛苦
會(huì)喝水的植物
植物的防身術(shù)
把植物做成藥
哦,不怕,不怕
將植物穿身上
主站蜘蛛池模板: 91丨九色丨首页在线播放| 国产亚洲欧美在线人成aaaa| 先锋资源久久| 日本欧美中文字幕精品亚洲| 亚洲区第一页| 97久久精品人人做人人爽| 亚洲精品天堂在线观看| 国产丝袜第一页| 精品福利一区二区免费视频| 色男人的天堂久久综合| 中文字幕亚洲第一| 免费Aⅴ片在线观看蜜芽Tⅴ| 精品一区二区三区无码视频无码| 91精品在线视频观看| 亚洲婷婷在线视频| 精品一区二区三区水蜜桃| 国产人在线成免费视频| 久久国产精品娇妻素人| 久久久久亚洲精品成人网| 小说 亚洲 无码 精品| 国产成人一区在线播放| 91无码国产视频| 午夜视频在线观看免费网站 | 午夜视频www| 久久久久青草线综合超碰| 国产亚洲高清视频| 亚洲福利网址| 国产区福利小视频在线观看尤物| 国产又色又爽又黄| 日本久久免费| 欧美笫一页| a国产精品| 日韩123欧美字幕| 欧美日韩福利| 久久国产精品影院| 午夜丁香婷婷| 国产日韩精品一区在线不卡| yjizz视频最新网站在线| 国产成人夜色91| 国产自产视频一区二区三区| 亚洲天堂777| 亚洲女同欧美在线| 午夜三级在线| 国产不卡网| 日韩高清欧美| 国产毛片网站| 日韩无码黄色网站| 午夜视频免费一区二区在线看| 国产日本一区二区三区| 91免费观看视频| 国产人前露出系列视频| 欧美精品在线免费| 综合久久久久久久综合网| 老司机精品99在线播放| 国产高清在线精品一区二区三区| 国产成人综合日韩精品无码不卡 | 国产在线观看91精品| 精品无码国产一区二区三区AV| 国产乱人伦AV在线A| 成年人福利视频| 亚洲国产av无码综合原创国产| 99成人在线观看| 日日噜噜夜夜狠狠视频| 免费国产无遮挡又黄又爽| 亚洲人成网线在线播放va| 日韩av无码DVD| 久久这里只有精品66| 激情综合婷婷丁香五月尤物| 国产91成人| 视频在线观看一区二区| 黄色网在线免费观看| 国产色伊人| 亚洲区一区| 无码一区中文字幕| 久久动漫精品| 久久永久视频| 亚洲无码高清一区二区| 久久久久无码精品国产免费| 精品少妇三级亚洲| 成人在线亚洲| 亚洲国产欧美自拍| Aⅴ无码专区在线观看|