999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

木荷基因組SSR位點開發及初步分析

2018-05-14 14:44:49林艷何紫迪毛積鵬蔣開彬王金榜黃少偉
熱帶作物學報 2018年9期

林艷 何紫迪 毛積鵬 蔣開彬 王金榜 黃少偉

摘 要 為開發木荷分子標記,采用高通量測序技術獲得木荷基因組原始數據,經生物信息學軟件對木荷基因組序列進行序列拼接、組裝和對比,共獲得308 418條Contig序列和459 984條Scafford序列。采用MISA軟件搜索木荷基因組序列中微衛星(Microsatellite)位點,共得到334 843個SSR序列,總長度5 074 708 bp,占木荷基因組大小的0.98%,木荷基因組SSR序列平均長度為15.2 bp,平均分布頻率為644個/Mb。木荷SSR序列中,單核苷酸序列數量最多,共188 217個,占木荷SSR序列總數的56.21%,其次是二核苷酸(23%)>三核苷酸(13%)>四核苷酸(5%)>五核苷酸(2%)>六核苷酸(1%)。木荷全基因組SSR序列中共包括400種重復基元,其中單核苷酸重復基元A和二核苷酸重復基元AT是主要重復基元,分別占總SSR的56%和11%,SSR基元的重復次數分布在4~40次,主要分布在4~25次。本研究豐富了木荷分子標記類型,為進一步群體遺傳結構和遺傳多樣性分析提供了基礎數據。

關鍵詞 木荷;SSR標記;生物信息學;基因組;高通量

中圖分類號 S792.99 文獻標識碼 A

Abstract In order to develop the molecular marker of Schima superba, high-throughput sequencing was used to obtain the original data of S. superba. Bioinformatics softwares were used to sequence, assemble and compare the S. superba genomic sequences. A total of 308 418 contig sequences and 459 984 scafford sequences were obtained. In total, 334 843 SSR sequences were obtained by using the bioinformatics analysis software MISA. The total length of the SSR was 5 074 708 bp, accounting for 0.98% of the genome size of S. superba, with an average length of 15.2 bp. The mean distribution frequency was 644/Mb. Among the SSR of S. superba genome, the number of single nucleotides was the largest, with a total number of 188 217, accounting for 56.21% of the total SSR of S. superba, followed by dinucleotide (23%) > trinucleotides (13%) > teranucleotides (5%) > pentanucleotides (2%) > hexanucleotide (1%). The SSR sequences of S. superba genome was consisted of 400 repeat motifs, in which mononucleotide repeat A and dinucleotide repeat AT were the major repeat motifs, accounting for 56% and 11% of the total SSR respectively. The number of repetitions of SSR motifs was distributed from 4 to 40, mainly between 4 and 25 times. This study would provide basic data for further genetic diversity analysis of S. superba.

Keywords Schima superba; simple sequence repeat; bioinformatics; genomes; high-throughput sequencing

DOI 10.3969/j.issn.1000-2561.2018.09.013

微衛星(Microsatellite),又稱簡單重復序列(Simple Sequence Repeats,SSRs),在原核生物和真核生物基因組中普遍存在,分布于基因間隔區、UTR區、內含子區等區域。SSR標記為共顯性標記,具有數量多、分布廣、多態性高和信息量大等優點[1]。SSR序列由1~6個重復并且串聯的核苷酸組成,由高度變異的核心序列和高度保守的側翼序列組成,可根據兩端保守的側翼序列針對性地設計引物,用于多態性的檢測[2]。SSR重復類型包括:單核苷酸(Mononucleotide)重復、二核苷酸(Dinucleotide)重復、三核苷酸(Trinucleotide)重復和四核苷酸(Teranucleotide)及以上重復[3],長度大多為100~200 bp,根據微衛星片段長度的不同又形成簡單序列長度多態性(Simple Sequence Length Polymorphism,SSLP)[4]。近年來,SSR分子標記技術作為第二代微衛星分子標記技術,已廣泛應用于群體遺傳多樣性分析[5]、種群內和種群間遺傳變異分析[6-7]、連鎖遺傳圖譜構建和群體遺傳結構分析等[8-9]。

木荷(Schima superba Gardn.et Champ)屬山茶科(Theaceae),木荷屬(Schima),常綠闊葉喬木,自然分布于福建、廣東、江西、浙江等31N以南,105E以東的地區[10]。木荷為典型的亞熱帶樹種,葉呈厚革質,含水量高達42%,混植于易發生火災的松樹林,可以起到很好的防火阻隔作用[11]。木荷作為南方重要的防火樹種,具有很大的研究價值,近幾年來已經成為林木遺傳育種專家重要的研究樹種。目前,從有關木荷SSR位點分析的文獻來看,研究者們采用的都是傳統的分子生物學方法[12-13],囿于依賴傳統的實驗技術方法,具有一定的局限性。

過去,人們對某些疾病現象的揭示局限于單個基因位點的研究,往往不能全面的揭示這些原理,隨著分子生物技術的進一步發展,第二代測序技術的出現將研究者們帶到了全基因組整體水平的研究層面,打破了傳統只對單個基因位點研究的局限,具有通量高、周期短、成本低和信息量全面等優點[14]。然而,面對如此巨大且復雜的數據量,生物信息學的作用不可忽視,生物信息學和第二代測序的出現大大推動了分子生物學的發展。迄今為止,未見有利用高通量測序和生物信息學方法開發木荷基因組SSR的報道。本研究在高通量測序的基礎上,利用生物信息學方法搜索木荷基因組SSR位點,分析木荷SSR序列生物信息學特征,為進一步遺傳結構和遺傳多樣性分析提供了基礎數據,還有助于利用分子標記輔助育種方法選育我國木荷優良種質資源。

1 材料與方法

1.1 材料

實驗材料為單一木荷無性系,來源于廣東省英德市林業科學研究所橋頭基地木荷優樹無性系種質基因庫,占地面積75 hm2,相對濕度77%,年降雨量1 906.2 mm,年平均氣溫21.1 ℃。采集木荷幼嫩葉片5~10片,寫上標簽并用密封袋裝好,帶回實驗室80 ℃超低溫冰箱保存,用于DNA提取。

1.2 方法

1.2.1 木荷DNA的提取 采用常規試劑盒方法提取木荷DNA,經1%瓊脂糖凝膠電泳檢測,用紫外分光光度計(NanoDrop 2000 spectroph?oto?me?ter)檢測DNA濃度和純度,置于20 ℃低溫保存。

1.2.2 木荷基因組的高通量測序 采用高通量測序平臺Illumina Hiseq 2500進行測序,測序讀長PE250 (Pair-end 250)或PE150(Pair-end 150)。

1.2.3 數據處理 數據處理的過程分為4個步驟:數據質控,篩選高通量測序數據中質量較高的數據(Clean Reads),篩選標準為:去除含N堿基或含有3個以上堿基質量值低于20的測序序列;序列組裝,采用Denove[15]序列組裝軟件,將測序數據組裝成scaffold序列;序列標簽聚類,采用序列比對方法,為減少比對誤差導致的SSR檢測錯誤,要求比對到SSR區域的測序片段為雙末端同時比對到參考序列。將相同的序列標簽聚類到一起,為后續的多態性檢測做準備。最終將得到的數據以fasta格式保存用于后續分析。

1.2.4 數據分析 采用生物信息學分析軟件MISA (http://pgrc.ipk-gatersleben.de/misa) 結合Perl語言,搜索基因組中所有SSR。統計標準設置如下:要求單核苷酸重復不少于10次,二核苷酸重復不少于6次,三核苷酸重復、四核苷酸重復、五核苷酸重復和六核苷酸重復不少于4次。重復序列兩邊的側翼序列大小設置為100 bp。

2 結果與分析

2.1 高通量測序數據分析

利用高通量測序技術共獲得34 574 976條原始數據(Raw reads),經過序列組裝和去除冗余序列得到34 379 120條高質量數據(High-quality reads)(表1),占Raw reads的99.4%,對SSR序列進行拼接分別得到308 418條和459 984條長度大于500 bp的contigs和scafford(圖1),堿基最長的contig序列長度為6 108 bp,堿基最長的scaffold序列長度為19 000 bp。

2.2 木荷SSR位點的數量分布

通過SSR生物信息學軟件MISA共檢測到334 843個SSR序列,木荷基因組SSR平均出現頻率為644個/Mb。SSR序列在木荷基因組上種類豐富,單核苷酸至六核苷酸均有分布,但數量上差異較大(表2)。其中,單核苷酸重復位點數量最為豐富(188 217個),占56.21%,二核苷酸重復位點數量高達五分之一(22.36%),三核苷酸重復位點次之(43 631個),占13.03%,四核苷酸重復位點共17 559個,占5.24%,五核苷酸重復位點6 277個,占1.87%,六核苷酸重復位點數量最少,3 027個,僅占0.90%,由此可見,木荷基因組SSR重復基元的數量隨著堿基重復次數的增加呈降低趨勢(圖2,圖3)。

2.3 木荷基因組SSR重復基元數量、頻率、長度特征

木荷基因組SSR各重復基元的種類和各重復基元的數量分布呈顯著差異(表3,圖3,圖4), 各重復類別的優勢重復基元數量分布情況見圖5。從木荷基因組中找到的SSR種類共400種,其中,單核苷酸重復類別共2種,以A重復基元占絕大多數(187 723個),占單核苷酸重復類別的99.7%,占所有SSR總數的兩種重復基元的56.1%,出現的頻率分別是361.01個/Mb,C重復基元出現頻率僅0.59個/Mb。在二核苷酸重復類別中,以AT重復基元數量最多(36 551個),占二核苷酸重復基元的48%,出現頻率為70.29個/Mb,AG重復基元數量和頻率略低于AT重復基元,分別為34 716個和66.8個/Mb。AC重復基元和CG重復基元出現的次數較低,出現頻率分別為9.22個/Mb和0.14個/Mb;在三核苷酸重復類別中,以AAT重復基元出現的次數最多(20 913個),出現頻率為40.22個/Mb,然后依次是AAG>ACC>ATC,出現頻率分別為15.97個/Mb、8.67個/Mb和5.33個/Mb。

木荷基因組四核苷酸重復類型共32種,AAAT為主要的重復基元(13 468個),出現頻率最高,為25.9個/Mb,其次為AAAC重復基元和AAAG重復基元,出現頻率分別為1.50個/Mb和1.51個/Mb。五核苷酸重復類型一共93種,數量最多的重復基元是AAAAT,出現頻率為5.29個/Mb。六核苷酸重復拷貝類型的種類最多,一共有259種,占所有重復基元數的65%,數量最多的重復類別為AAAAAT,出現頻率為1.47個/Mb,其余重復基元不占優勢,出現的頻率均較低,重復基元種類隨重復次數增加。

木荷基因組SSR序列總長度為5 074 708 bp,平均長度為15.12 bp,總長度占木荷總基因組大小的0.98%,單核苷酸重復類型的總長度最長,從單核苷酸至六核苷酸長度依次降低,各重復類別平均長度分布規律與總長度相反,從單核苷酸至六核苷酸呈升高的趨勢,依次為12.74、19.62、15.20、17.61、21.32、25.81 bp(表4)。六核苷酸重復基元平均長度最長,其中單核苷酸重復類型共兩種,分別為A和C,二核苷酸重復基元類別共四種,三核苷酸、四核苷酸、五核苷酸重復類型以及六核苷酸重復類型種類逐漸遞增,依次為10種、32種、93種和259種,六核苷酸重復種類最多,占所有核苷酸種類的65%,由此可見,重復類型種類隨著堿基重復次數的增加而增加。

木荷基因組SSR中,單核苷酸重復基元的分布范圍在10~40次,主要分布在10~25次,占99%;二核苷酸重復基元分布范圍為6~40次,主要分布在6~20次,占97%;三核苷酸重復基元分布在4~21次,主要分布在4~13次,占99%;四核苷酸重復基元分布在4~10次,主要分布在4~7次,占99%;五核苷酸重復基元分布范圍為4~9次,主要分布在4~5次,占96%;六核苷酸重復基元范圍分布在4~9次,主要分布在4~5次,占95% (圖6)。

3 討論

分析木荷基因組序列共得到334 843個SSR序列,平均每個SSR位點出現的頻率為644個/Mb,相比茶樹[16]、柑橘[17]、楊樹[18]等植物,出現頻率更高,說明木荷基因組SSR位點較為豐富。木荷基因組SSR各重復類別中,單核苷酸重復類別出現的頻率最高,為361.96個/Mb,其次為二核苷酸重復(146.41個/Mb)>三核苷酸重復(83.91個/Mb)>四核苷酸重復(33.77個/Mb)>五核苷酸重復(12.07個/Mb)>六核苷酸重復(5.82個/Mb)。

目前,SSR標記技術已大量用于農作物和動物基因SSR位點開發[19-20]。木荷基因組SSR重復序列中以單核苷酸重復類型最為豐富,其次是二核苷酸重復類型,這與在模式植物楊樹上的研究結果相似[21]。鄭燕等[22]在水稻、玉米、高粱這3種禾本科植物的研究中,發現三核苷酸重復出現次數最多,其次為六核苷酸SSR重復序列。孫蛟龍等[23]在浮萍轉錄組中發現二核苷酸重復類型數量最多,其次為三核苷酸重復類型。由此可見,SSR序列的分布規律在不同的物種上差異較大,這可能是由于物種間基因組大小不同造成優勢SSR序列差異。在木荷基因組單核苷酸至六核苷酸重復類別中,數量最多的重復基元分別為A、AT、AAT、AAAT、AAAAT以及AAAAAT,說明這些優勢重復基元富含A/T核酸,在木荷基因組中大量存在,這與棗樹[24]、楊樹[25]、黑麥草[26]等植物基因組SSR序列研究一致。

本研究基于高通量測序技術,首次利用生物信息學分析方法發掘木荷基因組SSR序列,統計分析木荷基因組SSR數量、長度、頻率和密度等生物信息學特征,成功開發了大量木荷SSR位點,豐富木荷分子標記類型,為木荷群體遺傳結構和遺傳多樣性分析提供數據基礎,有利于加快建立木荷種質資源評價與保護機制,也有利于進一步木荷種質資源多樣性研究和品種選育。

參考文獻

[1] 張立榮, 徐大慶, 劉大群. SSR和ISSR分子標記及其在植物遺傳育種研究中的應用[J]. 河北農業大學學報, 2002(1): 90-94.

[2] Xu M, Liu X, Wang J W, et al. Transcriptome sequencing and development of novel genic SSR markers for Dendrobium officinale[J]. Molecular Breeding, 2017, 37: 18.

[3] 鄢秀芹, 魯 敏, 安華明. 刺梨轉錄組SSR信息分析及其分子標記開發[J]. 園藝學報, 2015,42(2): 341-349.

[4] Xie J K, Chen D Z, Xiao Y Q, et al. Genetic diversity of Dongxiang wild rice (Oryza rufipogon Griff.) detected by SSLP markers[J]. Agricultural Sciences in China, 2003, 2(7): 12-18.

[5] 白 玉. DNA分子標記技術及其應用[J]. 安徽農業科學, 2007, 35(24): 7 422-7 424.

[6] 左力輝, 張 雙, 梁海永, 等. 榆樹轉錄組EST-SSR引物開發及遺傳多樣性分析[J]. 植物遺傳資源學報, 2018, 19(1): 157-166.

[7] 楊育峰, 史典義, 王雁楠, 等. 基于轉錄組測序數據的甘薯SSR標記開發及群體聚類分析[J].分子植物育種, 2018, 16(11): 3 569-3 579.

[8] 洪彥彬, 梁炫強, 陳小平, 等. 花生栽培種SSR遺傳圖譜的構建[J]. 作物學報, 2009, 35(3): 395-402.

[9] 徐立安, 李新軍, 潘惠新, 等. 用SSR研究栲樹群體遺傳結構[J]. 植物學報, 2001, 43(4): 409-412.

[10] 楊智杰, 陳光水, 謝錦升, 等. 杉木、木荷純林及其混交林凋落物量和碳歸還量[J]. 應用生態學報, 2010, 21(9): 2 235-2 240.

[11] 趙秀軍. 木荷的生物學特征及其栽培技術要點[J]. 南方農業, 2017, 11(17): 50-51.

[12] 辛娜娜, 張 蕊, 徐肇友, 等. 木荷1代育種群體遺傳多樣性分析[J]. 林業科學研究, 2015, 28(3): 332-338.

[13] 金則新, 李鈞敏, 李建輝. 木荷種群遺傳多樣性的ISSR分析[J]. 浙江大學學報(農業與生命科學版), 2007, 33(3): 271-276.

[14] 周家蓬, 裴智勇, 陳禹保, 等. 基于高通量測序的全基因組關聯研究策略[J]. 遺傳, 2014, 36(11): 1 099-1 111.

[15] Li G, Zhao Y, Liu Z, et al. De novo assembly and characterization of the spleen transcriptome of common carp (Cyprinus carpio) using Illumina paired-end sequencing[J]. Fish & Shellfish Immunology, 2015, 44: 420-429.

[16] 楊 華, 陳 琪, 韋朝領, 等. 茶樹轉錄組中SSR位點的信息分析[J]. 安徽農業大學學報, 2011, 38 (6): 882-886.

[17] Chen C, Zhou P, Choi YA, et al. Mining and characterizing microsatellites from citrus ESTs[J]. Theoretical and Applied Genetics, 2006, 112 (7): 1 248-1 257.

[18] 張新葉, 宋叢文, 張亞東, 等. 楊樹EST-SSR標記的開發[J]. 林業科學, 2009, 45(9): 53-59.

[19] 呂遠大, 李 坦, 石 麗, 等. 基于全基因組重測序信息開發玉米H99自交系特異分子標記[J]. 作物學報, 2014, 40(2): 191-197.

[20] 白俊艷, 王玉琴, 龐有志, 等. 絨山羊EST序列的生物信息學分析[C]//中國畜牧獸醫學會信息技術分會. 中國畜牧獸醫學會信息技術分會2012年學術研討會論文集. 北海: 中國畜牧獸醫學會. 2012: 5.

[21] Li S, Yin T. Map and analysis of microsatellites in the genome of Populus: The first sequenced perennial plant[J]. Science in China Series C: Life Sciences, 2007, 50(5): 690-699.

[22] 鄭 燕, 張 耿, 吳為人. 禾本科植物微衛星序列的特征分析和比較[J]. 基因組學與應用生物學, 2011, 30(5): 513-520.

[23] 孫蛟龍, 方 揚, 靳艷玲, 等. 浮萍轉錄組數據SSR位點的生物信息學分析[J]. 應用與環境生物學報, 2015, 21(3): 401-405.

[24] 肖 京. 棗基因組SSR位點特征分析及引物開發[D]. 保定: 河北農業大學, 2014.

[25] 蔣雪梅, 胡廷章, 向興勝, 等. 楊樹全基因組微衛星序列的統計及其生物信息學分析[J]. 西南農業學報, 2015, 28(2): 527-533.

[26] Hou S, Sun Z, Linghu B, et al. Genetic diversity of Buckwheat Cultivars (Fagopyrum tartaricum Gaertn.) assessed with SSR markers developed from genome survey sequences[J]. Plant Molecular Biology Reporter, 2016, 34(1): 233-241.

主站蜘蛛池模板: 国产人成在线视频| 欧美a网站| 黄色免费在线网址| 中文字幕第4页| 欧美在线一二区| 国产丰满成熟女性性满足视频 | 久久综合九色综合97网| 亚洲电影天堂在线国语对白| 成人在线天堂| 日韩高清成人| 国产国产人成免费视频77777| 呦视频在线一区二区三区| 2020亚洲精品无码| 国产一区二区精品福利| 91久久国产成人免费观看| 日韩小视频网站hq| 亚洲a级毛片| 福利一区在线| 婷婷开心中文字幕| 一级一级特黄女人精品毛片| 亚洲AV人人澡人人双人| 久久久久无码精品| 亚洲视频无码| 日韩AV无码一区| 天天做天天爱夜夜爽毛片毛片| 国产JIZzJIzz视频全部免费| 亚洲 日韩 激情 无码 中出| 国产精品福利导航| 亚洲国产欧美自拍| 中文一级毛片| 亚洲伦理一区二区| 欧美在线综合视频| 日本午夜三级| 精品国产成人三级在线观看| 成年女人18毛片毛片免费| 狂欢视频在线观看不卡| 亚洲人成网站在线播放2019| 久久综合AV免费观看| 人妻中文字幕无码久久一区| 亚洲欧美日韩精品专区| 亚洲一区无码在线| 欧洲亚洲一区| 亚洲成人一区在线| 国产精品自在在线午夜区app| 天天色综网| 91美女视频在线| 亚洲中文精品久久久久久不卡| 欧美成人手机在线视频| 亚洲精品无码不卡在线播放| 无码有码中文字幕| 国产精品无码翘臀在线看纯欲| 真实国产乱子伦视频| 国产无码网站在线观看| 高清色本在线www| 99久久国产综合精品2023| 亚洲区一区| 美美女高清毛片视频免费观看| 欧美一区二区啪啪| 91亚洲免费视频| 亚洲成aⅴ人在线观看| 国产欧美日韩va另类在线播放| 成人综合网址| 九月婷婷亚洲综合在线| 一级香蕉人体视频| 97人人做人人爽香蕉精品| 国产91九色在线播放| 亚洲欧洲美色一区二区三区| 在线日本国产成人免费的| 午夜人性色福利无码视频在线观看| 欧美高清三区| 四虎永久在线精品影院| 91精品国产一区自在线拍| 欧美亚洲一区二区三区在线| 男人天堂亚洲天堂| 国产精品视频猛进猛出| 久久香蕉国产线看观看式| 国产三级国产精品国产普男人 | 国产另类乱子伦精品免费女| 日韩视频免费| 国产情精品嫩草影院88av| 成人午夜久久| 欧美日一级片|