顏廷進 蒲艷艷 張文蘭 田茜 王棟 李群 戴雙 丁漢鳳



摘要:為了探索SNP標記技術在菜豆真實性和品種純度鑒定中的應用,采用2b-RAD技術對200份國內(nèi)外菜豆品種進行全基因組掃描、分析和評價,從中篩選出3 302個高分辨率、單拷貝和分布比較均勻的SNP標記,可以將除2個近等基因材料以外的198份品種資源區(qū)分開。基于組合最優(yōu)化算法,利用 Haploview 4.2軟件獲得了菜豆資源鑒定最少SNP位點組合一套,包含46個 Tag- SNP標記,與3 302個SNP標記區(qū)分結果相同。本研究可為菜豆真實性和品種純度鑒定技術體系的建立和指紋數(shù)據(jù)庫的構建奠定基礎。
關鍵詞:菜豆;SNP標記;品種真實性;品種純度;鑒定
中圖分類號:S643.1?文獻標識號:A?文章編號:1001-4942(2019)12-0111-09
Abstract?In order to explore single nucleotide polymorphism (SNP) markers applying in authenticity and purity identification of common bean varieties, two hundred common bean varieties and landraces from China and abroad were conducted genome-wide scanning, analysed and evaluated by 2b-RAD technology. Three thousand three hundred and two SNP markers were screened out with high resolution, single copy and uniform distribution in the linkage map, which could distinguish all the varieties and landraces except two near-isogenic materials. Based on the combinatorial optimization algorithm, 46 Tag-SNP markers as the minimum site combination of SNPs were obtained by Haploview 4.2 software,Whose distinguishing ability was as same as that of the 3 302 SNP markers. The study provided a foundation for the identification of variety genuineness and purity and the construction of fingerprint database of common bean.
Keywords?Common bean; SNP markers; Variety genuineness; Variety purity; Identification
菜豆(Phaseolus vulgaris L.)作為世界范圍內(nèi)重要的食用豆類作物,擁有最大的豆類種植面積[1],產(chǎn)量約占全球食用豆的一半[2]。它起源于中美洲和安第斯山兩個中心[3],并于500多年前引入中國進行栽培[4]。我國菜豆品種資源較為豐富[5],是世界上普通菜豆生產(chǎn)和消費的主產(chǎn)區(qū)之一。作為我國重要的植物蛋白質來源,菜豆在貧困地區(qū)營養(yǎng)供應和人類繁衍發(fā)展方面發(fā)揮了重要作用,同時也為發(fā)達地區(qū)膳食結構的調整做出巨大貢獻[6]。
農(nóng)作物品種真實性鑒定和純度分析是農(nóng)業(yè)生產(chǎn)發(fā)展過程中的重要技術和關鍵環(huán)節(jié)。隨著作物生物學研究的發(fā)展,菜豆品種的真實性和純度技術分析經(jīng)歷了多個階段。形態(tài)學方法主要是田間小區(qū)種植鑒定,依靠品種間的特征特性差異進行品種區(qū)分,是評價作物真實性、純度鑒定和遺傳多樣性的有效手段之一[7-9]。較多研究證實利用形態(tài)標記對普通菜豆品種進行真實性鑒定、結構分析和多樣性研究非常有效,有助于進一步了解品種形態(tài)變異特點及亞群之間的關系[10-13],但易受人為因素、環(huán)境氣候條件的影響,無法保證檢測結果的準確性及時效性。
隨著分子群體遺傳學理論和技術的發(fā)展,朊蛋白、同工酶等被用于作物品種結構和遺傳多樣性研究。其中朊蛋白標記方法在普通菜豆遺傳結構及多樣性研究中應用最廣泛[14-17]。蛋白質和同工酶是基因表達的產(chǎn)物,其遺傳方式并非全部表現(xiàn)為共顯性遺傳,多態(tài)性較少,對親緣關系較近及遺傳基礎復雜的材料難以鑒別。近年來,DNA分子標記技術由于具有豐富的多態(tài)性和顯著的個體特異性,能夠在分子水平上識別品種間差異,不易受外界環(huán)境影響,可快速、準確地完成品種鑒定[18-20]。SSR分子標記技術已應用于遺傳連鎖圖譜構建、品種鑒定和純度分析、基因定位、圖位克隆等多項研究中[21-24],同樣應用于玉米、小麥、甘藍、大豆、水稻、棉花、馬鈴薯等作物的鑒定工作[25-31]。但在實際應用過程中,SSR標記出現(xiàn)了不易實現(xiàn)數(shù)據(jù)整合和通量低等缺陷。單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)標記作為最新發(fā)展起來的分子標記,具有檢測通量大、分布密度廣、多態(tài)性高、遺傳穩(wěn)定性強、速度快等特點,并且國內(nèi)外很多公司推出的各種SNP分析檢測平臺,其分析系統(tǒng)自動化程度高、易于標準化操作,很好地彌補了SSR標記的技術缺陷,適合大規(guī)模SNP研究及基因分型。迄今,SNP標記技術已在水稻[32]、玉米[33,34]、大豆[35]、大麥[36]、棉花[37]等作物品種鑒定研究中得到廣泛應用。
本研究將SNP標記技術應用于200份普通菜豆的品種鑒定,利用抽提得到的DNA,采用2b-RAD技術,使用標準型5′-NNN-3′接頭與酶切標簽連接,于文庫質控合格后在Illumina Hiseq Xten平臺進行雙端測序,以期篩選出鑒定不同菜豆品種資源的最少SNP位點組合,并為菜豆品種測序真實性和純度鑒定技術體系的建立和指紋數(shù)據(jù)庫的構建奠定基礎。
1?材料與方法
1.1?試驗材料
供試樣品為200份菜豆品種(表1)。其中,152份材料引自美國西部植物引種站(Western Regional Plant Introduction Station),來源于墨西哥、哥倫比亞、秘魯、危地馬拉、玻利維亞等10個國家;48份為從國家資源庫引進的國內(nèi)品種,材料類型分為地方品種和栽培品種。
1.2?DNA提取和2b-RAD測序
采用Ezup柱式植物基因組DNA抽提試劑盒[生工生物工程(上海)股份有限公司產(chǎn)品]抽提菜豆基因組DNA,具體操作方法參照試劑盒說明書,并通過1%瓊脂糖凝膠電泳和Thermo Scientific NanoDrop ND-2000進行DNA質量和濃度檢測。
2b-RAD是一種簡化基因組測序技術,其原理是使用ⅡB型限制性核酸內(nèi)切酶將基因組DNA進行酶切,然后對酶切片段進行測序。本試驗所提DNA經(jīng)檢測后利用該技術進行酶切,酶切后的簡化基因組測定由青島歐易生物科技有限公司Illumina Hiseq Xten平臺完成。
1.3?測序質量分析和SNP基因分型
利用Illumina Hiseq Xten平臺對2b-RAD技術構建的200個菜豆樣品標簽測序文庫進行雙端(paired-end)測序,采用標準型5′-NNN-3′接頭建庫。將原始reads(測序時的最小序列單位)按照以下條件進行過濾:(1)剔除不含有限制性內(nèi)切酶(BsaXⅠ)識別位點的序列;(2)剔除低質量序列(質量值低于30的堿基超過15%,判定為低質量reads);(3)剔除含N堿基的序列。將得到的高質量reads用于后續(xù)分析。
對于有參考基因組的標記,采用RAD typing軟件,利用最大似然法進行分型。為了保證SNP位點分型的準確性和嚴謹性,進行以下條件的過濾:(1)剔除最小的等位基因頻率(MAF)小于0.01的SNP位點;(2)剔除SNP分型缺失率高于20%的位點;(3)剔除同一個標簽上SNP位點多于2個的數(shù)據(jù)。
1.4?數(shù)據(jù)分析
使用Haploview 4.2軟件進行SNP標簽統(tǒng)計分析,從而獲得鑒定菜豆所用的最少SNP位點組合,即核心SNP位點;通過TreeBeST 1.9.2軟件計算距離矩陣,構建系統(tǒng)進化樹。
2?結果與分析
2.1?SNP位點分布
參照Fu[38]等的基因分型策略,以菜豆為參考基因組(ftp://ftp.ncbi.nlm.nih.gov/genomes/all/GCF/000/499/845/GCF_000499845.1_PhaVulg1_0/GCF_000499845.1_PhaVulg1_0_genomic.fna.gz),根據(jù)比對結果統(tǒng)計樣品獲得的標簽數(shù)及深度信息并計算測序數(shù)據(jù)對參考基因組的覆蓋度。200個樣品的標簽平均數(shù)目為83 497,平均測序深度為29×,覆蓋度范圍0.38%~0.49%;獲得25 561個SNP位點,使用劃窗口的方式繪制SNP在染色體上的分布圖,窗口大小設置為200 kbp,每次移動100 kbp,統(tǒng)計區(qū)間內(nèi)的SNP數(shù)目,結果如圖1所示。SNP在菜豆染色體上的平均分布密度為每kb 4.92×10-2個。
2.2?核心SNP位點篩選
從獲得的25 561個SNP位點中刪除有缺失的SNP,剩余3 302個SNP位點,再用 Haploview 4.2軟件挑選 tag SNP,篩選條件: MAF=0.2,哈迪溫伯格平衡 p-value>10-7。試驗共篩選得到19個位點,將這19個位點連接成序列,得到146條序列。其中有四條序列分別對應16、17、5、3個菜豆樣品。用 Haploview 軟件繼續(xù)挑選16個樣品中的tag SNP,結合人工篩選,挑選出10個位點,可以將該類樣品分開。利用同樣的方法挑選tag SNP區(qū)分包含17、5、3個等個數(shù)的樣品,共挑選出17個位點。綜合分析可得,使用46個位點可以將198個品種樣品區(qū)分開來(表2)。
2.3?品種鑒別方法
將每個樣品的3 302個沒有缺失的位點連接成序列后,得到199條不同序列,可以很容易區(qū)分198個菜豆品種。為了進一步簡化操作程序,節(jié)約試驗成本,通過軟件分析結合人工挑選,篩選出46個核心位點。將每個品種的46個核心位點按染色體排列順序從左到右、從上到下連接成序列,也獲得了不同的199條序列(表3)。利用每個品種之間的位點差異、排列順序的不同,同樣可達到區(qū)分198個菜豆品種的目的。由于P-190 和 P-200 兩個樣品親緣關系較近,不能用此進行區(qū)分,因而必須使用有缺失的SNP位點(NC_023749.1-7722596位點)。本試驗共通過47個SNP位點完成了200個菜豆品種的區(qū)分工作。
2.4?系統(tǒng)進化樹
將每個SNP標記首尾相連,如果缺失相應的位點,則用“-”代替。獲得的序列采用鄰接法(neighbor-joining method)構建進化樹,利用TreeBesT 1.9.2軟件計算距離矩陣,進化樹的可靠性通過bootstrap 法進行檢驗(重復1 000次)。由圖2可以很清晰地看到,本試驗建立的SNP標記法可以將200份菜豆品種按照親緣關系的遠近分類,從而進一步探明了200份菜豆的進化歷程和親緣關系。
3?討論與結論
快速、準確、經(jīng)濟的檢測技術是研究工作者的追求目標。宋偉等[39]利用42個SNP位點的基因分型數(shù)據(jù)信息成功區(qū)分105份玉米自交系材料;劉麗華等[40]研究表明14個SNP標記與384個SNP標記區(qū)分能力相同,可區(qū)分378個小麥材料中的376個,僅有兩個近等位基因系的品種無法區(qū)分,區(qū)分開的比例為99.5%。本研究利用46個SNP位點成功對198個菜豆品種進行區(qū)分,區(qū)分開的比例為99%,對于親緣關系特別近的兩個樣品P1-199和P-200采用SNP缺失的辦法進行了區(qū)分。但隨著菜豆新品種數(shù)量的增加,已篩選出的核心SNP位點能否滿足要求,仍需進一步驗證,并且還可能需要再確定新的核心位點。但對于親緣關系特別近的品種,即使再增加核心位點也無法進行區(qū)分,建議使用“核心位點+擴展位點”相結合的模式,達到完全區(qū)分所有品種的目的。
目前,Cavanagh等[41]和Wang等[42]分別開發(fā)了小麥9k和90k高通量SNP分析芯片,用于小麥身份鑒定。以后的應用研究中,我們應進一步驗證菜豆46個核心SNP位點的有效性,若能成功區(qū)分所有菜豆品種,可以考慮將46個SNP位點連成序列,做成芯片,進而構建菜豆品種真實性和品種鑒定數(shù)據(jù)庫,直接用于菜豆品種真實性和品種純度鑒定。
參?考?文?獻:
[1]?Kole C. Wild crop relatives: genomic and breeding resources legume crops and forages[M]. New York: Springer, 2011.
[2]?Wilson R F, Stalker H T, Brummer E C. Legume crop genomics[M]. Champaign: AOCS Press, 2004: 61-82.
[3]?張曉艷, 王坤, 王述民. 普通菜豆種質資源遺傳多樣性研究進展[J]. 植物遺傳資源學報, 2007,8(3): 359-365.
[4]?鄭卓杰. 中國食用豆類學[M]. 北京: 中國農(nóng)業(yè)出版社, 1997.
[5]?郝曉鵬, 田翔, 王燕, 等. 山西普通菜豆種質資源籽粒品質分析和評價[J]. 山西農(nóng)業(yè)科學, 2016, 44(6): 808-810,832.
[6]?宗緒曉. 食用豆類高產(chǎn)栽培與食品加工[M]. 北京: 中國農(nóng)業(yè)科學技術出版社, 2002: 227-249.
[7]?Newbury H J, Ford-Lloyd B V. Estimation of genetic diversity[M]. Dordrecht: Springer, 2000: 192-206.
[8]?Delacy I H,Skovmand B,Huerta J. Characterization of Mexican wheat landraces using agronomically useful attributes[J]. Genetic Resources and Crop Evolution, 2000, 47(6): 591-602.
[9]?Dotlacil L, Hermuth J, Stehno Z, et al. Diversity in European winter wheat landraces and obsolete cultivars[J]. Czech Journal of Genetics & Plant Breeding, 2000, 36: 29-36.
[10]欒非時, 崔成煥, 王金陵. 菜豆種質資源形態(tài)標記的研究[J]. 東北農(nóng)業(yè)大學學報, 2001, 32(2): 134-138.
[11]張赤紅, 曹永生, 宗緒曉, 等. 普通菜豆種質資源形態(tài)多樣性鑒定與分類研究[J]. 中國農(nóng)業(yè)科學, 2005, 38(1): 27-32.
[12]張曉艷, 王坤, Blair M W, 等. 中國普通菜豆形態(tài)性狀分析及分類[J]. 植物遺傳資源學報, 2007, 8(4): 406-410.
[13]王蘭芬, 武晶, 王昭禮, 等. 普通菜豆種質資源表型鑒定及多樣性分析[J]. 植物遺傳資源學報, 2016, 17(6):976-983.
[14]Igrejas G, Carnide V, Pereira P, et al. Genetic diversity and phaseolin variation in Portuguese common bean landraces[J]. Plant Genetic Resources, 2009, 7(3): 230-236.
[15]雷蕾, 王蘭芬, 武晶, 等. 中國普通菜豆種質資源朊蛋白變異及多樣性分析[J]. 植物遺傳資源學報, 2017, 18(6): 1006-1012.
[16]Negahi A, Bihamta M R, Negahi Z. Diversity in Iranian and exotic common bean (Phaseolus vulgaris L.) using seed storage protein (phaseolin)[J]. Agricultural Communications, 2014, 2(4): 34-40.
[17]Carovic'-Stanko K, Liber Z, Vidak M, et al. Genetic diversity of Croatian common bean landraces[J]. Frontiers in Plant Science, 2017, 8: 604.
[18]Roy S, Ray B P, Sarker A, et al. DNA fingerprinting and genetic diversity in lentil germplasm using SSR markers[J]. Asian Journal of Conservation Biology, 2015, 4(2): 109-115.
[19]Brown S, Higham T, Slon V, et al. Identification of a new hominin bone from Denisova Cave, Siberia using collagen finger printing and mitochondrial DNA analysis[J]. Scientific Reports, 2016, 6:23559.
[20]Salimizand H, Menbari S, Ramazanzadeh R, et al. DNA fingerprinting and antimicrobial susceptibility pattern of clinical and environmental Acinetobacter baumannii isolates: a multicentre study[J]. Journal of Chemotherapy, 2016, 28(4): 277-283.
[21]張增翠, 侯喜林. SSR分子標記開發(fā)策略及評價[J]. 遺傳, 2004, 26(5): 763-768.
[22]Min S K, Choi B, Park J H, et al. Assessment of genetic diversity and population structure of the sub core set in sesame(Sesamum indicum) using SSR markers[J]. Gene, 2016, 28(1): 73-83.
[23]Dencic S, Depauw R, Momcilovic V, et al. Comparison of similarity coefficients used for cluster analysis based on SSR markers in sister line wheat cultivars[J]. Genetika, 2016, 48(1): 219-232.
[24]An M, Deng M, Zheng S S , et al. De novo transcriptome assembly and development of SSR markers of oaks Quercus austrocochinchinensis and Q. kerrii(Fagaceae)[J]. Tree Genetics & Genomes, 2016, 12(6): 103-112.
[25]王鳳格, 楊揚, 易紅梅, 等. 中國玉米審定品種標準SSR 指紋庫的構建[J]. 中國農(nóng)業(yè)科學, 2017, 50(1): 1-14.
[26]Yumiko F, Hiroyuki F, Hiroshi Y. Identification of wheat cultivars using EST-SSR markers[J]. Breeding Science, 2009, 59: 159-167.
[27]王慶彪, 張揚勇, 莊木, 等. 中國50個甘藍代表品種EST-SSR指紋圖譜的構建[J]. 中國農(nóng)業(yè)科學, 2014, 47(1): 111-121.
[28]謝華, 關榮霞, 常汝鎮(zhèn), 等. 利用SSR標記揭示我國夏大豆(Glycine max(L.) Merr)種質遺傳多樣性[J]. 科學通報, 2005, 52(5): 343-351.
[29]張云, 龍云星, 奎麗梅, 等. 我國水稻兩用核不育系 SSR 遺傳多樣性分析[J]. 分子植物育種,2017, 15(7): 2836-2846.
[30]匡猛, 楊偉華, 許紅霞, 等. 中國棉花主栽品種 DNA 指紋圖譜構建及SSR標記遺傳多樣性分析[J]. 中國農(nóng)業(yè)科學, 2011, 44(1): 20-27.
[31]段艷鳳, 劉杰, 卞春松, 等. 中國88個馬鈴薯審定品種SSR指紋圖譜構建與遺傳多樣性分析[J]. 作物學報, 2009, 35(8): 1451-1457.
[32]Shirasawa K, Shiokai S, Yamaguchi M, et al. Dot-blot-SNP analysis for practical plant breeding and cultivar identification in rice[J]. Theoretical and Applied Genetics, 2006, 113(1):147-155.
[33]Jones E S, Sullivan H, Bhattramakkid A, et al.A comparison of simple sequence repeat and single nucleotide polymorphismmarker technologies for the genotypic analysis of maize(Zea mays L.)[J]. Theoretical and Applied Genetics, 2007, 115(3): 361-371.
[34]Tian H L, Wang F G, Zhao J R, et al. Development of maize SNP3072, a high-throughput compatible SNP array, for DNA fingerprinting identification of Chinese maize varieties[J]. Molecular Breeding, 2015, 35: 136.
[35]Yoon M S, Song Q J, Choii Y, et al. Barcsoy SNP23: a panel of 23 selected SNPs for soybean cultivar identification[J]. Theoretical and Applied Genetics, 2007, 114(5): 885-899.
[36]張利莎, 董國清, 扎桑, 等. 基于 EST-SSR和 SNP 標記的大麥麥芽純度檢測[J]. 作物學報, 2015, 41(8) :1147-1154.
[37]Kuang M, Wei S J, Wang Y Q, et al. Development of a core set of SNP markers for the identification of upland cotton cultivars in China[J]. Journal of Integrative Agriculture, 2016, 15(5): 954-962.
[38]Fu X, Dou J, Mao J, et al. RAD typing: an integrated package for accurate de novo codominant and dominant RAD genotyping in mapping populations[J]. PloS ONE, 2013, 8(11):e79960.
[39]宋偉, 王鳳格, 田紅麗, 等. 利用核心SNP位點鑒別玉米自交系的研究[J]. 玉米科學, 2013,21(4): 28-32.
[40]劉麗華, 龐斌雙, 劉陽娜, 等. 基于 SNP 標記的小麥高通量身份鑒定模式[J]. 麥類作物學報,2018, 38(5): 529-534.
[41]Cavanagh C R, Chao S, Wang S, et al. Genome-wide comparative diversity uncovers multiple targets of selection for improvement in hexaploid wheat landraces and cultivars[J]. Proc. Natl. Acad. Sci. U. S. A., 2013, 110(20): 8057-8062.
[42]Wang S, Meyer E, Mckay J K, et al. 2b-RAD: a simple and flexible method for genome-wide genotyping[J]. Nature Methods, 2012, 9(8):808-810.