葛辰等
摘要:大鱗副泥鰍是鰍科重要經濟魚類,通過Illumina HiSeq 2000測序平臺對2個大鱗副泥鰍樣本的轉錄本進行了高通量測序,其中AB2011M-1是群體中生長較快的10尾魚的混合轉錄本,AB2011M-2是生長較慢的10尾魚的混合轉錄本。通過對以上2個混合轉錄本的測序,分別獲得了65 536和80 786個單核苷酸多態性(single nucleotide polymorphisms,SNP)突變;對2個測序樣本進行表達差異的比較,獲得了39個表達差異基因。隨機選取120個位點設計引物,進行驗證分析,共獲得16個有效的多態性標記。
關鍵詞:大鱗副泥鰍;高通量測序;SNP;多態性標記;引物設計
中圖分類號: S917.4文獻標志碼: A文章編號:1002-1302(2014)10-0021-07
主要從事魚類遺傳育種與保護生物學研究。E-mail:lingqf@suda.edu.cn。大鱗副泥鰍(Paramisgurnus dabryanus)屬鯉形目鰍科花鰍亞科副泥鰍屬,別稱板鰍、黃板鰍,是一種底棲雜食性淡水魚類,主要分布于東亞地區。大鱗副泥鰍的肉質鮮美、營養豐富[1],近幾年來,其市場需求量不斷增大,已成為我國重要的水產養殖物種[2]。
育種是應用各種遺傳學方法,改造生物的遺傳結構,實現培育出高產優質品種的目標[3]。通過傳統育種方法獲得一個新品種需要經過5代以上人工選擇[4],因此,利用傳統的育種方法獲得優良品系需要投入大量的時間、人工和資源;且育種操作多憑經驗來控制選擇手段,影響因素較多,不能快速滿足當前漁業發展對水產良種的需要。
隨著分子生物學的發展,分子標記輔助育種(molecular assisted selection,MAS)技術已日趨成熟。最早應用于MAS育種的分子標記有限制性片段長度多態性(restriction fragment length polymorphism,RFLP)、隨機擴增多態 DNA (random amplified polymorphic DNA,RAPD)[5]、擴增片段長度多態性(amplified fragment length polymorphism,AFLP)[6]等標記方法。近年來,簡單重復序列(Simple Sequence Repeat,SSR)和單核苷酸多態性(single nucleotide polymorphism,SNP)也被應用于MAS育種[6-7]。其中,SNP作為新興的分子標記,擁有數目多、分布廣、遺傳穩定等優點而廣泛受到關注。
篩選未知或已知SNP的方法有等位基因特異寡核苷酸片段分析(allele-specific oligonucleotide,ASO)[8]、基因芯片技術(gene chips)[9]、探針技術(TaqMan)[10]、AFLP[11]、變性梯度凝膠電泳(denatured gradient gel electrophoresis,DGGE)、單鏈構想多態性(single strand conformation polymorphism,SSCP)[12]、直接測序等方法。這些方法各有所長,在不同的分析領域得到了廣泛的應用。其中,最快捷、開發量最大的是高通量測序方法,該方法通過不同個體的同一DNA片段的直接測序以及序列比對,使SNP突變的檢出率可達100%,且可以直接得到突變堿基的類型及其準確位置等 SNPs 分型的參數[13-14]。
在水產動物中,鯉[15]、草魚[16]、大口黑鱸[17]、櫛孔扇貝[18]等均已有SNP的研究報道,但迄今為止,尚未見到通過高通量測序批量開發大鱗副泥鰍SNP的研究報道。本研究旨在開發與生長差異相關的多態性SNP標記,為大鱗副泥鰍的分子育種奠定理論基礎和實踐方法。
1材料與方法
1.1試驗材料
2011年,以400組洪澤湖野生大鱗副泥鰍為親本,進行人工繁殖,獲得1個混合選育群體。2012年10月,隨機采樣200尾子代,測量體寬、體長、全長、周長、體厚和體重等性狀指標,然后選取生長顯著快速的10尾魚[體質量(11.02±103) g]和顯著緩慢的10尾魚[體質量(2.25±0.36) g],分別標志為混合樣本AB2011M-1和AB2011M-2。分別提取以上2組試驗魚的肌肉組織,于RNA樣本保存液 (D311A,TaKaRa) 中4 ℃保存備用。
1.2RNA的提取與轉錄組文庫構建
用TRIzol 試劑對樣本肌肉組織提取總RNA,等量混合成快、慢2個轉錄組測序樣本。對cDNA庫進行片段長度的篩選,進行PCR擴增(使用Phusion DNA聚合酶,共15個循環),擴增產物由2%瓊脂糖電泳檢測,回收300~500 bp的cDNA片段。
1.3轉錄組測序與組裝
通過TBS-380微型熒光計的定量化測定,具有雙末端的cDNA片段在Illumina HiSeq 2000 (讀長長度為2×100 bp)平臺上進行測序。
使用SeqPre(https://github.com/jstjohn/SeqPrep) 和condetri_v2.0.pl (http://code.google.com/p/condetri/downloads/detail?name=condetri_v2.0.pl )軟件進行序列除雜。用Trinity軟件對去雜后片段進行序列組裝和拼接(http://trinityrnaseq.sourceforge.net/)。
1.4轉錄本基因注釋
使用蛋白質非冗余數據庫(NR數據庫)中的的BlastX程序進行轉錄本的比對,E值的設定為小于1.0×10-5[19]。比對獲得的序列使用Blast 2 GO軟件進行GO(gene ontology)注釋[20],GO分類使用in-house perl scripts[21];然后使用軟件blastx/blastp 2.2.24+對序列進行KEGG(kyoto encyclopedia of genes and genomes)分析。
1.5SNP分析
將拼接好的序列作為對比模板,通過軟件Samtools (http://samtools.sourceforge.net/)和VarScan v.2.2.7(http://varscan.sourceforge.net/)將從AB2011M-1和AB2011M-2中獲得的序列信息分別與模板進行對比,得到候選SNP的信息。根據分析結果,選取差異基因所含的SNP,設計引物進行驗證。用Primer 5.0軟件設計引物,引物合成由生工生物工程(上海)股份有限公司完成。PCR擴增的反應體系為 20 μL,包含1 μL DNA模板,10 μL 2× PCR Mix(CW2296,世紀康為),上下游引物各1 μL,7μL H2O。PCR反應循環流程為:94 ℃預變性3 min;94 ℃變性30 s,55 ℃退火40 s,72 ℃延伸30 s,25個循環;72 ℃延伸5 min。PCR產物首先通過2%瓊脂糖電泳進行初步篩選,具有清晰條帶的標記再通過6%聚丙烯凝膠電泳進行基因分型。在進行聚丙烯凝膠電泳前,用SSCP變性劑對產物進行95 ℃變性10 min,并立即冰浴處理。SSCP變性劑配方包括49 mL去離子甲酰胺、1 mL 0.5 mol/L EDTA(pH值8.0)、0.1 g溴酚藍、0.1 g二甲苯青FF。DNA分子質量標記采用Takara公司的DL-1 000 DNA marker。
2結果與分析
2.1數據的篩選、拼接與注釋
3討論與結論
3.1測序結果注釋
在本研究中,58.56%的序列預測到ORFs,60.98%的序列在NR數據庫中得到注釋,注釋到的基因參與了大鱗副泥鰍的代謝和其他生物過程,沒有被注釋到的基因可能是此物種的特異基因,需要通過進一步的研究將這些特異基因擴充至各個數據庫中,以豐富數據庫的內容。
3.2SNP的開發
本研究通過第二代測序技術在2個樣本中分別獲得 65 536 和80 786個SNP。由于是對轉錄本進行測序,因此,這些SNP又稱為cSNP。cSNP在轉錄區域形成的頻率遠低于非轉錄區[22],在生物進化中這是為了保護物種的穩定性,轉錄區發生的非同義SNP突變可能會在進化過程中被淘汰,達到保護的目的[23]。cSNP與相關性狀有重要的聯系,因此,cSNP 往往具有重要的研究價值,可以為進一步的相關性狀關聯、代謝通路、遺傳作圖研究提供有效的工具,為分子育種奠定基礎。
SNP突變形式有轉換(C/T,G/A)和顛換(C/A,G/T,C/G,A/T),研究表明轉換出現的頻率約為顛換頻率的2倍[24]。本研究中,轉換/顛換為1.39,和Manuel等人對比目魚 EST-SNP 研究結果相近(1.408)[25],與鮭魚[26]、烏頰魚[27]和斑馬魚[28]的EST-SNP研究結果(1.885)有一定差距,表明了不同生物在進化過程中承受著不同的進化壓力[22]。
3.3SNP的驗證
SNP是單個堿基引起的突變,在檢測中可能會造成假陽性,影響試驗的準確性[25-26],因此,采取32個個體重復2次SSCP檢測,以消除假陽性干擾。本研究SNP驗證率(239%)較預期(50%)低,可能是由于使用的擴增模板是DNA,其中的內含子會同時被擴增出來。內含子也可能存在SNP的干擾,造成擴增片段長度過大、擴增條帶多而雜,降低了在聚丙烯凝膠電泳中的分辨率[29],由此造成某些具有多態的SNP無法被鑒定。
參考文獻:
[1]Cho Y S,Kim B S,Kim D S,et al. Modulation of warm-temperature-acclimation-associated 65-kDa protein genes (Wap65-1 and Wap65-2) in mud loach (Misgurnus mizolepis,Cypriniformes) liver in response to different stimulatory treatments[J]. Fish & Shellfish Immunology,2012,32(5):662-669.
[2]倪勇,伍漢霖. 江蘇魚類志[M]. 北京:中國農業出版社,2006:391.
[3]樓允東. 魚類育種學[M]. 北京:中國農業出版社,2001.
[4]孫效文. 魚類分子育種學[M]. 北京:海洋出版社,2010.
[5]Jackson T R,Ferguson M M,Danzmann R G,et al.Identification of two QTL influencing upper temperature tolerance in three rainbowtrout (Oncorhynchus mykiss) half-sib familie[J]. Heredity,1998,80:143-151.
[6]Robison B D,Wheeler P A,Sundin K,et al. Composite interval mapping reveals a major locus influencing embryonic development rate in rainbow trout (Oncorhynchus mykiss)[J]. The Journal of Heredity,2001,92(1):16-22.
[7]Kocher T D,Lee W J,Sobolewska H,et al. A genetic linkage map of a cichlid fish,the tilapia(Oreochromis niloticus)[J]. Genetics,1998,148(3):1225-1232.