肖海霞 阿布來提·蘇來曼 托乎提·阿及德 努爾尼薩·莫拉尼亞孜 張國庭 帕熱哈提江·吾甫爾 王 瓊 蘇玲玲 謝立榮 劉應進 買買提·克玉木 田可川 劉武軍
(1新疆畜牧科學院畜牧研究所,新疆烏魯木齊 830011;2新疆畜牧科學院,新疆烏魯木齊 830011;3新疆農業大學,新疆烏魯木齊 830052)
中國是世界上畜禽遺傳資源最豐富的國家之一,《國家畜禽遺傳資源品種名錄(2021版)》已確定948個畜禽品種。畜禽資源是中國種業創新、打贏種業翻身仗的根基。當前,組織開展的第3次全國畜禽遺傳資源普查為摸清畜禽和蜂、蠶遺傳資源家底,發掘一批新資源,科學評估資源珍貴稀有程度和瀕危狀況,實現應收盡收、應保盡保,打好種業翻身仗奠定種質資源基礎。我國現有24個驢品種,新疆主要有和田青驢、吐魯番驢和新疆驢3個地方品種和1個注冊的商標品牌——疆岳驢。疆岳驢是1958—2003年新疆喀什地區岳普湖縣先后8次從陜西省引進優質關中驢和當地地方品種新疆驢進行雜交改良,形成具有適應性強、耐粗飼、抗病力強、生產性能較高的良種驢,深受各地農牧民喜愛,已被全國20多個省區引作種畜,但至今未進行品種審定[1]。
SLAF-seq(specific?locus amplified fragment sequenc?ing)[2]是一種基于高通量測序為基礎的酶切簡化基因組技術,可快速鑒定出高密度的SNP位點,并在此基礎上進行系統發生樹分析、群體結構分析、遺傳圖譜整合、QTL定位等后期分析。SLAF-seq簡化基因組測序在生物遺傳多樣性方面得到了較為廣泛的運用[3]。雖然目前SLAFseq技術在驢上的應用尚無報道,但該技術對于植物或者動物的DNA測序流程、基因分型以及隨后的序列分析均無差異[4]。因此,本文采用簡化基因組測序技術(SLAFseq),選擇足夠多的疆岳驢樣本,獲得高密度覆蓋全基因組的SNP標記,通過SNP標記進行疆岳驢群體遺傳學研究,以期為疆岳驢的關聯遺傳學研究、定位重要乳用性狀相關基因、優質資源開發利用和培育新品種(配套系)奠定堅實基礎。
1.1 試驗材料新疆喀什地區岳普湖縣新疆金陽光畜牧養殖有限公司125頭疆岳驢頸靜脈采血3~5 mL,檸檬酸鈉抗凝,-20 ℃保存。
1.2 試驗方法
1.2.1 SLAF-seq簡化基因組測序 利用天根血液基因組DNA提取試劑盒提取樣品基因組DNA。經質檢合格后,選擇最適的酶切方案酶切驢樣品DNA。將獲得的SLAF標簽(酶切片段)的3′端處理連接Dual-index[5]測序接頭、PCR擴增和純化、樣品混合和凝膠切割,以選擇目標片段,然后鑒定文庫,并通過illuminahiseq測序。
1.2.2 SNP質控 用BWA[6]將測序讀取并與參考基因組進行比較,GATK[7]和samtools[8]用于開發SNP,根據完整度>0.5,MAF>0.05過濾。
1.2.3 統計分析 通過MEGA5[9]軟件的neighbor-joining算法,構建樣品的群體進化樹。通過admixture[10]軟件,分析樣品的群體結構,分別假設樣品的分群數(K值)為1~10,進行聚類。對聚類結果進行交叉驗證,根據交叉驗證錯誤率的谷值確定最優分群數。通過EIGENSOFT[11]軟件,進行主成分分析(PCA),得到樣品的主成分聚類情況。使用SPAGeDi[12]軟件可以對自然群體個體間的親緣關系進行估計。當2個材料之間的親緣關系值<0時,則直接定義為0。
2.1 疆岳驢基因組SNP標記的開發與篩選對疆岳驢基因組進行電子酶切預測,最終確定使用RsaI+EcoRVHF@酶切,酶切片段長度為364~394 bp的序列定義為SLAF 標簽,預測SLAF 標簽數為234 762 個。試驗中RsaI+EcoRV-HF@酶切酶切效率是95.24%,共得到1 318.13M reads。通過生物信息學分析,獲得1 416 014個SLAF 標簽,平均測序深度為880.87 x,其中多態性的SLAF標簽共有900 598個,共得到4 887 196個SNP標記(圖1)。

圖1 SNP在染色體上的分布
2.2 系統發育分析基于MEGA5軟件的neighbor-joining
算法,構建125頭疆岳驢的群體進化樹。由圖2可知,125頭疆岳驢聚集為2個大的分支:1個分支79頭聚集在一起,親緣關系較近;另1分支46頭聚集在一起,親緣關系較近。這2個分支親緣關系較遠。

圖2 125頭疆岳驢的系統進化樹
2.3 遺傳結構分析基于SNP,通過admixture軟件計算樣品的群體結構Q[13]。分別假設125個樣品的分群數(K值)為1~10,進行聚類,根據各個K值對應的交叉驗證錯誤率位置來確定分群數,擁有最低交叉驗證錯誤率K值的分群數為最優分群數,結果顯示當K值為2時峰值最低(圖3),說明當把樣品分為2個群來計算群體結構Q時最優。

圖3 125頭疆岳驢的群體結構與聚類分析結果
2.4 PCA分析PCA能對樣本的具體分組及親緣關系情況進行評估,并查看樣本在結果中的分布是否與試驗設計及表型一致。125頭疆岳驢PCA聚類見圖4,樣本比較清晰的分成2個大群,群內空間距離較近,關系比較接近;群間空間距離較遠,親緣關系較遠。這與系統發育樹結果相一致。

圖4 125頭疆岳驢PCA聚類圖
2.5 親緣關系分析使用SPAGeDi軟件可以對群體間的親緣關系進行估計,結果顯示125頭疆岳驢親緣關系在0.4和1.0頻率最高,提示可分為2個群體,進一步佐證了進化樹、PCA的聚類結果,Kinship值的頻率分布見圖5。

圖5 125頭疆岳驢親緣關系頻率分布
我國是世界上畜禽遺傳資源最豐富的國家之一,數量眾多、特點突出的種質資源是加快畜禽種質創新、培育國內產業優勢、實現多元化發展不可或缺的戰略性資源。目前,國家畜禽遺傳資源品種名錄(2021年版)確定了948個畜禽品種,這些珍貴的基因是畜禽育種和種業創新的基礎素材。由于畜禽遺傳資源屬于可變性和可更新資源,一直處于動態變化中。摸清并掌握畜禽種質資源家底,及時了解畜禽資源的動態變化,將為行業管理、科學研究和產業發展提供基礎支撐。當前,組織開展的第三次全國畜禽遺傳資源普查將依托畜禽保種養殖場全面系統開展生產性能測定,在分子水平上收集整理有關遺傳信息,推動建立畜禽品種DNA特征庫,國家畜禽遺傳資源委員會對新發現的遺傳資源將按規定及時進行鑒定評估。發掘種質資源和優異基因,將為中國畜禽種業自主創“芯”做好準備。通過資源調查和科學評估,摸透并掌握這些品種和特性,對當前乃至未來產業發展具有重要價值。
世界毛驢資源也很豐富,共有194個品種,其中我國有24個地方驢品種(主要分大、中、小型驢3種)。新疆主要有3個地方品種(和田青驢、吐魯番驢和新疆驢)和1個品牌(疆岳驢)。疆岳驢是20世紀50年代以來先后8次引進關中驢對新疆驢進行雜交改良、橫交固定、選育提高[15]、培育而成的優良高產大型役肉兼用型驢,具有適應性強、耐粗飼、抗病力強、生產性能較高等特點,深受各地農牧民喜歡。最初曾被稱為“岳普湖關中驢”、“關新驢”,現被稱為“疆岳驢”,主要分布于喀什地區岳普湖、伽師、巴楚、疏勒、英吉沙、喀什等縣市[16-18]。岳普湖縣是疆岳驢的發源地且飼養數量較多,2000年疆岳驢作為1個品牌通過國家商標管理局注冊命名,2004年7月岳普湖縣被農業部特產之鄉暨宣傳活動組織委員會命名為“中國毛驢之鄉”[19-20],但至今未進行品種審定。陸東林等[1]通過介紹新疆疆岳驢的培育過程、中心分布區、外貌特征、體尺體重、生產性能、飼料飼養、遺傳育種等研究進展情況,建議運用現代遺傳育種技術,加強優良性能基因的篩選和種驢培育,開展系統的選育和純繁,為疆岳驢的品種鑒定和審定奠定基礎。
簡化基因組測序技術(specific?locus amplified frag?ment sequencing,SLAF-seq),利用限制性內切酶對基因組進行酶切,產生一定大小的片段,構建測序文庫,對酶切后產生的SLAF標記進行高通量測序[21]。黃倫[22]以四川省38個樣點蜜蜂為主要研究對象,利用SLAF-seq簡化基因組測序技術共獲得268 631個SLAF標簽,標簽的平均測序深度為253.24 x,其中,多態性SLAF標簽有189 234個,共獲得1 018 013個SNP標記。樊英智[23]通過對6個不同類型的中國家驢品種群體進行全基因組混池重測序共獲得700多萬個單核普酸多態性(SNPs)變異信息。王文浩[21]基于酶切的SLAF-seq簡化基因組測序技術測定391只11世代的京海黃雞,共得到103 680個SLAF標記和90 030個SNPs。本研究通過SLAF-seq簡化基因組測序技術獲得1 416 014個SLAF標簽,平均測序深度為880.87 x,其中多態性的SLAF標簽共有900 598個,共得到4 887 196個SNPs。楊虎等[24]利用8個微衛星標記檢測了新疆3個地方驢品種的遺傳多樣性,計算了各群體的平均遺傳雜合度(h)、多態信息含量(PIC)和群體間遺傳距離。這說明新疆地方驢遺傳多樣性豐富,群體遺傳變異程度較高,育種潛力大。聚類分析表明和田驢先與喀什驢聚為一類,然后與吐魯番驢聚類,與史料及地理分布一致。Li等[25]使用SLAF-seq技術做出了包含20個連鎖群的5 785個SLAFs的大豆的高密度遺傳圖譜,該圖譜將有效促進大豆潛在重要農業性狀相關基因和QTLs的鑒定。黃倫[22]基于SLAF-seq基礎上進行群體遺傳學分析發現,四川地區中蜂從分子水平上明顯分為6個種群:阿壩種群、甘孜1種群、甘孜2種群、涼山攀枝花種群、四川盆地。樊英智[23]在全基因組混池重測的基礎上進行的主成分分析(PCA)顯示關中驢與和田青驢先聚在一起且它們與庫倫驢遺傳距離很近,其他3個品種驢與關中驢、和田青驢、庫倫驢距離都較遠且它們之間也相距較遠。本研究通過MEGA5軟件的neighbor-joining算法,構建125頭疆岳驢的群體進化樹發現其中79頭為1個分支,46頭為另外1個分支。分支內親緣關系較近,分支間親緣關系較遠;通過admixture軟件對聚類結果進行交叉驗證,通過主成分分析(PCA)分析進行評估,使用SPAGeDi軟件進一步佐證了125頭疆岳驢驢分成了2個群體,這可能與該公司外購驢有關,形成了純種疆岳驢和雜種的疆岳驢2個群體。這個結果為疆岳驢的鑒定和申報新品種(配套系)奠定了堅實的基礎。
應用SLAF-seq簡化基因組測序技術對125頭疆岳驢血液DNA進行檢測,獲得4 887 196個疆岳驢的群體SNP標記;通過系統發育、遺傳結構、PCA和親緣關系分析發現125頭疆岳驢分成2個群體,為爭取在第三次全國畜禽遺傳資源普查申報新培育品種(配套系)和疆岳驢重要性狀QTL定位奠定基礎。