劉正喜,武 斌,胡明月,白春艷,趙中利,曹 陽(yáng),馬惠海*,閆守慶* (.吉林大學(xué) 動(dòng)物科學(xué)學(xué)院,吉林 長(zhǎng)春 3006;.吉林省農(nóng)業(yè)科學(xué)院 畜牧獸醫(yī)研究所,吉林 公主嶺 3600)
單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)是指在DNA水平上因單個(gè)核苷酸的替換、插入或缺失導(dǎo)致的核酸序列多態(tài)性[1]。插入/缺失多態(tài)性(insertion/deletion,InDel)是指基因組中某個(gè)等位基因座位上因插入或缺失了小片段 DNA所產(chǎn)生的多態(tài)性[2]。與其他種類的分子遺傳標(biāo)記相比,SNP和InDel標(biāo)記具有在基因組中分布廣泛、穩(wěn)定性好和檢測(cè)易自動(dòng)化和規(guī)模化等優(yōu)勢(shì)。隨著2代測(cè)序技術(shù)的快速發(fā)展和測(cè)序價(jià)格的下降,SNP和InDel分子標(biāo)記已在大量非模式生物中被廣泛挖掘,并廣泛應(yīng)用于遺傳圖譜構(gòu)建[3]、重要經(jīng)濟(jì)性狀主效基因定位[4-5]、種屬鑒定[6]、個(gè)體識(shí)別[7]、生物群體遺傳結(jié)構(gòu)以及系統(tǒng)發(fā)育分析等方面[8-9]。
綿羊?qū)俣唇强?Bovidae)綿羊?qū)?Ovis)動(dòng)物,是人類最早被馴化的家養(yǎng)動(dòng)物之一,可為人類提供食物和附屬品(肉、毛、皮和奶等)[10]。近年來,國(guó)內(nèi)羊肉產(chǎn)品消費(fèi)需求急劇增長(zhǎng),但是目前在我國(guó)肉羊產(chǎn)業(yè)發(fā)展中,引進(jìn)品種的繁殖力低和地方品種的生長(zhǎng)速度慢是制約肉羊生產(chǎn)的兩個(gè)主要問題,因此生長(zhǎng)速度快且繁殖力高的肉用綿羊新品種或品系的培育勢(shì)在必行[11]。
雙乾肉羊是吉林省農(nóng)業(yè)科學(xué)院利用杜泊羊?yàn)楦副尽⒓质”镜鼐d羊?yàn)槟副荆ㄟ^雜交、回交以及橫交固定等常規(guī)育種手段結(jié)合分子標(biāo)記輔助選擇方法,選育出的具有采食性好、生長(zhǎng)速度快和產(chǎn)仔數(shù)高等種質(zhì)特性的肉用羊新種群。雙乾肉羊群體中有黑頭、紅頭和白頭3種毛色類型,雜交試驗(yàn)表明不同毛色表型均可穩(wěn)定遺傳。
本研究以紅頭和黑頭雙乾肉羊?yàn)樵囼?yàn)動(dòng)物,基于基因組重測(cè)序技術(shù),檢測(cè)紅頭和黑頭雙乾肉用綿羊全基因組SNP/InDel標(biāo)記數(shù)量和染色體分布,然后基于SNP/InDel做選擇信號(hào)分析,鑒定影響雙乾肉羊毛色的候選基因及因果突變,研究結(jié)果可為解析雙乾肉羊種質(zhì)特性以及品種選育提供分子標(biāo)記和理論依據(jù)。
1.1 試驗(yàn)材料本試驗(yàn)中52只黑頭和60只紅頭雙乾肉羊抗凝血樣本采自吉林省乾安肉羊有限責(zé)任公司,使用EDTA-K2抗凝,搖勻后送至實(shí)驗(yàn)室-20℃ 保存?zhèn)溆谩?/p>
1.2 主要試劑血液基因組DNA提取試劑盒(EasyPure?Blood Genomic DNA Kit)購(gòu)自北京全式金生物技術(shù)有限公司;2×Taq PCR Mastermix、DL2000 DNA Marker和瓊脂糖凝膠DNA回收試劑盒購(gòu)自天根生化科技(北京)有限公司;其他試劑均為國(guó)產(chǎn)或進(jìn)口分析純。
1.3 DNA提取、文庫(kù)構(gòu)建及測(cè)序采用血液DNA提取試劑盒提取基因組DNA,1%瓊脂糖凝膠電泳檢測(cè)DNA的完整性,NanoDrop 2000超微量分光光度計(jì)檢測(cè)DNA的濃度和純度。將檢測(cè)合格樣品用于構(gòu)建DNA小片段文庫(kù),文庫(kù)質(zhì)檢合格后,使用Illumina PE150測(cè)序平臺(tái)進(jìn)行高通量測(cè)序,測(cè)序深度約12倍。建庫(kù)及測(cè)序工作委托北京安諾優(yōu)達(dá)基因科技有限公司完成。
1.4 原始數(shù)據(jù)過濾測(cè)序原始圖像數(shù)據(jù)文件經(jīng) CASAVA堿基識(shí)別形成原始數(shù)據(jù)(Raw Data),對(duì)Raw Data進(jìn)行質(zhì)控分析、堿基質(zhì)量分布分析、測(cè)序數(shù)據(jù)過濾后獲得高質(zhì)量數(shù)據(jù)(Clean Data)。數(shù)據(jù)過濾主要包括去除接頭污染、低質(zhì)量以及N比例大于5%的reads。
1.5 全基因組SNP和InDel變異檢測(cè)采用BWA(v0.7.15)軟件將Clean Data比對(duì)到綿羊參考基因組上(Oar_rambouillet_v1.0)[12],然后通過Picard(v2.21.2)軟件進(jìn)行對(duì)比,對(duì)結(jié)果進(jìn)行排序和標(biāo)記重復(fù)處理,最后用GATK(v4.1.4.0)軟件進(jìn)行SNP和InDel檢測(cè)[13]。通過該軟件的SelectVariants功能篩選出高質(zhì)量的變異位點(diǎn),過濾標(biāo)準(zhǔn)參考其官網(wǎng)推薦閾值,并利用R軟件包CMplot繪制SNP密度分布圖。
1.6 選擇信號(hào)分析采用VCFtools[14]軟件,以50 kb 作為滑動(dòng)窗口,25 kb作為滑動(dòng)步長(zhǎng),計(jì)算紅頭和黑頭雙乾肉羊之間的群體分化指數(shù)FST;將分布在前1%窗口的FST值對(duì)應(yīng)的窗口定義為受選擇區(qū)域,使用SnpEff(v5.0)軟件對(duì)受選擇區(qū)域進(jìn)行基因注釋[15],從而篩選毛色相關(guān)基因,并利用重測(cè)序數(shù)據(jù)分析候選基因的多態(tài)性。
1.7 MC1R基因多態(tài)性與毛色的相關(guān)性分析根據(jù)NCBI數(shù)據(jù)庫(kù)中綿羊MC1R基因序列(NC_040265.1),采用Primer Primier 5.0軟件設(shè)計(jì)引物(MC1R-F:5′-AGGGCGGAAGAGCGACACTGC-3′;MC1R-R:5′-GATGGCACCCAGGAAGCAGA-3′),引物由生工生物工程(上海)股份有限公司合成。采用PCR產(chǎn)物直接測(cè)序的方法分別對(duì)46只黑頭和54只紅頭雙乾肉羊的MC1R基因編碼區(qū)內(nèi)2個(gè)錯(cuò)義突變位點(diǎn)進(jìn)行基因分型。PCR 擴(kuò)增反應(yīng)體系20 μL:2× PCR Master Mix 10 μL,DNA 模板1 μL,正向和反向引物(10 μmol/L)各0.5 μL, ddH2O 8 μL。PCR擴(kuò)增條件:95℃預(yù)變性2 min;94℃變性30 s,60℃退火30 s,72℃延伸90 s,共30個(gè)循環(huán);72℃延伸2 min。PCR產(chǎn)物送生工生物工程(上海)股份有限公司測(cè)序,采用Chromas和Haploview軟件確定樣品2個(gè)SNP位點(diǎn)的基因型和單倍型。
2.1 測(cè)序數(shù)據(jù)統(tǒng)計(jì)及比對(duì)通過對(duì)6只紅頭和6只黑頭雙乾肉羊進(jìn)行全基因組重測(cè)序,紅頭雙乾肉羊命名為RSQ-1~6,黑頭雙乾肉羊命名為BSQ-1~6,共獲得Raw Data 430.15 G,平均測(cè)序深度約為12倍,各樣本堿基數(shù)量在29.85~45.42 G,reads數(shù)在198.97~302.78 M;經(jīng)過過濾獲得Clean Data 424.73 G,占原始數(shù)據(jù)98.74%,所有樣品Q30均大于93.19%。將Clean Data同參考基因組進(jìn)行比對(duì),結(jié)果表明,各樣本的比對(duì)率最低為99.88%,最高為99.91%,平均比對(duì)率為99.90%。
2.2 全基因組SNP和InDel變異檢測(cè)基于GATK軟件對(duì)12只雙乾肉羊全基因組范圍內(nèi)的SNP和長(zhǎng)度小于或等于60 bp的InDel進(jìn)行檢測(cè)和過濾后,共鑒定了32 338 805個(gè)高質(zhì)量變異位點(diǎn),平均每kb的變異位點(diǎn)數(shù)量為11.51個(gè)。變異位點(diǎn)以SNP為主,共計(jì)27 877 089個(gè),其在基因組中的平均密度為9.92 SNP/kb(圖1),包含錯(cuò)義突變 120 895 個(gè),無義突變1 305個(gè);另外有同義突變206 743 個(gè);SNP主要以轉(zhuǎn)換為主,轉(zhuǎn)換類型以A/G型最多,顛換類型中以G/T型最多。堿基轉(zhuǎn)換的發(fā)生頻率是堿基顛換的2.45倍。本試驗(yàn)獲得InDel位點(diǎn)4 461 716個(gè), InDel長(zhǎng)度以1 bp 和2 bp 為主,3~10 bp 的InDel 1 415 519個(gè)。不同染色體上的 SNP/InDel 出現(xiàn)頻率不同,20號(hào)染色體頻率最高,平均每kb包含13.95個(gè),X染色體頻率最低,平均每 kb僅為7.72個(gè)。

注:橫坐標(biāo)代表染色體的物理位置,窗口大小為1 Mbp;縱坐標(biāo)代表染色體;綠色代表SNP密度小的區(qū)域;紅色代表SNP密度高的區(qū)域圖1 各染色體SNP密度分布圖
2.3 全基因組選擇信號(hào)檢測(cè)按照Holsinger和Weir的統(tǒng)計(jì)方法檢測(cè)紅頭和黑頭雙乾肉羊全基因組變異序列的FST值[16],F(xiàn)ST值越大表明不同群體間遺傳分化程度越大。將1 124個(gè)分布在前1%的FST值對(duì)應(yīng)的窗口確定為受選擇區(qū)域(圖2),通過SnpEff軟件在受選擇區(qū)域內(nèi)共注釋到1 977個(gè)基因,其中在兩種毛色雙乾肉羊群體中分化程度最高的毛色相關(guān)基因?yàn)镸C1R。進(jìn)一步分析測(cè)序數(shù)據(jù),在MC1R基因編碼區(qū)發(fā)現(xiàn)了5個(gè)SNP,即c.218 T>A、c.361 G>A、c.429 C>T、c.600 T>G 和c.735C>T,其中c.218 T>A及c.361 G>A為錯(cuò)義突變,c.218T>A造成第73位氨基酸由蛋氨酸變?yōu)橘嚢彼?c.361G>A導(dǎo)致其翻譯的氨基酸由天冬氨酸變?yōu)樘於0罚渌?個(gè)SNP位點(diǎn)均為同義突變。12個(gè)測(cè)序樣本的5個(gè)SNP位點(diǎn)基因型結(jié)果見表1。

注:橫坐標(biāo)為染色體號(hào);縱坐標(biāo)為FST 值圖2 紅頭和黑頭雙乾肉羊全基因組水平上的FST選擇信號(hào)分布

表1 重測(cè)序個(gè)體MC1R基因5個(gè)SNP位點(diǎn)的基因型
2.4 群體基因分型與相關(guān)性分析以MC1R-F和MC1R-R為引物進(jìn)行PCR擴(kuò)增,獲得了與預(yù)期大小相符的584 bp目的條帶,對(duì)46只黑頭雙乾肉羊和54只紅頭雙乾肉羊進(jìn)行c.218 T>A和c.361 G>A 2個(gè)錯(cuò)義突變位點(diǎn)基因分型。PCR產(chǎn)物測(cè)序結(jié)果表明,2個(gè)SNP位點(diǎn)均存在3種基因型(圖3)。在c.218 T>A位點(diǎn),46只黑頭羊中,35只為AA基因型,11只為AT基因型,而所有的54只紅頭羊的基因型均為TT;在c.361 G>A位點(diǎn),46只黑頭羊中,35只為AA基因型,11只為AG基因型,而所有的54只紅頭羊均為GG基因型;單倍型分析結(jié)果表明2個(gè)錯(cuò)義突變位點(diǎn)完全連鎖,有TG和AA 2種單倍型,單倍型TG頻率為59.5%,單倍型AA頻率為40.5%。以上結(jié)果表明,2個(gè)錯(cuò)義突變與雙乾肉羊黑頭性狀完全相關(guān),且黑毛色表型對(duì)紅毛色表型為顯性。

圖3 MC1R基因c.218 T>A和c.361 G>A 多態(tài)性位點(diǎn)測(cè)序峰圖
畜禽重要經(jīng)濟(jì)性狀主效基因的精細(xì)定位以及因果突變的解析是當(dāng)代動(dòng)物遺傳育種的重要任務(wù)之一。在2代測(cè)序技術(shù)出現(xiàn)之前,主效基因定位主要采用RFLP、RAPD和SSR等分子標(biāo)記,但由于受到標(biāo)記數(shù)量的限制,主效基因定位耗時(shí)長(zhǎng)、費(fèi)用高,且難以精細(xì)定位[17]。近年來,由于2代基因組測(cè)序技術(shù)具有高通量、快速和高效等特點(diǎn),已被廣泛應(yīng)用于動(dòng)物全基因組范圍內(nèi)SNP和InDel標(biāo)記的篩選與鑒定[18-19]。JIANG等[5]對(duì)8頭荷斯坦公牛進(jìn)行全基因組重測(cè)序,共獲得插入或缺失長(zhǎng)度為1~49 bp 的InDel標(biāo)記912 302 個(gè),每個(gè)個(gè)體的標(biāo)記數(shù)量范圍為323 490~411 070。SABAHAT等[8]對(duì)2個(gè)巴基斯坦駱駝品種的103個(gè)個(gè)體進(jìn)行簡(jiǎn)化基因組測(cè)序,篩選獲得了63 619個(gè)SNP,然后基于這些標(biāo)記對(duì)2個(gè)品種的群體遺傳結(jié)構(gòu)及品種間遺傳關(guān)系進(jìn)化了系統(tǒng)分析。雙乾肉羊是利用生長(zhǎng)速度快且肉品質(zhì)好的杜泊羊與抗寒能力強(qiáng)且產(chǎn)仔數(shù)高的本地綿羊雜交選育而成的肉用綿羊新種群,目前其種群內(nèi)的遺傳結(jié)構(gòu)以及優(yōu)良種質(zhì)特性的遺傳基礎(chǔ)并不清楚。因此,本試驗(yàn)基于重測(cè)序技術(shù)對(duì)12只紅頭和黑頭雙乾肉羊全基因組水平上的SNP和InDel標(biāo)記進(jìn)行了篩選,分別獲得了27 877 089個(gè)SNP和4 461 716個(gè)InDel多態(tài)性標(biāo)記,為該種群遺傳多樣性以及選擇信號(hào)分析提供了豐富的遺傳標(biāo)記。
動(dòng)物毛色通常是一個(gè)品種或物種的重要特征,可作為形態(tài)學(xué)標(biāo)記進(jìn)行物種或品種純度的鑒別,同時(shí),毛色的差異也會(huì)對(duì)動(dòng)物的生長(zhǎng)速度、生產(chǎn)性能以及疾病的抵抗力具有一定的影響,因此對(duì)動(dòng)物毛色多樣性的形成與調(diào)控機(jī)制的研究具有重要理論和實(shí)踐意義[20]。目前基于全基因組SNP/InDel的FST選擇信號(hào)檢測(cè)策略被廣泛應(yīng)用于家畜重要經(jīng)濟(jì)性狀相關(guān)候選基因和因果突變位點(diǎn)的篩選與鑒定。ZHOU等[21]基于76只有色羽鴨和30只北京鴨的基因組重測(cè)序數(shù)據(jù)做全基因組關(guān)聯(lián)分析,結(jié)果表明MITF基因所在染色體區(qū)域具有較強(qiáng)的選擇信號(hào),通過比較北京鴨和鵝的基因組發(fā)現(xiàn)在MITF的外顯子1M和外顯子2之間存在約6.6 kb的缺失,該缺失與北京鴨的白毛色完全相關(guān)。HENKEl等[22]對(duì)1匹斑點(diǎn)馬的基因組進(jìn)行了約19倍深度的重測(cè)序,然后對(duì)5個(gè)斑點(diǎn)候選基因進(jìn)行結(jié)構(gòu)性變異檢測(cè),結(jié)果表明MITF基因外顯子6~9區(qū)間約63 kb的大片段缺失與其斑點(diǎn)毛色以及聽力喪失有關(guān)。雙乾肉羊群體中有3種毛色類型,即紅頭、黑頭和白頭,紅頭和黑頭表型個(gè)體雜交試驗(yàn)表明黑色對(duì)紅色為顯性,毛色表型與生產(chǎn)性能的關(guān)系目前還并不清楚。本試驗(yàn)基于重測(cè)序獲得的雙乾肉羊SNP和InDel標(biāo)記,計(jì)算紅頭和黑頭2個(gè)群體之間的FST值,獲得了1 124個(gè)選擇區(qū)域,其中哺乳動(dòng)物毛色調(diào)控主效基因MC1R位于14號(hào)染色體的其中1個(gè)選擇區(qū)域內(nèi)。
MC1R基因編碼黑素皮質(zhì)激素受體1(melanocortin receptor 1),該受體是最小的G蛋白偶聯(lián)受體,具有7個(gè)跨膜結(jié)構(gòu)域[23]。黑素皮質(zhì)激素受體1與黑色素細(xì)胞刺激激素α(α-MSH)結(jié)合,然后激活膜上的腺苷酸環(huán)化酶系統(tǒng),通過環(huán)磷酸腺苷激活酪氨酸激酶催化細(xì)胞內(nèi)的黑色素合成[24]。黑素皮質(zhì)激素受體1在動(dòng)物毛色形成與調(diào)控中具有重要的作用,研究表明MC1R基因多態(tài)性與多種動(dòng)物毛色多樣性相關(guān)[25]。賴偉寧等[26]采用候選基因法對(duì)野生型和黃毛色豚鼠MC1R基因進(jìn)行PCR擴(kuò)增與測(cè)序,發(fā)現(xiàn)該基因存在2 760 bp缺失多態(tài)性,群體基因分型結(jié)果表明黃色豚鼠均為缺失純合子,而野生型豚鼠基因型為野生型純合子或缺失雜合子,從而推測(cè)該基因的缺失與豚鼠的隱性黃毛色有關(guān)。本試驗(yàn)基于FST值的選擇信號(hào)將與雙乾肉羊毛色相關(guān)的候選基因定位到MC1R基因上,依據(jù)重測(cè)序數(shù)據(jù)發(fā)現(xiàn)在該基因的編碼區(qū)內(nèi)存在5個(gè)SNP位點(diǎn),其中2個(gè)為錯(cuò)義突變,3個(gè)為同義突變。對(duì)2個(gè)錯(cuò)義突變位點(diǎn)進(jìn)行PCR擴(kuò)增,對(duì)產(chǎn)物直接測(cè)序并進(jìn)行群體基因分型,結(jié)果表明所有紅頭毛色個(gè)體2個(gè)位點(diǎn)均為野生型等位基因純合子,而黑頭個(gè)體為突變型等位基因純合子或雜合子,表明2個(gè)錯(cuò)義突變與黑頭雙乾肉羊毛色相關(guān),且黑色對(duì)紅色為完全顯性。
本研究利用高通量重測(cè)序技術(shù)在12只雙乾肉羊全基因組水平上共獲得了27 877 089個(gè)SNPs和4 461 716個(gè)InDel 多態(tài)性標(biāo)記;基于FST的選擇信號(hào)以及群體基因分型確定了MC1R為紅頭和黑頭雙乾肉羊毛色表型的候選基因以及該基因編碼區(qū)內(nèi)的2個(gè)錯(cuò)義突變與雙乾肉羊黑毛色完全相關(guān)。本研究為雙乾肉羊種質(zhì)特性的遺傳基礎(chǔ)研究以及分子標(biāo)記輔助選擇育種提供了科學(xué)依據(jù)。