刁淑琪,羅元宇,蔡 迪,陳桂華,陳贊謀,張 豪,李加琪,張 哲
(華南農業大學動物科學學院,廣東 廣州 510642)
杜洛克豬全基因組連鎖不平衡分析
刁淑琪,羅元宇,蔡 迪,陳桂華,陳贊謀,張 豪,李加琪,張 哲
(華南農業大學動物科學學院,廣東 廣州 510642)
利用豬Illumina Porcine SNP60K芯片對福建某核心種豬場杜洛克豬216個個體進行基因型檢測,基于該高密度SNP芯片數據,運用Haploview軟件計算全基因組連鎖不平衡并構建杜洛克豬連鎖不平衡圖譜。結果表明,該杜洛克豬群體不同染色體上相鄰標記間r2存在波動,波動范圍為0.46~0.59,相鄰標記間的平均連鎖不平衡程度r2為0.52,SSC10的r2最低(平均為0.46),SSC6的r2最高(平均為0.59),連鎖不平衡水平隨著標記間距的增加而衰減、變異程度隨之減小。該研究結果可為杜洛克豬遺傳分析及全基因組選擇研究提供參考。
豬;連鎖不平衡;杜洛克;SNP
連鎖不平衡(Linkage Disequilibrium,LD)又稱等位基因關聯,是指同一條染色體上,等位基因間廣泛存在的非隨機組合現象[1]。連鎖不平衡是群體遺傳學研究的重要內容之一,在分子生物學研究與動物遺傳育種領域,群體基因組連鎖不平衡信息是數量性狀基因座定位、群體遺傳結構分析和全基因組選擇的基礎。連鎖不平衡受選擇、突變和遺傳漂變等因素的影響。隨著科學技術的發展,覆蓋全基因組的高密度遺傳標記已廣泛運用于人和動植物的連鎖不平衡研究,并取得了很大的研究進展。在人類基因組學研究中,將單核苷酸多態性(Single Nucleotide Polymorphisms,SNP)作為遺傳標記來深入研究連鎖不平衡已成為一種趨勢。結合關聯分析和功能研究,將包括復雜疾病及其中間表型在內的人類各種表型特征,與基因組上以SNP為主的多態性位點聯系起來,這對疾病預測、預防和治療等的突破具有重要作用[2]。
目前,在畜禽方面有很多基于連鎖不平衡的研究。在牛的連鎖不平衡研究中,Mckay等[3]利用2 670個SNP標記構建了8個不同品種的連鎖不平衡圖譜,并發現其LD區域長度不超過500 kb。Lu等[4]利用SNP標記對安格斯牛、夏洛萊牛和雜交牛3個群體進行LD分析,發現當標記間距小于30 kb時,3個品種的LD分別為0.29、0.22和0.21,認為不同品種和不同染色體間LD強度具有顯著差異。Ross等[5]以r2作為LD的度量指標,利用SNP標記估計了澳大利亞荷斯坦牛、澳洲安格斯牛、新西蘭黑白花奶牛和娟姍牛4個群體的LD,其大小分別為0.35、0.25、0.22和0.14。
在豬的連鎖不平衡研究方面,Amaral等[6]通過分析中國家豬、歐洲家豬和歐洲野豬的371個SNP,發現歐洲豬種的LD程度高于中國豬種。Badke等[7]以r2作為度量指標對長白豬、約克夏、杜洛克和漢普夏的LD進行比較,發現在標記間距較小時,杜洛克豬的LD較高;而標記間距較大時,漢普夏豬的LD較低。此外,Ai等[8]比較了中國地方豬和西方家豬的LD,發現西方家豬的LD高于中國地方豬。
本研究以杜洛克豬為研究對象,基于SNP芯片基因組數據分析杜洛克豬群體的連鎖不平衡水平及其衰減規律,旨在為杜洛克豬的連鎖不平衡研究提供一定的參考。
1.1 試驗材料
試驗對象為福建某核心種豬場的216頭杜洛克豬(公豬20頭,母豬196頭),試驗豬均在常規條件下飼養,體況正常。使用OMEGA Tissue DNA Kit對所有個體的耳組織抽提基因組DNA。采用Illumina Porcine SNP60K芯片[9]進行SNP基因分型[10],共得到61 565個SNP。
1.2 基因型質量控制
采用美國農業部和愛荷華州立大學于2010年9月聯合組裝的豬基因組(Sus scrofa Build 10)作為參考序列(http://www.animalgenome. org/blast/),利用Plink軟件[11]對供試的216個個體和61 565個SNPs進行基因型質量控制。質控標準為:個體檢出率(call rate)>0.95,SNP檢出率>0.95,最小等位基因頻率(Minor allele frequency,MAF)>0.05和哈迪-溫伯格平衡P值(Hardy-Weinberg equilibrium,HWE)≥10-6。經過質控后,剩余215個個體和32 186個有效SNP用于后續研究。
1.3 LD度量
連鎖不平衡程度通常用D'[12]和r2[13]進行度量,本研究選用r2作為LD的度量標準。r2表示兩個位點統計上和遺傳上相關程度的關系(0< r2<1),其表現較穩定r2,對基因頻率的變化不敏感。r2的計算公式為:

式中,PA1和PB1是兩個標記位點上第1個等位基因的頻率,PA1B1是等位基因之間形成的單倍型頻率。
采用Haploview軟件[15]計算各SNP之間的r2值,采用R軟件進行后續的統計分析。

圖1 杜洛克豬質量控制后SNP最小等位基因頻率分布
2.1 基因型質量控制
供試的216個個體和61 565個SNPs進行基因型質量控制后,剩余215個個體和32 186個有效SNP進行后續分析。質控后的SNP最小等位基因頻率(MAF)分布情況見圖1。從圖1可以看出,MAF呈均勻分布,本研究中稀有突變位點極少。其中,70%以上SNP的MAF>0.20,說明本研究中杜洛克豬群體中的SNP多態性較高,分型數據適用于LD的計算和圖譜的構建。
2.2 杜洛克豬各染色體LD
杜洛克豬18條常染色體和X染色體r2的衰減趨勢如圖2所示。從圖2可以看出,相鄰標記間的LD水平隨標記間物理距離的增大而衰減。此外,除了SSC6、SSC14、SSC16、SSC17和SSC18等染色體外,其他染色體上個別間距較大的標記之間也存在高r2現象。
2.3 杜洛克豬全基因組LD及LD圖譜

圖2 杜洛克豬各染色體的r2分布
杜洛克豬全基因組r2的衰減趨勢如圖3所示,在全基因組水平上,LD變化趨勢與各染色體LD一致,即LD水平隨標記間距的增加而衰減,LD的變異程度也隨之減小。但在某些距離較遠的SNP標記之間,LD程度也很高。
本研究還構建了杜洛克豬全基因組連鎖不平衡圖譜(圖4),圖4中顏色越深代表LD程度越強。結果表明,除了在相同染色體上的標記間存在LD,不同染色體上的標記間也存在一定程度的LD。
2.4 杜洛克豬不同標記間距的LD分布
本研究統計了杜洛克豬各染色體上相鄰標記間的r2分布情況,從表1可見,杜洛克豬不同染色體上相鄰標記間的r2存在波動,波動范圍為0.46~0.59。
對杜洛克豬的r2統計發現,不同染色體上標記間的LD程度存在差異。本研究分別統計了杜洛克豬在標記間距為50 kb、500 kb、1 Mb和5 Mb時各染色體的LD分布,結果(表1)表明,SSC10的連鎖不平衡程度較低,SSC6的連鎖不平衡程度較高。

圖3 杜洛克豬全基因組的r2分布

圖4 杜洛克豬全基因組連鎖不平衡圖譜
本研究利用Illumina Porcine SNP60K芯片,對216頭杜洛克豬進行了全基因組LD分析,揭示了該杜洛克豬群體中LD的變化規律,成功構建了杜洛克豬的高密度連鎖不平衡圖譜,為杜洛克豬QTL定位、群體遺傳結構分析及基因組選擇等研究提供了參考。
在相鄰標記(標記間距平均為82 kb)之間,該杜洛克豬群體的平均LD程度為0.52,結果與Badke等[16]對4個外種豬的LD研究結果(r2=0.46,相鄰標記間距約為70 kb)相似。在每條染色體之間,杜洛克的LD程度波動范圍為0.46~0.59。這說明杜洛克擁有較高的連鎖不平衡水平,推測其在進化過程中受到高強度的人工選擇,長期的選育也導致了杜洛克豬種的高度純化,從而使其LD程度較高。此外,本研究比較了標記間距為50 kb、500 kb、1 Mb和5 Mb時各染色體的r2分布,發現SSC10的r2較小,SSC6的r2較大。這與Uimari等[17]對芬蘭長白豬和芬蘭約克夏豬LD進行分析的研究中SSC10 r2偏小的結果相同。同時,也與Lei等[18]對3個丹麥豬種進行LD分析研究得到SSC10的r2偏小的結果相同。

表1 杜洛克豬各染色體上標記間的r2分布情況
LD隨著標記間距的增加呈衰減趨勢,標記間r2逐漸降低,本研究結果與上述規律一致。但在本研究中發現某些距離較遠的標記間也存在強LD,這可能和參考基因組序列有關[19-20]。通過比較不同物種間相鄰標記間的連鎖不平衡發現,杜洛克豬的LD程度高于人類的LD水平[21-22],也高于綿羊的LD水平[23]。參考GWAS和GS的研究,將有用的LD界定為相鄰標記間平均r2>0.3[24],這在本研究中SNP密度是充足的,但質控后的SNP在基因組上呈非均勻分布,這可能會影響到SNP芯片在相關研究中的應用效果。
[1]Hill W G,Robertson A. Linkage disequilibrium in finite populations[J]. TAG. Theoretical and applied genetics. Theoretische und angewandteGenetik,1968,38(6):226-231.
[2]Wall J D,Pritchard J K. Haplotype blocks and linkage disequilibrium in the human genome[J]. Nat Rev Genet,2003,4(8):587-597.
[3]McKay S D,Schnabel R D,Murdoch B M,et al. Whole genome linkage disequilibrium maps in cattle[J]. BMC GENET,2007,8(1):74.
[4]Lu D,Sargolzaei M,Kelly M,et al. Linkage disequilibrium in Angus,Charolais,and Crossbred beef cattle[J]. Frontiers in Genetics,2012,3.
[5]de Roos Al APWD,Hayes B J,Spelman R J ,et al. Linkage Disequilibrium and Persistence of Phase in Holsten-Friesian,Jersey and Angus Cattle[J]. Genetics,2008,179(3):1503-1512.
[6]Amaral A J,Megens H J,Crooijmans R P M A,et al. Linkage Disequilibrium Decay and Haplotype Block Structure in the Pig[J]. Genetics,2008,179(1):569-579.
[7]Badke Y M,Bates R O,Ernst C W,et al Estimation of linkage disequilibrium in four US pig breeds[J]. Bmc Genomics,2012,1(13):1-10.
[8]Ai H S,Huang L S,Ren J. Genetic Diversity,Linkage Disequilibrium and Selection Signatures in Chinese and Western Pigs Revealed by Genome-Wide SNP Markers[J]. Plos One,2013,2(8):e56001.
[9]Ramos A M,Crooijmans R P M A,Affara N A,et al. Design of a High Density SNP Genotyping Assay in the Pig Using SNPs Identified and Characterized by Next Generation Sequencing Technology[J]. Plos One,2009,8(4):e6524.
[10]Heaton M P,Harhay G P,Bennett G L,et al. Selection and use of SNP markers for animal identification and paternity analysis in U.S. beef cattle[J]. Mamm Genome,2002,13(5):272-281.
[11]Purcell S,Neale B,Todd-Brown K,et al. PLINK:A Tool Set for Whole-Genome Association and Population-Based Linkage Analyses[J]. The American Journal of Human Genetics,2007,81(3):559-575.
[12]Lewontin R C. The Interaction of Selection and Linkage. I. General Considerations;Heterotic Models[J]. Gnentics,1964,1(49):49-67.
[13]Hill W G. Estimation of linkage disequilibrium in randomly mating populations.[J]. Heredity,1974,33(2):229-239.
[14]Zhao H,Nettleton D,Soller M,et al. Evaluation of linkage disequilibrium measures between multi-allelic markers as predictors of linkage disequilibrium between markers and QTL[J]. Genet Research,2005,86(1):77-87.
[15]Barrett J C,Fry B,Maller J,et al. Haploview: analysis and visualization of LD and haplotype maps[J]. Bioinformatics,2005,21(2):263-265.
[16]Badke Y M,Bates R O,Ernst C W,et al. Estimation of linkage disequilibrium in four US pig breeds[J]. Bmc Genomics,2012,1(13):1-10.
[17]Uimari P,Tapio M. Extent of linkage disequilibrium and effective population size in Finnish Landrace and Finnish Yorkshire pig breeds[J]. J Anim Sci,2011,89(3):609-614.
[18]Wang L,Rensen P S,Janss L,et al. Genomewide and local pattern of linkage disequilibrium and persistence of phase for 3 Danish pig breeds[J]. Bmc Genet,2013,1(14):1-11.
[19]Farnir F,Coppieters W,Arranz J J,et al. Extensive Genome-wide Linkage Disequilibrium in Cattle[J]. Genome Res,2000,10(2):220-227.
[20]Smith E M,Wang X,Littrell J,et al. Comparison of linkage disequilibrium patterns between the HapMap CEPH samples and a family-based cohort of Northern European descent[J]. Genomics,2006,88(4):407-414.
[21]Dunning A M,Durocher F,Healey C S,et al. The extent of linkage disequilibrium in four populations with distinct demographic histories[J]. Am J Hum Genet,2000,67(6):1544-1554.
[22]Kruglyak L. Prospects for whole-genome linkage disequilibrium mapping of common disease genes.[J]. Nat Genet,1999,2(22):139-144.
[23]Zhao F P,Wang G K,Zeng T,et al. Estimations of genomic linkage disequilibrium and effective population sizes in three sheep populations[J]. Livest Sci,2014,170:22-29.
[24]Ai H S,Huang L S,Ren J. Genetic Diversity,Linkage Disequilibrium and Selection Signatures in Chinese and Western Pigs Revealed by Genome-Wide SNP Markers[J]. Plos One,2013,8:e560012.
(責任編輯 崔建勛)
Genome-wide linkage disequilibrium analysis in Duroc pigherd
DIAO Shu-qi,LUO Yuan-yu,CAI Di,CHEN Gui-hua,CHEN Zan-mou,ZHANG Hao,LI Jia-qi,ZHANG Zhe
(College of Animal Science,South China Agricultural University,Guangzhou 510642,China)
In this study,we collected 216 Duroc pigs from a breeding herd in Fujian province and genotyped them with Illumina Porcine SNP60K Bead Chip. Based on the high-density SNP data,the genome-wide LD was calculated with Haploview. Results showed that LD reduced as the marker intervals increasing. The r2between adjacent markers ranged from 0.46 to 0.59 in the Duroc population. The mean r2was 0.52 among adjacent markers across the genome,with the minimum in SSC10 (r2=0.46),and the maximum in SSC6 (r2=0.59). This study provides useful information for further genome-wide analysis of Duroc pig.
pig;linkage disequilibrium;Duroc;SNP
S828.2;Q343.1
A
1004-874X(2016)11-0116-06
2016-08-10
廣東省自然科學基金(2014A03031345);國家現代農業產業技術體系項目(CARS-36);華南農業大學大學生創新訓練項目(201410564155)
刁淑琪(1993-),女,在讀碩士生,E-mail:saradiao@126.com
張哲(1984-),男,博士,副教授,E-mail:zhezhang@scau.edu.cn
刁淑琪,羅元宇,蔡迪,等.杜洛克豬全基因組連鎖不平衡分析[J].廣東農業科學,2016,43(11):116-121.