王 玨,劉成琨,2,劉德武,王克君,4,陳 潔,吳珍芳,方美英*
(1.中國農業大學動物科技學院,北京 100086;2.北京貝瑞和康生物技術有限公司,北京 102200;3.華南農業大學動物科學學院,廣州廣東 510642;4.河南農業大學牧醫工程學院,河南鄭州 450002)
全基因組選擇自2001 年提出以來[1],在奶牛育種工作中已被廣泛應用,但在其他物種中應用還處于起步階段?;蚪M選擇基于SNP 標記與數量性狀位點(QTL)之間的關聯開展,因此SNP 芯片中標記的密度對于基因組選擇的準確性十分重要,而高密度SNP 芯片的成本較高,使其應用受限;另一方面,由于性狀和群體的差異,篩選對所有性狀都具有遺傳效應的共同SNP 位點較為困難。基因型填充可以在一定程度上解決這一問題[2-3]?;蛐吞畛涫抢靡延械姆中托畔嶋H未分型的位點進行基因型預測[4]。大部分基因型填充是根據已有的單倍型信息進行單倍型構建填充,這其中又根據是否利用家系信息分為不依賴于家系信息而僅利用群體連鎖不平衡信息構建單倍型、根據家系信息和標記連鎖信息共同構建單倍型2 種策略[5]。根據算法不同,使用單倍型進行填充又有3 種不同方法:馬爾可夫-門特卡羅方法(Markov Chain Monte Carlo,MCMC),如IMPUTE2[6]、BEAGLE[7]等;最大簡約法(Maximum Parsimony,MP),如findhap[8];最大期望法(Expectation-Maximization,EM),如plink[9]?;蛐吞畛浞椒ū姸啵畛涞目煽啃砸约靶试谏a過程中最被關注。Johnston 等[10]研究發現Beagle[11]、Fimpute[12]和Findhap[13]3 種軟件填充的準確率都在95%左右。Larmer等[14]也比較了Beagle2[11]和Fimpute[12]在不同牛染色體上的填充效果,結果表明,雖然兩種方法在不同品種中表現不同,但總體都可以得到95%以上的較高基因型填充準確率?!?br>