朱 波,李宏偉,周姵諾,李 倩,高 翰,王澤昭,汪聰勇,蔡文濤,徐凌洋,陳 燕,張路培,高 雪,高會江,2,,李俊雅
(1.中國農業科學院北京畜牧獸醫研究所,北京 100193; 2. 國家肉牛遺傳評估中心,北京 100193;3. 肉用西門塔爾牛育種聯合會,北京 100193)
肉牛業是我國畜牧業的重要組成部分,我國是肉牛生產大國,卻不是肉牛育種強國,肉牛種業長期依賴進口。為了擺脫這種局面,切實提高我國肉牛整體生產水平和經濟效益,2012年,農業部制定了《全國肉牛遺傳改良計劃(2011—2025年)》,并篩選國家肉牛核心育種場,成立國家肉牛遺傳評估中心,將開展肉牛遺傳評估作為提升我國肉牛種業發展的重要一環[1]。肉牛育種已有100多年的歷史。近50年以來,世界各國肉牛育種工作者經過不斷探究,形成了一套完善且有效的肉牛育種體系[2]。由于各國肉牛主要品種有一定差異,而不同品種在生產性能方面各有部分差異,如法國、美國和澳大利亞存欄較多的中大型肉牛品種夏洛萊、利木贊和西門塔爾牛在生長速度上更加突出[3-4],美國和澳大利亞存欄較多的中小型肉牛品種安格斯及日本的和牛在肉質性狀上更加突出[5-6],美國和印度存欄較多的瘤牛品種婆羅門牛和巴西的內洛爾牛在耐熱能力和屠宰率上優勢更突出[7-9]。因此,各國在進行遺傳評估時,制定的綜合選擇指數在所選擇的性狀和權重方面也有一定差異。本文介紹了我國肉牛遺傳評估體系,同時,對各大洲主要肉牛生產大國的遺傳評估體系分別進行綜述,從常規遺傳評估和基因組遺傳評估體系兩方面分別進行對比分析,包含群體規模、所用芯片、每年評估次數、遺傳評估模型、負責部門等信息,旨在為給我國肉牛遺傳評估和育種工作提供借鑒,以期縮短我國肉牛育種同國外的差距,加快育種進程。
肉牛常規遺傳評估的核心方法是1975年Henderson[10]提出的以線型混合模型為基礎的最佳線性無偏預測法(best linear unbiased prediction, BLUP),主要評估了生長發育、體型、屠宰、胴體、肉質和繁殖6大類性狀。在評估過程中依據不同性狀的固定效應而構建不同的模型,利用個體間的親緣關系構建分子血緣關系矩陣(molecar relationship matrix A),進行迭代計算估計育種值(estimated breeding value, EBV)。在求解混合模型方程組(mixed-model equations, MME)時要利用性狀的方差組分,而計算方差組分用到的方法主要有最小方差二次無偏估計(minimum variance quadratic unbiased estimator,MIVQUE)[11]、最大似然法(maximum-likelihood,ML)[12]、約束最大似然估計法(restricted maximum-likelihood,REML)[13]和貝葉斯方法[14]等,其中REML方法應用最廣。2001年,Interbull 官方公布的指南中指出,在計算估計育種值的模型中,對于生產性狀而言,動物模型優于公畜模型,多性狀模型優于單性狀模型;針對閾性狀而言,公畜模型和公畜-外祖父模型估計結果更為準確[15],常用的育種值估計軟件有美國1993年開發的MTDFREML[16]和1997年開發的BLUPF90[17]、英國1995年開發的ASREML[18]和丹麥2013年開發的DMU[19]等。在種公牛遺傳評估方面,后裔測定技術是評估公牛種用價值最可靠的方法,但由于周期長、后裔的屠宰和肉質性狀難以收集等問題造成成本過高,難以在生產實踐中推廣應用[20]。
隨著分子生物學技術的發展,Meuwissen等[21]于2001年提出全基因組選擇概念,它是利用基因組范圍內的SNP位點進行基因組育種值的估計,目前已經在奶牛[22]、肉牛[23]、豬[24]、雞[25]等動物育種中廣泛應用。依據基因組育種值估計方法的差異,其計算模型可分為兩類:一是直接計算個體的基因組估計育種值,其原理是利用SNP標記信息構建個體間的關系矩陣(genomic relation matrix, G)或系譜信息與SNP標記的綜合信息構建H矩陣,在混合模型方程組中直接求解個體的基因組育種值,常用的計算方法有2008年提出的GBLUP[26]和2009年提出的ssGBLUP[27];二是間接計算個體的基因組估計育種值,其原理是先構建參考群,并估計每個SNP標記的效應值,隨后在驗證群體中依據SNP標記信息和參考群估計的標記效應值計算個體的基因組估計育種值,常用的計算方法包括RRBLUP[28]和貝葉斯方法,如2001年提出的BayesA和BayesB[21]、2011年提出的BayesCπ[29]和2012年提出的BayesR[30]等。


北美主要肉牛生產代表國是美國和加拿大。目前,美國和加拿大的遺傳評估體系是各協會負責數據收集,如美國西門塔爾牛協會、美國安格斯協會、加拿大西門塔爾牛協會、加拿大安格斯協會等,收集的數據包括牛只登記信息、系譜信息、生產性能測定等,評估則由各大學和科研機構聯合進行。目前,美國和加拿大應用同一個評估體系進行評估,2014年,Theta Solutions公司成立,該公司開發了一套強大的BLOT遺傳評估系統。該評估系統能綜合各品種信息,同時整合系譜和基因組信息進行多品種ssGBLUP 評定,該系統是從2016年開始進行多品種遺傳評定,幾乎每周評定1次,目前,該評估系統已在美國紅安格斯協會、美國西門塔爾牛協會、美國安格斯協會、加拿大西門塔爾牛協會、加拿大利木贊協會等14個肉牛協會上應用,并在協會網站上公布遺傳評估結果。
美國早期的遺傳評估是分品種進行的,遺傳評估由4所大學主導完成,分別是科羅拉多州立大學、康奈爾大學、喬治亞大學和愛荷華州立大學,4所大學負責的品種各有差異;2001年,美國國家肉牛遺傳評估協會(National Beef Cattle Evaluation Consortium, BCCEC)成立,后期的常規遺傳評估由該組織負責。該組織利用多品種遺傳評估體系評估了13個肉牛品種共計17 600 000余頭牛,評估的結果再反饋給各協會,并在各協會網站上展示[36],每年會發布1次遺傳評估報告。各品種協會根據生產模式和市場的差異制定了不同的綜合選擇指數,例如西門塔爾牛及其西門塔爾雜交群體在西門塔爾牛協會登記群體達5 600 000頭,選用兩個綜合選擇指數對個體進行評估,分別為全性能指數(all-purpose index, API)和終端指數(terminal index, TI)。其中,API指數是評估種公牛的終身指數,其后代要維持母牛群體規模,剩余的母牛和公牛全部育肥屠宰,該指數中不包括剪切力性狀,TI指數用于評估種公牛的終端指數,其后代全部育肥屠宰,該指數未包括母性性狀如母親產奶量、母親產犢難易度等性狀。安格斯牛登記群體達297 087頭,選用4個綜合選擇指數進行評估;海福特牛登記群體達81 174頭,選用4個綜合選擇指數進行評估(https://selectsiresbeef.com/resources/terminology/),美國各肉牛品種評估的性狀如表1[20]所示,各品種的綜合選擇指數所選擇的性狀有一定差異,其中,最多的是安格斯協會有15個性狀,最少的是圣格魯迪牛協會有8個性狀。而對于各品種制定的綜合選擇指數中各性狀的具體加權值,并沒有明確報道。

表1 美國15個主要肉牛協會遺傳評估性狀匯總表
美國安格斯協會是最早應用基因組遺傳評估的組織,其參考群體達到50 000頭以上,基因芯片利用Illumina Bovine50K(54 001個SNPs位點)或更低密度芯片進行基因分型,每年評估2~3次[37-38]。美國西門塔爾牛協會的基因組選擇參考群達77 000頭,大部分個體的基因芯片利用Illumina Bovine50K芯片進行基因分型,僅有264頭西門塔爾牛利用Illumina Bovine770K芯片進行基因分型[39]。利木贊牛基因組選擇參考群體為2 239頭,基因芯片利用Illumina Bovine50K芯片進行基因分型[39]。其他品種如海福特、夏洛萊和布蘭格斯牛的參考群體也在逐漸擴建[37]。美國早期基因組選擇研究主要采用BayesC方法和GBLUP方法[38-39],而ssGBLUP方法既可利用基因組信息,又可以利用系譜信息。因此,美國大多數協會目前都在利用ssGBLUP方法進行基因組評定。
歐洲主要牛肉生產國是英國、德國、法國和意大利,其中,利木贊和西門塔爾牛在英國最多,弗萊維赫牛是德國的主要品種,蒙貝利亞牛、夏洛萊和利木贊在法國存欄較多。1999年,歐州各國就開始針對不同飼養系統下的遺傳評估結果進行聯合比較分析,2001年到2004年,愛爾蘭育種聯合會(Irish Cattle Breeding Federation, ICBF)、國際動物記錄委員會(International Committee for Animal Recording, ICAR)、法國國立農學研究院(l’Institut National de la Recherche Agronomique, INRA)、法國拉格學院(l’Institut de l’Elevage, IE)、英國肉類和畜牧委員會(the British Meat and Livestock Commission, MLC)等機構進行了第一次歐洲肉牛國際聯合評估[40],并于2007年展開了Interbeef計劃,并成立了Interbull遺傳評估中心[41],參加的國家包括法國、愛爾蘭、英國、丹麥、挪威、芬蘭和瑞典等歐洲國家。在進行遺傳評估時,發現各國的飼養條件差異較大,在設計不同的固定效應及基因與環境效應互作時,其評估結果差異較大。2009年,Interbull各成員國討論確定了聯合評定的綜合選擇指數包括胴體重、體型評分和產犢難易度性狀[42]。目前,歐洲Interbull中心幾乎每季度評估1次,并把結果發布在中心網站上(https://www.icbf.com/wp/)。該中心數據庫目前收集的表型數據達10億條,各國主要肉牛品種的評估性狀情況及評估結果發布情況如表2所示,僅有愛爾蘭和英國分別發布4個和3個肉牛品種的遺傳評估結果。

表2 歐洲各國的主要肉牛品種評估性狀及評估結果發布情況
目前歐洲Interbeef中心數據庫擁有超過2百萬頭肉牛的基因型測定數據。愛爾蘭于2016年利用一步法評估了超過100 000頭肉牛,并在愛爾蘭肉牛聯合會網站上(http://www.icbf.com)公布了其基因組遺傳評估結果。英國于2015年公布了利木贊牛基因組遺傳評估結果,其建立的參考群包含720頭采用高密度芯片進行基因分型個體和1 700頭中等密度芯片進行基因分型個體,其評估方法為一步法,用的是EGENEs軟件(http://www.sruc.ac.uk/info/120275/egenes)。法國于2015年開始對夏洛萊、利木贊和布藍地牛進行基因組遺傳評估,建立了1 029頭夏洛萊、606頭利木贊和1 645頭布藍地牛的參考群體,基因組評定方法是BayesC,其中有8%~35%的種牛經過后裔測定驗證[37]。
拉丁美洲主要的牛肉生產國是巴西(占拉丁美洲牛肉總產量的51.6%)、阿根廷(18.5%)、墨西哥(9.4%)和哥倫比亞(5.1%),而烏拉圭、委內瑞拉、巴拉圭、玻利維亞、厄瓜多爾和智利等其他國家的牛肉生產量較少[43]。該洲肉牛品種以瘤牛、歐洲牛及瘤牛和歐洲牛的雜交牛為主,遺傳評估主要以傳統遺傳評估為主,ANCP(Associa??o Nacional de Criadores e Pesquisadores)組織負責肉牛主要品種的遺傳評估工作,包括內洛爾牛(Nellore)、古澤拉牛(Guzerá)、婆羅門牛(Brahman)和塔巴普牛(Tabapu?),每年評估約230萬頭肉牛。拉丁美洲各國肉牛主要品種遺傳評估的牛只數和評估性狀如表3所示。而基因組遺傳評估僅在內洛爾牛上有相關報道[37]。

表3 拉丁美洲各國肉牛主要品種遺傳評估的牛只數和評估性狀統計表
巴西的主要肉牛品種是瘤牛,約占肉牛總量的80%,瘤牛品種中有90%是內洛爾牛。在1980年以前,巴西肉牛的遺傳改良進程非常有限,評估性狀主要集中在體重上。1995年,第一篇關于采用最優線性無偏預測(BLUP)方法進行遺傳評估的文章,成為了巴西內洛爾牛進行品種選育的轉折點[43]。每年有9個組織進行內洛爾牛的遺傳評估工作,其數據共收集了超過200萬條記錄的10 000多頭公牛,評估中考慮的性狀包含生長、繁殖、胴體和肉質性狀。其他品種肉牛每年也會進行評估,其中,古澤拉和婆羅門牛分別有3個機構對其進行遺傳評定工作,其他品種的遺傳評估工作僅由協會負責,每年評估一次。
巴西肉牛基因組選擇從2010開始構建內洛爾牛參考群體,先利用低密度芯片和中等密度芯片對內洛爾牛進行基因分型,隨后全部利用Illumina Bovine770K高密度芯片進行基因分型。2014年,內洛爾牛參考群體達685頭,所有個體全部利用Bovine770K獲得基因型,利用3種方法(GBLUP、BayesLasso和BayesC)估計15個生長和胴體性狀的基因組育種值,結果表明,BayesC和BayesLasso方法的基因組育種值估計準確性均高于GBLUP方法[44]。2016年,內洛爾牛參考群體達1 756頭,該群體來自于294頭種公牛,所有個體同樣使用高密度芯片進行基因分型,利用3種貝葉斯方法評估胴體性狀的基因組估計育種值的準確性,包括貝葉斯嶺回歸、BayesLasso和BayesC。結果表明,BayesC和BayesLasso方法評估的準確性基本相同[45]。
澳洲的肉牛生產國主要為澳大利亞和新西蘭,同時,澳大利亞和新西蘭也是我國的主要肉牛進口國家。近年來,我國從澳大利亞和新西蘭進口了大量的西門塔爾牛、海福特牛和安格斯牛。澳大利亞和新西蘭在進行常規遺傳時,數據可聯合使用,其遺傳評估應用的軟件是BREEDPLAN(https://breedplan.une.edu.au/),24個肉牛品種協會分別進行單個品種的遺傳評估,大部分品種每年評估一次,只有少部分大型協會每年評估3次,評估結果會在各協會網站上公布[46]。
澳大利亞常規遺傳評估包括了24個肉牛品種,各肉牛協會收集數據并發布遺傳評估結果,評估的軟件為BREEDPLAN。品種數量大的協會每年評估3次,品種數量少的協會每年至少評估一次,每個協會根據育種的實際情況制定了不同的選擇指數。以西門塔爾牛為例,常規遺傳評估包括生長、繁殖、肉質等23個性狀。西門塔爾牛遺傳評估指數包括四個:本土母親指數(domestic maternal index)、出口母親指數(export maternal index)、北部綜合指數(northern terminal index)、犢牛指數(vealer terminal index),這4個指數都是用來評價每頭牛和群體間的遺傳差異所獲得的凈利潤。本土母親指數主要針對本土貿易,其后代公牛全部閹割,在14月齡時停喂草或谷物,活重能達430 kg(240 kg的胴體重和6 mm的背膘厚),后代母牛全部留下用于育種。出口母親指數主要針對出口貿易,其后代公牛全部閹割,在28月齡時停喂草或谷物,活重能達700 kg(380 kg的胴體重和8 mm的背膘厚),后代母牛也全部屠宰。北部指數主要針對出口貿易,其后代公牛全部閹割,在28月齡時停喂草或谷物,活重達630 kg(345 kg的胴體重和12 mm 的背膘厚)。犢牛指數主要針對犢牛貿易,犢牛斷奶后在8月齡售賣,活重達350 kg(195 kg的胴體重和6 mm的背膘厚)。所有評估指數中各性狀權重都通過育種規劃計算得出。4個綜合選擇指數相對于各性狀的權重如表4所示,其中產犢難易度、200日齡重、400日齡重、600日齡重和背膘厚的育種值在指數中占的權重較高。

表4 西門塔爾牛不同綜合指數對應各性狀的權重表
2014年7月14日,澳大利亞生物學家Ben Hayes在《自然·遺傳學》雜志發表了千牛計劃的研究成果,重測序了4個品種234頭牛的全基因組數據,其中包含43頭西門塔爾牛。千牛基因組計劃的實施旨在為加速優良品種選育提供數據支持[47]。目前,千牛計劃有40個機構參與,已對6 920頭牛進行重測序,其中,歐洲牛品種3 103頭,包含9千余萬個SNPs位點,瘤牛及瘤牛與歐洲牛雜交牛3 817頭,包含1億3千余萬個SNPs位點(http://www.1000bullgenomes.com/),該計劃可以定位出更多影響目標性狀的變異位點,挖掘更多關聯基因。
基因組遺傳評估已經在澳大利亞研究了數年,但評估結果并未在協會上公布,最開始是應用低密度芯片評估肉質性狀,近期安格斯牛的基因組遺傳評估是利用了傳統BLUP計算的育種值當做表型去計算基因組估計育種值。目前,澳大利亞的基因組選擇參考群體已擁有9個品種共計10 181頭,其中,安格斯牛1 734頭,墨瑞灰牛223頭,短腳牛717頭,海福特牛613頭, 婆羅門牛3 384頭和雜交牛3 510頭,基因型數據獲取應用了5種不同款的芯片,包括879頭個體通過Illumina 770K芯片獲取基因型、6 852頭個體通過兩款50K芯片(54 001個SNPs位點 和54 609個SNPs位點)獲取基因型、2 138頭個體通過7K芯片(6 909個SNPs位點)獲取基因型和312頭個體通過Affymetrix ParalleleSNP 10K(11 932個SNPs位點)芯片獲取基因型,基因組育種值估計方法為BayesR,收集的表型性狀包括育肥期日增重、斷奶重、育肥期增重及其體高、胴體重、背膘厚、眼肌面積、零售肉重、每日采食量、剩余采食量等19個性狀[48]。婆羅門牛的基因組遺傳評估利用的軟件是BREEDPLAN,建立的參考群體超過1 000頭,主要測定了繁殖性狀和200天體重。為了收集更多更準確的表型信息和難以測定的表型,澳大利亞還建立了專門化表型收集農場(beef information nucleuses, BINs),以期能提高育種值估計的準確性[49]。
常規遺傳評估是20世紀肉牛育種的基礎,歐美發達國家的常規遺傳評估工作已有幾十年的歷史,而中國肉牛遺傳評估工作從2012年才開始,起步較晚。另一方面,各國不同地區的肉牛生產體系、性能測定體系各有差異,導致不同國家地區的常規遺傳評估體系各有不同,主要體現在各地區各品種協會制定的綜合選擇指數上。以西門塔爾牛為例,美國和加拿大評估了生長性狀、胴體和肉質性狀及繁殖性狀共計15個 性狀,依據不同的育種目標制定了API和TI兩個綜合選擇指數(https://simmental.org/site/index.php);英國評估了生長性狀、胴體和肉質性狀及繁殖性狀共計15個性狀,制定了兩個綜合選擇指數(http://www.britishsimmental.co.uk/);澳大利亞同樣評估了生長性狀、胴體和肉質性狀及繁殖性狀共計18個性狀,制定了4個綜合選擇指數(https://simmental.com.au/)。中國目前肉牛生產體系和性能測定體系使得制定的綜合選擇指數暫時只能利用生長發育性狀和母親產奶量性狀。而歐洲、北美和澳洲等肉牛育種發達國家和地區的產業體系、性能測定體系和遺傳評估體系較完善,考慮性狀較多。
目前,世界各國主要肉牛品種基本上都在利用全基因選擇技術進行選種,該技術提高了育種值估計的準確性,大大縮短了世代間隔,加快了遺傳進展。各個國家開展肉牛全基因組選擇的時間各有差異,以北美為代表的肉牛基因組遺傳評估體系開展的時間最早,也是目前最成熟且應用最新計算方法的體系。以西門塔爾牛品種為例,其制定的API和TI指數也是多個國家肉牛育種的主要參考指數,美國開發的商業化BLOT遺傳評估系統能綜合各品種信息,同時整合系譜和基因組信息進行多品種SSGBLUP評定,也是目前主流的基因組遺傳評估系統之一。歐洲肉牛基因組遺傳評估以Interbeef評估中心為主,大部分歐洲國家加入了該組織,該中心的數據庫有超2百萬頭牛測定了基因型,以單品種基因組遺傳評估為主,目前還未報道相關基因組選擇綜合選擇指數。澳洲肉牛基因組遺傳評估系統以BREEDPLAN為主,主要是澳大利亞和新西蘭的各品種肉牛聯合會進行評定,其基因型測定個體要少于北美和歐洲。拉丁美洲的基因組遺傳評估主要是巴西的內洛爾牛,其他品種無相關報道。各國基因組遺傳評估參考群情況如表5所示,可以看出各國建立的參考群規模各有差異,美國最早建立了參考群,而中國相對于其他國家和地區較晚;從計算方法上,中國基因組評估方法采用的是貝葉斯方法,而國外多采用ssGBLUP方法,主要由于國外有大量的系譜和表型數據,而針對中國表型數據和系譜數據較少的情況下,貝葉斯方法在中國應用更有優勢;從參考群測定的表型性狀看,中國參考群測定了生長發育、屠宰、胴體、肉質和繁殖性狀共計87個性狀,是目前基因組選擇測定表型性狀最多的國家。

表5 不同國家基因組選擇參考群情況
目前,各國肉牛育種已進入全基因組選擇時代,肉牛全基因組選擇技術在主要肉牛品種上已展開應用。隨著各國基因組選擇參考群體規模的不斷擴大,育種值估計的準確性也將逐步提高,世代間隔將大幅度縮短,可以有效提高肉牛遺傳進展和加快新品種培育進程。在肉牛全基因組選擇應用過程中,仍有一些問題需要解決:1)肉牛品種居多,如何進行多品種基因組遺傳評估一直來是個難題[37];2)常規遺傳評估體系是進行基因組遺傳評估的基礎,因此,需要持續地開展肉牛生產性能測定工作,積累大量的表型數據和系譜數據,如何形成快速的、低成本的生產性能測定體系也是當前迫切需要解決的問題;3)近年來,有報道稱,全基因組選擇在應用過程中加快了目標性狀的遺傳進展,而忽略了后代群體中近交程度的增加、遺傳多樣性的降低以及有害基因的純合等問題,因此,難以維持長期的遺傳進展,基因組選配技術的提出為個體提供精準選配,該方法利用了待選擇個體的基因組信息實施優化的選配,實現了長期且可持續的遺傳進展[52]。
相對于遺傳評估工作起步較早的歐美發達國家,中國的肉牛遺傳評估工作起步晚,但隨著中國肉牛生產性能測定體系和遺傳評估體系的完善,以及全基因組選擇的應用,中國肉牛育種將提升到更高的臺階;同時,中國于2020年修訂了《全國肉牛遺傳改良計劃2021—2035》,以期進一步完善肉牛良種繁育體系,加強肉牛聯合育種機制創新,提高肉牛自主制種供種能力,切實提升肉牛生產水平和經濟效益。肉牛全基因組選擇技術給中國肉牛育種提供了契機,在未來十年甚至二十年內有望趕超國外,成為肉牛育種強國。