褚 楚,張靜靜,丁 磊,樊懿楷,包向男,向世馨,劉 銳,羅雪路,任小麗,李春芳,劉文舉,王 亮,劉 莉,李永青,江 漢,李委奇,孫 偉,李喜和,溫 萬,周佳敏,張淑君*
(1.華中農業(yè)大學動物科學技術學院、動物醫(yī)學院,動物遺傳育種與繁殖教育部實驗室,武漢 430070;2.內蒙古國家乳業(yè)技術創(chuàng)新中心有限責任公司,呼和浩特 011517;3.寧夏回族自治區(qū)畜牧工作站,銀川 750000)
動物攝取蛋白質是為了獲得其中的氨基酸,尤其是對動物生長發(fā)育至關重要的必需氨基酸[1]。牛奶中的氨基酸組成與人奶相似,富含人體內不能合成的必需氨基酸及3種支鏈氨基酸,是較為優(yōu)質的乳蛋白資源[2]。其中,牛奶中富含的異亮氨酸(isoleucine,Ile)、精氨酸 (arginine,Arg)、組氨酸 (histidine,His)是成年人、兒童、早產兒重要的必需氨基酸,在人類生命代謝中占有特別重要的地位。牛奶中的異亮氨酸占牛奶中總氨基酸含量的5.8%左右,具有提高機體免疫力[3]、促進蛋白質合成、激活抗氧化防御系統(tǒng)[4]、改善生長性能、提高腸道免疫和物理屏障功能等重要生物功能[5]。牛奶中的組氨酸占奶中總氨基酸含量的2.6%左右,是處于生長發(fā)育階段動物非常重要的一類營養(yǎng)物質[6],它在酶的活性部位發(fā)揮著特別重要的作用[7-8]。牛奶中的精氨酸占奶中總氨基酸含量的3.5%左右[9],研究發(fā)現(xiàn)攝入精氨酸可以改善機體免疫力[10]、促進氨轉化成尿素進而降低人體血氨,是維持嬰幼兒生長和氮平衡必不可少的氨基酸[11]。因此,牛奶中游離氨基酸含量的準確檢測有助于奶牛的健康養(yǎng)殖,同時,也是穩(wěn)定乳制品質量,實現(xiàn)標準化加工的前提。關于奶制品中游離氨基酸的測定方法目前暫無國家標準,當前用于游離氨酸含量檢測的分析技術主要有氨基酸自動分析儀分析法、高效液相色譜法[12]、液相色譜-質譜儀[13]、氣相色譜-質譜儀、毛細管電泳、核磁共振等,該技術測定準確率較高,但此類方法也存在成本高、耗時長、難操作和儀器設備要求高等不足,難以在奶牛生產性能測定DHI的實踐中快速批量化使用[14-17]。中紅外光譜(mid-infrared spectroscopy,MIR)技術是一種非常經濟高效的檢測工具,具有方便快捷、無污染、無破壞性、無前處理等優(yōu)勢[18],彌補了傳統(tǒng)檢測方法的不足,近年來已經成為一種檢測趨勢。在定量分析過程中,中紅外光譜的靈敏度比其他光譜要高[19]。我國現(xiàn)已通過中紅外光譜技術對牛奶中蛋白總量和脂肪總量等常規(guī)乳成份指標進行檢測,已廣泛應用于奶牛生產性能DHI測定中[20-21]。目前對牛奶中游離氨基酸含量的快速批量檢測方法研究較少,僅有一篇國外研究將MIR應用于牛奶中游離氨基酸含量的定量檢測,McDermott 等[22]利用來自7個研究牛群和69個商業(yè)牛群的715個奶樣建立了基于MIR的牛奶中游離氨基酸含量的定量模型,并探討了泌乳階段、胎次、月份、遺傳等對牛奶中游離氨基酸含量的影響。然而,目前尚無基于牛奶MIR的中國荷斯坦牛游離氨基酸含量的預測模型,也沒有我國奶牛群體氨基酸含量及其影響因素相關研究信息。
本研究利用中紅光譜MIR不同預處理方法、特征波段選擇算法及建模方法,建立中國荷斯坦牛牛奶中3種重要游離氨基酸(精氨酸、組氨酸、異亮氨酸)含量的MIR預測潛力模型,并將所建立的MIR預測模型應用于大規(guī)模奶牛奶數據的預測,從群體水平上探討牛奶中游離精氨酸、組氨酸和異亮氨酸含量,以及在不同胎次、泌乳階段、季節(jié)及牧場之間的變異特征。若MIR預測準確性良好,則將提供一種方法來估計大量牛奶中游離氨基酸含量,有望應用于我國奶牛生產性能測定DHI中,增加奶牛奶品質性狀的表型指標。
從我國華北、華中和西北4個省份(A、B、C、D)的9個中國荷斯坦奶牛養(yǎng)殖場中,采集健康狀況良好的奶牛奶樣共217份,采樣時間為2018年10月至2019年1月。牛奶采集利用自動擠奶裝置完成,奶樣一式兩份,一份用于MIR測定,一份用于氨基酸參考值測定,每份牛奶采集約40 mL,分裝到DHI檢測瓶中,依次編號,并向每個采樣瓶里立即加入溴硝丙二醇防腐劑,緩慢搖晃使其充分溶解。運回途中在奶樣周圍放置冰袋(2~4 ℃)防止變質,樣本到達實驗室后立即進行光譜采集。
MilkoScanTMFT+[傅里葉變換中紅外光譜儀(FTIR),丹麥FOSS公司]; 全自動氨基酸分析儀(德國SykamS433D);游離氨基酸分析柱(LCAK07/Li,4.6 mm ×150 mm);游離氨基酸分析除氨柱;針管過濾器;0.45 μm 尼龍濾膜;渦漩振蕩器;離心機;進樣瓶。
氨基酸標準溶液(34AA,PH游離,貨號AA-S000031);茚三酮(N105629-500 g,阿拉丁);緩沖液A、緩沖液B、緩沖液C、再生液D均購于德國Sykam公司;LiOH×H2O;檸檬酸×H2O;HCl(濃度為37%);辛酸;磺基水楊酸;其他試劑均為國產分析純。
1.3.1 中紅外光譜的采集 將采樣瓶放在42 ℃水浴鍋內預熱15~20 min,將預熱后奶樣放在檢測鐵架上反轉搖晃數次使牛奶中成分分布均勻,在保持環(huán)境溫度為室溫的前提下,將樣品放上檢測履帶,打開瓶蓋,依次通過FT-MIR儀進行檢測,檢測結果輸出牛奶MIR、牛奶常規(guī)乳成分(乳脂、乳蛋白、乳糖、尿素氮、總固形物)及牛奶體細胞數數據。
1.3.2 牛奶中游離精氨酸、組氨酸和異亮氨酸的含量測定 1)100 nmol·mL-1標準液配制:取100 μL標準液加900 μL樣品稀釋液,渦旋混勻。上機前用 0.45 μm尼龍濾膜過濾。2)奶樣的處理:吸取約8 mL奶樣于離心管中,3 000 r·min-1離心5 min(達到分離固態(tài)物的目的即可),若奶樣中懸浮物不至于干擾取樣均勻性,則此步驟可跳過;離心后準確吸取上清液1 mL于另外的離心試管中,加入2%磺基水楊酸9 mL,混勻靜置15 min;設置離心機轉速為3 000 r·min-1離心20 min或10 000 r·min-1離心10 min,離心后取上清液;上機前用 0.45 μm 尼龍濾膜過濾。色譜條件:色譜柱:LCAK07/Li;流速:洗脫泵0.45 mL·min-1+衍生泵0.25 mL·min-1;檢測波長:570 nm+440 nm;反應器溫度:38~74 ℃梯度升溫;平均每批次檢測20個樣品,一批次只需進樣一次標準液,若中途更換試劑(流動相、茚三酮等)則標準液需重新進樣。
首先去除光譜為空值的記錄,其次對真實值進行篩選,即真實值在平均值±標準差范圍內則歸為正常值,否則為異常值。217條數據經異常值篩選后,保留精氨酸數據185條,組氨酸數據197條,賴氨酸數據197條,具體信息見表1。

表1 牛奶樣本在不同地區(qū)的分布情況
牛奶膠束的散射以及儀器運行過程中產生的隨機噪聲會對光譜造成干擾,因此光譜中不僅包含許多有用的化學信息,還存在大量的背景噪聲和無用信息。為去除光譜采集過程中環(huán)境、儀器及操作引起的系統(tǒng)誤差,正式建模前需先對光譜進行預處理。本研究采用的光譜預處理方法包括標準正態(tài)變量變換(standard normal variate transformation,SNV)、多元散射校正(multivariate scatter correction,MSC)、差分及Savitsky-Golay(SG)平滑(SG平滑包含w和k兩個參數,w指窗口長度,該值需為正奇整數;k指對窗口內的數據點進行k階多項式擬合)。結果僅展示最優(yōu)光譜預處理。
牛奶MIR由925~5 008 cm-1范圍內的1 060個單獨的波點組成,中紅外光譜特征維數較多,不同波段之間信息有一定的重疊性,通過特征提取算法,能夠大大降低光譜維數,提高建模速度,并且可去除光譜中的噪音。本研究利用競爭性自適應重加權算法(competitive adaptive reweighted sampling,CARS)、遺傳算法(genetic algorithm,GA)及最小角回歸算法(least angle regression,LAR)提取特征變量,并與目前國際上牛奶MIR建模常用的274個信息波點(925~1 584 cm-1、1 719~1 784 cm-1及2 652~2 976 cm-1,以下稱為“信息波點”)相比較。
1.6.1 數據集劃分 根據4個地區(qū),將總數據集劃分為3部分,即訓練集、測試集和外部驗證集,三者數據比例約為4∶1∶1,訓練集用于訓練模型,測試集用于測試模型性能,外部驗證集用于驗證模型的泛化能力。在第一輪,A、B、C地區(qū)數據用于訓練集及測試集,D地區(qū)數據用于外部驗證集;在第二輪,A、B、D地區(qū)數據用于訓練集及測試集,C地區(qū)數據用于外部驗證集;以此類推,直至每個地區(qū)的數據都用于一次外部驗證。此過程不僅可了解模型對于建模地區(qū)數據的預測力(測試集結果),還可了解其對其他地區(qū)數據的預測能力(外部驗證集結果)。
1.6.2 建模方法 本研究比較了兩種建模算法,即偏最小二乘回歸(partial least squares regression)及嶺回歸。
為探討模型的應用性能,將預測模型應用于從E省(未參與建模的省份)9個不同奶牛場4 690頭牛采集的32 559個牛奶樣本的MIR光譜,去除光譜及常規(guī)乳成分空值、真實值范圍之外的異常值后獲得樣本23 707個。然后,通過比較氨基酸預測值與真實值的差異、氨基酸與乳成分及體細胞數相關性的差異,進一步確定模型在大規(guī)模數據集上外部驗證的性能。最后,使用混合線性模型分析胎次、泌乳階段、季節(jié)(春季:3~5月;夏季:6~8月;秋季:9~11月;冬季:12月~次年2月)及牧場對牛奶中游離精氨酸、組氨酸及異亮氨酸含量的影響,以探討模型的預測應用效果:
yijklmn=DIMi+Parityj+Seasonk+Herdl+Cowm+eijklmn
其中,yijklmn為分析的3種氨基酸性狀表型,包括精氨酸、組氨酸和異亮氨酸;DIMi為第i水平DIM的固定效應(i=1,2,…,12,以30 d為間隔分為12個水平,其中第12類包括DIM>330 d的樣本);Parityj是奶牛的第j胎的固定效應(j=1:第一胎次;j=2:第2胎次;j=3:第3胎次;j=4:第4胎次;j=5:第5胎次;j=6:第6及后胎次);Seasonk是季節(jié)固定效應(k=1:春季;k=2:夏季;k=3:秋季;k=4:冬季);Herdl是第l個牧場的隨機效應(l=1~9);Cowm是奶牛個體的隨機效應;eijklmn為隨機殘差,假設服從eijklmn~N(0,σe2)正態(tài)分布,其中σe2是殘差方差。
牛奶的原始光譜如圖1所示。牛奶MIR由925~5 008 cm-1范圍內的1 060個單獨的波點組成,共包含5個區(qū)域,大致分為短波紅外區(qū)(SWIR)、中波紅外區(qū)(MWIR)和長波紅外區(qū)(LWIR)。5 010~3 673 cm-1被稱為SWIR區(qū)域,此區(qū)域通常被認為與牛奶成分的化學鍵無關[24-25];3 669~3 052 cm-1被稱為SWIR-MWIR區(qū)域;3 048~1 701 cm-1被稱為MWIR-1區(qū)域,此區(qū)域與C-H,C=O,C-N和N-H鍵有關,所有這些鍵均與乳脂含量有關[26];1 698~1 585 cm-1被稱為MWIR-2區(qū)域;1 582~925 cm-1被稱為MWIR-LWIR區(qū)域,此區(qū)域被稱為“指紋區(qū)”,該區(qū)域通常被認為是預測牛奶成分最重要的區(qū)域,因為它與化學鍵C-H,芳香族C=C,C-O和N-O有關[27]。不同樣本在MWIR-2(1 698~1 585 cm-1)及SWIR-MWIR(3 669~3 052 cm-1)區(qū)域吸光度的變異很大,這是由水吸收導致,一般認為,水吸收區(qū)域不含信息特征,因此來自吸水區(qū)域的波數通常被認為不能用于預測牛奶成分或任何其他特性[28]。在MWIR-1區(qū)域及MWIR-LWIR區(qū)域均觀察到特征吸收峰,在SWIR區(qū)域未觀察到特征吸收峰。

SWIR.短波紅外或近紅外區(qū)域;MWIR.中波紅外區(qū)域(3.0~8.0 μm);LWIR.長波紅外區(qū)域(8.0~15.0 μm)
利用兩種建模算法、3種波段選擇算法及4種光譜預處理算法對牛奶中游離精氨酸、組氨酸及異亮氨酸分別建立基于MIR的預測模型,模型結果見表2。

表2 不同建模算法及特征選擇方法對氨基酸預測模型性能的影響
2.2.1 光譜預處理、特征選擇算法及建模算法的選擇 建模前,使用CARS、GA和LAR算法分別對光譜數據進行特征提取,分別找出能夠代表精氨酸、組氨酸、異亮氨酸含量的特征變量,然后利用SG平滑、差分、MSC、SNV方法對光譜進行預處理。
對于精氨酸,利用CARS算法提取到的光譜特征建模效果好(RP2=0.58),其次是274個信息波點(RP2=0.50),GA和LAR算法表現(xiàn)出相似的結果(RP2=0.45)。對于組氨酸,表現(xiàn)出和精氨酸類似的規(guī)律,即CARS算法(RP2=0.56)優(yōu)于274個信息波點(RP2=0.50)建模,GA(RP2=0.34)和LAR(RP2=0.47)算法差于274個信息波點建模。對于異亮氨酸,利用274個特征信息波點(RP2=0.49)建模效果最好,優(yōu)于CARS(RP2=0.38)、GA(RP2=0.32)及LAR(RP2=0.28)。3種氨基酸建模最優(yōu)波段在MIR上的分布范圍如下:精氨酸經過CARS算法共選擇出71個波點:9個分布在MWIR-1區(qū)域、5個分布在MWIR-2區(qū)域;13個分布在MWIR-LWIR區(qū)域、26個分布在SWIR區(qū)域、18個分布在SWIR-MWIR區(qū)域。組氨酸經過CARS算法共選擇出93個波點:27個分布在MWIR-1區(qū)域、2個分布在MWIR-2區(qū)域;26分分布在MWIR-LWIR區(qū)域;16個分布在SWIR區(qū)域、22個分布在SWIR-MWIR區(qū)域。目前,國際上牛奶MIR建模常用的274個信息波點分布在925~1 584 cm-1、1 719~1 784 cm-1及2 652~2 976 cm-1范圍內,包含了MWIR-1中的乳脂吸收區(qū)及MWIR-LWIR(牛奶指紋)區(qū)域。
從表2可以看出,與嶺回歸相比,利用PLSR算法建立精氨酸、組氨酸和異亮氨酸模型效果較好,此類模型的R2及RPD較高、RMSE及MAE較低。綜上所述,采用CARS特征選擇算法+無光譜預處理+PLSR建模算法開發(fā)的精氨酸含量預測模型效果最好,該模型RP2=0.58,RMSEp=6.89 nmol·mL-1,MAE=5.64 nmol·mL-1,RPD=1.41;采用CARS特征選擇算法+SG平滑(窗口長度為11,2階多項式)預處理+PLSR建模算法開發(fā)的組氨酸含量預測模型效果最好,該模型RP2=0.56,RMSEp=0.88 nmol·mL-1,MAE=0.70 nmol·mL-1,RPD=1.63;采用274個特征信息波點+SG平滑(窗口長度為29,3階多項式)預處理+PLSR建模算法開發(fā)的異亮氨酸含量預測模型效果最好,該模型RP2=0.49,RMSEp=1.75 nmol·mL-1,MAE=1.34 nmol·mL-1,RPD=1.55。
2.2.2 預測最優(yōu)模型的跨地區(qū)外部驗證 利用所建立的最優(yōu)預測模型對來自不同地區(qū)的未參加建模的奶牛奶進行外部驗證,以探討建立的氨基酸預測模型對其他地區(qū)數據的預測能力,即跨地區(qū)預測能力。由表3可看出,數據集的劃分不同,模型的外部驗證結果略有差異,對于精氨酸、組氨酸和異亮氨酸,跨地區(qū)外部驗證的預測誤差分別為7.70~10.11 nmol·mL-1,1.22~1.49 nmol·mL-1,2.01~2.76 nmol·mL-1。由圖2可看出,真實值和預測值的散點圖圍繞在y=x(真實值等于預測值),表明在小規(guī)模數據集上,跨不同地區(qū)外部驗證數據的預測值與真實值呈現(xiàn)出一定的相關趨勢。

a.A、B、C地區(qū)數據建模,D地區(qū)數據做外部驗證(最優(yōu)模型外部驗證結果);b.A、B、D地區(qū)數據建模,C地區(qū)數據做外部驗證(最優(yōu)模型外部驗證結果);c.A、C、D地區(qū)數據建模,B地區(qū)數據做外部驗證(最優(yōu)模型外部驗證結果);d.C、D、B地區(qū)數據建模,A地區(qū)數據做外部驗證(最優(yōu)模型外部驗證結果)

表3 最優(yōu)模型的跨地區(qū)驗證
綜合模型在跨不同地區(qū)外部驗證數據集上的預測誤差及相關關系結果,表明目前建立的氨基酸最優(yōu)預測模型可用于區(qū)分高氨基酸含量牛奶及低氨基酸含量牛奶,即分析氨基酸含量高低趨勢,可用于奶牛性能高低評估,若模型用于較準確地預測真實含量還需要進一步優(yōu)化和提高。
為了進一步探討模型對牛場大規(guī)模奶牛群牛奶的預測應用效果,利用建立的最優(yōu)精氨酸、組氨酸、異亮氨酸含量預測模型對來自沒有參加建模的另外9個不同奶牛場(位于E省)的4 690頭牛采集的32 559個牛奶樣本的MIR光譜進行預測分析。
2.3.1 模型預測的氨基酸含量及其高低趨勢 “2.2.2”說明了基于MIR的氨基酸含量預測模型對氨基酸含量高低趨勢具有一定的預測潛力。由表4可知,在進行跨不同地區(qū)或牧場的外部驗證時,3種氨基酸含量的預測值略低于真實值,但在含量值的高低趨勢是相似的,精氨酸含量最高,其次是異亮氨酸,組氨酸的含量最低。

表4 牛奶中游離氨基酸真實值及預測值的含量及分布情況
2.3.2 模型預測的氨基酸含量與牛奶常規(guī)乳成分相關 3種氨基酸預測值與牛奶常規(guī)乳成分和體細胞數及產奶量的相關性同3種氨基酸測定真實值與牛奶常規(guī)乳成分和體細胞數及產奶量的相關性相比,均呈現(xiàn)相同的正相關或負相關,預測值與牛奶常規(guī)乳成分(牛奶常規(guī)乳成分、體細胞數、產奶量)的相關強度略低于真實值與三者的相關強度(圖3)。綜合以上結果,建立的預測模型具有預測奶牛氨基酸含量及其變化趨勢的潛力。

左側圖代表3種氨基酸預測值與牛奶常規(guī)乳成分、體細胞數、產奶量的相關性;右側圖代表3種氨基酸真實值與牛奶常規(guī)乳成分、體細胞數、產奶量的相關性;不顯著相關性系數圖塊上有X符號
2.3.3 模型預測氨基酸含量的影響因素 經過混合線性模型分析可知,泌乳階段、牧場、季節(jié)對牛奶中游離精氨酸、組氨酸及異亮氨酸含量均有極顯著影響(P<0.001),而胎次對精氨酸含量無顯著影響,對組氨酸和異亮氨酸有極顯著影響(P<0.001)(表5)。

表5 混合線性模型分析結果
圖4A展示了泌乳階段對牛奶中精氨酸、異亮氨酸及組氨酸含量的影響。共觀察到兩種變化規(guī)律,第一個對應異亮氨酸和組氨酸,在泌乳前2個月含量降低,隨后小幅度增加,至泌乳6個月后又有降低趨勢,在后期趨于穩(wěn)定;第二種變化規(guī)律對應精氨酸,在泌乳前期和中期(1~9月)牛奶中精氨酸含量不斷升高,泌乳9~11月略微降低,隨后又轉為上升趨勢。圖4B可看出,不同牧場之間氨基酸含量有差異,令人感興趣的是,精氨酸和異亮氨酸在不同牧場之間的變化規(guī)律幾乎相同,而組氨酸表現(xiàn)出與二者完全相反的變化規(guī)律。由圖4C可知,隨著從低胎次到高胎次的過渡,牛奶中精氨酸、異亮氨酸和組氨酸含量有降低趨勢,但變化不明顯,差異不顯著。圖4D展現(xiàn)了牛奶中精氨酸、異亮氨酸和組氨酸含量在不同季節(jié)中的變化。精氨酸、組氨酸和異亮氨酸對于季節(jié)的變化響應了相似的變化規(guī)律,即春季到秋季含量升高,在秋季含量到達頂峰,隨后降低。3種氨基酸的最高值均出現(xiàn)在秋季,精氨酸的最低值出現(xiàn)在春季,異亮氨酸和組氨酸的最低值出現(xiàn)在冬季。
本研究利用不同的特征選擇方法、光譜預處理方法及建模算法建立了基于MIR的牛奶(原料牛奶)中游離精氨酸、組氨酸和異亮氨酸含量的預測模型,三者最優(yōu)預測模型的預測性能相似,RP2均在0.5左右(0.58、0.56、0.49),RPD在1.5左右(1.41、1.63、1.55),預測誤差RMSEp也在預期范圍內(6.89、0.88、1.75 nmol·mL-1),這些結果表明,雖然建立的氨基酸預測模型目前不能進行精準定量檢測,但可用于預測牛奶中的氨基酸含量,鑒別高游離氨基酸牛奶和低游離氨基酸牛奶,即用于牛奶氨基酸含量高低趨勢分析,也可用于奶牛的品質性狀指標氨基酸含量預測及其高低的比較。
目前,國內外僅有一篇文獻研究MIR對牛奶中游離氨基酸含量的定量預測,McDermott 等[22]使用PLSR方法,利用712個奶樣的MIR及參考值建立了牛奶中游離總氨基酸、谷氨酸、甘氨酸、賴氨酸、精氨酸、天冬氨酸、絲氨酸及纈氨酸含量的定量預測模型,驗證集中相關系數為0.26(精氨酸)~0.75(甘氨酸)(對應R2為0.07~0.56),RPD為1.07(絲氨酸)~1.38(甘氨酸),此研究與本研究只有一種相同氨基酸,即精氨酸。與McDermott 等[22]的研究(r=0.26,R2=0.07,RPD=1.25)相比,本研究建立的游離精氨酸定量預測模型(驗證集R2=0.58,RPD=1.41)結果較好。對于精氨酸含量預測模型的建立過程,本研究與McDermott 等[22]均使用了PLSR建模算法,且并未對光譜進行預處理,造成預測效果有差異的可能原因有光譜預處理方法、特征波選擇方法、建模數據量、樣本采集廣泛度(多樣性和代表性)、建模集中測試集與訓練集的分布情況、真實值的測定過程、牧場的飼養(yǎng)管理等[29]。McDermott 等[22]使用的波段范圍為 926~1 580 cm-1、1 717~2 986 cm-1、3 696~3 808 cm-1(僅去除了水吸收區(qū)域),而本研究結合3種波段選擇算法(GA、LAR、CARS)選出了最優(yōu)預測模型,Gottardo等[30]表明,在PLS分析之前采用變量選擇方法可以提高牛奶中脂肪酸組成的預測精度。
當將建立的預測模型應用到跨不同地區(qū)外部驗證集中時,由于不同地區(qū)氣候、牧場管理條件、奶牛飲食等均有差異,導致外部驗證集的變異性未包含在建模集中,因此模型對外部驗證數據產生了有偏預測,這是預期內的結果,有文獻表明,對于準確的預測方程,驗證數據集中存在的變化必須包含在校準數據集中[31-32],因此,為建立穩(wěn)健準確的氨基酸預測模型,需要在模型中加入來源于不同飼養(yǎng)條件、飲食、品種、氣候等的氨基酸數據,以在建模集中包含足夠多的變異,這可以通過跨地區(qū)及國際合作實現(xiàn)。
奶牛的泌乳階段可分為泌乳初期、泌乳前期、泌乳中期、泌乳后期、干奶期5個階段,泌乳階段不同,奶產量及牛奶中氨基酸含量也會有所差異。相關文獻表明,牛奶中游離氨基酸含量在泌乳初期和泌乳后期較高。McDermott 等[22]利用基于MIR的牛奶中游離氨基酸含量模型預測了大量比利時DHI數據,結果表明牛奶中總游離氨基酸含量與大多數游離氨基酸含量(谷氨酸、甘氨酸、賴氨酸、精氨酸和天冬氨酸)在泌乳早期降低,直到產犢后第65天,隨后逐漸升高,這與本研究結果(精氨酸從泌乳前期到后期均有上升趨勢)有所差異,產生差異的原因可能是本研究建模數據中泌乳早期數據較少,因此對于泌乳早期會產生較大誤差的預測,更重要原因可能與奶牛飼料、飼養(yǎng)管理和季節(jié)等因素有關。
季節(jié)對牛奶氨基酸含量的影響有多方面,主要是不同季節(jié)導致飼草營養(yǎng)成份[33]、空氣溫度等發(fā)生變化,因此,在生產中為了得到質量更優(yōu)的奶產品,對奶牛養(yǎng)殖要注意營養(yǎng)水平及溫度的調控,在夏季防暑降溫至關重要。本研究結果表明,牛奶中精氨酸含量在秋季最高,春夏季含量較低,這與其他文獻報道一致[34]。奶牛屬于耐冷不耐熱的動物,在較高溫的環(huán)境中具有較低的生產性能,因此夏季牛奶中氨基酸含量降低。有學者以荷斯坦奶牛為研究對象,探討荷斯坦牛奶中氨基酸含量的季節(jié)變化特點,結果表明隨著返青期、盛草期、枯草前期和枯草期等季節(jié)的更替,牛奶中總氨基酸和必需氨基酸的含量呈遞增趨勢。在返青期,牧草水分含量較高,干物質較少,以此為飼料生產的牛奶表現(xiàn)出較低氨基酸含量的特點;盛草期牧草快速生長,干物質含量迅速升高,奶牛粗纖維、粗脂肪、粗蛋白攝入量增多,為乳腺細胞合成蛋白質提供較為充足的原料,因此盛草期間牛奶中氨基酸含量較返青期高;隨著枯草期的到來,牧草中粗纖維含量升高,導致奶牛產奶量降低而乳脂率升高,進而提高牛奶中氨基酸含量[35]。
胎次是影響牛奶營養(yǎng)成份、奶牛生產性能和血液指標的重要因素,同時對牛奶氨基酸含量也有較大影響。牛奶中各游離氨基酸含量和游離氨基酸總量在奶牛第1胎時最高[22],且隨胎次的增長有明顯下降的趨勢,這與本研究結果一致。隨奶牛胎次的增長其奶中氨基酸含量降低的原因可能是頭胎泌乳牛較為健康,患乳腺炎的較少,往后的胎次由于飼養(yǎng)管理、環(huán)境等原因會發(fā)生乳腺疾病,從而導致牛奶中氨基酸和蛋白質含量的下降[36]。以上分析的不同影響因素對模型預測結果影響效應與變化規(guī)律與文獻報道類似,從另一個角度也說明該模型具有一定的預測能力。
本研究在國內率先利用MIR建立牛奶中3種氨基酸含量的預測模型,結果表明MIR有預測牛奶中游離精氨酸、組氨酸和異亮氨酸的潛力,特別是在牛奶氨基酸含量高低趨勢分析以及奶牛的品質性狀指標氨基酸含量預測及其高低比較方面具有一定預測能力。然而,所建立的模型還需要更多有代表性樣本進行優(yōu)化和提高,以進行較精準定量檢測牛奶中3種氨基酸含量。大規(guī)模牛奶樣本預測結果表明了牛奶中游離精氨酸、組氨酸和異亮氨酸預測值在不同泌乳階段、胎次、季節(jié)和牧場中的變化趨勢:牛奶中游離氨基酸含量預測值在秋季最高,精氨基酸含量在整個泌乳期呈上升趨勢,精氨酸和組氨酸及異亮氨酸含量均隨胎次有降低的趨勢。