陳夢醒,周曉晶,*,劉健偉
(1.黑龍江八一農墾大學動物科技學院,黑龍江 大慶 163319;黑龍江八一農墾大學理學院,黑龍江 大慶 163319)
奶牛乳房炎是指奶牛在各種外界的因素(化學、物理、環境、微生物等因素)[1-2]的刺激下奶牛乳腺發生炎性的癥狀[3],是危害奶牛的常見群發性炎癥類疾病之一,發病率高,是當今世界奶牛養殖所需要面對的重大難題。全世界約有2.2 億頭奶牛,其中約有1∕3 的奶牛患有各種類型的乳房炎。我國奶牛養殖業每年因乳房炎所造成的經濟損失高達30 億元[4]。乳房炎對奶牛的健康和生產性能有以下幾點影響[5]:(1)患病牛的產奶量降低[6];(2)產出的牛乳中炎性細胞的數量嚴重超標[7],導致牛奶品質明顯下降[8];(3)對奶牛的繁殖性能產生不利的影響[9-10]。同時對牧場的管理成本主要有如下影響:(1)乳房炎治療的成本增加[11];(2)在治療的過程中,抗生素的使用易產生耐藥性,即使在停藥后仍然存在一段時間的棄奶期[12-13];(3)病情嚴重或者愈后不良的奶牛會增加奶牛的死亡和淘汰率[14]。奶牛乳房炎疾病的確診主要是通過臨床監測與實驗室檢驗。從臨床發現再到實驗檢測確診的時間周期過長,易耽誤病情。若能提早干預患病牛只或者對疑似患病的奶牛及時預警,不僅可減少疾病對奶牛的傷害,同時可降低牧場對疾病的投入。本研究旨在通過建立奶牛乳房炎早期預警模型來揭示患有乳房炎的病牛或無明顯臨床癥狀的隱性患病牛只并及時進行科學治療,進而減少抗生素和抗菌藥物的使用,對保證奶產品質量、提高動物福利、提高牧場經濟效益具有重要生產意義及生態學意義[14]。
采用黑龍江省某兩個規模化牧場奶牛的產奶量、活動量以及反芻時間等數據,對奶牛乳房炎與影響因素之間的關系進行調查研究,找出影響奶牛乳房炎發病的關鍵因素,建立奶牛乳房炎早期預警模型,進行模型檢驗,通過ROC曲線(用真陽性率和假陽性率作圖所得的曲線,它可以表示靈敏度與特異度之間的相互關系)將模型可視化,從而為降低奶牛乳房炎發病率、減少牧場的經濟損失和增加乳品的安全性提供依據。該預警模型的研究為牧場的管理者提供了更加簡單有效的奶牛乳房炎疾病監測方法。
數據來自于黑龍江省兩個牧場,牧場1 共有751 頭泌乳牛,分布在2 個畜舍,按照泌乳天數劃分的6 個區,采用奶牛電子身份證(電子耳標)、TMR 精準飼喂等管理手段進行管理;采用SCR 智能擠奶系統實時記錄產奶量;采用豐頓牛群管理系統對奶牛體征進行監控,對奶牛狀況適時查詢和追溯。牧場2 共有169 頭牛,其中健康牛145 頭,病牛24頭,采用的飼養方式與牧場1相同,用于檢驗模型的穩定性。
采用SCR 智能管理系統實現對奶牛的產奶量、活動量及反芻時間的數據收集。該系統包括數據采集器、數據收集器、SCR 數據處理軟件等設備。SCR智能系統通過項圈(頸部計步器)感應奶牛運動時頸部的變化測定奶牛的活動量;通過聲波感應判斷奶牛的反芻時間,每間隔2 h實時記錄奶牛的相關數據;通過64 位的轉盤式擠奶系統進行擠奶,實時采集產奶量。疾病數據由奶牛場獸醫在確診當天錄入牧場安裝的管理系統。對于本研究的牛群,泌乳奶牛采用全混合日糧,滿足其全面營養需求。每天在06:30和15:00提供飼料2次。牛舍中配有風扇,每間隔7~8 m 有1 個飲水槽,保證自由采水,飲用水充足。泌乳牛每天在05:00、14:00、21:30 擠奶3 次,每次擠奶時系統自動記錄單個產奶量。
數據來自于牧場2020 年10 月—2021 年3 月患有乳房炎疾病奶牛和健康奶牛的產奶量、活動量及反芻時間,其中健康的牛只共計680頭,患有乳房炎的牛只共計71 頭。在自動化監控系統收集到的數據中,選取患有乳房炎的奶牛確診前1~20 d 的產奶量、活動量以及反芻時間共60 個變量作為預測因子,對于未患有乳房炎的奶牛,取相應的60個指標為對應數據。其中與產奶量有關的數據用m-1~m-20來表示;活動量用r-1~r-20來表示;反芻時間用a-1~a-20來表示,統計數據(平均值和標準差)見表1。

表1 產奶量、活動量、反芻時間相關信息
Logistic 回歸分析是一種廣義的線性回歸分析模型,可應用于數據挖掘、疾病預警、經濟預測等。根據其因變量的不同有多種回歸方式,本研究的因變量是二分變量,即采用二元Logistic 回歸模型。
令:y=1 表示患有乳房炎疾病的奶牛,y=0 表示健康的奶牛。將發病率記為Pdis,則其與自變量X1,X2,…,Xn之間的Logistic回歸模型為:

則不發病的概率為:

定義:

本研究利用R 軟件4.0.5 實現二元Logistic 分析模型的建立與檢測。首先對60 個變量進行篩選,剔除錯誤或者缺失項過多數據,對于只缺少部分數據的指標,本研究采取補0的方法;然后對處理好的數據進行顯著性檢驗,篩選出P<0.1的相關變量,通過R4.0.5 編程分別進行二元Logistic 分析,建立乳房炎疾病預警模型。
通過R 4.0.5 對60 個處理好的指標進行顯著性檢驗,因變量為Y(是否患病),為二分變量,自變量為上文所選定的60 個指標,剔除P>0.1 的指標,即用P≤0.1的指標進行模型建立,使模型穩定性更高。結果見表2~表4。

表2 產奶量顯著性檢驗

表3 活動量顯著性檢驗

表4 反芻時間顯著性檢驗
通過顯著性檢驗所得的指標,運用R4.0.5進行編程,使用牧場2021 年2 月前的數據進行二元Logistic 分析,通過ROC 曲線(見圖1)進行敏感度和特異性分析,其中敏感性(Sensitivity)又叫做真陽性率(TPR),是指真實正樣本判斷準確率;特異性(Specificity)又叫做假陽性率(FPR),是指真實負樣本判斷準確率。ROC曲線越靠近左上角試驗的準確性就越高。通過混淆矩陣對模型的正確率進行檢驗,共選393頭牛,其中健康牛只347頭,病牛46頭,預測健康牛只288頭、患病牛只41頭,得到模型的正確率為84%。建立奶牛乳房炎二元Logistics回歸預警如下:Z=-18.590 0-0.102 5m-11+0.003 4m-12+0.049 4m-13+0.025 1m-14-0.052 0m-18-0.031 0m-19+0.172 8m-20-0.008 3r-1-0.002 1r-2+0.000 0r-3+0.009 7r-4+0.000 6r-5-0.006 0r-6+0.005 9r-7+0.013 3r-8-0.004 6r-9-0.001 3r-10+0.001 3r-11+0.005 3r-12-0.004 5r-13+0.002 3r-15-0.101 5r-16+0.186 6r-17-0.006 4r-18+0.008 4r-19-0.002 7r-20+0.010 0a-1+0.006 0a-11-0.013 3a-14-0.020 9a-18+0.005 7a-19+0.009 5a-20

圖1 ROC曲線
則預測奶牛是否患病的概率模型如公式6:

通過該牧場2021 年2 月后的數據對模型進行精確性檢驗,共選340頭牛,其中健康牛只325頭,病牛15頭,預測健康牛只308頭、患病牛只12頭,ROC曲線如圖2,得到模型的整體精確性為94%。

圖2 ROC曲線
通過牧場2 的奶牛數據對模型進行穩定性檢驗,本次驗證采取的數據為牧場2的相關數據,共選169 頭牛,其中健康牛只145 頭,病牛24 頭,預測健康牛只127 頭、患病牛只20 頭,ROC 曲線如圖3,得到模型的整體穩定性為87%,

圖3 ROC曲線
通過研究患病奶牛的產奶量、活動量和反芻時間,與健康奶牛這三項數據進行對比,建立了預警模型。二元Logistics回歸模型中主要的指標集中在活動量,說明活動量在二元logistics 回歸模型中擬合效果較好,其模型的精確率為94%,穩定性為87%。本研究能夠通過對產奶量、活動量及反芻時間這三項數據進行監測確定奶牛是否患有乳房炎。模型的計算可以為牧場的管理提供了一定的支持,減少牧場的經濟損失。通過奶牛乳房炎預警模型,首先,可以發現產奶量、活動量相對于反芻時間對診斷奶牛是否患病的效果更好;其次,測試二元Logistics回歸模型的精確性高,為接下來開發應用于牧場生產管理實踐的軟件提供了算法與依據。通過國內外文獻對于奶牛乳房炎與影響因素的研究表明,比較患病和健康的牛群,對每頭牛不同時間段的行為變化的觀察,其活動量、產奶量、采食量、反芻時間的總體趨勢在各個研究之間是一致的。但關于乳房炎影響因素不僅僅是產奶量、活動量和反芻時間這三種,還應考慮奶牛疾病確診當天及關鍵時間節點的血液指標、躺臥行為、胎次、泌乳期、泌乳階段、乳汁溫度、體重、體況評分等影響因素,同樣對奶牛乳房炎的研究有著重要的意義[15]。未來研究將會考慮更多影響因素用于對奶牛乳房炎疾病的預警及診斷研究。