陳靜 劉顯軍 朱玉博 鄧亮
摘 要: 本文對畜牧實驗設計中的實驗方案、實驗設計方法、設計原則和樣本含量的確定中常出現的統計學問題和錯誤進行分析,并相應提出了制定合理畜牧實驗設計的建議。提出了在統計學和專業知識基礎上制定的畜牧實驗設計是正確進行畜牧科研生產的重要保證。
關鍵詞: 畜牧;實驗設計;統計學;錯誤
一、 引言
科學研究是推動畜牧業的發展的重要手段。動物品種選育,飼料配方的配置,新的飼養管理方法的確定等都離不開實驗研究。實驗設計是在研究工作前,根據研究項目的需要,應用數理統計原理,作出的整體實驗安排,力求較少的投入,獲得最多的可靠的資料。畜牧實驗設計的制定是在生物統計學的基礎上制定的。然而由于畜牧研究人員對生物統計基礎知識和應用缺乏深入的了解,致使在畜牧實驗設計和統計分析中?;蚨嗷蛏俪霈F統計學方法上的問題和錯誤。
二、 畜牧實驗設計中常出現的統計學的問題和錯誤
(一) 實驗方案不合理
實驗設計的目的是為了控制降低實驗誤差,無偏估計處理效應,對總體作出可靠、正確的推斷。實驗設計的核心是實驗方案,而實驗方案的核心是研究的因素和水平。根據因素的多少可以分為單因素實驗方案和多因素實驗方案。不同的方案有不同的設計方法。然而如果混淆實驗方案和實驗方法,實驗設計就可能從根本上發生錯誤。比如在育肥豬飼料中添加6種不同劑量的亞麻籽油(0%、0.4%、0.8%、1.2%、1.6%、2%),進行飼養實驗。這是一個有6個水平的單因素完全隨機實驗,是單因素實驗方案。但如果每個亞麻籽油水平下分析2個不同劑量豆油的育肥豬的飼喂效果,結果用單因素方差分析顯然不對。該實驗實際是一個多因素實驗方案,是6×2析因設計,應進行兩因素方差分析(即多因素方差分析)。
在設置因素水平時,要充分考慮課題、因素的特點及動物的反應能力。水平的數目過多和水平數太少都會導致結果分析不全面。同時水平間的差異要根據因素的性質來確定,如仔豬飼料中油脂的含量在2%左右,而鐵的含量僅為0.008%左右,兩者在數量等級差異很大,因此兩個因素的水平差異就不能統一確定。此外,因素水平的排列可采用靈活方式,如等差法、等比法等設置水平。
(二) 實驗設計方法不恰當
在畜牧實驗設計時,即使是相同的實驗方案,也要根據因素的關系采取不同的設計方法。同樣是兩因素的設計,如果兩因素是平等關系(如考查不飽和脂肪酸和品種對育肥豬生產性能的影響),可采用多因素析因設計。如兩因素是從屬關系(如考查公畜的種用價值,要考慮與配母畜,但是在同期,公畜和母畜的不同水平是不能交叉),這種情況則可選取系統分組設計。如果要研究飽和脂肪酸(動物油)的飼喂效果,但實驗動物差異較大,這時可采用隨機單位組設計,把單位組(動物)作為一個因素進行統計。雖然實驗結果是按照兩因素方差分析進行,但本實驗設計本質是單因素實驗設計。除假定單位組因素與實驗因素不存在交互作用外,單位組效應也認為是隨機效應,是從誤差中分離出來的,如果單位組不顯著,還要與誤差進行合并,以增加誤差自由度,提高實驗的精確性。
(三) 不遵循實驗設計重復原則進行實驗設計
實驗研究中總會出現誤差。根據產生誤差的原因和性質不同,可分為系統誤差(片面誤差)和隨機誤差(抽樣誤差)兩類。動物實驗誤差的主要來源主要來自供試動物、飼養管理、環境條件以及一些隨機因素等引起的差異。重復的作用是估計實驗誤差和降低實驗誤差。如果一處理內只有一個觀測值,即無重復,則無法計算統計量,也就不能估計實驗誤差的大小。值得注意的是,在多因素析因設計中,由于每個因素水平都有多個觀測值,實驗人員在統計時往往忽視多因素實驗的處理數與水平數的差異。單因素實驗設計中處理數等于水平數,每個水平內(即處理)的觀測值的個數就是重復數。而多因素析因設計中,處理數等于水平組合,即水平數的乘積,因此實驗的重復數是每個處理內的觀測值的個數,這才是真正的重復數。
在無重復正交設計中,其誤差是由“空列”來估計的。然而“空列”并不空,實際上是被未考查的交互作用。誤差既包含實驗誤差,也包含交互作用,稱為模型誤差。但一些研究者進行正交設計時,沒有認識到“空列”存在的意義,用因素占用了“空列”,這將導致誤差平方和(SS e)和誤差自由度(df e)為零,此實驗得出的數據沒有統計學意義。解決占用“空列”的措施只有增加重復,最好能有二次以上的重復。重復可采用完全隨機或隨機單位組設計。但即使有重復,我們也不提倡這種占用“空列”的正交設計,因為多因素之間的交互作用會被掩蓋,而模型誤差會夸大實驗誤差,有可能掩蓋考查因素的顯著性。
(四) 不滿足實驗精度的要求忽視樣本含量
在實驗研究中,樣本含量的大小關系到結果的精確性。一味選取較大的樣本含量,必然相應投入較多的人力、物力和時間。但在實際實驗中,人為的操作對動物的影響必然導致動物生產性能的下降,從經濟方面考慮卻要求樣本越小越好。因此,如何確定適宜樣本含量是畜牧實驗設計中一個重要內容。在實驗設計中,研究者往往忽略統計中對實驗精度的要求。實驗精度要求是(df e≥12),而df e=12是實驗精度的最低要求。不同的實驗設計計算處理內重復數的方法是不同的。完全隨機設計中處理數k≥3,則n≥12/k+1。在隨機單位組設計中,處理數k≥3,則n≥12/(k-1)+1。然后再根據實驗單位數(kn),乘以每個實驗單位包含的動物數既得最小樣本含量。但拉丁方設計比較特殊,r×r拉丁方雖然有r 2個觀測值,但其實驗單位只有r個。當處理數低于4,即3×3和4×4拉丁方,其df e<12,為了使df e達到12,需要進行重復拉丁方設計,即3×3拉丁方重復6次,4×4拉丁方重復2次。因此在計算最小樣本含量時,要考慮拉丁方的重復數。
除此之外,處理數k=2的實驗設計中,最小樣本含量還要參考實驗要求的準確性高低、所研究對象的變異度大小和能夠接受的允許誤差。如處理數k=2的完全隨機設計(即非配對設計或成組設計),重復數n=2t 2 αS/(x? 1-x? 2) 2;在處理數k=2是隨機單位組設計(即配對設計),重復數n=t α 2S 2 d/d ?2。
三、 小結
完善可行的實驗設計能夠嚴格的控制誤差,提高實驗效率。而實驗設計不當,不僅達不到實驗的目的,甚至導致整個實驗的失敗。因此,能否合理地進行實驗設計,關系到科研工作的成敗。掌握生物統計學知識和專業技能,提高實驗設計方法的選擇能力,防止錯誤發生,是保障科研順利開展和進行的基礎。
參考文獻:
[1]李轉見,韓瑞麗,孫桂榮,等.生物統計附試驗設計教學心得與常見錯誤分析[J].畜牧與飼料科學,2016,37(10):89-92.
[2]陳庭木,王寶祥,楊波,等.3因素隨機裂區試驗設計及其統計分析[J].安徽農業科學,2017,45(25):3-5,7.
[3]趙振華,賈青.試驗設計中的統計學錯誤淺析[J].邯鄲農業高等??茖W校學報,2004,21(4):11-13.
[4]明道緒.生物統計附試驗設計[M].北京:中國農業出版社,2014.
[5]邱世芳,郭黎萱.雙邊試驗設計下基于區間估計的樣本量的確定[J].重慶理工大學學報(自然科學),2018,32(4):219-229.