郝嘉琪


摘 要:生物統計是數理統計在生物中的應用,尤其在農業領域中發揮著日益重要的作用。文章對生物統計與農業科學試驗的聯系,以及在農業試驗中的分析、應用和數據的處理等方面進行了論述。
關鍵詞:生物統計 農業 試驗設計 應用
中圖分類號:F32
文獻標識碼:A
文章編號:1004-4914(2017)06-224-02
一、生物統計學概況
生物統計學是建立在數理統計的基礎上,結合生物科學的基本原理,利用數據分析解釋生物的各種現象,從而興起的一門交叉性學科。早在1889年《自然的遺傳》一書中就提及“相關”、“回歸”等有關統計的概念。從記錄統計學開始,經過描述統計學,一直發展到現在的推斷統計學,生物統計學逐漸發展了起來。隨著社會的進步和科技的發展,生物統計在植物界如農業、林業,動物界如養殖業、漁業,微生物界如發酵產業、分子生物學等領域均有很大的影響力,甚至在人類疾病及遺傳等醫學領域的重要性也愈加顯著。
世間萬物都是相互聯系的,運用生物統計可研究其相互之間的關系以預測其活動規律。目前,許多國家的相關大學都開設生物統計科目,主要講授方差分析、回歸分析、簡單矩陣等課程,以及生物統計在植物育種、作物栽培、作物生產、農林經濟管理、養殖業等方面的應用,還有如何利用電腦軟件整理、分析相關數據等內容{1}。
二、農業科學試驗的過程
生物科學研究,尤其農業科學研究是以實驗為基礎的科學。在農業生產過程中,為了提高農產品的質量和產量、減少田間害蟲群體的數量、合理施用農藥化肥等方面,需要提前對試驗進行正確、科學且周密的設計,從而達到預期的效果。
對于農業科學中的各項研究,大部分都需要經過若干年的試驗周期,而且還必須選擇多個地方進行,從而使研究的結果趨于平均化,最后得到具有代表性的結論。這些試驗都要運用到“八性”統計思維中的隨機性、概括性與代表性等理論{2},在試驗過程中搜集、調查得來的數據再做進一步的統計分析、處理,從而得出適宜于農業領域的有效結論。
三、統計與科學試驗的關系
試驗所得數據只是所有研究對象的一部分,具有變異性,同時觀察的數據也可能存在誤差,如果直接將其應用于生產中必定會帶來難以估計的嚴重后果。而生物統計能在部分個體的基礎上,推斷出總體的相關參數,為農業人員提供理論依據,有效解決生產中存在的疑難問題。生物統計是農業科學試驗的理論基礎,而良好的科學試驗設計可以為統計推斷帶來準確的數據來源。
一是生物統計能將試驗調查的數據系統化、條理化,從而便于分析研究;二是生物統計能夠分析出農業試驗各變量間的相關性;三是生物統計是科學試驗方案的原則與依據。生物統計和科學試驗二者之間相輔相成,將其相互結合必然成為今后農業科學研究的理論指導體系。
四、生物統計分析
(一)推斷統計
推斷統計是由樣本統計量推斷總體參數的統計方法,可分為總體的假設性檢驗和總體的參數估計兩部分。
1.總體的假設性檢驗。研究的總體是無限的,而有限的樣本可以推斷出總體是否滿足所研究的問題。例如:農業科學中經常涉及肥料品種對農產品產量影響的研究,施用肥料的面積是有限的,此時就可以運用推斷統計的總體假設性檢驗,對施用不同品種肥料的產量進行收集、整理、分析,做進一步的推斷。而推斷需要對總體做出假設,首先,假設幾個總體參數之間或總體參數與一個確定值是相等的,此為無效假設;其次,做出對應于無效假設即相等關系的備擇假設,也就是互不相等關系,并確定顯著水平。對于上例,無效假設為施用不同肥料對產量的影響沒有顯著差異。之后,認為無效假設是正確的,計算其概率并與顯著水平比較,比較過程中,規定小概率事件在實際中是不可能發生的,由此判斷是否接受無效假設。若上述例子中計算得到的概率小于顯著水平,認為不可能發生,則否定無效假設,即不同品種肥料對產量的多少有顯著影響。
2.總體的參數估計。在農業研究中,需要對新引進品種的種子千粒重、發芽率、肥料利用率等問題進行一個區間范圍的估計。由樣本的調查結果預測總體相關參數在符合一個特定概率時的區間,便于挑選優良品種,有針對性地投入生產,達到省時省力的作用。
(二)方差分析與回歸、相關分析
1.方差分析與田間試驗。方差分析適用于存在多種處理、多個重復的試驗中,其基本方法為計算多個處理觀察值的偏差平方和(SST)及其自由度(fT),再分解為多種影響因子的偏差平方和(SSA、SSe)與自由度(fA、fe),從而計算相關統計量(F0),在顯著水平下做出統計推斷,并列出方差分析表,直觀表明所研究問題的顯著性。例如:分別用多種不同的藥劑處理小麥種子,比較苗高,檢驗藥劑的品種對小麥苗高影響有無顯著性差異。此研究中的變異來源為藥劑不同品種間引起的變異,以及試驗誤差引起的變異。通過方差分析表可看出藥劑的品種對苗高是否有影響,哪種藥劑更有利于種子生長。
田間試驗中,由于同一塊試驗地的各個區域存在不同的自然環境,如土壤肥力、鹽堿性、水分等,且需要設置多個重復,因此將試驗地隨機劃分為多個小區,每個小區的處理各異,這種設計方法叫做隨機區組法。例如:對小麥6個品種(1-6)進行比較,每種重復3次(Ⅰ、Ⅱ、Ⅲ),設計的田間排列如下:
而有些田間試驗中,由于條件的限制,所有處理不能完全在小區內隨機排列,這時就可以將小區劃分為不同的級別:主級小區與次級小區。需要大片土地的處理作為主級小區,其內包含剩余處理的各個水平。如有A1、A2兩個玉米品種,B1、B2、B3三個水平的施肥量,重復試驗2次(Ⅰ、Ⅱ),設計的田間排列如下圖。這種設計能有效地利用試驗地與材料,節省資源且實施方便。方差分析需要對主因素即玉米品種間、副因素即施肥量水平間、主副因素間的互作效應進行差異顯著性檢驗。
2.回歸、相關分析與試驗結論。統計學中的關系有因果關系與平行關系兩種。施肥量與作物產量間是因果關系,研究因果兩者之間的關聯程度叫回歸分析,而施肥量與種植密度間就為平行關系,共同決定產量,關于平行關系間密切程度的探討就是相關分析。為了使結果更加明顯,通常建立直線回歸模型并計算相關系數來表達各因素間的聯系。利用以上方法便于研究者對日后的農事勞作進行預測,并制定出一系列的優良決策。
五、生物統計在農業上的應用
農業科學從過去的定性研究到現在逐漸趨向于定量化研究{3},這一過程中不可缺少的是數學工具。生物與數學相互融合產生的生物統計學在農業科學的多方面研究中發揮著巨大作用。
為了提高農產品的品質與產量,我國新引進多種糧食品種。但新品種適宜在什么樣的環境下生長、利于作物生長的肥料品種以及施肥量的多少等問題都需要事先用生物統計學進行分析研究。除此之外,農田生態系統中的各種害蟲、雜草的生長也會對作物產生不利的影響,農業勞作者一般通過簡單噴灑農藥的方法來控制。而施用何種農藥以及藥劑量的多少,既能有效消滅作物天敵又能盡量降低對農作物的損害,同時降低經濟損失等等問題,也要依靠生物統計學進行預測和預報。
另外還有學者發現,具備生物統計學知識可以預測一些生物現象的發生,而且準確率較高,然而很多人對此卻并不了解{4}。因此在相關人群中普及生物統計學的知識勢在必行。
六、數據處理
對農業試驗中的調查數據做進一步的分析處理時,會出現數據冗雜繁瑣的現象,這就需要一些統計軟件加以輔助運算。其中使用最多的是SPSS(Statistical Package for the Social Science)與SAS(Statistical Analysis System)軟件。SPSS與SAS是世界上廣為流行的統計軟件,在農業、經濟、人文、醫學、教育、自然科學等科研活動中必不可少。它的功能既全面又強大,這是其被廣泛使用的重要原因之一。非專業人士也能很快掌握其操作方法并熟練應用。
通過統計軟件可以將研究人員所需要的結果完美展示出來,既方便又快捷。但是,完全依靠軟件也并不科學,只有生物統計工作者利用軟件分析出的結果,再結合生物科學有關理論對其在農業領域中所帶來的影響作出總體的分析研究判斷,這樣才能得出最后的正確結論,從而指導人們的生產活動,最終達到事半功倍的效果。
注釋:
{1}彭先恐,張汝斌,王福亭.生物統計在農業科學上的應用[J].河南農學院學報,1980(3):96-105.
{2}胡良平,劉惠剛.統計學思想與三型理論在生物醫學科研中的應用[J].中西醫結合學報,2007,5(2):216-219.
{3}周季維.應用生物統計學基礎(一)[R].云南:云南省農科院情報室.
{4}Oluwatosin Akinsola, Olutayo James, Adebayo Lbikunle, Wasiu Adeyemo. Understanding biostatistics: A study of Nigerian dental resident doctors [J]. Nigerian Journal of Experimental and Clinical Biosciences, 2014:100-104.
(作者單位:西北農林科技大學農學院2014級農學2班 陜西楊凌 712100)
(責編:若佳)