應(yīng)智霞 施陳 鄒志文


摘 要:生物統(tǒng)計(jì)學(xué)是大多數(shù)高等院校生命科學(xué)領(lǐng)域本科學(xué)生必修的基礎(chǔ)課程,也是一門在實(shí)踐中廣泛應(yīng)用的學(xué)科。該課程的主要目的是培養(yǎng)學(xué)生的數(shù)據(jù)分析能力,提高其科研和實(shí)踐應(yīng)用能力。然而,傳統(tǒng)教學(xué)側(cè)重于理論知識(shí)的講解,而忽略了培養(yǎng)學(xué)生應(yīng)用統(tǒng)計(jì)軟件分析試驗(yàn)數(shù)據(jù)的能力。基于此,該研究以配對(duì)數(shù)據(jù)t-檢驗(yàn)為例,通過對(duì)3種代表性的統(tǒng)計(jì)軟件(Excel、SPSS和R)進(jìn)行比較,分析總結(jié)了3種軟件在生物統(tǒng)計(jì)學(xué)教學(xué)中的優(yōu)缺點(diǎn)。針對(duì)本科生教學(xué),選擇Excel或SPSS為教學(xué)輔助軟件,加深學(xué)生對(duì)理論知識(shí)的理解,提高學(xué)生的數(shù)據(jù)處理能力。并將R逐步引入教學(xué)中,提升學(xué)生處理復(fù)雜數(shù)據(jù)和解決實(shí)際問題的能力,使其成為具有對(duì)理論知識(shí)理解和軟件應(yīng)用能力的綜合性人才。
關(guān)鍵詞:Excel;SPSS;R;輔助教學(xué);配對(duì)t-檢驗(yàn)
中圖分類號(hào) G642.0文獻(xiàn)標(biāo)識(shí)碼 A文章編號(hào) 1007-7731(2021)13-0197-04
Abstract: Biostatistics is not only a compulsory basic course for undergraduates in the field of life science in most colleges and universities, but also a subject with wide practical application. The main purpose of this course is to cultivate students′ ability of data analysis, and improve students′ ability of scientific research and practical application. However, the traditional teaching focuses on the explanation of theoretical knowledge, and neglects the students′ ability of using statistical software to analyze data. Based on this, we compared the application of three statistical software (Excel, SPSS and R) in the case study of paired t-test, then analyzed and summarized the advantages and disadvantages of the three software in biostatistics teaching. We summarized that it would deepen students′ understanding of theoretical knowledge and improve students′ data processing ability via choosing Excel or SPSS as teaching assistant software for undergraduate teaching. Then, gradually introducing R into teaching process could improve students ability to deal with complex data and solve practical problems, and consequently made students become comprehensive talents with the ability to understand theoretical knowledge and apply software.
Key words: Excel; SPSS; R; Assistant teaching; Paired t-test
生物統(tǒng)計(jì)學(xué)是大多數(shù)高等院校生物學(xué)相關(guān)專業(yè)的基礎(chǔ)必修課,也是一門實(shí)踐應(yīng)用廣泛的學(xué)科。生物統(tǒng)計(jì)學(xué)應(yīng)用數(shù)理統(tǒng)計(jì)的知識(shí)來(lái)認(rèn)識(shí)、分析、推斷和解釋生命過程中的各種現(xiàn)象和試驗(yàn)調(diào)查資料,從而揭示大量隨機(jī)現(xiàn)象中的規(guī)律。通過學(xué)習(xí)這門課程,可以培養(yǎng)學(xué)生數(shù)據(jù)分析的能力,提高其科研和實(shí)踐應(yīng)用能力。但是,該課程傳統(tǒng)的教學(xué)過程仍存在一些問題,如側(cè)重理論知識(shí)的講解,忽略統(tǒng)計(jì)軟件的實(shí)踐應(yīng)用練習(xí),使課程單調(diào),理論知識(shí)枯燥、難懂,不利于培養(yǎng)學(xué)生應(yīng)用統(tǒng)計(jì)軟件分析試驗(yàn)數(shù)據(jù)的能力[1]。
隨著計(jì)算機(jī)技術(shù)的普及和發(fā)展,各種統(tǒng)計(jì)分析軟件也應(yīng)運(yùn)而生,在生物統(tǒng)計(jì)中的應(yīng)用越來(lái)越廣泛[2-7]。運(yùn)用統(tǒng)計(jì)軟件輔助生物統(tǒng)計(jì)學(xué)課堂教學(xué),將會(huì)改善課程的教學(xué)效果,提高學(xué)生的科研和實(shí)踐應(yīng)用能力。常用的統(tǒng)計(jì)軟件有Excel、SPSS、SAS、R語(yǔ)言和MATLAB等,每個(gè)統(tǒng)計(jì)軟件具有各自的優(yōu)缺點(diǎn),如何正確選擇恰當(dāng)?shù)慕y(tǒng)計(jì)軟件輔助課程教學(xué)尤為重要。為此,本研究通過比較不同統(tǒng)計(jì)軟件在生物統(tǒng)計(jì)教學(xué)應(yīng)用中的優(yōu)缺點(diǎn),為生物統(tǒng)計(jì)學(xué)教師因地制宜地選擇恰當(dāng)?shù)慕y(tǒng)計(jì)軟件,進(jìn)行因材施教,從而改善該課程的教學(xué)效果、提高人才的培養(yǎng)質(zhì)量,最終達(dá)到培養(yǎng)具有對(duì)理論知識(shí)理解和軟件應(yīng)用能力的綜合性人才的目的。
1 常用的統(tǒng)計(jì)軟件
常用的統(tǒng)計(jì)軟件有Excel、SPSS、SAS、R語(yǔ)言和MATLAB等,本研究主要選擇3種具有代表性的統(tǒng)計(jì)軟件進(jìn)行比較,分別為Excel、SPSS和R。
Excel作為常用辦公軟件,較易上手,具有較強(qiáng)的數(shù)據(jù)計(jì)算和圖表制作功能,并提供了大量統(tǒng)計(jì)函數(shù)和數(shù)據(jù)分析工具,如統(tǒng)計(jì)學(xué)參數(shù)或特征數(shù)的計(jì)算、數(shù)據(jù)分類、描述統(tǒng)計(jì)、t檢驗(yàn)、方差分析、相關(guān)與回歸等,這些可基本滿足生物統(tǒng)計(jì)學(xué)的本科教學(xué)要求[8-10]。
SPSS是世界上最早采用圖形菜單驅(qū)動(dòng)界面的統(tǒng)計(jì)軟件,其操作界面友好、功能界面展現(xiàn)規(guī)范、數(shù)據(jù)接口較為通用、分析結(jié)果輸出整齊。SPSS利用菜單式操作可以實(shí)現(xiàn)絕大部分統(tǒng)計(jì)分析功能,如描述統(tǒng)計(jì)、比較均值、一般線性模型、相關(guān)、回歸、聚類分析、非參數(shù)檢驗(yàn)等[11],幾乎涵括了生物學(xué)中所有的統(tǒng)計(jì)方法。
R是國(guó)外眾多大學(xué)統(tǒng)計(jì)相關(guān)課程的教學(xué)工具和當(dāng)前眾多學(xué)者的科研統(tǒng)計(jì)分析工具。R是屬于GNU系統(tǒng)的一個(gè)自由、免費(fèi)、源代碼開放的統(tǒng)計(jì)計(jì)算和統(tǒng)計(jì)制圖軟件。R語(yǔ)言在統(tǒng)計(jì)描述、統(tǒng)計(jì)作圖、統(tǒng)計(jì)分布及統(tǒng)計(jì)檢驗(yàn)等方面提供了豐富的函數(shù),是一個(gè)用于統(tǒng)計(jì)計(jì)算和統(tǒng)計(jì)制圖的優(yōu)秀工具[12,13]。
2 配對(duì)數(shù)據(jù)t檢驗(yàn)案例分析
2.1 案例介紹 以白車軸草(Trifolium repens L)根系在2種土壤(蛭石V和營(yíng)養(yǎng)土N)中地下生物量的顯著性分析為例。蛭石和營(yíng)養(yǎng)土放置在花盆內(nèi)部左右兩側(cè),白車軸草在花盆正中間生長(zhǎng),通過根系分配在2種土壤中地下生物量的顯著性分析,探究白車軸草根系的覓食行為(有機(jī)體在其生境內(nèi)進(jìn)行的促進(jìn)對(duì)必需資源獲取的搜尋或分枝過程)。在同樣條件下種植8盆,2種土壤中地下生物量見表1。
2.2 案例理論分析 經(jīng)驗(yàn)和正態(tài)性檢驗(yàn)可知,2組數(shù)據(jù)均服從正態(tài)分布,且2組數(shù)據(jù)的差值形成的1個(gè)數(shù)據(jù)組也服從正態(tài)分布。對(duì)于服從正態(tài)分布的2個(gè)樣本均值的差異顯著性檢驗(yàn),一般采用成組t檢驗(yàn)或配對(duì)t檢驗(yàn),其中成組t檢驗(yàn)也稱2個(gè)獨(dú)立樣本資料的t檢驗(yàn),適用于完全隨機(jī)設(shè)計(jì)的兩樣本均數(shù)的比較,即將受試對(duì)象隨機(jī)分配成2個(gè)處理組,每一組隨機(jī)接受1種處理;而配對(duì)t檢驗(yàn)適用于配對(duì)設(shè)計(jì)2樣本平均數(shù)差異顯著性檢驗(yàn),即同一樣本接受不同處理的比較,或?qū)ν?個(gè)受試對(duì)象處理前后的比較,或同一對(duì)象的2個(gè)部位給予不同的處理,或?qū)⑹茉噷?duì)象按情況相近者配對(duì),分別給予2種不同處理,觀察2種處理效果有無(wú)差別。本例題中為同一對(duì)象的2個(gè)部位給予不同的處理,因此采用配對(duì)t檢驗(yàn)。
配對(duì)t檢驗(yàn),是單樣本t檢驗(yàn)的特例。配對(duì)樣本觀測(cè)數(shù)據(jù)之差dj形成1個(gè)新的單樣本,檢驗(yàn)此樣本反映的總體均值μd是否為0。
因此,檢驗(yàn)假設(shè)為:
H0∶μd=0
H1∶μd≠0
檢驗(yàn)統(tǒng)計(jì)量為:
t=[dSd/n]~t(n-1)
其中,n為樣本差值的容量,[d]為樣本差值的均值,Sd為樣本差值的標(biāo)準(zhǔn)差。
t=[dSd/n]=[0.19250.1111958]=-4.89656
臨界值t7,0.025=2.365,[t]>t7,0.025,即P<0.05,結(jié)論是拒絕H0,認(rèn)為白車軸草在蛭石和營(yíng)養(yǎng)土中地下生物量有顯著差異,且通過右尾檢驗(yàn),有[t]>t7,0.025=1.895,認(rèn)為蛭石生物量顯著低于營(yíng)養(yǎng)土中地下生物量。
2.3 Excel軟件分析步驟及結(jié)果 將表1數(shù)據(jù)復(fù)制粘貼于Excel中,在菜單“數(shù)據(jù)—數(shù)據(jù)分析”中選擇“t-檢驗(yàn):平均值的成對(duì)二樣本分析”,自動(dòng)打開“t-檢驗(yàn):平均值的成對(duì)二樣本分析”的對(duì)話框(見圖1),在變量1的區(qū)域選擇表中第一行數(shù)據(jù),變量2的區(qū)域選擇第2行數(shù)據(jù),輸出區(qū)域可任意選擇一個(gè)空白區(qū)域,點(diǎn)擊“確定”,可自動(dòng)在輸出區(qū)域內(nèi)產(chǎn)生成對(duì)雙樣本均值分析的結(jié)果(見表2)。
2.4 SPSS軟件分析步驟及結(jié)果 定義變量并建立數(shù)據(jù)文件。將表1中數(shù)據(jù)轉(zhuǎn)置后拷貝到SPSS數(shù)據(jù)編輯器中,第一列變量為蛭石中根系生物量(V),第2列為變量營(yíng)養(yǎng)土中根系生物量(N)。在菜單“分析(A)—比較均值(M)—配對(duì)樣本T檢驗(yàn)(P)”,打開“配對(duì)樣本T檢驗(yàn)”對(duì)話框(見圖2)。選擇圖2左側(cè)框中變量“V”和“N”分別為“Variable 1”和“Variable 2”,點(diǎn)擊確定即可生成結(jié)果(見表3~5)。
2.5 R軟件分析步驟及結(jié)果 在R輸入下列命令:
x<-c(0.12,0.12,0.13,0.04,0.06,0.09,0.11,0.10);
y<-c(0.28,0.40,0.51,0.06,0.31,0.23,0.31,0.21);
t.test(x,y,paired=T,conf.level=0.95)
R自動(dòng)產(chǎn)生配對(duì)t檢驗(yàn)的結(jié)果,結(jié)果如下:
Paired t-test
data: x and y
t=-4.8966,df=7,p-value=0.00176
alternative hypothesis: true difference in means is not equal to 0
5 percent confidence interval:
-0.1950549 -0.1899451
sample estimates:
mean of the differences
-0.1925
3 討論
利用這幾個(gè)軟件可快速完成配對(duì)t檢驗(yàn)統(tǒng)計(jì)分析,且每個(gè)軟件分析結(jié)果與理論分析結(jié)果一致。但是,不同軟件的操作過程及結(jié)果輸出形式不一樣。對(duì)軟件操作而言,Excel和SPSS都可以通過菜單式操作進(jìn)行相應(yīng)的統(tǒng)計(jì)分析,而R則需要命令式語(yǔ)句進(jìn)行統(tǒng)計(jì)分析。對(duì)軟件輸出結(jié)果,Excel和SPSS都展示每組變量的描述、2組變量的相關(guān)性以及統(tǒng)計(jì)檢驗(yàn)的相關(guān)結(jié)果;R直接顯示出t檢驗(yàn)的結(jié)果。
相比而言,Excel和SPSS操作比較簡(jiǎn)單,易學(xué)易用,適合生物統(tǒng)計(jì)學(xué)初學(xué)者,可作為本科教學(xué)的有效輔助工具;而R需要一定的編程基礎(chǔ),對(duì)于統(tǒng)計(jì)初學(xué)者來(lái)說過于專業(yè),學(xué)習(xí)難度較高。但是,Excel只能做一些簡(jiǎn)單的統(tǒng)計(jì)分析,SPSS雖然提供了很多常用的統(tǒng)計(jì)方法,但是分析功能仍然有所欠缺,且用法幾乎固定。相比而言,R具有一套完整的數(shù)據(jù)處理、計(jì)算和制圖系統(tǒng),強(qiáng)大的編輯語(yǔ)言可以通過自由撰寫增加統(tǒng)計(jì)功能。例如,就R語(yǔ)言的t.test() 命令可以實(shí)現(xiàn)不同t檢驗(yàn),如果上例題中輸入:t.test(x,y=NULL,mu=0.1),則檢驗(yàn)1個(gè)樣本的總體均值與0.1有無(wú)顯著差異;輸入:t.test(x,y,paired=F,var.equal=F),則為方差不等的成組t檢驗(yàn)。還可以利用參數(shù)alternative設(shè)置單尾檢驗(yàn)或者雙尾檢驗(yàn),alternative=two.side,為雙尾檢驗(yàn),greater和less分布為右尾和左尾檢驗(yàn),利用conf.level設(shè)定置信水平,默認(rèn)α=0.95。此外,R還可以嵌套各種函數(shù)命令進(jìn)行其他統(tǒng)計(jì)分析。
綜上,在理論知識(shí)講解之后,緊接著介紹Excel或者SPSS的統(tǒng)計(jì)功能、操作步驟和結(jié)果解釋,把課程理論教學(xué)、實(shí)際案例分析和軟件應(yīng)用有機(jī)結(jié)合,可以加深對(duì)統(tǒng)計(jì)原理等理論知識(shí)的理解,并掌握應(yīng)用軟件進(jìn)行數(shù)據(jù)統(tǒng)計(jì)分析的方法,產(chǎn)生了較好的教學(xué)效果。在今后的生物統(tǒng)計(jì)學(xué)教學(xué)實(shí)踐中,應(yīng)緊密加強(qiáng)Excel或者SPSS軟件應(yīng)用與理論教學(xué)的融合,并考慮將R等專業(yè)軟件逐步引入教學(xué)中,以期進(jìn)一步提升學(xué)生分析處理復(fù)雜數(shù)據(jù)、解決實(shí)際問題的能力。
參考文獻(xiàn)
[1]王魏根,隋娟娟,偶春.“生物統(tǒng)計(jì)學(xué)”課程實(shí)踐教學(xué)改革[J].河北農(nóng)業(yè)大學(xué)學(xué)報(bào):農(nóng)林教育版,2017,19(2):98-102.
[2]王魏根,趙胡.統(tǒng)計(jì)軟件用于生物統(tǒng)計(jì)學(xué)課程教學(xué)的應(yīng)用[J].阜陽(yáng)師范學(xué)院學(xué)報(bào):自然科學(xué)版,2014,31(4):121-123.
[3]高麗.Excel和SPSS軟件輔助生物統(tǒng)計(jì)學(xué)教學(xué)模式的探索[J].大學(xué)教育,2014,3(15):144-146.
[4]詹秋文.Excel和SAS在生物統(tǒng)計(jì)學(xué)的應(yīng)用比較[J].生物學(xué)雜志,2009,26(1):74-75,83.
[5]段煉,張瑞杰,張明明,等.R語(yǔ)言在生物統(tǒng)計(jì)學(xué)課程教學(xué)中的應(yīng)用[J].黑龍江科技信息,2017,18(8):61.
[6]應(yīng)智霞,張歡,葛剛,等.MATLAB軟件在生物統(tǒng)計(jì)理論教學(xué)中的應(yīng)用——以抽樣分布為例[J].生物學(xué)雜志,2020,37(4):127-129.
[7]譚啟玲,任濤,黨麗娜,等.Spss統(tǒng)計(jì)軟件在提高生物統(tǒng)計(jì)學(xué)課程教學(xué)效果中的應(yīng)用[J].安徽農(nóng)業(yè)科學(xué),2016,44(31):245-246,251.
[8]高麗.Excel統(tǒng)計(jì)功能在生物統(tǒng)計(jì)學(xué)本科教學(xué)中的應(yīng)用[J].大學(xué)教育,2017,6(3):66-68.
[9]楊景峰.EXCEL的計(jì)算功能在生物統(tǒng)計(jì)學(xué)教學(xué)中的應(yīng)用[J].內(nèi)蒙古民族大學(xué)學(xué)報(bào):自然漢文版,2012,27(6):738-741.
[10]張丹,呂海燕,張幸果,等.應(yīng)用Excel軟件有效提高《生物統(tǒng)計(jì)學(xué)》課程的教學(xué)效果[J].河北農(nóng)業(yè)科學(xué),2012,16(8):93-95,99.
[11]姚玉昌,滕小華,趙騫,等.有效結(jié)合SPSS統(tǒng)計(jì)軟件,提高《生物統(tǒng)計(jì)學(xué)》教學(xué)效果[J].黑龍江畜牧獸醫(yī),2012,13(8):161-162.
[12]王建,戴習(xí)林,彭司華.R語(yǔ)言與生物統(tǒng)計(jì)學(xué)結(jié)合的教學(xué)實(shí)踐探索[J].時(shí)代教育,2017,12(23):50-51.
[13]張哲,張豪.淺談R語(yǔ)言在生物統(tǒng)計(jì)學(xué)教學(xué)中的應(yīng)用[J].教育教學(xué)論壇,2013,4(27):54-55.
(責(zé)編:張宏民)
安徽農(nóng)學(xué)通報(bào)2021年13期