文 靜 邵 惠
p值還是n值:決定顯著性差異的結(jié)果
文 靜 邵 惠
(杭州師范大學(xué)體育與健康學(xué)院,浙江 杭州 311121)
在假設(shè)檢驗中不論進(jìn)行均數(shù)差異檢驗,還是率的差異性χ2檢驗,對于有無差異結(jié)果取決于值。文章指出,在樣本量確定的情況下,其結(jié)果決定于值;但在樣本不確定情況下,而決定值大小與樣本量有關(guān)。在實際應(yīng)用中,對于表明研究結(jié)果是否具有差異時,除了顯示值外,同時也要指出研究的樣本量。
顯著性差異;樣本量;概率
在實際工作中,抽樣研究非常普遍。統(tǒng)計學(xué)除了描述統(tǒng)計外,還有推斷統(tǒng)計,后者是統(tǒng)計學(xué)的精華和使命。統(tǒng)計推斷主要有兩種方法:一是參數(shù)估計,二是假設(shè)檢驗。常見的統(tǒng)計推斷方法有獨立樣本差異性的檢驗、率的差異性χ2檢驗,還有配對資料的檢驗、方差分析等。假設(shè)檢驗是數(shù)理統(tǒng)計學(xué)中根據(jù)一定假設(shè)條件由樣本推斷總體的一種方法,作為統(tǒng)計推斷的一個重要內(nèi)容,歷來受到人們的極大關(guān)注并得到廣泛的運用。
在進(jìn)行假設(shè)檢驗時,檢驗結(jié)果不僅與樣本的統(tǒng)計量有關(guān),如樣本平均數(shù)、標(biāo)準(zhǔn)差,還與樣本量有關(guān)。在數(shù)理統(tǒng)計學(xué)計算檢驗的統(tǒng)計量公式中都有體現(xiàn),公式中不僅含有平均數(shù)、標(biāo)準(zhǔn)差,還有樣本量n。如:

率的差異性χ2檢驗就是比較樣本的實際觀測值與理論推斷值之間的偏離程度。實際觀測值與理論推斷值之間的偏離程度采用χ2與0比大小表示。例如,2017年10月9日,國慶長假后第一天,某學(xué)校對學(xué)生出勤情況進(jìn)行檢查,以不同專業(yè)的兩個班為例,武術(shù)與民族傳統(tǒng)體育專業(yè)班應(yīng)到學(xué)生28人,實到22人;休閑體育專業(yè)班應(yīng)到學(xué)生41人,實到35人。問不同專業(yè)學(xué)生出勤情況是否存在差異,或者說出勤情況與專業(yè)有沒有關(guān)系。根據(jù)統(tǒng)計計算卡方值為0.535,值為0.465,表明兩個專業(yè)出勤率沒有差異。然而兩個班(樣本量)的出勤率明顯不等,卻推斷出兩個專業(yè)沒有差異。而如果類似抽樣10次,得到卡方值為5.535,值為0.021,則表明兩個專業(yè)出勤率存在顯著性差異。類似這樣的案例在實際工作中會經(jīng)常遇到,這在統(tǒng)計學(xué)中不難解決,可采用列聯(lián)表分析。
表1 不同樣本量的統(tǒng)計結(jié)果比較表
籃球隊員排球隊員 籃球隊員排球隊員 樣本量77 693693 均值64.5765.28 64.5765.28 t值-0.199 -2.137 P值0.846 0.033 結(jié)果差異不顯著 差異顯著
獨立樣本檢驗用于檢驗兩樣本均值所代表的兩未知總體均值差異是否具有顯著性。例如表1,問籃球隊員與排球隊員的縱跳成績有沒有顯著性差異。可根據(jù)獨立樣本檢驗來綜合判斷,而不能簡單地回答有還是沒有。
在假設(shè)檢驗中,不同樣本量導(dǎo)致結(jié)果不一致。從理論上說,產(chǎn)生這些問題的根本原因是抽樣誤差的存在并且有大小之分,而抽樣誤差的產(chǎn)生是由于個體間存在差異,并且這種差異是無法改變的。因此,在研究兩個樣本所屬總體是否存在差異時,假設(shè)檢驗應(yīng)該充分考慮抽樣誤差的存在及大小。而對同一總體的不同抽樣,其抽樣誤差大小,即標(biāo)準(zhǔn)誤是由樣本量決定的。一般而言,不同樣本的均數(shù)一定存在著差異,從理論上講,當(dāng)樣本量足夠大時,它在統(tǒng)計學(xué)上會變得顯著,即使兩樣本均數(shù)相差0.0001。由此可見,在實際工作中,樣本量的確定對判斷結(jié)果具有決定意義,因此顯得非常重要。
樣本容量過大,會增加調(diào)查工作量,會增加人力、物力、財力、以及時間的成本。而如果樣本容量確定的科學(xué)合理,一方面,可以在既定的調(diào)查費用下,使抽樣誤差盡可能小,以保證推算的精確度和可靠性;另一方面,可以在既定的精確度和可靠性下,使調(diào)查費用盡可能少,保證抽樣推斷的最大效果。所以在研究具體問題時,得到什么結(jié)果是由推算的精確度和可靠性決定的,而這與調(diào)查的費用等成本有關(guān)。
假設(shè)檢驗的結(jié)果與樣本量之間的關(guān)系,關(guān)系到假設(shè)檢驗結(jié)果的可靠性程度。假設(shè)檢驗所作出的一切判斷結(jié)果一定是基于一定的樣本量前提下的,所以在報告假設(shè)檢驗結(jié)果時,除了表明考慮到顯著性水平α條件外,同時應(yīng)該報告樣本量的大小,尤其是差異不顯著時。這樣,報告的信息才明確與完整,才能令人信服。
[1]雷福民.體育統(tǒng)計方法與實例[M],北京:高等教育出版社,2017.
[2]文靜,陳冀杭.多種評價方法對中國競技體育實力的評價研究[J].杭州師范大學(xué)學(xué)報(自然科學(xué)版),2008(4):316-320.
[3]文靜.確定主觀評分類項目比賽名次方法的探討[J].浙江體育科學(xué),2008(1):112-113.
P Value or n Value: Which Determines the Result for Significance Difference
WENJing,etal.
(Hangzhou Normal University, Hangzhou 311121, Zhejiang, China )
文靜(1971—),博士,副教授,研究方向:統(tǒng)計測度研究。