田載今
從計算結果可知,甲、乙的平均訓練成績差距不大,甲比乙略高。
(2)將甲的全部訓練成績(共100個)按環(huán)數(shù)從小到大依次排列,這100個數(shù)據(jù)中處于正中間位置的是第50個數(shù)據(jù)7和第51個數(shù)據(jù)8。這兩數(shù)的平均數(shù)為7.5,即為甲訓練成績的中位數(shù)。
將乙的全部訓練成績(共99個)按環(huán)數(shù)從小到大依次排列,這99個數(shù)據(jù)中處于正中間位置的是第50個數(shù)據(jù)8,即為乙訓練成績的中位數(shù)。
從計算結果可知,一般情形下,甲發(fā)揮中等水平時成績介于7環(huán)和8環(huán)之間的可能性較大,乙發(fā)揮中等水平時成績是8環(huán)的可能性較大。
(3)在甲的全部訓練成績(共100個)中,出現(xiàn)次數(shù)最多的是7環(huán)(26次),7即這組數(shù)據(jù)的眾數(shù)。
在乙的全部訓練成績(共99個)中,出現(xiàn)次數(shù)最多的是7環(huán)(25次)和8環(huán)(25次),7和8即這組數(shù)據(jù)的眾數(shù)。
從計算結果可知,雖然每次射箭成績可能會有變化,但在一般情形下,甲射中7環(huán)比射中其他環(huán)數(shù)的可能性要大,乙射中7環(huán)或8環(huán)比射中其他環(huán)數(shù)的可能性要大。
(4)由前面的平均數(shù)及方差公式,可得s2甲≈1.95,s2乙≈1.84。
從訓練成績的方差看,甲略大于乙,這說明甲的數(shù)據(jù)比乙的數(shù)據(jù)的離散程度略高,也即成績的起伏略大。乙的成績相對來說穩(wěn)定些。
從上面這個例子可以看出,四種數(shù)據(jù)代表的求法不同,所表示的意義也各異。
平均數(shù)是所有數(shù)據(jù)之和除以數(shù)據(jù)的個數(shù)所得的商,它是分析和比較數(shù)據(jù)的集中趨勢時最常用的數(shù)據(jù)代表。平均數(shù)的計算利用了一組數(shù)據(jù)中的每一個數(shù)據(jù)。任何一個數(shù)據(jù)的變化。都會影響平均數(shù)的大小。如果一組數(shù)據(jù)中有少數(shù)數(shù)據(jù)的值明顯地過大或過小,最好不要僅僅使用平均數(shù)來考量,因為個別過大或過小的極端值會導致平均數(shù)與數(shù)據(jù)的實際集中點有較大差距。這時,最好用中位數(shù)作為數(shù)據(jù)代表,因為中位數(shù)不受極端值的影響。有時,為了決定是用平均數(shù)還是用中位數(shù)作為代表來分析一組數(shù)據(jù)的集中趨勢,最好把這兩個數(shù)據(jù)代表都算出來。如果它們的值很接近,則使用平均數(shù);如果它們有很大的不同,則使用中位數(shù)。
根據(jù)一組數(shù)據(jù)的中位數(shù),可以把數(shù)據(jù)分成同等數(shù)目的兩組,其中一組數(shù)據(jù)的值不小于中位數(shù),而另一組數(shù)據(jù)的值不大于中位數(shù)。將一組數(shù)據(jù)由小到大排列,有奇數(shù)個數(shù)據(jù)時,處于正中間位置的數(shù)就是中位數(shù):有偶數(shù)個數(shù)據(jù)時,取處于正中間位置的兩個數(shù)的平均數(shù)作為中位數(shù)。可以看出,中位數(shù)并不一定是原始數(shù)據(jù)之一。但它很好地代表了一組數(shù)據(jù)的“中點”,而且很容易找出它。
眾數(shù)是指一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)據(jù)。它一定是這組數(shù)據(jù)中的某個數(shù)據(jù)。有時,眾數(shù)可能不止一個。如上例中乙的訓練成績就有兩個眾數(shù)。如果一組數(shù)據(jù)中各個不同的數(shù)值出現(xiàn)的次數(shù)完全一樣,則這組數(shù)據(jù)就沒有眾數(shù)。找眾數(shù)只需要比較各數(shù)據(jù)的個數(shù),而不需要計算。眾數(shù)反映了一組數(shù)據(jù)的最大集中點。由眾數(shù)可知這個數(shù)據(jù)在這組數(shù)據(jù)中出現(xiàn)的次數(shù)最多,但由它并不能知道這個數(shù)據(jù)具體出現(xiàn)了多少次,以及它比其他數(shù)據(jù)的出現(xiàn)次數(shù)多到何種程度。和中位數(shù)一樣,眾數(shù)也不受極端值的影響。
平均數(shù)、中位數(shù)和眾數(shù)的側重點不同,反映一組數(shù)據(jù)的集中趨勢的角度不同。因此,應根據(jù)實際問題的需要,選取合適的數(shù)據(jù)代表來研究數(shù)據(jù)的集中趨勢。
從方差的計算公式可以看出。它實際上是各數(shù)據(jù)與平均數(shù)之差的平方的平均數(shù)。之所以用差的平方,是因為差本身有正負。而平方后則不存在負數(shù),相加求平均數(shù)時不會正負相抵,從而能更準確地刻畫各數(shù)據(jù)與平均數(shù)的平均偏離程度。圖1是數(shù)據(jù)散點圖。其中(1)(2)里的點分別表示兩組數(shù)據(jù)。直觀上可以發(fā)現(xiàn),(1)中數(shù)據(jù)點分布的離散程度較高,各點與平均數(shù)對應的水平線的偏離度大;(2)中數(shù)據(jù)點分布的離散程度較低,各點與平均數(shù)對應的水平線的偏離度小。這里的偏離度不是就個別數(shù)據(jù)點而論的。而是就所有數(shù)據(jù)點的偏離度的平均水平而言的。(1)中數(shù)據(jù)的方差較大,(2)中數(shù)據(jù)的方差較小。這是數(shù)據(jù)離散程度的幾何解釋。