葉莉
頻率分布直方圖是用來刻畫樣本數據分布的重要工具之一,也是用樣本估計總體的常用方法.整個制圖過程,操作性強,分布直觀,圖形簡潔美觀,也適用于計算機繪圖,所以在各行業的數據處理中應用廣泛.
高中課程標準對頻率分布直方圖的具體要求是:1.通過實例體會分布的意義和作用,會列頻率分布表、畫頻率分布直方圖表示樣本數據,并體會其特點;2.會用樣本的頻率分布直方圖估計總體分布,會用樣本的頻率分布直方圖估計總體的基本數字特征.簡單地說,就是能“制圖”,會“用圖”,而我們在應用中產生的錯誤也主要發生在這兩個過程中.
一、頻數的統計錯誤
例1 從2015年9月1日起,學校不再代收學平險保險費,在校學生意外保險由家長自行辦理. 武漢市某區在開學之初,以班級為單位,對學生自行購買保險的情況進行了抽樣統計,得到了如下20個班級購買保險人數情況(如下表),試作出該樣本的一個頻率分布直方圖.
錯解 計算這組數據的極差為30-5=25,將組距定為5,組數定為5,則將20個數據分為[5,10],[10,15],[15,20],[20,25],[25,30]這5組,得到每組的頻數分別為5,8,5,2,2,…….
正解 在上述解答中,各小組頻數之和為22,大于樣本容量,顯然是錯誤的. 原因是分組區間全是雙閉區間,則數據“10”在第一組和第二組均被計入頻數,數據“15”也是如此. 在分組時,應將20個數據分為[5,10),[10,15),[15,20),[20,25),[25,30]這5組,得到每組的頻數分別為4,7,5,2,2,…
點撥 分組時,每組所在區間一般是選擇“左閉右開”,而不是“雙閉”或“雙開”,防止某些數據漏選或某