



利用統計知識來進行數據收集、分析與處理時,經常要通過合理的數據處理,借助樣本來估計總體,為保證數據分析過程的科學性,往往需要從總體取值規律、總體百分位數、總體集中趨勢及總體離散程度四個方向的估計來實現,達到統計分析與應用的科學性與有效性。
一、總體取值規律的估計
總體取值規律的估計,主要以頻率分布、頻率分布直方圖等形式來設置,從中看出數據取值規律及其分布特點。
例1某企業招聘,一共有200名應聘者參加筆試,他們的筆試成績都在[40,100]內,按照[40,50),[50,60),…,[90,100]分組,得到如圖1所示的頻率分布直方圖,則a=______;該企業根據筆試成績從高到低進行錄取,若計劃錄取150人,估計應該把錄取的分數線定為______分。
解析:依題意,由(0.005+0.010+a+0.030+a+0.015)×10=1,解得a=0.020。因為150/200=0.75,所以1-0.75=0.25。又因為(0.005+0.010)×10=0.15,(0.005+0.010+0.020)×10=0.35,所以錄取的分數線應定在[60,70)內。設分數線定為m分,則0.15+(m-60)×0.020=0.25,解得m=65,所以應該把錄取的分數線定為65分。故填0.020;65。
點評:熟悉頻率分布直方圖的結構特征及數據特點,方便從中確定一些相關的數據信息,如圖中縱軸上的數據是各組的頻率除以組距的結果,圖中各小長方形的面積之和為1等,這些都是識圖與用圖的關鍵。
二、總體百分位數的估計
總體百分位數的估計,主要以第幾個百分位數的確定與應用等形式來設置,借助數據分析與數學運算來求解。
例2(1)某校舉行了全校大課間跑操比賽。現從該校隨機抽取20個班級的比賽成績,得到如表1所示的統計表,由統計表可得這20個比賽成績的第80百分位數是()。
A.8.5B.9C.9.5D.10
(2)已知一組數據1.3,2.1,2.6,3.7,5.5,7.9,x,9.9的第65百分位數是7.9,則實數x的取值范圍是()。
A.[7.9,+∞)B.(7.9,+∞)
C.[7.9,9.9]D.(7.9,9.9)
解析:(1)依題意,由20×80%=16可知第80百分位數是第16個和第17個成績的平均數。由題表數據可知第16個成績為9,第17個成績為10,所以第80百分位數為9+10/2=9.5。故選C。
(2)因為8×0.65=5.2,所以第65百分位數是第6個數,將除去x的其他數據從小到大排序可得1.3,2.1,2.6,3.7,5.5,7.9,9.9。當xlt;7.9時,則第6個數可能是x或5.5,不符合題意;當x≥7.9時,則第6個數是7.9,符合題意。綜上所述,實數x的取值范圍是[7.9,+∞)。故選A。
點評:(1)總體百分位數的估計需要注意的兩個問題:①總體百分位數的估計的基礎是樣本百分位數的計算,因此計算準確是關鍵;②由于樣本量比較少,因此對總體的估計可能存在誤差,對總體百分位數的估計一般是估計值而非精確值。(2)確定要求的p%分位數所在區間[A,B),由頻率分布表或頻率分布直方圖知樣本中小于A的頻率為a,小于B的頻率為b,則p%分位數=A+組距×(p%-a/b-a)。