王森
抽樣調查是常用的調查方式之一,但隨機抽取樣本有一定的原則,若抽取時太過隨機,有時會使樣本的代表性失真,這時需要進行“干預”,以便使隨機抽取的樣本更有代表性,讓抽樣調查更能反映總體的情況。以下面兩例分析隨機抽樣造成偏差太大的原因,并提出一些改進建議。
例1 小明同學為了調查全市初中生人數,對自己所在城區人口和城區初中生人數作了抽樣調查:城區人口約3萬,初中生人數約1200。全市人口實際約300萬,為此他推斷全市初中生人數為12萬。但市教育局提供的全市初中生人數約8萬,與估計數據有很大偏差。請你用所學的統計知識,幫助他分析造成很大偏差的原因。
【解析】由抽樣調查的原則知小明同學這次抽樣僅選取了城區人口,不能很好地代表全市人口,所以估計的初中生人數與實際人數有較大差距。其錯誤原因是抽樣沒有代表性,沒有考慮城區與農村兩種區域代表。
例2 小剛、小強和小穎住在同一小區中,在學習了“數據的收集與整理”后,他們用不同的方法調查了解所在小區中小朋友的年齡情況:小剛調查了當天在院子里玩耍的小朋友,情況如圖1;小強調查了他所居住的二單元的小朋友,情況如圖2;小穎調查了每個單元一樓的兩家住戶家中小朋友的年齡,數據如下:
這個小區中小朋友的年齡情況到底如何?你認為誰的調查方式好一些,為什么?如果你去調查的話,有沒有更好的方案?
【解析】這個小區中小朋友年齡在0~7歲比例最多,14~17歲占比第二,7~14歲的小朋友占比最少。
三個人中,以小穎的調查好一些。原因如下:小剛調查的范圍只是當天在院子里玩耍的小朋友,在特定時間段與特定的地點(院子里)去進行這樣的調查時,抽樣一般不具有代表性;而小強調查的只是住在二單元的小朋友,對象較少,不具有廣泛性;相對來說,小穎調查的效果較好。
解后回顧:為使樣本更具代表性,這個問題的抽樣還可以進一步優化,比如我們在調查前應認真規劃好抽樣的方案,應用抽簽法對不同單元、不同樓層進行調查,體現樣本抽取的隨機性、代表性和廣泛性。
(作者單位:江蘇省海安市李堡鎮初級中學)