甘肅 魏正清
超幾何分布與二項分布是常見的離散型隨機(jī)變量的分布問題,一直是高考考查的熱點.但有不少學(xué)生在求解離散型隨機(jī)變量的分布列時,時常把超幾何分布問題當(dāng)二項分布處理,或把二項分布問題當(dāng)超幾何分布處理.本文從三個層面剖析易混誤區(qū).

如果隨機(jī)變量X的分布列具有下列形式:

X01…mPC0MCn-0N-MCnNC1MCn-1N-MCnN…CmMCn-mN-MCnN
則稱隨機(jī)變量X服從超幾何分布.

可見,超幾何分布必須要知道總體的容量,且是不放回抽取;而二項分布不需要知道總體容量,且是放回抽取的.
例1在中國,不僅是購物,而且從共享單車到醫(yī)院掛號再到公共繳費,日常生活中幾乎全部領(lǐng)域都支持手機(jī)下單和支付.出門不帶現(xiàn)金的人正在迅速增加.中國人民大學(xué)和法國調(diào)查公司益普索(lpsos)合作,調(diào)查了騰訊服務(wù)的 6 000 名用戶,從中隨機(jī)抽取了60名,統(tǒng)計他們出門隨機(jī)攜帶的現(xiàn)金(單位:元)如莖葉圖所示,規(guī)定:隨身攜帶的現(xiàn)金在100及以上的為“淡定族”,其他為“非淡定族”.
用樣本估計總體,若從騰訊服務(wù)的用戶中隨機(jī)抽取 3人,設(shè)這3人中“淡定族”的人數(shù)為隨機(jī)變量ξ,求隨機(jī)變量ξ的概率分布列及數(shù)學(xué)期望.


依題意得ξ=0,1,2,3,





得隨機(jī)變量ξ的分布列為

ξ0123P271 0001891 0004411 0003431 000

評析題目中已知“用樣本估計總體”,這就是說要把樣本的頻率視為總體的概率進(jìn)行計算,顯而易見不是超幾何分布問題,而是典型的獨立重復(fù)試驗,因而是二項分布問題.但學(xué)生很容易忽視“用樣本估計總體”或不理解“用樣本估計總體”,而用超幾何分布求概率,錯誤地把樣本容量6 000當(dāng)成總體容量6 000,陷入以偏概全的解題誤區(qū).
例2為了盡快提高學(xué)生的數(shù)學(xué)成績,某學(xué)校把試卷進(jìn)行講評后,再重新讓學(xué)生測試,不出現(xiàn)任何的問題才“過關(guān)”,出現(xiàn)錯誤的同學(xué)認(rèn)為“不過關(guān)”,根據(jù)分層抽樣隨機(jī)抽取50名學(xué)生,可得頻率分布表如下:

分?jǐn)?shù)段[0,60)[60,75)[75,90)[90,105)[105,120)[120,150]人數(shù)510151055過關(guān)人數(shù)125534
根據(jù)上表的信息,從高三的學(xué)生中選取5名,求至少 3名學(xué)生過關(guān)的概率.
錯解依題意,抽取的50名學(xué)生中過關(guān)的學(xué)生共 7人,不過關(guān)的學(xué)生共43人,
則選取的5名學(xué)生中至少3名過關(guān)的概率為

評析題目中要求“從高三學(xué)生中選取5人”,可高三學(xué)生總?cè)藬?shù)題目并沒有告知,也就是不知道總體容量,這也正是超幾何分布與二項分布的本質(zhì)差別之一.因為超幾何分布需要知道總體的容量,而二項分布不需要知道.因而學(xué)生很容易誤把樣本容量當(dāng)成總體容量進(jìn)行計算,陷入概念混淆,內(nèi)涵與外延理解不透引起的解題誤區(qū).
例3近年來城市“共享單車”的投放在我國各地迅猛發(fā)展,“共享單車”為人們出行提供了便利.M市現(xiàn)有某種共享單車,某調(diào)查機(jī)構(gòu)對這種共享單車的質(zhì)量進(jìn)行了調(diào)查,從使用過這種共享單車的市民中隨機(jī)抽取了1 000人,每人分別對這種共享單車進(jìn)行評分,滿分均為60分,并將分?jǐn)?shù)分成6組,得到頻數(shù)分布表如下:

分?jǐn)?shù)[0,10)[10,20)[20,30)[30,40)[40,50)[50,60]評分人數(shù)203050150400350
用樣本估計總體,從參與調(diào)查的市民中任選4人,記其中對該種共享單車評分不低于30分的人數(shù)為X,求X的分布列與數(shù)學(xué)期望.
錯解依題意,對該種共享單車評分不低于30分的共800人,評分低于30分的共200人.
依題意得X=0,1,2,3,4,





得隨機(jī)變量X的分布列為

ξ01234P110 0003610 00048610 0002 91610 0006 56110 000

評析題目中給出“用樣本估計總體”,這就說明基本事件的概率已知,顯然不是超幾何分布,而是重復(fù)試驗,是二項分布問題.學(xué)生很容易忽視“用樣本估計總體”,陷入概念理解不深不透引起的解題誤區(qū).
例42017年華北地區(qū)霧霾治理取得了很大成效,空氣質(zhì)量與2016年相比得到了很大改善.某市設(shè)有12個監(jiān)測站點監(jiān)測空氣質(zhì)量指數(shù)(AQI).如圖是2017年11月的30天中,AQI的頻率分布直方圖,其中分段區(qū)間分別為[48,72),[72,96),[96,120),…,[216,240],11月僅有1天的AQI在[144,150)內(nèi).
(1)該市市民小孟是星期日查看官方公布的本市的AQI,如果AQI小于150,小孟就去體育館踢球,以統(tǒng)計數(shù)據(jù)中的頻率為概率,求小孟星期日去踢球的概率;
(2)“雙創(chuàng)”活動中,驗收小組把該市的空氣質(zhì)量作為一個評價指標(biāo),從當(dāng)月的空氣質(zhì)量監(jiān)測數(shù)據(jù)中抽取3天的數(shù)據(jù)進(jìn)行評價,設(shè)抽取到的AQI不小于150的天數(shù)為X,求X的分布列與數(shù)學(xué)期望.




故X的分布列為

X0123P2712554125361258125


(2)依題意,得X=0,1,2,3,

故X的分布列為

ξ0123P2041 0154591 0152971 01511203

評析題目中已知“從當(dāng)月的空氣質(zhì)量監(jiān)測數(shù)據(jù)中抽取3天的數(shù)據(jù)進(jìn)行評價”,這就說明是從30天中抽3天,顯然是典型的超幾何分布.但學(xué)生很容易看到頻率分布直方圖,產(chǎn)生錯覺,就把頻率當(dāng)概率,看成二項分布的問題,陷入定勢思維引起的解題誤區(qū).





故ξ的分布列為

ξ0123P8271227627127


依題意得ξ=0,1,2,3,

故ξ的分布列為

ξ0123P145528551255155



教學(xué)考試(高考數(shù)學(xué))2018年5期