王運行

超幾何分布是人教A版選修2-3中的內容,也是概率統計中學生理解起來比較困難的一部分內容。教材中對于超幾何分布是以數學模型的定義形式給出,定義形式與二項式分布極為近似,很容易混淆。那么超幾何分布與二項式分布之間到底有沒有聯系呢?接下來筆者將引用2017年甘肅省第二次診斷考試18題對此問題進行探究。
這道題的內容是:甘肅省瓜州縣自古就以盛產“美瓜”而名揚中外,生產的“瓜州蜜瓜”有4個系列30多個品種,質脆汁多,香甜可口,清爽宜人,糖含量達14%~19%,是消暑止渴的佳品,有詩贊曰:冰泉浸玉露,霸刀破黃金:涼冷消晚暑,清甘洗渴心。調查表明,蜜瓜的甜度與海拔高度、日照時長、溫差有極強的相關性,分別用x,y,z表示蜜瓜甜度與海拔高度、日照時長、溫差的相關程度,并對它們進行量化:0表示一般,1表示良,2表示優。再用綜合指標W=x+y+z的值評定蜜瓜的等級,若W≥4,則為一級;若2≤W≤3,則為二級;若0≤W≤1,則為三級。近年來,周邊各省也開始發展蜜瓜種植,為了了解目前蜜瓜在周邊各省的種植情況,研究人員從不同省份抽取了10塊蜜瓜種植地,得到如下結果:
■
(1)若有蜜瓜種植地110塊,試估計等級為一級的蜜瓜種植地的數量;
(2)在所取樣本的二級和三級蜜瓜種植地中任取兩塊,X表示取到三級蜜瓜種植地的數量,求隨機變量X的分布列及數學期望。
這道題的第(2)問考查內容很簡單,分析題目條件就可以發現,這道題是“無放回”抽取,是超幾何分布,分布如下:
■
可得E(X)=1×■+2×■=■
但是很多學生沒有讀懂題意,將“無放回”抽取當做了“有放回”抽取,于是把這道題當做一道二項分布去做,分布列如下式:
■
得到此時。E(X)=1×■+2×■=■
觀察結果,我們發現兩種方法的計算結果竟然是相同的。這到底是偶然,還是超幾何分布與二項式分布的期望真的存在某種必然性的聯系,這個問題引發了筆者的思考,并就此進行了一系列的探究。
我們首先猜想將不放回的“超幾何分布”題目改變為有放回的“二項分布”時,兩種情況所得到的期望相同。
由此產生如下證明:有N件產品,其中M件是次品,有放回地任意抽取n件,則其中恰好抽到的次品件數X是服從二項分布,即X~B(n,p),其中P=■,其中n≤M≤N
■
那么由二項分布的性質可知E(X)=np=n■
若將上述問題中“有放回”改為“無放回”:有N件產品,其中M件次品,無放回地任意抽取n件,則其中恰好抽到的次品件數X是服從超幾何分布的,其中n≤M≤N,其分布列
■
那么E(X)=■k■,由組合數的性質:KCkm=
MCk-1M-1,nCnN=NCn-1N-1
E(X)=■k■=■■=■■
=■■Cn-kN-M·Ck-1M-1
注意到:(1+x)N-M·(1+x)M-1=(1+x)N-1
由兩邊xn-1系數相等,得
Cn-1N-M·C0M-1+Cn-2N-M·C1M-1+…+Cn-kN-M·CkM-1+…+C0N-M·Cn-1M-1=Cn-1N-1即
■Cn-kN-M·Ck-1M-1=Cn-1N-1
所以E(X)=■k·■=n·■
由以上證明可得猜想正確。
結論:將不放回的“超幾何分布”題目改變為有放回的“二項分布”時,兩種情況所得到的期望相同,這個結論在解決有關超幾何分布期望的選擇題以及填空題的過程中可以快速地判斷結果,為學生在考試過程中節省時間。