【摘要】概率論與數理統計作為現代數學的重要分支,在各個領域都有極為廣泛的應用,而概率論是數理統計的基礎,因此要學好概率論與數理統計,必須有扎實的概率論功底.本文給出了判斷隨機變量是否服從二項分布的簡單條件,分析了如何更好地使用全概率、貝葉斯定理,進一步簡化中心極限定理,使得它們更容易被學生接受.
【關鍵詞】二項分布;全概率定理;貝葉斯定理;中心極限定理;簡化
一、引 言
概率論與數理統計作為現代數學的重要分支,在自然科學、社會科學和工程技術的各個領域都具有極為廣泛的應用,特別是隨著計算機的迅速普及,概率統計在經濟、管理、金融、保險、生物、醫學等方面的應用更是得到長足的發展.正是概率統計的這種廣泛的應用性,使得它今天成為各類專業大學生的最重要的數學必修課之一.概率論是數理統計的理論基礎,因此要學好概率論與數理統計必須有扎實的概率論功底.在這門課程的教學過程中,發現學生對如何判斷隨機變量是否服從二項分布,對全概率、貝葉斯、中心極限定理如何使用感到困難,因此,根據自己多年的教學實踐經驗,談談自己對這些問題的理解及教學體會.
二、二項分布
二項分布是最常見的離散型分布,在概率論與數理統計的應用上有著重要的地位.因此熟練掌握二項分布尤為重要.為了使學生對二項分布有準確深入的理解,下面從兩個方面來分析.
1.如何判斷隨機變量ξ服從二項分布
二項分布與n重Bernoulli實驗有著密切的聯系,可以把ξ是否服從二項分布歸結到判斷隨機變量ξ是否表示n重Bernoulil實驗中事件A發生的次數.我們得到的結論是:如果ξ表示n重Bernoulli實驗中事件A發生的次數,則ξ服從二項分布,即ξ~B(n,p),否則不然.這樣我們就可以把判斷是否服從二項分布的問題轉化到了判斷是否是n重Bernoulli實驗.學生可以根據n重Bernoulli實驗判定的4個條件來一一判斷,這樣學生的可操作性強了,對這個問題就不會無從下手.到此雖然解決了如何判斷隨機變量ξ服從二項分布,但是ξ是否真正地確定下來了呢?確定一個離散型隨機變量ξ的狀態必須知道它的概率分布.從二項分布公式中可知我們必須確定兩個參數n,p.這就是我們要考慮的第二個問題.
2.設ξ~B(n,p),如何確定兩個參數n,p
在文獻[2]中我們歸納得到:
(1)參數n即是n重Bernoulli實驗的重數n.
(2)參數p為n重Bernoulli實驗中事件A發生的概率.
利用(1),(2)學生就能夠快速、準確地判斷ξ是否服從二項分布并確定ξ的分布.為了方便省時,大家熟悉一些常見的服從二項分布的隨機變量是有必要的.
如:n個病人治療有效(無效)的個數,檢查n件產品中次品(合格品)的個數,n次射擊中命中的次數,醫學領域二分類記數資料.
三、全概率、貝葉斯定理
1.全概率定理
在計算事件發生的概率時,常常遇到事件同時受到多個因素的影響,使得我們不能夠直接計算此事件的概率,這就使得許多學生對計算這類事件的概率無從下手,對于這個問題全概率定理給了我們很好的方法.從這個定理得到:我們可以借助引入各種小前提因素將樣本空間適當地分解為若干部分,使得在每個部分中(即在各小前提下)容易求得所要的概率.
利用全概率定理的時候我們要弄清兩個關鍵的問題:
第一,哪種情況下得用全概率定理.
第二,如何準確地找到定理中所需要的完備事件組.
下面針對這兩個問題進行分析.
(1)哪類事件概率的計算得用全概率定理
從全概率定理的形式上看是比較復雜的,因此能不用盡量不用.那么什么樣的事件概率的計算得用它呢?我們把它歸納為復雜事件的概率計算得用全概率定理.對于復雜事件我們有如下定義:
定義1 受兩個或兩個以上因素影響的事件稱為復雜事件.
如:10個簽中有4個難簽,3個人參加抽簽(不放回),甲先乙次丙最后,設B為乙抽到難簽這個事件.事件B就是一個復雜的事件,因為事件B受到甲抽到難簽和沒有抽到難簽這兩個因素影響.
(2)找完備的事件組
用全概率公式去解決復雜事件的概率首先得準確地找到完備的事件組,很多學生在找完備的事件組的時候往往遺漏某些事件,導致找到的事件組并不是完備的.為了找到恰當的完備的事件組我們分成兩個步驟:
第一,找事件組:確定復雜事件受到哪些因素影響,每一個因素就設定為一個事件,這樣就得到一組事件B1,B2,…,Bn.
第二,驗證B1,B2,…,Bn是否完備,進一步防止遺漏某些事件.
2.貝葉斯定理
貝葉斯定理是全概率定理的推論,這樣有了對全概率定理的分析作為基礎,分析貝葉斯定理就簡單多了.貝葉斯定理中所需要的完備的事件組尋找的方法和全概率定理中的一樣.下面我們只要弄清楚哪類條件概率得用貝葉斯定理去解決,這類的條件概率有這樣的特點:都是在已經知道實驗結果的條件下的條件概率.
最后使用全概率定理與貝葉斯定理時應注意以下三點:
(1)全概率定理是把復雜的事件的概率分解為較為簡單的事件的概率計算.
(2)貝葉斯定理往往用于從結果分析原因時的概率計算,用于幫助我們追查事件的起因.
(3)使用兩個定理時,對樣本空間進行劃分,劃分后的事件組必須是完備事件組.
四、中心極限定理
在概率論與數理統計中,中心極限定理是非常重要的內容,而且是概率論和數理統計之間承前啟后的一個重要的紐帶.它提出大量獨立隨機變量之和近似服從正態分布,因此它不僅提供了計算獨立隨機變量之和的近似概率的簡單方法,而且有助于解釋為什么很多自然群體經驗曾出現鐘形曲線這一事實,因此中心極限定理使正態分布有了廣泛的應用.但在講授這一內容時卻十分棘手,學生難以理解該定理,不能很好運用該定理解決問題.本人從教學改革角度出發,以提高學生知識能力為主,對中心極限定理課堂的教學進行初步的探討,使原本復雜的中心極限定理通俗化.
1.獨立同分布的中心極限定理
定理1 設隨機變量X1,X2,…,Xn,…相互獨立,服從同一分布,并且具有期望和方差:E(Xi)=μ,D(Xi)=δ2(i=1,2,…),則隨機變量Yn=∑ni=1Xi-nμnδ的分布函數Fn(x)收斂到標準正態分布函數.即對x∈R滿足limn→∞Fn(x)=limn→∞P(Yn≤x)=Φ(x).
從定理1的結論上似乎看不出它可以用來解決什么問題,下面對這個結論進行分析提取有用的信息.
令X=X1+X2+…+Xn,
E(X)=E(X1)+E(X2)+…+E(Xn)=nμ,
D(X)=D(X1)+D(X2)+…+D(Xn)=nδ2,則有
Yn=∑ni=1Xi-nμnδ=X-E(X)D(X),
Fn(x)=P(Yn≤x)n充分大時Φ(x).
由上式,可得到:
(1)當n很大時,Yn=X-E(X)D(X)可以近似服從標準正態分布.即Yn~N(0,1).
(2)當n很大時,X可以近似服從正態分布且X~N(E(X),D(X)).
通過上面的分析我們把獨立同分布的中心極限定理簡化如下:
設隨機變量X1,X2,…,Xn相互獨立且服從同一分布,并且E(Xi),D(Xi)存在(i=1,2,…,n),X=X1+X2+…+Xn.若n足夠大,則X~N(μ,δ2),其中μ=E(X),δ2=D(X).
對于相互獨立的隨機變量序列{Xn},不管Xi(i=1,2,…,n)服從什么分布,只要它們是服從同一分布且有數學期望與方差,那么當n充分大時隨機變量之和X=∑ni=1Xi近似地服從正態分布X~N(E(X),D(X)).
2.棣莫弗—拉普拉斯定理
定理2 設隨機變量X1,X2,…,Xn,…相互獨立,并且都服從參數為P的兩點分布,則x∈R有
limn→∞P∑ni=1Xi-nPnP(1-P)≤x=Φ(x).
下面我們對這個定理的結論進行分析
令X=X1+X2+…+Xn,顯然X~B(n,P),
E(X)=E(X1)+E(X2)+…+E(Xn)=nP,
D(X)=D(X1)+D(X2)+…+D(Xn)=nP(1-P),
Yn=X-nPnP(1-P)=X-E(X)D(X),則有
P∑ni=1Xi-nPnP(1-P)≤x=P(Yn≤x)n充分大Φ(x).
由上式,可得到:
(1)當n很大時,Yn=X-E(X)D(X)可以近似服從標準正態分布.即Yn~N(0,1).
(2)當n很大時,X可以近似服從正態分布且X~N(E(X),D(X)).
通過上面的分析我們把棣莫弗—拉普拉斯中心極限定理簡化如下:
設X~B(n,P),若n充分大(一般nP≥5),則X~N(μ,δ2),其中μ=E(X)=nP,δ2=D(X)=nP(1-P).
對于二項分布來說,當nP較小時,可令λ=nP,用泊松分布近似計算比較精確;當nP較大時,則根據棣莫弗—拉普拉斯中心極限定理可用正態分布近似計算.
中心極限定理以嚴格的數學形式闡明了在大樣本條件下,不論總體的分布如何,樣本的均值總是近似地服從正態分布.如果一個隨機變量能夠分解為獨立同分布的隨機變量序列之和,則可以直接利用中心極限定理進行解決.
【參考文獻】
[1]王松桂,張忠占,等.概率論與數理統計[M].北京:科學出版社,2006.
[2]袁蔭棠.概率論與數理統計[M].北京:中國人民大學出版社,1985.
[3]魏宗舒.概率論與數理統計教程[M].北京:高等教育出版社,2001.
[4]茆詩松.概率論與數理統計教程[M].北京:高等教育出版社,2004.
[5]尹長明,韋程東.公共基礎課《概率論與數理統計》教學的點滴體會[J].廣西大學學報,2008(6).