李沁杭

摘要:為了彌補傳統正態分布概率查表計算的局限性,本文根據定積分的極限定義,融合計算機的快速計算能力,設計和實現正態分布機器計算。數據仿真表明本文提出的機器計算精度達到了工程要求。
關鍵詞:正態分布;概率;機器計算
1.引言
由大數定理和中心極限定理可知[1],自然界的許多隨機變量均可由正態分布來模擬。如醫學中同質群體的身高、紅細胞數、血紅蛋白量均呈現正態或近似正態分布,實驗中的隨機誤差也可按正態分布規律處理。正態分布是一個在數學、物理及工程等領域都非常重要的概率分布,甚至在統計學的許多方面存在重大的影響力。
連續性正態分布的密度函數 為:
(1)
式中表示隨機變量,是隨機變量均值,是隨機變量的方差。正態分布的密度函數的特點是:關于對稱且在該處最大值,在正(負)無窮遠處取值為0,在處有拐點, 它的形狀是中間高兩邊低。當是為標準正態分布,如圖1所示。服從正態分布的隨機變量的概率規律為:鄰近的概率大,而遠離的概率越小;越小,分布集中在附近,反之,分布越分散。
對于標準正態分布概率計算常常采用查表計算方法,正態分布的概率計算一般使用將原來的分布轉化為標準正態分布利用查表進行計算。
傳統查表計算正態分布概率必須具有標準正態分布表,同時需要人為進行必要的的計算。上述因素使得傳統計算方法效率較低,為了彌補這些不足,本文運用定積分的極限定義,結合計算機的快速計算能力,實現正態分布概率的快速計算。
2.機器計算
設隨機變量服從期望為方差為 的正態分布,隨機變量在區間的概率:
(2)
(2)無法運用牛頓積分法得到其解析解。本文運用定積分的極限定義[2],將區間等間隔劃分為個子區間,如圖2所示。運用矩形面積逼近(2)式:
(3)
(3)式的取值決定了得精度,越大,其精度越高,但計算量較大。
在實際應用中,除了計算區間的概率外,還存在和兩種概率的計算,由于計算無法對進行數值計算,本文根據正態分布的對稱性,將的概率轉化為:
(4)
同理可得
(5)
3.實驗仿真
為了驗證本文算法的有效性,在1.6GHz主頻CPU和4G RAM的個人計算機上,運用C語言編程實現[3],本文未采用任何優化計算,對服從標準正態分布的任意區間概率進行計算,并與人工查表計算相比較,部分結果如表1所示。本文算法的運行時間較短,其中最大為2.710ms。相對于人工計算,本文算法最大相對誤差為0.877%,滿足工程要求。
為了進一步驗證本文算法的有效性,對服從期望為方差為 的正態分布的任意區間概率進行計算,并與人工查表計算相比較,部分結果如表2所示。本文算法的運行時間較短,其中最大為2.882ms。相對于人工計算,本文算法最大相對誤差為0.961%,滿足工程要求。
4.結論
傳統查表計算正態分布概率必須具有標準正態分布表,效率較低,同時需要人為進行必要的的計算。為了彌補為了彌補傳統正態分布概率查表計算的局限性這些不足,本文運用定積分的極限定義,結合計算機的快速計算能力,實現正態分布概率的快速計算。仿真結果表明,本文算法的計算效率較高,且計算精度滿足工程要求。
參考文獻:
[1]劉紹學 普通高中課程標準試驗教科書 數學選修2-3 人民教育出版社,2009年4月第3版 2015年6月成都第7次印刷
[2]劉紹學 普通高中課程標準試驗教科書 數學選修2-2 人民教育出版社,2007年1月第2版 2015年5月成都第7次印刷
[3]譚浩強 C程序設計(第四版)清華大學出版社 2012年07月