摘要:隨著統隨著統計模擬計算技術在工程實際中的廣泛應用,均勻分布的實際作用日益凸顯。為能深入挖掘出均勻分布的廣泛應用以及在課堂教學中對其作更加深入有味的分析,本文在歸納整理均勻分布的性質基礎上,給出其在求解方程根的概率、估計無理數的值、計算復雜被積函數的定積分、求解幾何概率、合理排考問題、求解會面等候概率、計算測量誤差以及在統計計算中的產生任意分布的隨機數等實際案例解答,并給出它們具體實現的R代碼。
關鍵詞:均勻分布;隨機模擬;案例式
中圖分類號:G4" 文獻標識碼:A""" doi:10.19311/j.cnki.16723198.2025.17.066
0 引言
均勻分布是概率統計中最基本的概率分布,從理論上看似乎非常的簡單,這往往使得在通常的課堂教學中教師可能主要講授其定義、給出其概率密度函數與分布函數后,再給出兩道例題就教學結束,其實這樣往往會導致學生對均勻分布的理解僅僅停留在理論的層面,難以理解其在實際問題中的廣泛應用,導致在學習完指數分布、正態分布之后不能很好區分其適用場景。這根本原因主要是在一些教學實際中可能缺乏豐富有味的教學資源,文獻[1]建議引用廣泛的實際案例來開展概率統計課程教學,文獻[2]給出了隨機模擬技術在概率統計教學中廣泛應用。本文提出在概率統計課程教學中通過引入豐富的學生遇到過的實際問題案例進行分析基礎上,再利用被廣泛使用的R軟件進行計算過程與結果的可視化展現,開展生動的場景式案例教學來提高課堂教學效果,基于均勻分布在統計中的重要地位,以均勻分布知識點[3]的教學為例,提升學生對概率統計知識的理解與應用的能力。文章首先介紹均勻分布的基本概念與性質,然后基于工程領域與實際工作場景,結合具體案例,討論研究其在不同領域中的廣泛應用,包括統計模擬計算[4]、隨機抽簽與會面等待、測量誤差計算[5]等。通過對均勻分布的深入分析探討,發現基于最簡單分布在統計計算中的重要且廣泛的應用[68]。
1 均勻分布簡介
均勻分布,也稱為等可能分布,是指在一個區間內,每個數值出現等可能的分布。常見的均勻分布有兩種,離散型均勻分布與連續型均勻分布。離散型均勻分布一般用來描述取有限種情形的等可能分布,例如拋擲一枚均勻硬幣出現正反面,投擲一枚均勻骰子出現的點數1點至6點等。連續型均勻分布是指出可能取到的所有值在一個給定區域或區間內出現的概率相等。均勻分布事實上具有非常的簡單性和直觀性,但在現實中有著廣泛的應用,由于離散型均勻分布比較簡單易用,下文將重點介紹連續型均勻分布及其工程實際中的應用。
1.1 一維均勻分布
若隨機變量X具有概率密度
fX(x)=1b-a alt;xlt;b0" 其他(1)
則稱X在區間(a,b)上服從均勻分布,記為X-U(a,b)。例如公交線路上兩輛公共汽車前后通過某汽車停車站的時間,即乘客的候車時間,在某個區間內隨機取一個實數等,均勻分布的數學期方差依次為E(X)=a+b2,D(X)=(b-a)212都較為簡單,使得均勻分布在模擬和分析中非常有用,尤其是在需要考慮隨機性和公平性的場景中。
1.2 一維均勻分布的應用
例1 設隨機變量X-U(0,1),求方程t2+3Xt+1=0有實根的概率?
解:P{9X2-4≥0}=P|X|≥23=∫1231dx=13。
例2 基于均勻分布采用隨機模擬的方法[4-6]求解無理數e、π以及ln2的值。
解:根據∫10exdx=e-1,求得e=∫10exdx+1≈1n∑ni=1eXi+1,其中Xi-U(0,1);
同理,基于∫1011+x2dx=π4,可得到,π=4∫1011+x2dx≈4∑ni=111+X2i,其中Xi-U(0,1)。
類似的,可以基于∫1011+xdx=ln2,得到,ln2=∫1011+xdx≈∑ni=111+Xi。
上述3個無理數近似值估計實現的R代碼如下。
基于最常用的標準均勻分布U(0,1)可以求解得高等數學課上被積函數的原函數為非初等函數或者是非常復雜的積分問題[78],例如∫10(cos2x3+sinx5)ex2dx,換句話說,均勻分布可以計算任意被積函數的定積分和廣義積分問題,例如任意區間的定積分∫5-2(cos2x3+sinx5)arctan(ex2)lnxdx。
例3 排考問題。假定某高校有20個機房,每個機房有50臺計算機,現在要安排1000名新生,舉行一場某門課程的上機考試,為避免過去按班級進行排考的弊端,即盡可能將所有學生進行隨機排考,即避免同班同學坐在相鄰位置機考,請給出排考安排表。
解:現在采用均勻分布的隨機數來安排每位考生的考試編號就非常的簡單,只要拿到這1000學生名單后在其姓名后面產生一個U(0,1)的隨機數,然后再按從小到大排序,再直接賦予每位考生的座位號就是其順序號即可,非常快捷,易于操作。
2 二維均勻分布
2.1 二維均勻分布簡介
若二維隨機變量(X,Y)在二維有界區域G內取值,且它的聯合概率密度函數為
f(x,y)=1SG,(x,y)∈G0,其他(2)
則稱(X,Y)服從區域G上的二維均勻分布。
2.2 二維均勻分布的應用
基于二維的均勻分布也可以計算無理數π,R代碼見圖2。
例題4 試求在(0,1)之間任取兩實數,它們的和不超過0.6的概率。
解:將問題轉換為(0,1)區間上的均勻分布問題也就是幾何概率問題,易得其概率為0.18,如果基于(0,1)區間上的均勻分布的隨機模擬也可快速求得其結果,R代碼見圖3。
例題5 試求在(0,1)之間任取兩實數,他們的積不超過0.6的概率。
解:本題還是基于(0,1)區間上的均勻分布或者幾何概率問題求得概率為0.6-0.6ln(0.6),即為0.9065,同樣基于均勻分布的隨機模擬計算可得相近的結果,模擬代碼見圖4。
例題6 (相遇問題) 總裁在上午7:15至7:45之間等可能到達辦公室,他的秘書在7點至8點間等可能到達辦公室,假設他們兩人到達辦公室是相互獨立的。試求:(1)求他們達到辦公室時間相差不超過5分鐘的概率;(2)試求經理先到辦公室的概率。
解:取定計時單位為分鐘,記X表示經理到達辦公室的時刻、Y表示秘書到達辦公室的時刻,則它們均服從如下均勻分布X~U(15,45),Y~U(0,60),求得它們的聯合分布為:
f(x,y)=11800,15lt;xlt;45,0lt;ylt;600,其他(3)
根據題意有:第(1)、(2)問題依次可表示為PX-Y≤5、PX<Y,進而求解得。
PX-Y≤5=∫4515dx∫x+5x-511800dy=16
PX<Y=∫4515dx∫60x11800dy=12
例題7 (測量誤差求解問題) 通常測量設備會存在測量誤差,人們一般假定測量誤差服從[-w,w]區間上的均勻分布。若進行了兩次測量,則兩次測量誤差X、Y都是隨機變量,現要計算這兩個誤差值的平均差距。
解:根據題意可知X、Y都是服從[-w,w]上的均勻分布且相互獨立,它們的聯合分布為:
f(x,y)=14w2,-wlt;xlt;w,-wlt;ylt;w0,其他E(X-Y=∫w-wdx∫w-w14w2x-ydy=23w,也就是說兩個誤差值的平均差距為23w。
3 均勻分布的隨機數的應用
近年來,隨著統計機器學習的進一步發展與應用,統計模擬計算受到業界與學術界的廣泛應用與重視,而在統計模擬計算中往往需要產生各種概率分布的隨機數,實際上要獲得這些隨機數首先都要先獲得基于均勻分布的隨機數,特別是標準的均勻分布隨機數,然后再基于逆變換法基本原理。逆變換法的基本原理就是先產生均勻分布的隨機數,再通過其他分布的分布函數的反函數進行變換來得到其他分布的隨機數。
設某隨機變量X的分布函數為F(x),F-1(y)=inf{x:F(x)≥y},0≤y≤1
引理1:設隨機變量Y~U(0,1),則X=F-1(y)的分布函數為F(x)。
證明:P{X≤x}=P{F-1(y)≤x}=P{y≤F(x)}=F(x)
由引理可知,要產生來自F(x)的隨機數,先產生Y-U(0,1)的y,然后計算F-1(y)即可。
例題8" 設X-U(a,b),基于U(0,1)試產生X的隨機數。
解:由已知可得X的分布函數為
F(x)=0,x≤ax-ab-aa<x<b1,x≥b
求得F-1(y)=a+(b-a)y,0≤y≤1。即從U(0,1)產生Y,則a+(b-a)y便是U(a,b)的隨機數。
例題9" 設X-EXP(1),基于U(0,1)產生X的隨機數。
解:由已知可得X的分布函數為
y=F(x)=0x≤01-e-xx>0
即x=-ln(1-y),又由于1-y與y具有相同的分布,從而有x=-lny
故可以分兩步完成隨機數的產生,第一步,從U(0,1)中生成y,第二步,計算x=-lny,得到來自標準指數分布的隨機數。R代碼如圖5所示。
對比圖6、圖7的直方圖,可發現基于逆變換法產生的標準指數分布隨機數與直接隨機產生的隨機數的直方圖非常相近,從而說明由標準均勻分布U(0,1)中生成隨機數的良好性態。
圖6 模擬次數N=100時,標準指數分布與擬變換法產生隨機數的直方圖對照
圖7 模擬次數N=100時,標準指數分布與擬變換法產生隨機數的直方圖對照
4 結論
均勻分布是概率論中常用、簡單但極其又重要的分布,在工程應用領域建模中有著廣泛的應用。本文建議在進行該部分內容教學時在介紹其基本概念與性質后,通過統計模擬技術重點開展案例式教學,文中給出了其在復雜函數的積分計算、會面的幾何概率法求解、如何合理排考、估計測量誤差以及其在統計計算中的強大功能,在后續教學、研究中將進一步探討其更加廣闊的應用。
主要參考文獻
[1]張建國.全概率公式與貝葉斯公式教學探析[J].科教文匯,2016,(18):4950.
[2]楊曉霞.概率統計中蒙特卡洛應用三例[J].科技世界,2014,(14):142143.
[3]盛驟,謝式千,潘承毅.概率論與數理統計[M].北京:高等教育出版社,2019.
[4]茆詩松,王靜龍,濮曉龍.高等數理統計[M].北京:高等教育出版社,2006.
[5]孟憲勇,王晶,劉彭.逆變換Monte Carlo算法及其應用[J].科學技術創新,2022,(03):5558.
[6]孫道德,程向陽,陳琛.概率論與數理統計學習與應用[M].北京:中國人民大學出版社,2023.
[7]薛毅,陳立萍.統計建模與R軟件[M].北京:清華大學出版社,2007.
[8]楊振海,張國志.隨機數生成[J].數理統計與管理,2006,25(02):244252.