范國良陸曉恒
(1. 安徽工程大學, 安徽 蕪湖 241000;2. 銅陵學院, 安徽 銅陵 244000)
獨立性與相關性判別的一些注記及應用
范國良1陸曉恒2
(1. 安徽工程大學, 安徽 蕪湖 241000;2. 銅陵學院, 安徽 銅陵 244000)
從兩個隨機事件的獨立性出發,引入兩個隨機變量的獨立性與相關性的概念,給出獨立性與相關性的一些常見判別方法及注記,通過實例說明使用密度函數判別獨立性有出錯的可能,進而給出使用密度函數判別獨立性的一個充要條件,以避免判別錯誤的發生。最后用一些實例說明獨立性與相關性在實際生活中的應用。
隨機變量;獨立性;相關性;正態分布
獨立性是概率論中最基本的概念之一,無論在理論研究還是在實際應用中都有特別重要的意義。概率論與數理統計中的許多成果都是在某種獨立性的前提下得到的,因而研究如何判斷隨機變量的獨立性顯得尤為重要。
(1)兩個隨機事件的獨立性
兩個事件的獨立性是指一個事件的發生不影響另一個事件的發生。這在實際問題中是很多的。比如在拋2枚硬幣的實驗中,記事件A為“第一枚硬幣是正面”,B為“第二枚硬幣是正面”,顯然A與B的發生是互不影響的。從概率的角度看,給定事件A的條件概率P(A|B)與無條件概率P(A),若事件A與B的發生是互不影響的,則有
P(A|B)=P(A),P(B|A)=P(B)
上述兩式又都分別等價于P(AB)=P(A)P(B)。
定義 對任意兩個隨機事件A與B,若有P(AB)=P(A)P(B)成立,則稱事件A與B相互獨立,否則稱A與B不獨立。
在隨機事件獨立的基礎上,接下來引入隨機變量的獨立性。
(2)兩個隨機變量的獨立性
定義:設X,Y是兩個隨機變量(r.v),若對任意的x,y,有

則稱隨機變量X和Y是相互獨立的。
注1 隨機事件的獨立性是隨機變量的獨立性的本質。
注2 由于F(x,y)= P(X≤x, Y≤y),Fx(x)=P(X≤x),Fy(y)=P( Y≤y),上述定義用分布函數表示即為:若對所有實數 ,有:則稱隨機變量X和Y是相互獨立的。

(2)式表明,當兩個隨機變量相互獨立時,它們的聯合分布函數等于兩個邊緣分布函數的乘積。(2)式把隨機變量的概率關系轉化為函數關系,而函數關系的判別一般來說會容易些。
注3 (充分條件)設(X,Y)是連續型r.v.,f(x,y)是(X,Y)的聯合概率密度,fx(x),fy(y)分別是X和Y的邊緣概率密度。若對所有實數x,y,有:
f(x,y)=fx(x)fy(y)
則隨機變量X和Y是相互獨立的。
注3 只是判別獨立性的充分非必要條件,所以應用時容易在這里出錯。我們看下面這個例子。
例1 設二維連續型r.v.(X,Y)在由x軸,y軸及直線所圍成的閉區域D上服從均勻分布,試問:r.v.X,Y是否相互獨立?
,則X與Y不獨立。
原因剖析:二維連續型r.v.在一個點上取值的概率為0,僅僅由一個點處的聯合概率密度函數值不等于兩個邊緣概率密度函數值的乘積,并不能推出(1)式或(2)式,故上面的解法不正確。
注4 (充要條件)若(X,Y)是連續型r.v.,f(x,y)是(X,Y)的聯合概率密度,fx(x),fy(y)分別是X和Y的邊緣概率密度。若對所有實數x,y,幾乎處處有

則隨機變量X和Y是相互獨立的。
想要證明兩個r.v.不獨立,只要證明在某個非零測度集上,幾乎處處有

由注4,例1的正確解法是:
注5 (充要條件)設(X,Y)的聯合概率密度f(x,y)(a 例2 設(X,Y)的聯合密度函數為: 解:因為x≤y≤2,y的范圍與x有關,不是一個常數,故由注5知X和Y不是相互獨立的。 注6 若(X,Y)是離散型r.v.,且對(X,Y)的所有可能取值(xi,yj),有: P(X=xi,Y=yj)=P(X=xi)P(Y=yj), 則隨機變量X和Y是相互獨立的。 定義 稱為r.v.X和 Y的相關系數。 相關系數反映了兩個隨機變量之間的一種聯系,若ρXY= 0,則稱X與Y不相關。 注7 若兩個r.v.X與Y相互獨立,則X與Y不相關。 注8 若兩個r.v.X與Y不相關,則r.v.X與Y不一定獨立。 下面這個例題可以清楚的展示上面的結論。 例3 已知r.v.X的分布律為:判斷r.v.X與Y是否相互獨立?是否相關? 解 由于Y=X2,Y=X2,Y的值完全由X決定,故X與Y不獨立。 注9 若隨機變量(X,Y)服從二元正態分布N(a,b,σ ,σ ;r),則下列三個命題是等價的:(1) 2212 X與Y相互獨立;(2)X與Y不相關;(3)r=0。 證明 由于獨立一定不相關,故(1)→(2)成立。又由定義立得(2)→(3)成立。下面證明(3)→(1)成立。當r=0時,立得(X,Y)的聯合密度等于兩個一元正態分布邊緣密度的乘積,由注5,有X與Y相互獨立,即(3)→(1)成立。 下面通過幾個例子來展示相關性與獨立性的實際應用。 例4 Head First健生俱樂部為自己能為每一位前來健身的人找到合適的班級感到自豪。這正是俱樂部風靡老中少健身者的原因。健身俱樂部目前正在動腦筋,為的是最有效的推銷它新開設的瑜伽班。他們想知道,是否參加游泳班的人更有可能參加瑜伽班。他們中有人提出“也許我們給游泳班的學員一些折扣,鼓勵他們參加瑜伽班?!?/p> 首席執行官不同意,“我想你們錯了”,他說,“參加游泳班的人和參加瑜伽班的人是相互獨立的,我不認為參加游泳班的人比其他人更有可能參加瑜伽班”。 他們調查了96人,問他們是否參加游泳班或瑜伽班。在這96人中,有32人參加瑜伽班,72人參加游泳班,有24人最積極,兩個班都參加了。 那么,誰對誰錯?瑜伽班和游泳班,是相關還是相互獨立? 分析 記A表示參加瑜伽班,B表示參加游泳班,則發現P(AB)=P(A)P(B),故參加游泳班的人與參加瑜伽班的人是相互獨立的,首席執行官是對的。瑜伽班和游泳班是不相關的。 例5 相關還是獨立? 1. 在星期二(已知條件)下雨。 獨立。不會由于是星期二而更有可能下雨或不下雨,因此二者是獨立事件。 2. 從抽屜里拿襪子,直到拿出一雙。 相關。在取出一只襪子后,下一次取襪子時,原來的襪子數就減少了,這會影響概率。 3. 從一盒巧克力中隨機拿巧克力,連續2次拿到黑巧克力。 相關。巧克力盒子中有黑、白巧克力,在第一次拿到黑巧克力后,黑巧克力減少一個。 例6 某部門承接組織一場商業性露天音樂會,遇到天氣變化,該部門希望能夠根據預計天晴時數(小時)預測出音樂會的聽眾人數,這樣一來,他們就可以衡量陰天可能給聽眾人數造成的影響。若聽眾人數少于3500人,這時票房收入將無法抵消成本費用,那么他們就取消音樂會。下面是樣本數據。 能否根據這組數據判斷露天音樂會聽眾人數與當天預計天晴時數之間的關系。 解 先根據樣本數據畫出散點圖,見左邊,右邊是一次曲線擬合圖。 圖1 樣本數據的散點圖 圖2 一次曲線擬合樣本數據圖 從圖1中可以看出,數據點在圖上呈直線分布,且這條線隨天晴時數增加而向上爬升。故可畫一條穿過這些點的直線y=a+bx,使這條線盡量接近各個點,見圖2。由最小二乘法可得:a=15.80,b=5.32。 于是,聽眾人數和天晴時數之間的關系接近y=15.80+5.32x,聽眾人數和天晴時數是相關的。接下來計算對應的相關系數: 由于r接近于1,說明聽眾人數和預計天晴時數之間有很強的正線性相關性。 隨機變量的相關性和獨立性是隨機變量的兩個最重要的關系,而不相關是不獨立的一種特殊關系,在判別隨機變量是否獨立時,要注意兩個隨機變量不相關,二者不一定獨立。另外聯合概率密度等于邊緣概率密度乘積只是判別隨機變量是否獨立的一個充分條件,而非充要條件。若兩個隨機變量服從二維正態分布,則獨立和不相關是等價的。 [1]魏宗舒.概率論與數理統計教程[M].北京:高等教育出版社,1982. [2]復旦大學.概率論基礎[M].上海:復旦大學出版社,1979. [3]張宏禮,王苫社,周曉晶,等.隨機變量獨立性的一個注記[J].高等數學研究2010(13):114-115. [4]金天壽,王曉華,李聰.隨機變量獨立性的判別方法[J].高等數學研究,2014(17):92-95. [5]金天壽.對事件獨立性的再認識[J].數學通報,2012(51):24-26. Some Notes and Practical Applications of Independence and Correlation Fan Guo-liang1, Lu Xiao-heng2 The concepts of independence and correlation of two random variables are introduced from the independence of two random events. Further we give some notes and discriminated methods for judging independence and correlation. By using the density function in general teaching material for judging independence is easy to make mistakes, and we analyze the situation of the mistakes which are easy to make by an example. To solve this problem, we in this paper, give a necessary and sufficient condition for judging the independence via the density function, which can avoid this mistake. At last, some real examples are taken to illustrate the applications of independence and correlation in life. random variable; independence; correlation; normal distribution O211 A 1672-0547(2016)06-0088-03 2016-06-23 國家自然科學基金(11401006) 范國良(1981-),男,安徽黃山人,安徽工程大學數理學院副教授,博士,碩士生導師,研究方向:概率統計; 陸曉恒(1966-),男,江蘇蘇州人,銅陵學院數學與計算機學院副教授,研究方向:概率統計。
二、相關性



三、應用





四、結論
(1.Anhui Polytechnic University, Wuhu Anhui 241000, China; 2.Tongling University, Tongling Anhui 244000, China )