羅 凱 吳 瑩
(廣州大學松田學院,廣東 廣州 511370)
?
相關性分析
——一個計量經濟學的視角
羅凱吳瑩
(廣州大學松田學院,廣東廣州511370)
摘要:本文從概率論的兩個例子出發構造了兩組數據,通過分析得到了決定樣本相關系數大小的一個因素——解釋變量的取值分布是否對稱,解釋了計量經濟學中相關性的含義,并給出了一個不相關但不獨立的例子。
關鍵詞:相關性;獨立;對稱
1.引言
在計量經濟學中,相關性是一個很重要的概念,在一般的線性回歸模型中,解釋變量與被解釋變量呈現出的便是一種相關關系。計量軟件一般不會直接給出度量相關性的統計量,但會給出一個與之聯系甚為緊密的結果——可決系數。雖然在計量經濟學中,相關系數與可決系數所表示的含義大相徑庭,但兩者的聯系如此緊密,以至于我們乍看時會有些許驚訝。具體一點說,如果我們用r表示相關系數,那么可決系數則為r2,用計量經濟學的語言:
所以我們可以用可決系數的大小來分析相關系數的某些特征,但在此之前,我們先引入兩個具體的例子。
2.兩個例子
例1.設X~U(-1,1),即X服從區間(-1,1)上的均勻分布,則其密度函數為:
因此:
再令Y=X2,則:
Cov(X,Y)=E(XY)-E(X)E(Y)
=E(X·X2)-E(X)E(X2)
=E(X3)-E(X)E(X2)
=0
顯然,這里X與Y不相關。
例2.假設X~U(0,1),即X服從區間(0,1)上的均勻分布,則其密度函數為:
因此:
再令Y=X2,則:
顯然,這里X與Y并非不相關。
下面我們將應用這兩個例子。
3.應用
利用上面的結論我們可以相應地構造出兩組數據:

X0.40.30.20.100.10.20.30.4Y0.160.090.040.0100.010.040.090.16

X00.10.20.30.40.50.60.70.8Y00.010.040.090.160.250.360.490.64

另外,我們還得到了一個不相關但卻不獨立的例子。很明顯,第一組數據不獨立,但它們卻是不相關的。我們還可以嚴格地證明這一點,也就是說,對于例1,我們可以證明:
P(X 其實我們可以求出隨機變量X的分布函數為: 隨機變量Y的分布函數為 所以: P(X 而隨機向量(X,Y)的聯合分布函數為: 從而P(X 至此,我們證明了我們的結論:兩個變量不相關并不意味著獨立。 參考文獻: [1]Damodar N.Gujarati, 2003.Basic Econometrics[M].4th ed.NewYork:McGraw-Hill Company. [2]茆詩松,程依明,濮曉龍.2011.概率論與數理統計教程[M].第二版.北京:高等教育出版社. [3]嚴士健,王雋驤,劉秀芳.2009.概率論基礎[M].第二版.北京:科學出版社.