買吐地·拜爾地,胡 江
(1.和田師范專科學校數(shù)學與信息學院,新疆 和田848000;2.東北師范大學數(shù)學與統(tǒng)計學院,吉林 長春130024)
多元統(tǒng)計分析是數(shù)理統(tǒng)計的一個重要分支,在社會學、經(jīng)濟學、氣象學等各個領域都有廣泛的應用.隨著計算機技術的發(fā)展,各個行業(yè)都可以收集、儲存大量的數(shù)據(jù)信息資料,然而經(jīng)典多元統(tǒng)計分析的理論卻隨著數(shù)據(jù)維數(shù)的增加表現(xiàn)得越來越差,甚至根本無法應用.這就要求人們研究一些新的理論方法去處理大維數(shù)據(jù),正是在這樣的背景下隨機矩陣理論應運而生.
隨機矩陣起源于20世紀50年代,當時物理學家們在量子力學中發(fā)現(xiàn)重核子能級結構可以用隨機矩陣的特征根表達,后來在1955年及1958年,數(shù)學物理學家、物理諾貝爾獎獲得者Wigner教授得到這類矩陣特征根經(jīng)驗分布的極限分布,也被稱為半圓律[1-2].1967年,Marˇcenko和Pastur給出了經(jīng)典樣本協(xié)方差矩陣的極限譜分布函數(shù)[3],這也被后人稱為M-P律.通常我們假設樣本{Xi}為一列獨立同分布的p 維隨機實列向量,i=1,…,n,并且Xi中元素{xij}獨立且滿足期望為0,方差為1.稱矩陣

為樣本協(xié)方差矩陣.假設{Yi}為另外一列與{Xi}獨立的獨立同分布的p 維隨機實列向量,i=1,…,N,類似的Yi中元素{yij}獨立且滿足期望為0,方差為1,Hn為一個p×p 非隨機正定對稱矩陣.那么記


叫作矩陣A 的經(jīng)驗譜分布函數(shù).這里的δ(·)表示示性函數(shù).此時我們可以定義廣義Beta矩陣.
定義1(廣義Beta矩陣) 將型為Bn=Sn(Sn+αnTN)-1的矩陣稱為廣義Beta矩陣,其中αn是任意非隨機正常數(shù).
我們主要考慮當{p,n,N}→∞,隨機矩陣Bn=Sn(Sn+αnTN)-1的經(jīng)驗譜分布函數(shù),即FBn 的極限.
Beta矩陣在多元分析中有很多的應用領域,比如檢驗多個總體協(xié)方差矩陣是否相等、多元方差分析、檢驗幾組向量的獨立性、典則相關分析等等.一般情況下只要是涉及比較兩個或多個總體的關系時,往往會用到Beta矩陣,實際上非常多的研究成果都涉及Beta矩陣[3-6].
記{z1(1),…,zn(1)}為一組p 維獨立同分布隨 機 向 量,{z1(2),…,zN(2)}是 另 外 一組p 維 獨 立 同分布隨機向量.令μi=E(z1(i))=0 以 及Σi=Var(z1(i)),i=1,2.那 么 假 設 各 自 滿 足zj(1)=Σ11/2X(·,j)以 及zj(2)=其中X(·,j)(X(·,j))表示Xn(XN)的第j列.我們要做的是檢驗

在原假設H0下

其中cn=n/(n+N),cN=N/(n+N),αn=N/n.顯然以上所有的檢驗函數(shù)都是Beta矩陣Bn的經(jīng)驗譜分布函數(shù)的線性函數(shù).若Hn=In為單位陣,白志東等在文獻[7]給出此時Beta矩陣的極限譜分布函數(shù)的形式及其線性譜統(tǒng)計量的中心極限定理.這給大維檢驗問題提供了一種理論支持,但是該理論可以得到檢驗函數(shù)的置信水平,卻無法得到準確的勢函數(shù).為彌補這一不足,我們進行了研究,得到一些有益的結論.
定義2(Stieltjes變換) 對任意定義在實數(shù)軸上的有界變差函數(shù)G,函數(shù)

稱為函數(shù)G 的Stieltjes變換.
定理1 在Beta矩陣定義的基礎上假設滿足條件:
(ⅰ)αn→α>0,p/n→βx>0.
(ⅱ)p/N→βy>0
(ⅲ)supnE|x11|4<∞,supNE|y11|4<∞.
(ⅳ){Hn}是一列p×p 厄爾米特矩陣,滿足依概率1譜范數(shù)有界,并且{Hn}的經(jīng)驗譜分布函數(shù)幾乎處處收斂到非隨機分布函數(shù)H.
(ⅴ)矩陣{Sn+αnTN}的最小特征根隨著n→∞幾乎處處收斂到一個正常數(shù).

由定理1及文獻[7]的定理1.1,我們可以直接得到如下結論:

引理1[8]記A 與B 是兩個p×n矩陣.那么有

及

其中L(·,·)表示Lévy距離.
引理2[9]對任意隨機矩陣An,令FAn 和sFAn(z)分別表示它的經(jīng)驗譜分布函數(shù)及經(jīng)驗譜分布函數(shù)的Stieltjes變換.那么,如果依概率1,F(xiàn)An 是緊的,并且對z∈C+,隨著n 趨于無窮時,sFAn(z)幾乎處處收斂到sF(z).那么存在一個以sF(z)為其Stieltjes變換的非隨機分布函數(shù)F,使得當n趨于無窮時,F(xiàn)An幾乎處處弱收斂到F.
引理3[10]令G 是一個有界變差函數(shù),x0∈R.如果存在,記作?sG(x0),那么G 在x0可導,并且它的導數(shù)是π-1?sG(x0).
由引理2我們知道要證明定理1只需要三個步驟:(1){FBn}是幾乎處處緊的其中s滿足方程(1);(3)方程(1)在C+上解唯一.
步驟1 對任意實數(shù)t1,t2≥0,我們可以得到

由于在定理1的假設條件下,我們知道FSn 幾乎處處收斂到M-P分布Fymp(參見文獻[3]),并且密度函數(shù)可以表示為

如果y>1,那么Fymp在原點具有質(zhì)量為1-1/y.其中所以{FSn}是幾乎處處緊的.
另外,由定理1的條件(ⅴ),(2)式的第二項使得當n足夠大時可以任意小,那么如果令1/t小于矩陣{Sn+αnT}的最小特征根,即可得{FBn}是幾乎處處緊的.
步驟2 由Stieltjes的定義,對z∈C+,

利用性質(zhì)Bn與S1/2n(Sn+αnTN)-1S1/2n有相同的特征根.記Bε=Sn(Sn+αnTN+εI)-1,其中ε>0足夠小.再由引理1我們得到

容易驗證

由定理1中條件(ⅴ)幾乎處處有

進一步有

下面考慮Bε的極限譜分布函數(shù).由于矩陣αnTN+εI 對于任意ε>0是可逆的,所以有

其中

由此可得


Silverstein在文獻[11]得到對z∈C+,矩陣的極限譜分布函數(shù)(非隨機)的Stieltjes變換,記為s^ε(z),滿足方程

其中Kε表示(αnT+εI)-1的極限譜分布函數(shù).由于?(z/(1-z))=|1-z|2?z>0,所以由(5)式我們得到sFBε(z)幾乎處處收斂到一個非隨機的極限sε(z),并且滿足方程

再根據(jù)Kε與K 的定義

所以令ε→0得


其中sT(z)表示分布函數(shù)K(x)的Stieltjes變換.再次利用Silverstein在文獻[8]的結果可以得到

所以得到方程(1).
步驟3 由于文獻[11]中已經(jīng)證明方程(7)在C+解唯一.那么根據(jù)引理3,我們得到分布函數(shù)K(x)在幾乎處處意義下唯一,再根據(jù)文獻[7]中定理2.3就得到了方程(6)在C+中解唯一的結論.綜上所述,定理1得證.
我們的模擬數(shù)據(jù)均來自標準正態(tài)分布,但是需要注意的是非正態(tài)數(shù)據(jù)的結果與此類似.首先假定H=I,那么可以得到推論1.模擬結果中p=3 000,n=5 000以及N=6 000.通過圖1可以看出擬合的效果非常明顯.
圖2直方圖中的H 是對角線元素為1 000 個1 與2 000 個15 的對角陣.首先我們可以看出在0.2~0.3之間有一個小區(qū)間沒有特征根出現(xiàn),這也就是所謂的絕對分離定理,也是我們今后將研究的問題.另外由于矩陣H 變得復雜以后,極限譜分布函數(shù)的密度函數(shù)f(x)的顯示表達式很難給出,這部分內(nèi)容可以參看文獻[11-12],所以圖2沒有給出極限譜密度函數(shù)圖像.

圖1 H=I時,廣義Beta矩陣極限譜分布密度函數(shù)
[1]WIGNER E P.Characteristic vectors of bordered matrices with infinite dimensions[J].Annals of Mathematics,1955,62(3):548-564.
[2]WIGNER E P.On the distribution of the roots of certain symmetric matrices[J].Annals of Mathematics,1958,67(2):325-327.
[3]MARˇCENKO V A,PASTUR L A.Distribution of eigenvalues for some sets of random matrices[J].Mathematics of the USSRSbornik,1967,1(4):457-483.
[4]ANDERSON T.An introduction to multivariate statistical analysis[M].Third Edition.New York:Wiley,2003:441-458.
[5]FUJIKOSHI Y,ULYANOV V V,SHIMIZU R.Multivariate statistics:high-dimensional and large-sample approximations[M].New York:Wiley,2011:219-244.
[6]MUIRHEAD R J.Aspects of multivariate statistical theory,Volume 42[M].New York:Wiley,1982:291-375.
[7]BAI Z D,HU J,PAN G,et al.Convergence of the empirical spectral distribution function of Beta matrices[J].Bernoulli,2015,21(3):250-286.
[8]BAI Z D,SILVERSTEIN J W.Spectral analysis of large dimensional random matrices[M].Second Edition.New York:Springer Verlag,2010:506.
[9]BAI Z D,ZHANG L X.The limiting spectral distribution of the product of the Wigner matrix and a nonnegative definite matrix[J].Journal of Multivariate Analysis,2010,101(9):1927-1949.
[10]SILVERSTEIN J W.Strong convergence of the empirical distribution of eigenvalues of large dimensional random matrices[J].Journal of Multivariate Analysis,1995,55(2):331-339.
[11]胡江,胡果榮,史曉磊.大維AR(1)模型樣本協(xié)方差陣的極限譜密度[J].東北師大學報:自然科學版,2010,42(2):1-6.
[12]SILVERSTEIN J W,CHOI S I.Analysis of the limiting spectral distribution of large dimensional random matrices[J].Journal of Multivariate Analysis,1995,54(2):295-309.