摘 要:在自回歸模型中,德賓-沃森(D-W)檢驗是一種使用非常廣泛的自回歸系數檢驗。但D-W檢驗有一個很大的限制:當檢驗的統計量落入了所謂“不確定域”則無法進行檢驗。本文利用Bootstrap重復抽樣方法對自回歸系數進行檢驗。蒙特卡羅研究表明,該方法消除了不確定域,改善了檢驗效果。
關鍵詞:BootstrapD-W檢驗自回歸系數
中圖分類號:O212.7文獻標識碼:A文章編號:1674-098X(2011)05(a)-0001-02
Bootstrap test of autocorrelation
HAN Kai-shan
(School of Science,North University of China,ShanxiTaiyuan 030051)
Abstract:The Durbin-Watson (D-W) test is one of the most widely used tests for autocorrelation in regression models.The D-W test has,however,an important limitation:the test is inconclusive when the test statistic falls into the so-called “indeterminate range”. The paper proposes a bootstrap test for autocorrelation.Monte Carlo study shows that the indeterminate range is eliminated with the bootstrap method and the power of the test is impproved.
Key words:Bootstrap;D-W test;autocorrelation
1 引言
在回歸模型中,德賓-沃森(D-W)檢驗已經被廣泛應用于自回歸系數的檢驗。但D-W檢驗存在嚴重的局限性。第一,D-W檢驗的統計數值分布是難以處理的。第二,D-W檢驗的統計分布依賴于設計矩陣。為克服這個問題,德賓和沃森給出了D-W統計量的上下界和,其分布不依賴于設計矩陣。和是可以被構造出來并且應用在D-W檢驗中的。當檢驗統計量的值落入所謂的“不確定域”時,即落入和之間時,檢驗的目的就無法達到了。已有多項研究,以消除“不確定域”,并改善D-W檢驗的能力?,F有的研究方法可分為兩類:近似分布法和數值計算法。這兩類方法所取得的成就并不令人滿意。近似分布法對D-W檢驗的能力沒有明顯改善;數值計算法又依賴于分布假設和設計矩陣。
本文利用Bootstrap重復抽樣方法對自回歸系數進行檢驗,并說明它的優良性質。
2 模型的建立
考慮自回歸模型:
(1)其中是維向量,是一個矩陣,是維向量。假設服從AR(1)模型:
(2)其中之間相互獨立且與獨立。
自回歸系數檢驗的原假設為,備擇假設為。D-W檢驗統計量為:
其中,由于的分布依賴于,所以D-W檢驗的臨界點不易處理。Durbin和Watson1971年提出用逼近的分布。Ali 1984年利用皮爾遜分布近似d的分布。數值計算方法是直接計算的的臨界值,Shively等人在1990年運用卡爾曼濾波方法提出一個更有效率的特征值算法。安斯利等人在1992年采用新的特征函數簡化了先前的方法。數值計算方法的優點是可以找到“真正的”臨界值點。但臨界值是依賴于誤差估計的。畢竟較快的計算方法具有較低的可靠性。另外,只有誤差項具有正態分布時,真正的臨界值才能得到。
Efron在1979年提出Bootstrap重復抽樣方法。其基本思想是:給出一組獨立觀測數據集和檢驗統計量:
(1)從原始數據中抽取一Bootstrap樣本,其中每個是一個從中可重復隨機抽取的。
(2)利用計算。
(3)重復步驟(1)及(2)次,得到 。
(4)的經驗分布函數可以作為的近似分布。
Bootstrap方法的有限樣本性質是合理的令人滿意的,但是當觀測數據是相互依存時,上述標準的Bootstrap方法就會失效。這是因為在自回歸模型中,處理的是一組相互依存的數據。如果是自相關的,重復抽樣就會使原始數據遭受破壞。有兩個替代方法可保留原始數據的自相關性,一種方法是“遞推Bootstrap”,另一種方法是“塊Bootstrap”。如果數據相關結構已知,遞推Bootstrap方法可以根據數據相關結構抽取樣本,保持原有數據的相關性。如果相關數據結構未知,塊Bootstrap通過塊抽樣以保持原始數據間的相關結構[8-10]。本文使用遞推Bootstrap方法和塊Bootstrap方法相結合的方法,以保留原有數據的自相關性。
3 模擬
模擬的回歸模型為:
假設檢驗為:,。
取,服從期望為0,方差為1的均勻分布。為一列的時間序列。本文利用如下的遞推Bootstrap和塊Bootstrap方法來檢驗自回歸系數:
(1)利用最大似然估計通過方程(1)估計系數,計算。
(2)利用最大似然估計通過方程(2)估計自回歸系數,計算。
(3)利用塊Bootstrap方法對殘差進行重復抽樣,得Bootstrap殘差向量 。
(4)利用原假設,從Bootstrap殘差向量抽取,得 ,通過方程,求得。
(5)利用最大似然估計求得:
(6)重復(3)-(5)步,得Bootstrap統計量及的經驗分布函數。
(7)比較原假設與的左側分位數,若的左側分位數大于,則拒絕原假設。
Bootstrap程序的設計是,先給定的值,令其等于0,每次增加0.05,直到達到0.4。模擬中,重復抽樣次數設為200次,模擬次數1000。
模擬結果如表1。
本文通過Bootstrap重復抽樣方法對自回歸模型的自回歸系數進行了檢驗,檢驗效果表明:該方法擺脫的D-W檢驗方法固有的不確定域,增強了自回歸系數檢驗的效果;同時,綜合遞推Bootstrap和塊Bootstrap兩種抽樣方法,對自回歸系數進行檢驗,得到的模擬效果相對于Jeong等的模擬的結果更為有效。
參考文獻
[1]Abrahamse P. A comparison between the pewer of the Durbin-Watson test and the power of the BLUS test[J].J Amer Statist Assoc.1969(64):938-948.
[2]Durbin J,Watson G..Testing for serial correlation in least square regression Ⅲ[J].Biometrika,1971(58):1-19.
[3]Farebrother R.The distribution of a linear combination of central random variables.A remark on AS153: Pan’s procedure for the tail probabilities of the Durbin-Watson statistic[J].Appl Statist,1984(33):366-369.
[4]Ali M.An approximation to the 1 distribution and power of the Durbin-Watson statistic[J].Biometrika,1984(71):253-261.
[5]Shively S,Ansley F and Kohn R.Fast evaluation of the distribution of the Durbin-Watson and other invariant test statistics in time series regression[J]. Journal of American Statistical Association,1990(85):676-685.
[6]Ansley F,Kohn R and Shively S. Computing p-values for the generalized Durbin-Watson and other invariant test statistics[J].J Econom,1992(54):277-300.
[7]Efron B.Bootstrap method:Another look at the Jacknife[J].Annals of statistics,1979(1):1-26.
[8]Veall R.Bootstrapping Regression Estimators under First-order Serial Correlation[J].Economics Letters,1986(21):41-44.
[9]Rayner K.Bootstrapping p values and power in the First-order Autoregression:A Monte Carlo Investigation[J].Journal of Business and Economic Statistics,1990(8):251-263.
[10]Künsch R.The Jackknife and the Bootstrap for General Stationary Observations[J].Annals of Statistics,1989(17):1217-1241.
[11]Jinook J,Seoung C.Bootstrap tests for autocorrelation[J].Computatianal Statistics and Data Analysis,2001(38):49-69.