袁曉惠,司 賀,王純杰
(長春工業大學 數學與統計學院,長春 130012)
作為一種穩健性方法,分位數回歸由Koenker和Bassett(1978)[1]提出后,就得到國內外統計學家廣泛的研究與應用,取得了很多重要成果。Koenker(2005)[2]的專著詳盡地總結了近30年來分位數回歸相關的理論及研究結果。
面板數據是經濟學中比較常見的一類數據,此數據既含有時間序列的信息又包括個體截面的信息。對面板數據的有效分析能為研究者提供更多的信息。Wooldridge[3]介紹了處理面板數據的一些經典統計方法。
面板數據的分位數回歸方法的相關研究,近十年來成為國內外一個研究熱點。對于固定效應的面板數據模型,羅幼喜和田茂再(2010)[4]通過模擬研究比較了三種分位數回歸估計方法,其中固定效應變換分位回歸估計(FEQR)表現最好。Kato和Galvao(2012)[5]推導了固定效應模型的分位數回歸估計漸近正態性質。Galvao和Kato(2016)[6]基于核提出光滑的分位數回歸估計,并用核函數構造回歸參數的漸近置信區間。核方法的估計效率依賴于窗寬的選擇,且一般需要假定數據獨立同分布,如果數據異質性較強,估計的效率可能會較低。
Brown和Wang(2005)[7]提出誘導光滑(IS)方法來估計秩回歸參數及相應的置信區間。Brown和Wang(2009)[8]運用此方法構造分位數回歸參數的點估計和區間估計,相比于核光滑方法,誘導光滑方法不需要選擇窗寬,近幾年,此方法得到廣泛運用。
本文針對固定效應的分位數回歸模型,運用誘導光滑的思想,構造回歸參數的誘導光滑點估計和置信區間估計。通過蒙特卡洛實驗和實例分析,說明新方法在回歸參數的點估計區間估計中具有一定的優勢。
考慮含有個體固定效應的分位數回歸模型:

其中:τ∈(0,1)是感興趣的分位數,其中 yit是響應變量在截面i和時刻t時的觀測值,相應的xit是 p維協向量,β0∈Rp是未知的參數向量,αi是個體i的個體效應。
通過求解如下優化問題可以求得αi和β0的估計:

其中 ρ()
u=u(τ-I(u≤0))。在實際問題中,往往 n比較大但T卻比較小,即對于每個個體而言,其觀測值并不多,要想利用這少量的個體觀測值去估計每個個體效應αi并非易事,而且即使能夠得到參數估計,其估計的效率也比較低??紤]到大多數的研究中,參數值β0才是人們的興趣所在,所以本文的重點將放在對β0的估計上。
β0的FEQR估計方法如下:然后基于考慮

最小化上述目標函數得到β0的FEQR估計為:

相應地,個體效應的估計:

羅幼喜和田茂再(2010)[4]通過模擬比較了FEQR估計和另外兩種方法在有限樣本下的估計效率,FEQR估計表現較好。
本文將誘導光滑思想[6]應用于式(2),首先構造關于β的誘導光滑估計函數。
其中?(),Φ()分別為是標準正態分布的密度函數和分布函數。通過最小化(β)可得 β0的誘導光滑估計及相應的個體效應
在此方法中,Γ未知,首先令Γ=(nT)-1Ip,通過不斷迭代更新Γ。
令和
(2)在第k步迭代中,

(3)重復(2)直到 β(k+1)收斂于,(nT)Γ(k)收斂于ΣIS。
本文根據固定效應面板數據模型產生模擬數據,用以比較誘導光滑估計和其他幾種估計在有限樣本下的表現。
設定的產生數據的模型如下:

誤差分布選擇有3種:①標準正態分布N( )0,1 ,②標準柯西分布C(0,1),③自由度為3的T分布t(3)。真值β0=1,令 τ=0.3,0.5,0.7 及 n=10,T=30。在不同的誤差分布影響下計算β0的5種估計:
(1)忽略個體固定效應,直接使用混合數據的最小二乘估計,記為LS估計;
(2)忽略個體固定效應,直接使用混合數據的分位回歸估計,記為QR估計;
(3)考慮個體固定效應的最小二乘估計,記為FELS估計;
(4)考慮個體固定效應的變換分位數回歸估計,記為FEQR估計;
(5)本文提出的考慮個體固定效應的誘導光滑估計,記為FEIS估計。
首先從均方根誤差(RMSE)的角度來衡量β0的估計的好壞。

這里K是模擬重復次數,設定K=1000。RMSE越小,說明估計的效率越高,估計效果越好。表1列出了在不同的誤差分布及不同的分位數下,以上5個估計的RMSE。為了說明估計效果,每一行中,最小的RMSE用“*”標出。

表1 在不同分位點不同誤差分布下β0的五種估計
從表1可以看出:
LS和QR的RMSE遠遠大于其余3種估計,說明在固定效應面板數據模型中,忽略個體效應,導致估計效率降低。在參數估計中應該將個體效應納入估計方法中。
當誤差分布為正態分布時,FELS估計的RMSE最小,而當誤差分布為柯西分布和T分布時,FELS的RMSE變得很大,尤其是柯西分布時,FELS估計的RMSE是FEQR和FEIS的RMSE的幾十甚至上百倍。而在實際數據的分析過程中,誤差分布的識別一般比較困難,且不一定會是正態分布。FELS估計在穩健性方面的表現呈現一定劣勢。
在3種誤差分布下,FEQR和FEIS估計的RMSE都非常小,說明這兩個估計對誤差分布的依賴較弱,具有穩健性。
大多數情形下,FEIS的RMSE小于FEQR的RMSE,說明FEIS方法在有限樣本下的點估計具有一定的優勢。

表2 β0的FEIS估計的標準差95%的置信區間的覆蓋率
表2列出了FEIS估計的標準差SD和估計的標準差的平均SE以及95%的置信區間的覆蓋率。

正如表2所示,FEIS估計的SD和SE比較接近,且基于估計的標準差而構造的置信水平為95%的置信區間的覆蓋率基本接近95%,說明FEIS方法置信區間估計表現較好。
本文通過一個真實的數據來展現FEIS方法在實際運用中的表現。數據來源于《中國統計年鑒》。包含華北地區5省市,東北地區3省,華東地區7省市,中南地區6省從1996—2013年的城鎮居民家庭平均每人全年消費性支出和城鎮居民平均每人全年家庭可支配收入的數據。目標是探索居民消費和收入之間的關系。
本文采用1978年全國年度消費物價指數CPI對變量進行平減,平減后的變量作為本文分析的對象。

表3 回歸結果比較
表3列出了上文中的5個估計的參數估計值(τ=0.5)。LS和QR的估計值較大,而考慮個體固定效應的其他3個估計比較接近。

圖1 三種方法的回歸結果
圖1畫出了FELS和FEQR、QR在不同分位點的估計值。QR估計波動性較大,FELS和FEQR估計值很接近。說明FELS的估計比較穩定,而FELS可以同時得到區間估計,可以得到更可靠的信息,具有一定優勢。
本文提出了面板數據分位數回歸的誘導光滑估計方法,可以在識別參數估計中同時得到參數點估計和區間估計,給實際工作者提高具有更可靠的信息。接著本文給出估計的簡單且有效的算法,通過很少的迭代數就可得到收斂的參數估計。蒙特卡洛模擬實驗表明本文所提方法在小樣本下表現出色。實例分析說明此方法操作簡單,估計效果穩定,具有實用價值,總體來說,誘導光滑估計方法在面板數據分位數回歸模型的參數估計中,具有一定的競爭力。