王克林 ,劉建平
(1.廣東商學院 經濟貿易與統計學院,廣州 510320;2.暨南大學 經濟學院,廣州 510632)
無回答誤差是非抽樣誤差的一個重要來源。它普遍存在于各種類型的統計調查中,且能對調查結果產生嚴重影響。當無回答誤差比較嚴重時,也就是當某次統計調查中落入到某一區域的樣本量很小甚至為零時,對該區域的估計問題稱為小域估計。小域問題在國內外的大型抽樣調查中都是存在的,是一個世界性的難題。無回答會使總體目標估計量產生偏倚,方差增大。因此,無回答也是國內外非抽樣誤差研究中一個長盛不衰的課題。在我國,政府統計往往都采用多階段抽樣調查的方式。這種抽樣調查方式中所產生的非抽樣誤差是非常值得關注和研究的[1]。其中一個方面,這種抽樣調查在抽樣方案設計時考慮的多數都是總體或子總體估計的需要,因而統計調查所獲得的數據往往只能滿足較大區域估計的需要。有時即使某區域樣本量不小但無回答誤差嚴重時,該區域的樣本量往往很難保證利用傳統的推斷估計方法達到所要求的可靠性。因而,探索有效解決分層抽樣中由于無回答等原因導致某些層樣本量偏小而無法估計的問題是滿足我國政府統計多層次推斷的迫切需要。
對小域估計問題,趙雪慧在其博士論文(2005)[2]中已經對國內外關于小域估計的理論進展和實際應用做了全面研究;對于無回答的影響、調整和降低措施,在一般的抽樣調查著作中都有介紹。馮士雍等(1997)[3]的研究都比較全面。本文對此不再做詳細介紹和綜述,本文嘗試將多階模型中的空模型和經驗加權方法應用于研究無回答問題。
多階模型分析通常是從空模型,又稱截距模型,或無條件均值模型開始的。 根據 Goldstein(1996),[5]王濟川等(2008)[4]的研究,空模型的基本格式可表示如下:

將式(1)、式(2)和式(3)所示空模型記為模型 1。 式(1)表示微觀層面的變量關系。其中,yij表示第j組第i個個體的取值水平;β0j和eij分別代表第j組因變量均值和圍繞該均值的個體隨機差異。式(2)表示宏觀層面的變量關系,總截距γ00代表的是yij的總(平)均值;u0j代表第j組的因變量均值(β0j)與總均值(γ00)之間的差異。 式(3)是式(1)和式(2)的組合,包括了固定效應(γ00)和隨機效應(u0j和 eij)兩部分。該模型的微觀層(水平1)和宏觀層(水平2)公式中均沒有解釋變量。若在式(1)中納入水平1解釋變量并將其系數設為隨機的,則模型就變為隨機系數回歸模型;若在式(2)中納入水平2解釋變量(即場景變量),模型就變為有條件約束的回歸。Goldstein(1988)介紹了多階模型的一般形式。由式(2)可見,分層抽樣中第j層研究變量Yij的均值估計值可以表示為:

采用Goldstein(1996)介紹的多階模型估計方法很容易得到式(4)中各層均值的估計值估計多階模型采用的方法是(有約束的)極大似然估計。因此,根據式(4)得到的各層均值的估計不僅具有小樣本估計的優良性質,還具有大樣本性質,如一致性、漸近正態性等。
經驗加權方法是多階模型估計方法的一種。按照經驗加權方法,分層抽樣中第j層均值的參數估計是利用第j層子樣本和整體樣本數據估計出來的最佳加權平均參數估計值。有很多學者, 如 Lindley&Smith (1972)[6]、Raudenbush&Bryk(2002)[7]、王濟川等(2008)[4]、趙雪慧(2005)[2]也將其稱為經驗貝耶斯方法。本文依其原意,稱其為經驗加權估計方法,且不詳細討論其估計原理,僅就其在無回答估計中的應用進行研究。
在式(1)~(3)所表示的多階模型中,β0j的經驗加權估計值可以表達為和的加權線性組合:

由式(5)可見,在經驗加權中,起關鍵作用的是權重系數ρj。經典文獻中將ρj稱為可靠性,它度量了參數估計值的可靠性。根據王濟川等(2008)的研究,在不存在測量誤差的假設下,空模型中β0j估計值的可靠性可以表示為:

其中,nj表示第j層樣本量。式(6)揭示了可靠性ρj是nj的函數。顯然,ρj的取值范圍在區間[0,1]之內。第j層的權重ρj越大,說明 β0,j的估計值的可靠性越大,則在的經驗加權估計值中所占比重就越大;否則總均值所占比重就會較大。從式(6)還可以看出,ρj的大小與第j層的樣本容量nj成正比。當第j層存在無回答時,或者其樣本量nj較小時,由式(6)可見,權重系數 ρj就比較小,對的估計就會收縮,多階模型的參數估計值就會被“拉”向用整個樣本計算出的參數估計值。因此,該方法也被稱為“收縮估計法”。
上文介紹了兩種解決統計調查中某些層(組)樣本數據稀少的情況:直接利用多階模型中的空模型進行估計的式(4),我們將其稱為多階模型方法(MLM);利用經驗加權法估計參數的式(5),將其記為經驗加權方法(EW)。下面運用2007年廣東城鎮住戶調查資料對這兩種方法進行比較驗證。數據來源可參閱王克林等和劉建平(2010)的研究。
由表1可見,不同估計方法的估計結果差異很大。首先,從整體上看,所有的可靠性估計值(ρj)均高于0.90,說明樣本均值對總體均值的估計是可靠的。其次,從估計效果來看,經驗加權方法(EW)的估計效果要優于多階模型(MLM)的估計效果。EW方法估計誤差率的均值為0.16%,遠低于MLM估計的2.00%。MLM估計結果中誤差率超過5.0%的地區有五個;而EW估計結果中誤差率除了14號地區為1.64%外,其余地區誤差率均低于1%。另外,EW估計誤差率的方差為0.5443,遠低于MLM估計的3.7978。由此可見,EW估計誤差率不僅低,而且穩定。
最后,再從小樣本的估計結果看,EW對小樣本的估計效果要遠遠優于MLM估計。EW估計中,樣本量為50的地區估計誤差合計為1.51%,遠低于MLM估計的24.46%。MLM估計中誤差率超過5%的五個樣本單元中,有四個來自小樣本;而EW估計中誤差率超過1%的樣本單元僅有一個,也來自小樣本。這說明EM估計方法更適合存在無回答時小樣本層的估計。這里,不妨稍微討論一下為什么EW估計的效果會是最好的。從式(6)可見,對應于的權數ρj實際上是與的可靠性成比例的。如果β0j的估計值方差較小,說明β0j圍繞總體均值估計值的波動程度較小,此時β0j的估計就會更多地被“拉向”總均值的估計,即這就是EW方法也被稱為條件收縮估計的原因。因為可靠性ρj的估計值與層樣本量nj呈正相關。因此,當樣本量較小時,利用整個樣本進行的參數估計值(總均值的估計)在EW估計中就占有較大比重。也就是說,EW估計在層樣本數稀少時“借助”了全部樣本的信息而MLM估計僅依靠層內稀有數據的信息。這就是為什么EM估計方法相對于MLM方法更適合存在無回答時小樣本層的估計的原因。

表1 多階模型(MLM)估計結果與經驗加權法(EW)估計結果的比較
[1]王克林,劉建平.調查員誤差的計量模型與測度方法[J].統計與決策,2009,(10).
[2]趙雪慧.域估計與方法研究[D].北京:中國人民大學,2005.
[3]馮士雍,倪加勛,鄒國華.抽樣調查理論與方法[M].北京:中國統計出版社,1997.
[4]王濟川等.多層統計分析模型——方法與應用[M].北京:高等教育出版社,2008.
[5]Goldstein.Multilevel Statistics Models[EB/OL].1996.http://www.soziologie.uni-halle.de/langer/multilevel/books/goldstein.pdf.
[6]Lindley,D.V.,Smith,A.EM.Bayes Estimates for the Linear Model[J].Journal of the Royal Statistical Society,Series B,1972,34.
[7]Raudenbush,S.W.,Bryk,A.S.Hierarchical Linear Models:Applications and Data Analysis Methods (2ndEdition)[M].Newbury Park,CA:Sage,2002.