摘 要:基于平衡半樣本的方差估計方法是應用在分層抽樣而又能提高效率的一種方法,本文將基于平衡半樣本的方差估計應用在Warner模型中,得到了的一個無偏估計量。
關鍵詞:方差估計平衡半樣本
中圖分類號:O212.4文獻標識碼:A文章編號:1674-098X(2011)05(a)-0096-01
1 引言
出于效率的考慮,調查設計者常常進行每層中僅取2個初級單位的分層。在這種情況下,僅僅有兩個獨立的隨機組(或重復或半樣本)可用于進行方差估計,所感興趣的總體參數的置信區間必然比希望的要寬。為了解決這一問題,若干技術被提出。折疊層方法(collapsed stratum method)的變形提供了忽略某些層的可能性,于是增加了可用的隨機組數[1,2]。然而,用這種方式估計方差,會出現偏倚。所提出的其他技術,包括刀切法(Jackknife)和半樣本重復(half-sample replication),目的是通過某種形式的“偽重復”(pseudoreplication)提高方差估計量的精度[3,4]。
2 放回簡單隨機抽樣
假定要從一個每層有2個初級單位的分層設計估計總體的敏感屬性所占的比例,這里每層所選取的單位組成一個放回簡單隨機樣本。在被抽取的初級單位中對敏感屬性所占比例進行估計,估計方法采用的是Warner模型。在各層中所有的初級單位中的相等,即
其中為樣本樣本群中被訪問者人數,為被訪問者中回答“是”的總數,由此我們可以得到是的無偏估計。
于是的無偏估計為,其中
,,
其中,而
這里算符表示對抽選中的初級單位為估計而得到的估計量求數學期望和方差;表示對初級單位進行放回簡單隨機抽樣而求數學期望和方差,則
由于各層中各初級單位相互獨立,所以
表示對層的初級單位的方差進行放回簡單隨機抽樣所求的樣本均值,則
由于是的無偏估計,所以
表示對層的初級單位的敏感屬性所占比例進行放回簡單隨機抽樣所求的樣本均值,所以
其中,進而
其中,定義
有,則我們有以下結論:
定理2.1:統計量是的一個無偏估計量。
證明:由前面所討論的結論可知
則有
。(證畢)
同樣,假定用不放回簡單隨機抽樣抽出個半樣本,并考慮其對應的方差估計量
由此,我們可以得到是的一個無偏估計量。現在我們只要求就可以了。通過前面的討論,只要個半樣本對所有都滿足性質,就會成立,也就是這組半樣本是平衡的,同樣我們還可以得到完全正交平衡,即與同時成立。
參考文獻
[1]Warner S L. Randomized response: a survey technique for eliminating evasive answer bias[J].American Statics Association,1965,60:63-69.
[2]Yan Zaizai, Nie Zankan. An Alternative Randomized Response Device[J].Applied Probability and Statistics ,2005,21(3):327-336.
[3]Kirk M.Wolte著,王吉利,李毅譯.Introduction To Variance Estimation[M].北京:中國統計出版社,1998.
[4]彭秀云,閆在在.敏感問題問卷技術設計[J].應用數學學報,2009,32(1):83-92.
[5]彭秀云,閆在在.一種隱含的隨機化回答技術[J].內蒙古大學學報(自然科學版),2009,40(3):264-270.
[6]馮士雍,施錫銓.抽樣調查——理論、方法與實踐[M].上海:上海科學技術出版社,1996.