李秀清


摘 要:文章選取2014年我國分地區出版物發行網點數量的數據,按照25%的經驗比例抽取了8個省市自治區作為樣本,分別運用簡單隨機抽樣、分層抽樣、PPS抽樣來估計2014年我國出版物發行網點總量。計算結果表明,PPS抽樣誤差率最小,估計精度最高,效果最好,簡單隨機抽樣次之,分層抽樣的誤差率最高,估計效果最差。
關鍵詞:出版物發行;簡單隨機抽樣;PPS 抽樣;分層抽樣;效果比較
本文根據我國2014年分地區出版物發行網點數量,應用三種不同的抽樣估計方法,估計我國2014年出版物發行網點的總數量,以期對我國出版物發行狀況有一個更客觀、合理的反映。
一、簡單隨機抽樣
簡單隨機抽樣又稱純隨機抽樣,即從總體N(31)中抽取n(8)個樣本單位時,總體中的每個單位具有相同的概率被抽中,也就是保證等概率。
(一)抽取原理。根據我國2014年各省市自治區出版物發行機構的數據,從31個總體中按照隨機原則抽取25%作為樣本,即下表所示的8個省市自治區。
(二)估計過程。文章的目的是用已抽取8個樣本地區的數據估計全國31個地區總的出版物發行網點數,則n=8,N=31。
即總體平均數的估計值:
點估計量:
估計方差:
總體總量的估計:
二、分層抽樣
分層抽樣是先將總體的單位按某種特征分為若干次級次級總體(層),然后再從每一層內進行單純隨機抽樣,組成一個樣本。可以提高總體指標估計的精確度。分組減小了各抽樣層變異性的影響,抽樣保證了所抽取的樣本具有足夠的代表性。
(一)抽樣方法及原理
將我國31個省按地域分為中部、西部、東部,分別為:
中部:山西,吉林,黑龍江,安徽,江西,河南,湖南,湖北。
東部:北京,天津,河北,遼寧,上海,江蘇,浙江,福建,廣東,山東,海南。
西部:四川,重慶,貴州,云南,西藏,陜西,甘肅,寧夏,青海,新疆,廣西,內蒙古。
按照等比例抽樣方法,從中部隨機抽取2個樣本,從西部和東部各隨機抽取3個樣本,樣本數據如表2所示:
(二)估計量
總體平均數的估計值:
三、PPS抽樣方法
(一)抽樣原理。PPS抽樣方法是指放回的按規模大小成比例的概率抽樣。它是一種使用輔助信息,從而使每個單位均有按其規模大小成比例的被抽中概率的一種抽樣方式。PPS是按概率比例抽樣,是指在多階段抽樣中,尤其在二階段抽樣中,初級抽樣單位被抽中的概率取決于其初級抽樣單位的規模大小,初級抽樣單位規模越大,被抽中的機率就越大;初級抽樣單位規模越小,被抽中的機率就越小。PPS抽樣就是將總體按一種準確的標準劃分出容量不等的具有相同標志的單位在總體中不同比率分配的樣本量進行的抽樣。
將我國2013年各省發行網點合計數進行升序排序后(從上至下依次為、 …)再累加并進行編碼(1~、~ … ~),結果如表3所示:
(二)估計量
1、樣本單位的抽取。本文采用規模累計等距抽樣的方法,從N(31)個總體中抽取其25%的樣本即n(8)個樣本。總體為我國分地區出版物發行網點的總數,由上表可知總體的全距為1722307,由可得組距為21538(172307/8),在1~21538中隨機抽取一個數字12306,在編碼中找其所屬范圍及對應的地區;在前一個隨機數的基礎上加組距21538再找其所屬范圍及對應省份;依次類推,抽取的樣本分別為山西、福建、遼寧、山東、上海、北京、浙江、江蘇。如表4所示:
2、估計量
根據公式 及 得:
字母含義: :2014年我國分地區出版物發行網點估計總量; :2013年我國各省出版物發行網點在全國發行網點中所占的比重;:估計的2014年我國各省出版物發行網點的方差
四、估計效果的比較
由表5可知,對我國出版物發行網點總量進行估計,得出PPS抽樣的估計精度最高,為97.3%;簡單隨機抽樣的次之,為77.27%;分層抽樣的估計精度最低,僅為51.86%。
參考文獻:
[1]王虎屏.新形勢下的城鄉出版物發行網點建設[A].新形勢下的城鄉出版物發行網點建設[C].2013:4.
[2]姚貞.出版物發行網點建設必須納入公共服務設施規劃[N].中國新聞出版報,2011-07-21(004).
[3]張玉.PPS抽樣方法在我國出口貿易預測中的應用[J].經濟研究導刊,2011(2):156-157.
[4]中華人民共和國國家統計局.中國統計年鑒—2015[M].北京:中國統計出版社,2015.