魏慧楠
摘 要: 隱藏人口通常是像吸毒者、無家可歸者、同性戀以及藝術家這樣的特殊人群,在實際調查中,調查者幾乎無法直接接觸到這類人群。 隱藏人口的一大特性是缺乏抽樣框,通過傳統的抽樣方法幾乎不能找到隱藏人口的成員,因此需要引入非概率抽樣。目前,應用于隱藏人口研究的抽樣方法有滾雪球抽樣、同伴驅動抽樣、捕獲再捕獲抽樣等。
關鍵詞: 隱藏人口;滾雪球抽樣;同伴驅動抽樣;捕獲再捕獲抽樣
【中圖分類號】 D569 【文獻標識碼】 A 【文章編號】 2236-1879(2018)11-0038-01
一、研滾雪球抽樣在隱藏人口研究中的應用
滾雪球抽樣是一種非概率抽樣方法,先對總體中少數成員開始調查,再通過這些成員尋找他們所知道的符合要求的新的總體成員,樣本就這樣像滾雪球一般越來越大。滾雪球抽樣在1959年首次被Coleman提出,也被稱為鏈式推舉抽樣法,他認為傳統的調查研究方法忽視了社會結構和個體之間的聯系,并基于此提出了重視個體關系的滾雪球抽樣。
在國內,陳怡在廣西壯族自治區多個市縣設立HIV監測哨點,每年4月和7月由統一培訓的工作人員通過滾雪球抽樣及連續采樣(強戒所)的方法對吸毒人員開展面對面訪談,獲取一般人口學、行為學等信息,并采血3-5ml檢測 HIV、梅毒及丙型病毒性肝炎(丙肝),分析了2007-2012年廣西壯族自治區吸毒人群人類免疫缺陷病毒陽性率及相關危險行為的變化趨勢。
二、同伴驅動抽樣在隱藏人口研究中的應用
RDS方法是一種由滾雪球法改良而來的近似概率抽樣方法,是由調查對象從其社會網絡中招募同伴參加研究,并通過獲得的社會網絡特征對總體特征做出漸進無偏估計和推斷。RDS方法源自于傳統的滾雪球抽樣方法,不同于以往的方法,RDS采取雙重激勵機,即對象參加調查獲得初級激勵,作為因調查而耽誤的時間的補償;每介紹一個符合條件并完成調查的同伴,還會獲得一定的額外補償,即次級激勵。此外,每個前來領取次級獎勵的對象還將接受一個有關聯系卡接受者和拒絕者的問卷調查,以評估招募過程中存在的選擇和無應答偏倚。
RDS最早于1994年由Heckthom在美國康涅狄格州的IDU人群中對傳統的鏈式推舉法改良而來。目前,RDS已在包括中國在內的20多個國家、100余項有關HIV和其他生物或行為學研究中被應用。研究涉及的危險人群有靜脈注射吸毒人群、男同性戀人群、性工作者和有高危行為的異性戀男性。
李婧于2009年10月至2010年1月,在廣西壯族自治區柳州市女性性工作者(female sex worker,FSWs)人群中應用RDS方法,由7名種子開始,利用FSWs人群的社會網絡由同伴招募研究對象,共招募到583名合格的FSWs,而RDS發現了更為隱蔽的只通過電話招攬客人的FSWs。此外,鮑宇剛等在全國大中城市中按整群抽樣法抽取了14個城市,然后采用同伴推動抽樣法(RDS)征募調查對象,問卷設計參考國家艾滋病綜合監測調杏問卷,由經過培訓的調查員嚴格按操作規程在私密房間進行調查,共選取了6101例MSM進行問卷調查。運用RDSAT軟件、SPSS13.0對調查數據進行統計學分析,對男男性行為人群的艾滋病感染狀況及艾滋病知識、態度、行為進行了深入研究。
三、捕獲再捕獲抽樣在隱藏人口研究中的應用
捕獲再捕獲的思想源于對生物種群規模的估計。早在 1786 年,Laplace 就已使用捕獲再捕獲抽樣方法估計法國人口總數;1895 年,Petersen 使用捕獲再捕獲抽樣估計魚的總數;1930 年 Lincoln發展了 Petersen 的捕獲再捕獲抽樣估計量,即為Lincoln -Pete rsen 估計量(簡稱為 LP 估計量), 并較好估計了野鴨總數;由于LP估計量在特殊情況下無法滿足估計要求,Chapman對LP估計量進行了改進,提出了Chapman估計量。目前,在捕獲再捕獲抽樣的實際應用中,采用的捕獲再捕獲抽樣估計量主要有兩種:LP 估計量和 Chapman估計量;同時,還有很多學者根據實際需求對估計量進行了改進。
目前,捕獲再捕獲抽樣在隱藏人口的研究中得到了廣泛應用。
在國外,Brittain探討了捕獲再捕獲抽樣方法在人口規模的應用,運用兩個資源的注冊人口數據,根據捕獲再捕獲估計量對流行病人群總體規模進行了估計。Marinus提出的B圖采樣設計可以看做是一個多重捕獲再捕獲抽樣過程,對荷蘭烏特勒支地區的吸毒人員規模進行了估計。
在中國,張高輝等應用捕獲再捕獲方法評價了山東省居民 2012-2013 年死因登記漏報率水平。首先,采用分層整群隨機抽樣法,在山東省所有縣(市、區)按照 2012 年死因登記系統報告死亡率進行分層抽樣和簡單隨機抽樣,共抽取 10 個村(居委會)。然后,從以上地區所在公安、民政和村(居委會)搜集人口死亡情況,作為數據來源一;山東省居民 2012-2013 年死因登記系統已報告的死亡資料,作為數據來源二。最后,按照捕獲再捕獲原理,基于兩個數據來源,計算出死亡總數的 Chapman 估計量,進而得出漏報率。
參考文獻
[1] 李婧.《同伴推動抽樣法在性病艾滋病防治目標人群研究中的應用》[J].中國艾滋病性病.2009.
[2] 鮑宇剛.《我國14城市男男性行為人群艾滋病感染狀況及艾滋病知識、態度、行為研究》[J]. 中華預防醫學雜志.2009.
[3] 楊貴軍.《捕獲再捕獲抽樣估計量的模擬研究》[J]. 統計與信息論壇.2011.
[4] 寇慶河.《捕獲再捕獲法及其在流行病學研究中的應用》[J].中國衛生統計.2006.
[5] 李姚礦.《隱藏人口的抽樣方法綜述》[C].軟科學國際研討會. 2012.
[6] 張高輝.《應用捕獲再捕獲方法評估山東省死因登記漏報率水平》[J].中國慢性病預防與控制. 2015.
[7] 吳艾琳.《基于同志網站利用捕獲-再捕獲法對重慶市男男性接觸者人群規模估計的研究》[J].中國預防醫學雜志.2014.