999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

分層抽樣下的變體平行模型及其實證研究

2019-08-23 01:16:42宋穎瀟
稅務與經(jīng)濟 2019年4期
關鍵詞:模型

呂 恕,宋穎瀟

(電子科技大學 數(shù)學科學學院,四川 成都 611731)

一、引言

互聯(lián)網(wǎng)飛速發(fā)展的現(xiàn)代社會,充斥著復雜多變的信息,其中敏感性信息因涉及個人隱私,如吸毒、性取向等,其調(diào)查結果獲取的難度極大。針對敏感性問題調(diào)查發(fā)展起來的專業(yè)調(diào)查方法,主要有隨機化應答技術和非隨機化應答技術,這些專業(yè)調(diào)查方法確保了受訪者在調(diào)查中的匿名性,提高了敏感性問題調(diào)查結果的有效性。其中非隨機化應答技術不需要復雜的隨機化裝置,使調(diào)查更簡單便捷,還可與網(wǎng)絡調(diào)查相結合,這一特點打破了以往敏感問題專業(yè)調(diào)查技術只能面對面、一對一,調(diào)查結果回答率和真實回答率不高的缺點,擴大了調(diào)查范圍、降低了調(diào)查成本、提高了調(diào)查效率。但非隨機化應答技術尚處于發(fā)展中,其各個方面的研究都還不完善,實際應用也不夠廣泛,因此對非隨機化應答技術的研究還有待于進一步深化。

非隨機化應答技術是針對二項選擇屬性特征敏感問題的調(diào)查模型,即是否具有某種敏感特征。變體平行模型[1]是非隨機化應答技術中應用范圍最廣且最高效的模型,其既解決了三角模型和交叉模型[2]的局限問題——不能用于敏感問題中兩分類都敏感的情況(如吸毒三次以上和吸毒三次以下),也解決了平行模型[3]中受訪者非敏感性特征的比例不易得的問題(如喜歡吃辣的人群比例)。目前國內(nèi)外對于敏感問題調(diào)查中非隨機化應答技術的應用,大多限于小范圍特定群體小樣本的簡單隨機抽樣,即使遇到復雜樣本也只是利用簡單隨機抽樣下的非隨機化應答技術進行調(diào)查,導致調(diào)查結果出現(xiàn)較大誤差。[4]分層抽樣劃分了總體類別,增大了各個類別中樣本的共同性,抽取的樣本代表性更好,抽樣誤差較小,因此分層抽樣常常被用于樣本間差異較大或樣本較多的復雜情況。

本文將分層抽樣引進變體平行模型中,對分層抽樣下變體平行模型的敏感比例估計值、估計值方差和樣本量的確定做出了詳細推導。介紹了網(wǎng)絡調(diào)查及其數(shù)據(jù)誤差[5],分析了分層抽樣下變體平行模型與網(wǎng)絡調(diào)查結合的效果。利用新設計進行實證研究——吸毒人員復吸比例調(diào)查研究,使用蒙特卡羅方法模擬實際的調(diào)查過程。

二、變體平行模型介紹

變體平行模型的設計如下:令X=1表示具有敏感性特征的人的類別(吸毒),X=0表示不具有敏感性特征的人的類別(不吸毒)。引入兩個二分隨機變量Y和W,假設Y和W都是非敏感的且X、Y、W相互獨立,p=P(W=1)已知而q=P(Y=1)未知。例如,Y=1表示受訪者喜歡吃辣,Y=0表示受訪者不喜歡吃辣,W=1表示受訪者ID最后一位是奇數(shù),W=0表示受訪者ID最后一位是偶數(shù)。可以合理地認為p≈0.5,要求估計具有敏感性特征的人群比例πv=P(X=1)(下標v表示變體平行模型the variant of Parallel Model)。

受訪者被要求如實回答表1左側部分,并選擇自己對應情況的符號。

表1 變體平行模型設計及其對應概率

由表1知,當受訪者選擇“○”時,受訪者屬于{Y=0,W=0}這一子類;當受訪者選擇“△”時,受訪者屬于{X=0,W=1}這一子類;當受訪者選擇“□”時,受訪者屬于{Y=1,W=0}∪{X=1,W=1}這一子類。因為{X=0}、{Y=0}、{Y=1}、{W=0}、{W=1}均是非敏感的,所以{Y=0,W=0}、{X=0,W=1}和{Y=1,W=0}∪{X=1,W=1}這三個子類都是非敏感的,無論受訪者做出什么樣的選擇都是非敏感的,都不會被采訪者知道他的真實分類,即受訪者是否具有敏感性特征。

三、分層抽樣下的變體平行模型

分層抽樣的具體方法為:按總體各單位的顯著特征(如性別、年齡等)將總體分層;根據(jù)各層單位數(shù)、總體單位數(shù)和樣本容量,確定每一層的抽樣比例(抽樣比);依據(jù)抽樣比在每層以簡單隨機抽樣的方法抽取樣本;匯總每層抽樣結果,組成總體抽樣樣本。在分層時需做到使層內(nèi)各單位間的差異盡可能小,層間各單位間的差異盡可能大,層與層相互獨立,總體各單位在劃分時不重不漏。

設調(diào)查總體容量為N,將總體劃分為L層,第i層容量為Ni(i=1,2,…,L),分別在各層以簡單隨機抽樣的方法獨立抽樣,調(diào)查共抽取總樣本容量為n,第i層樣本容量為ni(i=1,2,…,L),對抽取的每個單位,采用非隨機化應答技術進行調(diào)查。

令πi表示第i層子總體中具有敏感性特征X的人群比例,qi表示第i層子總體中具有非敏感性特征Y的人群比例,pi表示第i層子總體中具有非敏感性特征W的人群比例。pi已知而qi未知。根據(jù)表1,設mi1、mi2、mi3分別表示第i層ni個子樣本中受訪者選擇“○”、“△”、“□”的人數(shù),λi1、λi2、λi3分別表示第i層ni個子樣本中受訪者選擇“○”、“△”、“□”的人群比例。

第i層子總體中:

由λi1=(1-qi)(1-pi),λi2=(1-πi)pi可得

調(diào)查總體中,πv的估計量為:

其中ωi=Ni/N為第i層的權重,即第i層的抽樣比例,∑ωi=1。

調(diào)查中預先給定一個精度α,

根據(jù)分層抽樣樣本量最優(yōu)分配原則可知,當且僅當

四、實證研究

網(wǎng)絡調(diào)查的誤差分為覆蓋誤差、抽樣誤差、無回答誤差和計量誤差,分層抽樣下的變體平行模型可以有效降低四類誤差,用于網(wǎng)絡調(diào)查兩分類均敏感的問題。本文實證研究主題為“吸毒人員復吸比例調(diào)查研究”,調(diào)查的目標人群是吸毒人員,以蒙特卡洛模擬的方式進行研究。吸毒人員分為被查獲一次且無戒毒史的偶吸人員和復吸(成癮)人員,復吸人員相比偶吸人員更難戒斷,同時男女在戒毒時產(chǎn)生的反應也有所不同,因此在戒毒方案的制定上要有所區(qū)分。

令X=1表示受訪者(吸毒人員)復吸,W=1表示受訪者編號ID尾數(shù)為偶數(shù),Y=1表示受訪者喜歡吃辣。則p=P(W=1)=0.5,q=P(Y=1)未知,求吸毒人員中復吸的人群比例π=P(X=1)的估計值。

首先將所有吸毒人員按性別分層,據(jù)《2015年中國毒品形勢報告》統(tǒng)計[6],截至2015年底,全國共有吸毒人員234.5萬(不含戒斷三年未發(fā)現(xiàn)復吸人數(shù)、死亡人數(shù)和離境人數(shù)),其中男性200.7萬名,女性33.8萬名,分別占85.6%和14.4%。設調(diào)查總體容量為N=5 000 000,男性層容量為Nm=4 280 000,層權重ωm=85.6%,女性層容量為Nf=720 000,層權重ωf=14.4%。令πm表示男性層中復吸人群比例,πf表示女性層中復吸人群比例,男性層和女性層中具有非敏感性特征W和Y的人群比例均與總體相同。

利用蒙特卡洛方法對男性層和女性層分別進行模擬,實現(xiàn)了變體平行模型的整個問卷調(diào)查過程,假設樣本量的設定是合理且有效的。在軟件中生成吸毒人員的信息矩陣,每個人的信息包括{X,Y,W},其中X、Y、W分別以一定的概率生成。據(jù)統(tǒng)計,截至2015年底,全國吸毒人員中偶吸人員106.9萬名,復吸人員127.6萬名,分別占45.6%和54.4%。因此在生成吸毒人員的信息矩陣時可將概率設定為:πs=P(X=1)=0.544,p=P(W=1)=0.5,其中s表示實際調(diào)查中敏感人群比重。

表2 分層抽樣下的變體平行模型

生成信息矩陣后,需要對信息矩陣進行篩選,按照表2分層抽樣下的變體平行模型選出符合條件的信息,即{X=0,W=1},得到受訪者中選擇“△”的人數(shù)。設mm、mf分別表示男性層和女性層中受訪者選擇 “△”的人數(shù),通過公式(1)、公式(2)計算可以得出實驗中男性層和女性層的敏感人群比例。

(1)

(2)

重復實驗100次,男性層和女性層的實驗結果分別如圖1、圖2所示。

圖1 男性層敏感人群比例重復實驗100次的結果

圖2 女性層敏感人群比例重復實驗100次的結果

再將重復100次實驗的男性層、女性層敏感人群比例代入計算公式(3),可以得到重復100次實驗情況下調(diào)查總體中敏感人群的比例,如圖3所示。

(3)

圖3 調(diào)查總體中敏感人群比例重復實驗100次的結果

由上述男性層、女性層和調(diào)查總體中的敏感人群比例圖可以看出,重復實驗100次,實驗結果總在預設值附近波動,因此蒙特卡洛模擬可以很好地實現(xiàn)敏感性問題調(diào)查的物理過程,且打破了抽樣調(diào)查在相同情況下只能進行一次有效調(diào)查的限制,得到了重復實驗100次的結果。

但是從圖中也可以看出,每個群體中波動的大小不同,分析男性層和女性層的敏感人群比例的方差可知,見公式(4)、公式(5),在設定的各層敏感人群比例與非敏感人群比例與總體保持一致的情況下,各層敏感人群比例的方差只與樣本量的大小有關,且兩者成反比。本實證研究中男性層的樣本量比女性層大,因此男性層敏感人群比例的方差比女性層小,很好地解釋了實驗結果中男性層波動更小的情形。

(4)

(5)

五、研究結論

通過上述分析可知,分層抽樣下的非隨機化應答技術應用范圍更廣、精度更高,相比簡單隨機抽樣下的非隨機化應答技術,更適用于調(diào)查較為復雜、單位間差異較大的總體。其與網(wǎng)絡調(diào)查相結合可以使得敏感性問題的調(diào)查變得更加便捷。分層抽樣下的變體平行模型需要注意以下三點:

3.各層樣本量分配比例的確定。每層在抽樣時的抽樣比例不能簡單地用層權來衡量,而應該根據(jù)分層抽樣樣本量最優(yōu)分配原則來確定。

實證研究中對于吸毒人員復吸比例的調(diào)查研究,成功地實現(xiàn)了相同條件下的重復實驗,實驗結果在真實值附近波動,模擬了敏感性問題調(diào)查的實際過程。該項實證有助于戒毒管理單位更加科學有效地幫助吸毒人員戒毒。本文對于變體平行模型的改進及其實證研究敏感性問題調(diào)查方法的進一步完善提供了可靠有效的理論參考和指導原則。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數(shù)模型及應用
p150Glued在帕金森病模型中的表達及分布
函數(shù)模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 国产91成人| 成人字幕网视频在线观看| 色综合综合网| 综合色婷婷| 欧美午夜在线播放| 中美日韩在线网免费毛片视频 | 亚卅精品无码久久毛片乌克兰| 成人一级免费视频| 欧美性爱精品一区二区三区| 亚洲中久无码永久在线观看软件 | 亚洲天堂网视频| 国产日本一线在线观看免费| 无码内射中文字幕岛国片| 国产成人亚洲综合a∨婷婷| 一本色道久久88亚洲综合| 午夜精品福利影院| 又爽又大又黄a级毛片在线视频| 亚洲国产成人久久77| 欧美亚洲香蕉| 无码日韩精品91超碰| 一级成人欧美一区在线观看| 亚洲国产中文欧美在线人成大黄瓜| 2021国产精品自拍| 亚洲成人黄色在线| 亚洲精品高清视频| 日本一本在线视频| 国产肉感大码AV无码| 真人高潮娇喘嗯啊在线观看| 午夜无码一区二区三区在线app| 国产成人亚洲欧美激情| 日韩欧美国产三级| 欧美va亚洲va香蕉在线| 中文字幕va| 99视频在线免费| 四虎综合网| 日韩小视频网站hq| 国产精品亚洲专区一区| 婷婷成人综合| 国产毛片高清一级国语 | 久久精品人人做人人综合试看| 日本爱爱精品一区二区| 91丝袜美腿高跟国产极品老师| 国产99视频精品免费视频7| 亚洲一区二区三区在线视频| 国产91色| 丰满的熟女一区二区三区l| 亚洲欧美另类中文字幕| 亚洲欧美综合在线观看| 亚洲日本韩在线观看| 色偷偷一区二区三区| 成人福利在线看| 亚洲中文字幕在线精品一区| 3p叠罗汉国产精品久久| 人妻中文字幕无码久久一区| 波多野结衣国产精品| 日本一本正道综合久久dvd| 亚洲AⅤ永久无码精品毛片| 77777亚洲午夜久久多人| 久久黄色影院| 亚洲av无码人妻| 亚洲成A人V欧美综合| 欧美日本在线播放| 大香网伊人久久综合网2020| jizz在线观看| 小说区 亚洲 自拍 另类| 精品视频免费在线| 又粗又硬又大又爽免费视频播放| 国产美女精品在线| 国产情侣一区二区三区| 国内精品免费| 老司机久久99久久精品播放 | 亚洲欧美另类久久久精品播放的| 亚洲乱码精品久久久久..| 一级一级特黄女人精品毛片| 久久综合色天堂av| 久久久久国产一级毛片高清板| 成人福利免费在线观看| 美美女高清毛片视频免费观看| 一级毛片免费不卡在线| h视频在线播放| 亚洲bt欧美bt精品| 激情成人综合网|