李佳圣
(浙江工業(yè)大學計算機科學與技術學院,浙江 杭州 310023)
民意調查,是通過科學嚴謹?shù)恼{查和分析方法,了解民眾的生存生活生產狀態(tài),反映民眾對政府、企業(yè)、群體以及個人等的測評程度,調查內容涉及政治、經濟、社會、文化、環(huán)境、百姓生活等各個方面。
近年來,國家統(tǒng)計局、各省市區(qū)統(tǒng)計局和部分市縣統(tǒng)計局相繼建立了民意調查機構,配置計算機輔助電話調查系統(tǒng)(簡稱CATI系統(tǒng))。本文通過對浙江省統(tǒng)計局民意調查機構的調查分析,就民意調查數(shù)據處理流程和質量控制問題作一探討。
浙江省統(tǒng)計局民意調查機構成立于2008年,建立了64個調查席位的CATI系統(tǒng),開通“12340”民意調查熱線。民意調查的成功開展,得益于數(shù)據處理流程和質量的有效控制。流程大致分為數(shù)據抽樣、數(shù)據采集、數(shù)據審核、數(shù)據分析和數(shù)據應用等五個方面。其中,數(shù)據抽樣、數(shù)據采集和數(shù)據審核由CATI系統(tǒng)完成,數(shù)據的分析和應用采用SPSS軟件系統(tǒng)(統(tǒng)計產品與服務解決方案)完成。
CATI系統(tǒng)不同于一般的電話調查,它在專門的中央機房統(tǒng)一完成,調查前先將調查問卷編輯在程序內,由計算機從號碼庫中按隨機方式或者PPS(按規(guī)模大小成比例的概率抽樣)方式抽取電話號碼,訪問員戴上耳機,坐在計算機屏幕前,按照屏幕上指示的調查內容對被訪者進行訪問,訪問結束后,管理人員還可以通過錄音回放功能對成功樣本進行審核。CATI系統(tǒng)在數(shù)據處理上,包括以下流程:
1.樣本管理。電話抽樣,家庭成員抽樣,隨機電話生成(系統(tǒng)自動剔除空號、傳真電話),有多種抽樣方式可供選擇。
2.問卷的生成和管理。各種類型的訪問題目均可實現(xiàn),并可做到題目和選項的隨機和輪換。
3.自動撥號或手動撥號。撥打電話可選擇電腦自動撥號或手動撥號,系統(tǒng)自動記錄每次撥打的情況,并可設定撥電話的次數(shù)。
4.預約訪問自動提醒、自動回訪。對于預約回訪的問卷,系統(tǒng)會自動跳到上次預約時訪問到的最后一道題目,并提醒訪問員繼續(xù)之后的題目的訪問。
5.工作狀況監(jiān)控。配額自動控制,完成情況實時監(jiān)視,技術報告即時生成。
6.數(shù)據錄音。可對訪問過程進行全程錄音或部分題目錄音,將訪問錄音以數(shù)字化的方式存儲在電腦硬盤上,也可根據客戶的要求,刻錄在光盤上,方便客戶的查聽。
7.現(xiàn)場監(jiān)控(監(jiān)聽、監(jiān)視)。督導通過工作站監(jiān)控各個訪問員的訪問情況,并可即時給訪問員發(fā)布信息或提示。
8.開放題編輯。可在訪問時即時編輯,也可在訪問后編輯;在訪問后編輯時可收聽該題的錄音,確保不會輸錯。
9.錄音收聽復核。錄音、題目及選項一一對應,可全程收聽錄音也可設定只收聽部分題目的錄音,使復核工作更加有效。
基于上述數(shù)據處理流程控制,通過實踐,浙江省統(tǒng)計局CATI系統(tǒng)具有以下優(yōu)點:一是樣本分布均勻。它使樣本抽樣不再受到地理的限制,可以覆蓋到全省各市、縣(區(qū))的鄉(xiāng)鎮(zhèn)、農村。同時樣本的選取嚴格按抽樣理論由計算機系統(tǒng)完成,避免人為因素。二是調查周期短。CATI調查中心只設立一個,通過中央機房即可通過電話對全省各階層人群進行調查訪問。三是調查更科學。高度智能化,可以使人腦很難完成的復雜訪問變得簡單易行。四是調查結果代表性強。用電話向被調查者進行訪問,不會給受訪者造成生活、安全等方面的太大的影響。五是抗干擾能力強。對一些敏感話題,電話調查可以使被訪者不容易產生心理障礙。
調查數(shù)據由CATI系統(tǒng)完成抽樣、采集和審核后,將被導入SPSS軟件系統(tǒng)進行數(shù)據分析和應用。調查數(shù)據分析應用SPSS軟件,主要特點:(1)操作簡便:除了數(shù)據錄入及部分命令程序等少數(shù)輸入工作需要鍵盤鍵入外,大多數(shù)操作可通過鼠標拖曳、點擊“菜單”、“按鈕”和“對話框”來完成。(2)編程方便:對于常見的統(tǒng)計方法,SPSS的命令語句、子命令及選擇項的選擇絕大部分由“對話框”的操作完成。(3)多項功能:具有完整的數(shù)據輸入、編輯、統(tǒng)計分析、報表、圖形制作等功能。比如數(shù)據的探索性分析、統(tǒng)計描述、列聯(lián)表分析、二維相關、偏相關、方差分析、非參數(shù)檢驗、多元回歸、生存分析、協(xié)方差分析、判別分析、因子分析、聚類分析、非線性回歸、Logistic回歸等。(4)數(shù)據接口:能夠讀取及輸出多種格式的文件。比如由dBASE、FoxBASE、FoxPRO產生的*.dbf文件,文本編輯器軟件生成的ASCⅡ數(shù)據文件,Excel的*.xls文件等均可轉換成可供分析的SPSS數(shù)據文件。能夠把SPSS的圖形轉換為7種圖形文件。結果可保存為*.txt及html格式的文件。(5)模塊組合:SPSS for Windows軟件分為若干功能模塊。可以根據分析需要和計算機的實際配置情況靈活選擇。
目前,浙江省統(tǒng)計局民意調查中用到的SPSS處理模塊主要有三項:一是數(shù)據管理模塊,主要用于調查數(shù)據的導入,整理和存儲。調查數(shù)據一般以數(shù)據表格形式保存在SPSS軟件中。二是結果分析模塊,一般用于分析調查數(shù)據,主要用到描述統(tǒng)計中的頻率分析、交叉分析、統(tǒng)計圖表分析和均值比較分析等內容。三是統(tǒng)計建模,主要用于實現(xiàn)復雜抽樣的設計方案,以及對相應的數(shù)據進行描述。
民意調查的數(shù)據質量控制,應當把握四個環(huán)節(jié):
1.訪問員管理。目前從各大專院校招聘普通話標準、做事認真的大學生擔任訪問員。在訪問員管理庫中,每個訪問員都有一個編號及進入訪問系統(tǒng)的密碼,這樣可以確保資料的安全,同時記錄訪問員開始工作時間、簽退時間及訪問員工作績效、所撥打每份問卷的開始時間和結束時間等。
2.現(xiàn)場督導。后臺配備監(jiān)控(監(jiān)聽、監(jiān)視)及錄音系統(tǒng),服務器可以隨時提供整個調查的進展,以及每個訪問員完成工作的具體情況。主機可隨時切換畫面,監(jiān)看、監(jiān)聽、錄音每個工作站的工作情況。在不打擾訪問員的情況下,由督導通過計算機鍵入文字信息,提醒訪問員訪問過程中注意的問題如語速、開放題沒有充分追問等。自動控制配額,如服務器上自動顯示配額的執(zhí)行情況,訪問員根據屏幕上的提示,篩選符合條件的被訪對象。訪問過程全程錄音,便于事后核查。安排督導現(xiàn)場巡視,每10名訪問員配備1名巡視督導。
3.事后審查。為了確保數(shù)據整體質量,減少調查過程中的誤差,中心還將隨機抽檢30%的調查錄音進行審核,確保調查數(shù)據的真實、準確。
4.樣本量確定。樣本量就是樣本所包含的單位個數(shù)。樣本量的大小直接影響抽樣誤差、調查的費用、調查所需的時間、調查員的數(shù)量以及其他一些重要的現(xiàn)場操作的限制條件。因此,需從三個方面對樣本量的大小進行科學地權衡和確定。(1)從抽樣推斷的可靠程度。要求推斷的可靠程度越高,概率度的數(shù)值越大,抽樣單位數(shù)也就要求多些;反之,則可少一些。(2)從總體標志變異程度。方差大,需要多抽一些樣本;方差小,可少抽一些。(3)從被訪者的回答率。調查的回答率是用收到的有效問卷數(shù)與計劃樣本量的比來表示。為了達到估計要求的精度,需要根據預計的回答率來調整樣本量的大小。
浙江省統(tǒng)計局民意調查機構經過五年多的探索和實踐,社會影響不斷擴大,有效搭建了政府與百姓之間的溝通新渠道。但是,隨著經濟社會發(fā)展和公民意識增強,政府和民眾對民意調查的需求越來越大,因此需不斷提升民意調查數(shù)據處理能力和質量控制水平。
1.建立民意調查數(shù)據倉庫。2008年至今,浙江省統(tǒng)計局民意調查機構共組織實施了185項社情民意調查項目,獲取成功樣本量1031522個。面對這么多的調查項目和大量第一手調查資料(數(shù)據、錄音等),而且有的調查是連續(xù)性調查,現(xiàn)有數(shù)據存貯及處理模式,在查詢的方便程度上、在數(shù)據的對比分析上還不能完全滿足各方面使用的需要。為此,迫切需要逐步建立起一個方便查詢、比較和分析的民意調查數(shù)據倉庫。
2.建立省級民意調查研究中心。目前,除了省統(tǒng)計局有民意調查機構,全省不少市縣統(tǒng)計局已建立CATI中心。作為省級民意調查機構可以將工作重點,由直接調查逐步轉向直接調查與研究指導并重,如對一些指標口徑、評價標準需要規(guī)范明確。加強對民意調查的市場需求、項目設立、項目接洽、調查宣傳、調查流程、質量控制、調查激勵、數(shù)據分析、調查指標等方面研究。
3.建立專職訪問員隊伍。一個成功的民意調查應該具備兩個前提條件,一是能通過電話將調查的問題明確地傳達給訪問者,二是設法取得對方的合作,使訪問者能給以真實、準確地回復。這就要求民意調查,必須建立一支專職的訪問員隊伍,特別是隨著業(yè)務量的擴大和調查頻率的增加,這個問題顯得越來越迫切。
4.建立CAPI系統(tǒng)(計算機輔助人員訪問系統(tǒng))。在使用CATI系統(tǒng)的同時,可考慮建立CAPI系統(tǒng)。CAPI系統(tǒng)是一種新的人員面對面訪問方式,是讓訪問員攜帶筆記型計算機(notebook)或是PDA,而在筆記型計算機中輸入計算機輔助人員訪問系統(tǒng)CAPI,訪問員在進行訪問時即可利用CAPI直接將問卷顯示于計算機屏幕上,可依著計算機屏幕上的問題進行訪問工作,并且將受訪者回答的答案直接輸入計算機中;若是受訪者不愿通過訪問員回答的話,亦可由受訪者直接將答案輸入計算機中以保障受訪者的隱私,如此不僅可提高訪問的有效性,更可以提高受訪者回答問卷的意愿。