尤眾喜
摘要:該文主要著眼于大規模調查項目的規劃、管理以及安全方面的議題。包括調查的技術支持方式,以及網絡調查項目的規劃與人員的協調。從基本的技術到調查管理系統,到對調查的分組管理,再到調查現場的應急處置方案,最后是數據安全議題。
關鍵詞:網絡調查;技術支持;調查管理系統
● 引言
網絡調查在社會科學研究中已經成為很重要的數據收集手段[1],但包括教育研究在內的社會科學領域,許多的研究人員還不太了解網絡調查的具體情況,使得他們遺憾地錯過了這種獲取數據的有力手段。當然也有許多研究者,雖然愿意使用但由于無法獲得合適的技術支持而不能使用這種手段。本文主要介紹如何規劃和管理較大規模的網絡調查項目。筆者寫作本文的初衷是總結本次調查活動中技術支持方面的經驗和教訓,以資其他相關機構、組織及個人參考使用。
無論以何種手段進行調查,其目的都是收集數據。考慮到調查手段的成本和效益,相比于其他調查手段,基于網絡的調查具有明顯的優勢,而且通過網絡問卷收集的數據同樣有效和可靠。[2]由于整個社會的發展進步,遍及全國的寬帶網絡的逐漸普及,各行各業信息化水平的不斷提高[3],筆者開始認真考慮是否采用網絡展開全國范圍內的問卷調查,綜合考慮成本與效益以及基礎設施的保障,本次調查最終以網絡為主要媒介傳送、呈現和回收問卷。
● 網絡調查的規劃
調查的規劃與組織是課題組的職責,但技術支持方必須去了解這些并從技術的角度提出意見和建議供課題組考慮。大規模調查的事先規劃是以后調查活動順利開展的制度保障,事實證明,對調查手段的熟悉程度制約著規劃的質量。
網絡調查既得益于技術又受制于技術,因此在規劃大規模網絡調查時要認真考慮技術因素的這種矛盾性。規劃要充分考慮:①技術手段的復雜性和脆弱性。②更多的工作在信息技術場景中進行。這里主要討論技術支持方面的基本措施。
1.獲取技術支持
對于網絡調查,涉及的技術因素比較多,一些研究者要么由于對技術手段比較陌生而忽視了這樣一個可選的手段,要么在使用時并不能充分了解這種手段的優勢在哪里。還有更多的研究者注意到了這種手段,也了解它的優勢,但又不知道如何獲取這方面的支持。取得技術支持的方式大致有三種:①購買專業調查網站的服務。②與技術支持單位(或個人)合作。[4]③自主解決。這里最可行的是第一種和第二種,第三種顯然可行性不高。如果一開始就決定要長期地和系列地搞調查;或者課題組想自己掌握所有數據,控制整個調查的過程(或者其他特殊的要求),則可以考慮要么長期給予技術支持,要么自主開發(或購買)這樣的系統。
2.分解任務
大規模的調查活動必須要分解任務,否則無法實施。可按照地域、受訪單或者受訪者群體位等原則分解任務。
3.編制技術指南
在調查開始之前編制好一份“技術支持指南”,確保參與調查的相關人員有一份詳細的技術指導書面資料。這份指南可以包含在課題組的工作手冊中,也可單獨提供。為便于課題組與合作單位用好網絡調查手段,這份指南需要對一些基本要求和操作步驟加以說明。
4.使用操作代碼
使用操作代碼(Token)會增加一些工作量,但其作用很顯著,應根據調查的具體情況決定是否使用操作代碼。全部的操作代碼及其使用情況保存在服務器上。操作代碼的兩個主要作用是:①受訪者只有通過他持有的操作代碼才能參與調查,一個代碼對應一份問卷。②使用操作代碼可使受訪者斷續地完成一份問卷,如在不同的時間和地點完成一份冗長的問卷。
5.人員協調與現場管理
組織一次集中填答并不容易,課題組要與受訪單位協調好時間、場地和調查對象,還要考慮技術支持等要素。一般有三方面的人員參與集中填答的調查活動:現場的受訪者、現場的組織與聯絡人員及遠程技術支持人員,后兩者的任務就是保障前者在預定的時間和地點順利完成問卷的填答。技術支持人員應該在集中填答開始前登錄調查系統進行檢查,調查開始后要及時向現場反饋進展情況。課題組在現場的人員也要直接、即時地與技術支持人員聯系,雙方密切合作確保調查順利完成。分散的受訪者可以自主選擇合適的時間和地點分散填答。對于他們,既無法巡視和督促,也難于在完成問卷后發放紀念品,因此需要采用一些其他的手段來輔助進行。
● 網絡調查的管理
1.網絡問卷系統的管理
調查管理系統是網絡調查的信息樞紐,由它管理著調查的數據收集,包括從問卷的設計發布直至所需數據全部收集完畢為止這個期間的各項核心信息。通過設定配額(Quotas),可以自動終止已獲取了預期數量的問卷的調查。時間窗口的作用是使得調查只在時間窗口內進行。通過這種簡單的時效控制使調查自動地在指定的時間開始和結束,時間窗口未開放或者關閉后都不能再參與調查。
設置操作碼則使得只有那些知道操作代碼(Token)的人才能參與調查(每份問卷都有一個唯一的代碼,也就是不同的人持有不同的代碼),也可通過操作代碼獲悉具體受訪者完成問卷的情況。本次調查按照實際情況被分解為若干次互不影響的獨立調查分組進行。為了不使所有的調查數據都混在一起,能夠清楚地知道哪些數據來自哪一次調查,使調查者能獨立管理每次調查,筆者對問卷進行了復制,復制的每一份問卷就是一個分組。
2.分組管理調查對象
將所有的受訪人員按照實際情況和具體需要進行分組,是做好大規模網絡調查的基本保障。假如不對大規模調查進行分組,就很難對調查過程施以控制,因而也很難對調查過程進行評價。不分組也使一個調查任務過于龐大而讓人不知該從哪里開始。通過分組可將一次大的調查分解為若干次小的調查,這使調查者可以仔細研究和分析調查過程中出現的各種問題,給調查過程的管理和評價帶來了很多方便。
3.應急處置方案endprint
這里討論的應急方案針對的是集中填答問卷的情形。通過網絡進行遠程調查,對基礎設施的要求比較高。而往往越先進復雜的手段越脆弱,計算機網絡可能是最脆弱的基礎設施之一。因此,進行遠距離的網絡調查時不可預知的因素很多,調查者無法解決基礎設施故障這一類問題。但可以提前準備一套應急預案,筆者的具體措施是將便攜式服務器帶到調查現場,在網絡有故障或者遠程服務器不可訪問時直接將便攜服務器接入本地局域網,通知現場人員從新的網絡地址進入。可以設想一種最壞的情況,如大面積停電或網絡中斷(雖然本次調查中沒有遇到)。這時可拿出事先預備好的紙質問卷,仍然可以保證調查的完成。
4.與技術支持人員的溝通
課題組不一定了解相關的技術,技術支持人員也不一定了解課題組的特定需求。顯而易見,如果雙方沒有好的溝通就會使得調查既不能充分發揮網絡和計算機在技術上的優勢,也不能完全展現課題組的意圖。為了避免此類情況發生,調查者首先應讓技術人員盡早參與到課題組的討論中,同時技術人員也應該積極發表意見和建議。在調查進行的過程中,技術支持人員要及時將服務器上的調查進展信息和發現的問題告知課題組,課題組也要及時地了解調查進展和收集到的數據的狀況。總的原則是雙方都應主動向對方咨詢或講解相關信息。
● 數據安全
網絡調查系統的管理者有兩項重要的職責:①保護數據的安全。數據來之不易,特別是對原始數據必須牢靠地加以保護。對每一次完成的調查,應及時地將其數據歸檔并備份保存。②保持數據的完整統一。電子信息來無蹤去無影,面對一次龐大而復雜的調查,應避免因規劃和管理不善而丟失數據或者造成混亂。
1.中途修改問卷
只要簡單地在服務器上修改就能夠很容易地更新問卷而不必重新印刷問卷,這是網絡調查手段的一個優勢。修改正在運行的問卷,必須注意到修改后的問卷結構或內容已發生了變化,特別是在結構上的變動。因此,調查者在修改前已經收集到的數據將不能夠與修訂后的問卷相匹配,會給數據的錄入、統計帶來麻煩。這些需要調查者在匯總數據時單獨加以處理,應特別予以留意。
2.記錄調查信息
由于調查是分組開展的,因此應建立調查信息表,嚴格記錄調查的分組情況和其他的所有重要信息(包括問卷的編號、問卷的類型、開始時間、結束時間、地點或單位名稱、聯絡人、受訪者人數、有效問卷的數量及未完成問卷的數量),這張表是保證調查數據完整統一的依據。另外,調查者還應將維護和管理調查系統的過程記錄下來,同時也應把調查過程中的一些主要的進展信息定期地向課題組發布簡報。
3.備份和集中存放數據
服務器上的數據庫內存儲著有關調查問卷的所有重要信息,其中最重要的是問卷本身和收集的數據。為了保險起見可對數據庫進行備份。第一種備份方式是定時自動備份,如設置服務器每天凌晨自動備份數據庫。第二種備份方式是手動備份,即不定時地手工操作備份。自動備份可使損失局限在一天以內,但是每天采集進來的數據量可能差異非常大。所以在完成一次集中填答后,就應該馬上備份數據。如果使用了不止一臺服務器,或者啟用了應急方案,則回收的數據有可能分散在不同的服務器上。因此,調查者必須將分散于不同服務器上的同一次調查數據合并起來。
4.未完成的問卷
在問卷填答過程中受訪者若中途放棄就會形成未完成的問卷。即便是在所有受訪者都完成問卷的時候還會產生未完成的問卷。必須注意的是有一些未完成問卷是由無關人員提交的,如課題組/技術支持等人員做測試,或者完全是由一些偶然撞上的人出于好奇而隨便填答,然后放棄而產生的。
● 結論與討論
從調查的結果來看,由于問卷的設計發布與數據收集高度定制化,也由于組織協調得力,因而調查過程始終高度可控,所以問卷回收及數據匯總工作完成得比較好。課題組按照自己的調查方案將大規模的調查分解為若干小的調查。這些小的分組調查可以逐個進行,也可幾個同時進行,依課題組的人力和計劃而定。這樣的分組雖然會提高管理的靈活性但也會增加管理的復雜性。分組時還須考慮調查是有組織的集中填答或者是自主分散填答。這兩種分組在管理上是不同的,一定程度上也增加了管理的復雜性。
服務器是數據采集的中心節點,在服務器上采用什么樣的調查系統,由什么樣的人來維護和管理,決定著數據收集環節的成效。課題組在當地開展調查時要有應急方案。數據是寶貴的,對系統的各種操作應慎之又慎,多用戶的系統要控制好權限。技術支持人員應該編制一份任務總表,記錄各項任務的具體信息和狀態,、課題組的各種要求等。操作代碼唯一地對應著一份具體的問卷。如果是匿名調查,就要確保不能從問卷反查到那位受訪者。
需要強調的是,本文采用的數據和經驗基于一次大范圍的有上萬人參與的教育調查活動,討論的內容主要局限在技術支持方面。從普遍意義上講,筆者在本文討論的這種技術支持模式比較適合大型(系列)的調查研究項目。
參考文獻:
[1]V. Vehovar,K. Lozar Manfreda,Nigel Fielding,Raymound M. Lee, Grant Blank.The SAGE Handbook of Online Research Methods [M].London: SAGE,2008:177—194.
[2]Victoria Klug.Cooking Appliance Use in California Homes Data Collected From a Web-Based Survey[R].Lawrence Berkeley National Laboratory, 2012.
[3]宋周鶯,劉衛東.中國信息化發展進程及其時空格局分析[J].地理科學.2013(03).
[4]Kristin Lovejoy, Susan L. Handy, Cliff Contreras. Results of the 2008-09 Campus Travel Survey[R].Institute of Transportation Studies, University of California, Davis, 2009.endprint