[摘要]在調查問卷中設置“開放題”其實是把定量調查變為定性調查,而這兩種資料如何共同使用,學術界尚未解決這一問題。我們無法使用“開放題”來進行社會學調查所要求的“假設—檢驗”操作,而且“開放題”等于問卷設計者的無原則放權,很難保證調查的質量。即使在封閉式問卷的備選答案中,也應該慎用“其他”這個選項(半開放題),因為它不僅會增加大量的缺失值,而且實際上用處很有限。筆者最后推論:在調查問卷中不應該設置任何一種直接詢問“原因”的提問,因為誰都無法涵蓋任何一個現象的所有原因。
[關鍵詞]社會調查方法;定量研究;問卷設計;開放題;調查操作化
[中圖分類號]C91-03
[文獻標識碼]A
[文章編號]1000-4769(2008)03-0081-05
在調查問卷中設置無備選答案的“開放題”,由被調查者自由回答,調查員記錄,這是我國社會調查中常用的方法。但筆者認為這是一種出于對問卷調查的性質缺乏了解而產生的失誤。
一、筆者的主要理由
第一,調查的主體被倒置。
“開放題”與“封閉題”絕對不僅僅是題型的差異,而是調查的方法論的根本不同,涉及到這樣一個問題:在一個調查的過程中,究竟誰是主體?誰聽誰說?
所有的封閉題都是以研究者為主體的,是研究者在說,被訪者在聽。這樣的調查,其實就是研究者首先拿出自己對于某個問題的一套看法,然后看看被訪者同意其中的哪一個;也就是研究者主動輸出,被訪者被動反應。這是沿用自然科學的方法,用研究者自己預設出來的尺度來衡量現實生活,就像用尺子量布一樣。從這個意義來說,所謂的問卷調查其實就是“測量生活”,是“客觀的”與“科學的”。
開放題在性質上與定性訪談的區別不大。所有的開放題都是僅僅提出問題,沒有備選答案,要求被訪者無拘無束地充分發表自己的看法,研究者僅僅是如實記錄而已。這樣,被訪者就成為主體了,是被訪者在說,研究者在聽;是被訪者主動輸出,研究者被動反應。這是“主體建構視角”的一種表現,是“讓生活告訴我們”的思路。這樣的調查其實是沿用藝術的方法,當然是“非科學的”(并不是不科學,更不是反科學)。
上述對立,非同小可,涉及到最根本的認識論爭論:究竟誰是第一性的?封閉題其實是“科學主義”的典型反映,而開放題則是后現代主義思潮的標志之一。但是,至少在目前的國際學術界,關于兩者如何結合甚至能否結合的討論,尚不足以給我們提供任何一種可操作的解決辦法,因此在問卷調查中這兩者不應該同時使用。
第二,由于開放題無法“預設答案”,也無法“強制選擇”,因此也就無法進行假設與檢驗的設計,無法運用于社會學的調查。
“相關假設”是社會學問卷設計的靈魂,而任何相關假設只有在預知所有可能的調查結果的前提之下,才可能提出與設置。這個“預知的可能結果”就是封閉題里面的有限的備選答案。如果調查的結果超出了備選答案,那么并不能檢驗這個假設是否正確,只能證明它本身不成立,證明研究者的設計失誤了。
例如在我們的調查實踐里,我們假設“愛情程度”與“性生活滿意度”相關,前者的備選答案是從“完全不愛”到“非常相愛”;后者的選項中從“非常不滿意”到“非常滿意”。這是封閉題,因此很容易統計分析出二者是否相關。封閉題其實就是我們已經預設了答案,被訪者無論如何也逃不出我們的“陷阱”;或者說,我們拒不采信被訪者的任何其他回答。只有在這樣的前提條件下,我們的相關假設才是可以成立的,也就當然是可以統計分析的。
可是,如果把這兩個提問設計為開放題,沒有了“圈套”,那么就有可能出現這樣的回答:在愛情程度上是“既愛又恨”,在性生活頻率上是“時而滿意,時而厭惡”。這樣的評價在日常生活中屢見不鮮,人數不少。可是我們卻從來也沒有假設過“既愛又恨”與“時而滿意,時而厭惡”之間究竟可能是什么關系,那么我們還應不應該來統計這樣回答的這兩個問題之間的關系呢?即使強制統計了,又能檢驗什么呢?因此我們只能說,我們原來的那個假設,僅僅在封閉題中才能夠成立。在開放題里就不成立。
極端地說(以期引起討論),從任何兩個開放題的回答中都無法提出任何對于雙方關系的相關假設,除非把原始的回答設法轉化為類似封閉題的備選答案的量化數據。可是,且不說這樣可以不可以,早知今日,何必當初,為什么原來還要設置開放題呢?若說開放題還有一些定性調查的意味,那我們不如直接去做純粹的定性調查。
封閉題是削足適履,就是用研究者自己的框框來套社會,就是強制被訪者在給定的范圍之內進行有限的選擇。封閉題就是社會學定量研究的望遠鏡或顯微鏡,不但是“眼睛”(研究者)唯一可以借助的測量工具,而且是“心靈”(假設—檢驗設置)的唯一載體。尤其是,僅僅是因為它像望遠鏡或顯微鏡的焦距與視界那樣預選了社會而且封閉了該預選,我們才能夠使用它。
第三,開放題最終還是要轉化為封閉題的選項,因此是多此一舉。
無論開放題所獲得的回答多么豐富多彩,由于問卷中的所有其他提問都是封閉題,所以我們就不得不把開放題的內容轉化為封閉題,才能進行相關分析。且不說這種轉化其實是很大程度上的信息扭曲,就算可以做到,如果一個被訪者在開放題里僅僅回答20個字,那么1000個樣本就會有兩萬字的文字記載;我們最后把這兩萬字的資料又變成不超過10個選項(在相關分析中最好不超過5個),這豈不是自己折騰自己?還不如一開始就把這些選項設置好,除非是由于沒有做過試調查而設計不出來。
當然,試調查也并不是萬能的,但凡是封閉題,或多或少都會冒著設計失誤的風險。這是問卷調查的無奈,我們所說的僅僅是:這種無奈其實無法靠設置開放題來解決。
也許有人認為,開放題可以“摟草打兔子”地順便獲得一些定性訪談資料。但是這首先是把試調查(預調查)給混進來了,只能說明自己的準備不足,根本就不應該倉促上馬。其次,定性調查對于調查者的許多獨特要求是問卷調查員所達不到的,反而會分散問卷調查員的精力。二者混同,只能把兩者的質量一起降低。
第四,開放題是研究者的無原則放權,因此無法保證調查的高質量。
在日常生活中,無論針對什么問題,大概從來沒有一個人會像我們所設計的封閉題的備選答案那樣來自主地表述。在問卷調查中也是如此,因此調查執行者往往必須在提出問題之后,馬上就宣讀備選答案,然后再急不可待地宣布“紀律”:只允許在這里面選擇一個答案。否則,被訪者可能就會開始天南海北地自主表述了。
可是,這不僅是必須的而且是有效的,有利于保證質量。由于有備選答案的制約,雙方都無法“離題萬里”,因此只要調查執行者認真,那么被訪者的選擇就會被忠實地記錄下來,就會成為足夠可靠的原始信息。
開放題則恰恰相反。無論研究者怎樣進行精心設計,只要不是自己親自去操作調查,那么就等于讓別人去啟發、引導、控制與記錄被訪者的所有表述:就是問卷設計者把自己的學術權力授給了那些很可能不足以承擔這個工作的調查員。讓他們替你做了第一道篩選。這樣獲得的資料,嚴謹的研究者恐怕是不敢貿然使用的。尤其要命的是,即使研究者明知道其中存在誤差,也沒有辦法進行檢驗,更無法修正。
在我們所了解到的一些調查中,有的研究者干脆讓調查員當場把被訪者的表述“擇其要”地記錄下來。其實,與其如此,還不如自己一開始就設計出封閉題來,反而更加可靠一些。
二、慎用“其他”選項——半開放題討論
首先需要說明,任何提問都必須設置至少三個選項:(此題)不適用、不知道、不回答。這些都不屬于我們下面要討論的“其他”。因為前三者都是因無法回答也無法記錄實際內容,與現有的備選答案都是不同質的;可是“其他”卻被作為同質的回答列入備選答案而且必須作為實際內容予以記錄。
半開放題是很多人經常采用的,其典型形式就是在備選答案中有一個“其他”的選項,有的研究者還專門寫上“請詳細記錄”這一類的字眼。一般來說,這樣做是為了涵蓋所有的可能的回答,但是它的失誤也恰恰在這里。
第一,“其他”的應用很有限。
這個選項很難運用于“等級測定”的各種提問之中,例如從“很差”到“很好”這樣的提問,就很難加進去一個“其他”的選項。
第二,“其他”必須確保是小概率。
它往往是在調查各種“事實”的時候才使用,是為了涵蓋某些我們在設計問卷的時候還不知道其存在的情況。例如在我們的性調查里,在考察人們的居住環境的時候就會提問:“現在,您自己住在什么樣的地方?”備選答案是:“1、集體宿舍、合租房、工作場所,等等;2、自己一個人單獨居住;3、住在自己的父、母、子女的家里;4、住在岳父母、公婆的家里;5、住在自己的小家(只有愛人或者孩子);6、住在自己的小家里。但還有其他親屬;7、其他情況。”
在這個設計里,“其他”就是為了“查漏補遺”。據我們所知,其中可能包括孫子女與祖父母的跨代共同居住、兩個陌生人的合租或合住甚至群租、寄宿在非直系親屬的人家里等等。
可是,若“其他”的被選擇概率稍大,整個提問就可以說作廢了。如果從嚴要求,若回答“其他”的被訪者超過10%。這個變量就很難再進行相關統計分析了,即使是分布統計與百分數統計也很勉強,大概只有絕對數統計還有些意義。
這是因為,如果我們沒有詳細記錄下“其他”的具體內容,那么其實就是不知道它是什么。這就等于是被訪者拒答,等于是缺失值,在做相關分析的時候不得不刪除,在做分布分析或者百分比分析的時候也缺乏實際意義。關于缺失值的統計處理方法,已經有很多學者予以討論,但是筆者在這里討論的是:我們何必讓“其他”選項來增加缺失值呢?
所以說,如果我們要在問卷中設置“其他”這個選項,那么我們一定要有充足的文獻依據或者生活知識,堅信它的被選擇率不會超過10%,最好不超過5%。可是,這是有風險的、難于控制的,因此我們建議最好不設置“其他”。
第三,“其他”實際上是亡羊補牢。
研究者往往是因為在試調查(預調查)中沒有獲得充分的認識,甚至沒有進行過試調查,因此在設計問卷的時候拿不準,無法窮盡所有的可能回答,就不得不設置一個“其他”選項,用半開放題來解決。這等于在正式調查里補充進行試調查,然后希望在事后的統計中加以彌補。
與其這樣,還不如把試調查做得更加全面深入一點,做得規模稍微大一點,使你的正式問卷更加符合實際情況。也就是說,為了慎用“其他”這個選擇,我們唯一可以推薦的方法就是擴大與強化試調查(預調查),在其中盡可能多地了解到所詢問的情況的多種可能性,然后在正式調查的問卷中用明確的備選答案盡量涵蓋之。
第四,“其他”的編碼很有風險。
如果是當場編碼的,就變成設計者無限賦權給調查員,由他來決定每個編碼之下的具體內容究竟是什么。其中的風險不在于調查員的水平高低,而在于每個調查員在編碼時的具體操作基本上無法統一起來。這不僅會削弱數據的可比性,而且“假數真算”的可能性也極大地提高了。
如果是事后編碼,不讓調查員當場編碼,而是研究者拿回原始記錄來進行編碼,其風險往往更大一些。這基本上是閉門造車。如果我們既沒有見過這個人,也不知道現場的情境,不了解前因后果,就把人家的彌散式的回答內容給編碼了,那就與修改數據差不多了。
第五,“其他”永遠還需要一個“其他”。
從方法論的層次來看,所有的封閉題都意味著:問卷設計者人為地、硬性地排除了被訪者出現其他任何表述的可能性,他說什么也不會被記錄下來。可是“其他”這個選項卻必須是不管被訪者說什么都要記錄下來。雖然我們可以忠實地詳細地做到這一點,但是我們所記錄下來的具體情況很可能千奇百怪,因此只要其中有一種情況是我們無法歸類的,那么我們就不得不再次設置一個“其他”。
第六,“其他”其實就是不要“其他”。
嚴格來說,對于“其他”的編碼是越多越好,因為對于一個記錄主體表述的資料來說,編碼的種類越多才越能少損失信息。可是我們所設計的另外的提問卻基本上是封閉題,而它的備選答案卻恰恰是較少為宜。這樣一來,我們在進行相關分析的時候,不得不把可能有數十種之多的原編碼再次抽象為很少幾種。其實際效果。就是舍棄了“其他”這個選項中很可能占大多數的“其他情況”。
第七,“其他”的真正用途。
當然。“其他”選項也還是有價值的。但不是在問卷設計方面,而是在調查的操作過程中,通過設置“其他”可以幫助我們避免作假或者避免被訪者的信息失真。例如總會有些被訪者覺得,我們所設置的所有備選答案都不符合自己的意思,可是他又只能在這個范圍之內選擇其中的一個。結果他就很可能勉強地選擇,甚至可能亂答一通。如果我們設置了一個“其他”,那么他就可以選擇這個了。不過,這種“其他”必須注明:這是被訪者的“其他選擇”,而不是被訪者真的有“其他情況”。因此,我們不建議非熟練的研究者使用這種方法。
三、啟示:操作決定質量
此處關于開放題的論述可以提示我們:在設計問卷的時候,我們就必須考慮到這個問卷的具體實施方案,尤其是我們準備使用什么樣的調查員、用什么樣具體的方法來進行調查,因為調查的質量實際上掌握在他們的手中。
絕對地來說,如果具體操作的調查員是新手(包括低年級的大學生),那么問卷中一定不要設置任何形式的開放題或者“其他”選項。因為這樣做,所獲得的信息會很嚴重地失真,等到數據拿上來,問卷設計者就連修正的可能性都幾乎沒有。如此,我們為什么要自己折磨自己呢?
四、推論:嚴格限用“原因提問”
為了引起討論,我們很極端地說,在問卷調查中,不是需要不需要、應該不應該的問題。而是根本就不可以直接用任何一種形式的提問去調查任何現象的任何原因。
這僅僅是因為,如果我們去調查任何一個現象的原因,那么無論我們多么高明或者多么努力,我們所設計出來的備選答案都不可能達到封閉題最起碼的四條要求:界定、歸類、涵蓋、互斥。
為什么說得這么斬釘截鐵?僅僅是因為任何一種現象只要是人類活動的結果,那么它的原因就必定是霧狀的。我們無法知道原因有多少個。這不是因為數不過來,而是因為就像我們無法把霧切成塊一樣,我們也不可能把原因人為地進行歸類;結果也就無法計數,也就根本不存在究竟有幾個原因的問題。這樣一來,我們怎么可能設計出既不知道內容又不知道個數的備選答案來呢?
在這方面,我們有過教訓。在1997年之前對于大學生的問卷調查中,我們曾經設計過這樣一個提問:
(如果被訪者沒有發生過人際性行為,那么)您為什么沒有進一步做下去?(請填寫選中的答案的序號)第一位重要的原因是:……;第二位的原因是……。1、怕對方拒絕;2、怕別人非議;3、怕影響自己的前途;4、怕學校處分我;5、怕影響對方的前途;6、做下去就不道德;7、不愿勉強對方;8、沒有合適的機會;9、違背家庭的期望;10、沒條件;11、怕懷孕;12、怕失貞;13、對方不答應;14、我沒有進一步做的欲望;15、感情還沒到應有地步;16、其他(寫出)。我們的這個提問,全方位地失誤了。
首先,我們怎么能夠界定什么叫原因,什么不叫原因呢?
在日常生活中,我們經常說別人:“你說的那個不叫理由。”這就是說,雖然他自己說那是個原因,可我們卻不承認。那么我們在設計問卷的時候,是不是凡是我們不承認的原因,就統統不列入備選答案呢?我們又根據什么來決定承認或者不承認呢?在上面的例子里,如果有的大學生說:“我沒有做愛,是因為印度洋發生了大海嘯。”那么筆者是不是需要設置一個“胡說八道”的備選答案讓他來回答呢?
其次,我們究竟根據什么,事先就設計出原因的分類呢?
在上面的例子里,筆者當年覺得自己設計的分類已經非常精致了,但是一位女同學回答說:“我不是‘怕影響自己的前途’(選項3),而是怕影響自己未來的婚姻。”筆者說:“婚姻也是一種前途啊。”但是她堅決不同意,說那是兩碼事。結果只好把她的回答歸人“其他”。這就是說,我們事先根本不可能知道我們設計出來的分類是不是符合生活實踐,只好強迫被調查者往我們的“陷阱”里鉆。如果人家不愿意鉆,我們就只好把她“開除”,拒絕了她所提供的信息。
第三,我們能夠做到“涵蓋”嗎?
筆者當年以為我們已經涵蓋了所有的原因。可是,我們居然漏掉了一個常見的原因:“我不做下去,是因為我怕被對方纏住。”這個失誤不是學問不深或者工作不努力的問題,而是因為“涵益”本身就有些像是永恒之夢。大千世界,無奇不有,任憑你是久經考驗的大專家,也只能是把自己認為最普遍的原因給羅列出來,其他的一概不問。可是,這究竟是在收集客觀世界的客觀信息,還是在按照自己的尺子去剪裁生活?
當然。我們有技術手段,可以設置一個“其他原因”就一勞永逸了。可是,在問卷調查中,“其他”必須是小概率發生的,否則就是雜音,是干擾,常常是統計不下去的罪魁禍首。那么,我們事先怎么知道“其他”以外的那些原因就一定不是大概率的呢?或者說,如果我們能夠事先就知道,那為什么還要去調查呢?
第四,在上面的例子里,筆者當年確實認為已經做到了各種備選答案的互相排斥、非此即彼。可是調查結果卻顯示出:幾乎是任何兩個原因,都有人回答說:兩者同時都有,并列第一,根本排不出順序。還有人添加了第三個與第四個原因,但是也堅持說全都是并列的。
看到這樣的結果。筆者捫心自問:我們就能夠把自己做任何事情的原因給排出一二三嗎?這些原因真的不可能是“半斤對八兩”嗎?于是筆者知道了自己傻。
絕對地說到底,所謂的“原因調查”其實就是削足適履,用我們的框框去套生活,就是“假數真算”,人為制造統計結果。與其讓這樣的調查結果來混淆視聽,還不如禁止直接詢問原因。
當然,筆者主張要禁止的僅僅是直接詢問原因。在假設—檢驗的設計中。卻是可以詢問原因的,因為我們并不是要查明這些原因究竟是什么,而是事先已經假設了這些原因可能對我們所設置的目標變量發揮作用。也就是說,我們可以調查那些已經假設出相關關系的原因。
但是在這樣的設計中,我們必須注意三點:
首先,如果是為了檢驗相關假設而去詢問原因,那么問卷中的提問就不能是“都有下列哪些原因”,而應該是“有沒有這個原因”。例如,女性中存在著回避夫妻性生活的現象。如果直接去詢問其原因,就必然設計出一大堆可能的原因,造成我們前面所說的那種失誤。但是在假設一檢驗的設計中,筆者已經假設:害怕懷孕可能促使女性主動放棄自己的部分性權利。筆者所關心的是這樣一個命題是否成立,而不是要去了解女性為什么會回避性生活。因此筆者在兩次性調查中的提問就變成:“有些女人,因為害怕自己懷孕,不大愿意過性生活。您自己在最近的12個月里。是不是曾經有過這種情況呢?”備選答案:1、經常有;2、偶爾;3、沒有。
其次,我們必須充分地意識到,這樣的提問無論得到什么樣的結果,都絕不能用來解釋“女性回避夫妻性生活”這個現象,不能說“害怕自己懷孕”是該現象的原因之一,因為“由于害怕懷孕而回避性生活”這個命題僅僅是筆者自己的假設,不是調查結果,筆者也沒有真的去詢問“女性回避夫妻性生活”的原因究竟是什么。
第三,這樣的問卷設計存在小概率的風險。因為“由于害怕懷孕而回避性生活”這個命題是事先假設的,如果在實際生活中很少有人是這樣。那么筆者的檢驗很可能就做不下去了。
說到最后,可能有人問:如果我非要調查“原因”不可。那我就沒辦法啦?筆者的回答是:為什么非要在問卷調查這一棵樹上吊死呢?定性調查更加海闊天空啊。
責任編輯:何 頻