摘要:社會科學必須以主體的身份,與統計學展開世界觀與方法論層次上的對話。筆者提出一些質疑與建議:隨機抽樣的終端應該是某個層次上的整體而不是單獨的個人;在末級抽樣層次上,應該追求信息的相對飽和而不是對于本層的代表性;應該是社會分層屬性的充分反映而不是“抽象的整體個人”的隨機分布;應該進行年齡分層抽樣來反映歷史時段的差異而不是僅僅對于現在時點的數據進行各種回顧分析;應該要求統計學為我們提供系統論指導下的隨機抽樣方法。筆者試圖以這些建議來化解隨機抽樣與非隨機抽樣之間的、定量調查與定性調查在抽樣問題上的那些虛構的矛盾,從而體現社會科學在更高層次上的整合性。
關鍵詞:隨機抽樣;社會調查;總體;代表性;抽樣框;抽樣單位
中圖分類號:C1
文獻標志碼:A
我國社會科學界的主流認識是:社會調查應該尋求對于總體的代表性,因此必須進行隨機抽樣(風笑天,1987,2005;袁方、林彬,1990;高嘉陵,1996;陶冶,1997;鄭杭生,2001;胡仕勇、葉海波,2003;李金昌,2004),而隨機抽樣的原則與方法則全部來自于統計學,社會科學的分析與探討僅限于如何更好地貫徹執行之(邊燕杰等,2001)。
筆者的問題是:這樣做就足夠了嗎?隨機抽樣并不是一個純技術手段,而是一種認識論與方法論。我們社會科學必須從這樣一個高度上對它進行哪些反思?促進它向什么方向發展?
一、抽樣終端:從“單獨個人”走向“社會基本單位”
目前中國幾乎所有社會調查中的隨機抽樣,其終端都是具體的個人,就是一個人一個人地抽取樣本。只要我們嚴格按照各種隨機抽樣方法操作,那么抽取的結果就足以代表某個總體;這一點在社會科學界從未遭到過質疑(陳膺強,1993;Joseph Maxwell,1996;Marshall,MN,1996;謝俊貴,2000;車文輝,2002;邊燕杰、李路路、蔡禾,2006)。
這一統計學論斷的背后的元假設是:每個個人都可以而且應該是孤獨地存在的,因此把其中的一些人分別地抽取出來之后,并不會影響他們的特質。這些“單獨的人”的相加結果仍然可以代表總體。這其實就是還原論(段培君,2002)的突出標本。
這當然符合以物為主要對象的統計學的道理與邏輯。可是,它符合我們社會科學主張的“人是處于環境、關系與歷史之中的”這個基本信念嗎?
因此,筆者的疑問是:如果明明是不可能孤獨存在的個人卻被當作單獨存在的物體來分別地抽取,那么無論抽樣的結果如何隨機,它所代表的,究竟是一個在生活中足夠真實的、只能存在于環境、關系與歷史之中的“社會人”的總體,還是一個具有無法測定的抽象性與虛擬性的“總人口”?即使我們不厭其煩地進行過無數次隨機抽樣調查之后,我們對于任何“社會人”的了解恐怕也不會增加。
進一步說,定量研究的社會科學家最應該關心的,恐怕既不是“總人口”,也不是“社會人”的總體,而是“中國社會”(劉少杰,1998;王小章,2002;駱玲,2005)。可是目前中國社會科學界通行的隨機抽樣的方法卻恰恰無法反映更無法代表這樣一個總體,這不僅僅是因為它的終端根本就不是任何一個層次上的“社會”,更是因為“生物人”的簡單相加無論如何也不是一個“社會”。
再進一步說,我們使用隨機抽樣調查數據進行相關分析所獲得的結果,恐怕既不是“社會之間的關系”,也不是“社會中人與人的關系”,而是“單獨人之間的關系”。
國內新近流行起來的多層次統計分析的技術(Goldstein H.1995;Judith D.&John B.,2003),雖然可以幫助我們更多地了解所處的環境對于個人行為的影響,但是它仍然把個人作為抽樣終端,所以仍然回答不了上述的疑問。換言之,如果不發展現有的隨機抽樣方法,那么再高級的統計技術也仍然無法彌補把“單獨個人”錯當作“社會中人”、把人的簡單相加錯當成“社會”這兩大失誤。
這其實是統計學的一個缺失,它還沒有給我們社會科學家提供一個適用的工具,來反映我們所需要的“社會中人”與“社會”的可量化的抽樣手段。但是反過來說,這也是因為我們社會科學的主流長期以來僅僅是跟著統計學的屁股跑,過于迷信隨機抽樣這個技術手段及其所謂的代表性,喪失了我們的主體性。結果,這兩個學科共同陷入了固步自封。
我們為什么不可以按照家庭、親友圈、社區、群體、階層、民族等等人類社會的其他單位來進行隨機抽樣呢?或者說,作為定量研究的社會科學家,我們認為究竟是什么樣的基本單位共同組成了“中國社會”這個總體呢?至少在社會科學界,筆者沒有看到“所有個人直接組成社會”這樣的論述,因此如果我們堅持隨機抽樣到個人,實在是沒有什么意思。
國際上有一些學者在調查家庭情況的時候,把家庭作為抽樣終端,然后抽取其中的一個人來表述整個家庭(而不是僅僅他自己)的情況。這并不僅僅是由于他們的研究目標是家庭,而在于他們落實了“家庭是社會的細胞”這一社會科學的經典命題。這啟發我們應該努力去尋找更加合適的終端以及尋找它們的隨機抽樣方法。
就此,筆者貿然提出自己的一些建議,哪怕目前還做不到操作化也罷。
我們可以考慮把隨機抽樣的終端從“個人”擴大到各種層次上的“社會基本單位”,對某些“社會的總體”進行測量。沿著這樣的視角,相信我們社會科學可以促進統計學去發展隨機抽樣的理論與方法,甚至社會科學自己領先一步也還是有可能的。
例如,如果我們希望調查“中國人的流動機制”這樣一個問題,那么我們完全可以把隨機抽樣的終端確定為全國的數百個社區,在每個社區里不再隨機抽取任何個人,也不再使用僅僅針對個人情況的問卷,而是使用專門為此而設計的問卷,找到數個“關鍵知情人”,請他們來講述作為一個整體的這個社區的人口流動的機制。
這樣,我們通過統計分析這數百個社區的資料,同樣可以得出具有代表性的量化認知。只不過這時候的總體已經不再是“中國總人口(所有個人)”,而是“中國的所有社區”。顯然,后一個總體更加符合我們社會科學的研究需要。
二、抽樣框:從追求代表性走向力爭信息無限豐富
眾所周知,中國目前現存的、足以據此劃分人群的統計資料非常缺乏,再加上許多人群都是分散的或者隱蔽的,因此也就無法得到他們的抽樣框,無法對他們進行隨機抽樣(邊燕杰等,2001)。結果,我們現在所說的任何一個范圍之內的隨機抽樣,實際上只不過是跟著現有的統計資料(例如人口普查數據)所擁有的那些指標走,其抽樣結果及其代表性都是人口學意義上的各式各樣的“總人口”,而不是社會學意義上的階層、群體、人群。
這種情況往往被視為隨機抽樣方法的局限性,甚至被反過來認為是社會學家的局限性,認為社會學家應該努力去建立這樣的按照人群來制定的抽樣框。
可是,除了特定的人口學指標所代表的“總人口”之外,我們真的能夠建立起對于任何一種符合社會科學定義的人群的抽樣框嗎?作為中國社會學的主要分支學科之一的社會分層研究,重要的產出之一其實就是要確定各種人群的分類指標,而這些新指標一定是各種現存的人口學資料里所沒有的。所以,如果我們希望使用隨機抽樣的方法來調查任何一種社會人群,那么在邏輯上就講不通。也就是說,雖然我們可以在人口學的抽樣框中使用隨機抽樣調查來確定我們希望了解的某個人群的分類標準是什么,卻無法根據這樣的分類標準去建立一個抽樣框再進行隨機抽樣去調查這個人群。例如,我們可以隨機抽樣地調查出“當今中國的工人”究竟應該如何劃分,卻無法隨機抽樣地去調查我們所劃分出來的“當今中國的工人”。
即使將來的總人口統計資料中的可分類指標無限地豐富了,也仍然解決不了這個邏輯上的矛盾。其中的道理只有一個:社會科學所要研究的一切目標人群,都不是天然地、客觀地存在著,也不是自發地、人口學意義上地產生出來,然后等著我們去調查。它們其實只不過是我們社會科學的研究成果所建構出來的。
因此,現有的統計資料其實根本無法給我們提供任何可用的抽樣框。或者反過來說,只要我們仍然沿用目前的隨機抽樣的方法,那么社會科學就會永遠跟著社會既有框架亦步亦趨。
最近在國際上出現而且正在引進中國的“被訪者推動抽樣方法”,就是試圖解決“在沒有抽樣框的情況下如果抽取有代表性的樣本”這個根本問題。
筆者不討論這個具體抽樣方法,而是從該方法中提出一個相反的思路:既然沒有抽樣框,那么我們社會科學家為什么一定要去追求“代表性”這個目標,而不是去尋求“某個研究對象的信息的無限豐富性”呢?也就是說,對于我們社會科學來說,最重要的認知是什么?僅僅是各種已知的情況在總體中究竟占了多大的比例,還是在總體中究竟存在著多少種與什么樣的未知情況?
前一個目標僅僅是“測量”,后一個目標卻是“發現”。筆者以為,“發現”才是社會科學家更擅長完成的任務,也是社會科學區別于統計學的安身立命之本。
如果這一命題足以成立,那么我們社會科學家也許就可以這樣做:在隨機抽樣的各個抽樣層次中,堅持尋找抽樣框,堅持使用隨機抽樣方法。但是在末端抽樣層次上,我們改為使用“信息飽和”的抽樣方法。
隨著電腦輔助調查方法的日臻成熟,使得這種抽樣方法的可操作性極大地提高了。
例如,在全國調查中,我們可以堅持隨機抽樣到社區,但是在社區內卻并不一定要隨機抽樣到個人,而是使用“最大差異”“抽樣法”來尋找被訪者。如是,我們在數百個社區里所獲得的信息,就足以匯總為具有全國地理分布代表性的“最豐富的信息”或者“相對飽和的信息”,而不僅僅是各種絕對數與比例。這,可能才是社會科學最需要的。
筆者在這里僅僅是提出一個新的思路,因此就不在操作的層次上展開了。
三、代表性:從“抽象人”走向“社會人”
“隨機抽樣足以代表總體”這個命題,其實是說,只有把所抽取的個人作為一個“抽象的人”(整體的計量單位)來統計的時候,這些人才能夠代表總體。反之,如果我們把這些人進行任何一種分類,那么對于其中任何一個分類的統計結果就不再具有代表性了(盧山,2004)。
例如“性別”這個變量,在我們的隨機抽樣樣本中與在中國總人口中,男女的比例都是大約各半。這當然足以代表中國總人口的狀況。但是分別來看,其中的那大約50%的男人或者女人,卻并不能代表中國所有的男人或者女人,因為我們并沒有把男人與女人分開,單獨地對每個性別進行隨機抽樣。
可是,社會科學里從來也不存在僅僅作為計量單位的“抽象的人”;從來都是把人進行各種分類之后再進行統計的。結果,當我們千辛萬苦地做完隨機抽樣,追求到一個“總體代表性”之后卻發現:不管我們說“男人是什么情況”還是“女人是什么情況”其實都是不具有代表性的,而且無論我們討論哪個社會分層的情況都是這樣的。
那我們為什么還要費勁兒地進行隨機抽樣呢?
尤其是,我們社會科學研究的本質特征不是單變量統計,而是進行相關分析。那么,我們怎么能夠認定我們所引入分析的那些相關變量中的各個分類也具有代表性呢?例如,我們的統計結果是“農民的性別與是否進城打工存在著相關關系”(男農民進城打工的更多),可是這一發現卻既不能代表“男農民”這個總體,也不能代表“進城打工者”這個總體。結果,我們根本就無法論證我們所發現的這種相關關系具有任何普適性。
統計學的解決方法是進行分層抽樣。在社會科學可操作的意義上,就是在末端抽樣層次(通常是社區)中,我們應該努力地按照社會學最珍視的“五朵金花”(性別、年齡、文化程度、職業、收入),盡可能多地進行分層抽樣而不是簡單隨機抽樣。
可是,且不談操作可能性,,問題在于,即使這樣分層抽樣出來的樣本,也仍然是僅僅在“抽象人”的意義上具有代表性,只不過所代表的是一個分層的總體而不是更上一級的總體。可是在分層樣本的任何行為或者事實的層次上,我們的調查結果仍然不具有代表性。也就是說,如果我們要調查的問題足夠深入,又追求統計結果的代表性,那么我們就必須不斷地分層下去,直到我們陷入“把調查目標作為自己的分層抽樣指標”這樣的泥坑為止。
總之,隨機抽樣其實只是使我們獲得了調查地點的地理分布的隨機性與該調查地點內的個人分布的隨機性;可是在該調查地點內,我們社會科學所最需要的、調查樣本的各種社會屬性的代表性,卻基本上無法獲得。
因此,社會科學應該擇其優而棄其劣。筆者提出一個新的思路,暫不做操作方法的展開。
在一個相當小的末級抽樣層次(例如萬人口的社區)中,如果僅僅抽取很少的人(例如有的全國調查在每個社區僅抽取10人),那么我們采用細致的分層比例分配抽樣法而不是隨機抽樣法,所損失的僅僅是“抽象人”對于末端抽樣層次的完全代表性,所獲得的卻是具有分層屬性的“社會人”的可保證數量,同時保留了調查地點的地理分布的隨機性。
當然,統計學肯定有無數方法來論證這種抽樣方法的“失”,但是社會科學也有充分的本學科理由來看重它的“得”。問題僅僅在于我們社會科學應該在這一點上與統計學展開充分對話,而不是削足適履。
四、代表什么?從“總體”走向“整體”
隨機抽樣的最大作用,就是足以代表某個總體,可是筆者對它的根本質疑也是由此而生。這可以分為兩個層次來看。
在技術的層次上,無論我們在上述的各個方面做出多么大的發展;我們所獲得的所謂“總體狀況”,其實還是把眾多的局部情況進行相加而得到的。一切隨機抽樣技術與加權技術都不能改變這一性質。
可是,系統論認為“整體大于部分之和”,而且整體與部分之間的關系并不是簡單相加,而是有機合成(貝塔朗菲,1987;黃欣榮,2004)。因此,如果說隨機抽樣的結果確實足以代表客觀事物的某個總體的狀況,那么把它運用于任何由人類及其活動所組成的總體的時候,難道就不需要任何修訂嗎?或者說,如果系統論已經對隨機抽樣的理論根基提出了挑戰,那么社會科學也就應該以反思與發展來代替對它的頂禮膜拜了。
進一步從認識論的層次來看,社會科學最需要研究的恐怕并不是任何一種統計學意義上的總體,而是某個作為社會存在的整體。這僅僅是因為前者往往并不真實存在而僅僅是研究者的建構產物,而后者卻是社會科學最主要的研究對象。
隨著“整體研究”的視角在我國得到越來越多的介紹與提倡(郇建立,2001;王寧,2002;劉中起、風笑天,2002;劉軍,2006;劉水林,2006;張天上,2006),我們社會科學不得不從系統論的高度來反思隨機抽樣。
社會科學家應該清醒地意識到:如果統計學暫時還不能給我們拿出一個系統論指導下的、足以反映整體狀況(而不僅僅是總體)的隨機抽樣方法來(楊心恒、顧金土,2000),那么我們也就不應該簡單地排斥各種非隨機抽樣方法。我們恰恰應該反過來好好研究一下:非隨機抽樣中究竟蘊含了一些什么值得發掘的內容?它的抽樣結果固然與“總體”無關,但是是否卻有可能與“整體”有關呢?
例如,在關于“典型抽樣”的爭論中,我們社會科學不應該再把隨機抽樣奉為唯一的判斷標準(王寧,2002),而是應該深入討論一下:如果“典型”確實是出于對“整體”的準確認識而選定的,那么它對于“整體”的表現性是否反而更強一些呢?這種“表現性”是否可以進一步建構為“對于整體(而不是總體)的質的代表性”呢?如果回答都是肯定的,那么我們就可以進一步研究典型抽樣與隨機抽樣之間的關系,無論是把兩者組合、結合、整合還是融合,或者論證出其不可能,都將是社會科學的原創性的貢獻。
五、小結與引申
本文不是為了顛覆,而是為了深入;說白了其實就是一句話:我們不是隨機抽樣方法的奴隸,而是它的園丁。
從技術的層次上說,社會科學應該創造出符合自己需要的新方法;從認識論的層次上,我們則應該把隨機抽樣灌輸給我們的還原論的世界觀與方法論,努力推向整體論與系統論的新階段。筆者的價值取向也已經在本文中表露無遺:社會科學應該作為主體,發出基于自己立場與利益的“非科學的”聲音。
操作的困難其實并不是一個真問題。如果我們具有了清晰的認識,那么總會朝著那個方向邁出一步的。
歸根結底,筆者所設想的一切技術上的發展方向,其實都潛含著這樣一個意思:
雖然統計學有充足的理由把隨機抽樣視為不可分割的一竿子插到底的連貫過程(李金昌,2004),但是社會科學也有充分的理由與需求把它分而治之。也就是說,以末段抽樣層次為界,前此的隨機抽樣保證了樣本的地理分布的隨機性,而此后的非隨機抽樣則保證了社會科學足以收集到自己所最需要的信息。這樣劃分的兩階段抽樣方法,不但不是水火不相容的,而且可能是最符合我們社會科學的理念與需求、最足以表
由此引申出筆者的另外一個方法論上的意思則是:所謂“定量調查就一定要隨機抽樣到底,定性調查就根本不需要隨機抽樣”其實是一個誤區,是把“要獲得什么性質的資料”與“該資料是否應該有代表性”這兩個問題給混淆起來了。
國內已有學者對后一個問題給予肯定的回答(王寧,2007),筆者則進一步認為,社會科學應該發展的方法是:定量調查舍棄末段抽樣層次的代表性,而定性調查則把自己所處的時空(而不是其調查內容)視為一個隨機抽樣的末段抽樣層次,依據上級層次的隨機抽樣結果來確定本調查的時空;即使僅有一個個案也是如此。這樣,無論定量調查還是定性調查,都足以獲得末段抽樣層次之上的某一級別的總體的代表性。這不僅可能是社會科學的特色,而且可以化解這方面的虛構的“定量與定性之爭”。
總之,如何發展隨機抽樣的探討,可以促進社會科學從技術層次與方法論的層次上,從“代表總體”提高到“表現整體”;更好地發揮自己在更高層次上對于抽樣方法的整合性。