王菱紅
國總統大選,全美大部刮起一陣農村包圍城市的強勁旋風,將此前不被看好的特朗普送進白宮。這個結局出乎之前大多數人的預料。對大選結果,人們給出各式各樣的解讀。每個人的解讀,都帶著自己的認知模式,好比透過一個獨特的棱鏡看世界。
眾說紛紜中,有一種說法各方似乎都同意,即民調預測大失準星,沒能準確反映選情民意。更有人指責主流媒體偏袒希拉里一方,操縱民調數據,故意誤導民意。一時間,民調機構和預測專家們灰頭土臉,前幾天他們好像還捧著能看透未來的水晶球,現在卻仿佛變成了一群數據傻瓜,蹲在角落里反省。普林斯頓大學的華裔學者Sam Wang,選前通過數學模型,預計希拉里獲勝幾率高達99%,因為把話說得太滿,不得不兌現諾言,在CNN當眾吃了“蟲子”——雖然是富于營養的罐頭蟋蟀,但是那鏡頭,還是令吾心生戚戚。
評論看得多了,發現很多人似懂非懂,其實并不真正明白民調到底是怎么一回事,也沒有搞清楚民調機構(pollsters)、預測模型(forecasters)、媒體(media)與政治評論家(pundits)的角色與概念。
打個比方說吧,民調機構好比是采礦的,對民意采樣收集并做必要的數據處理;模型預測機構好比是做深加工的,把民調數據放入統計模型中進行分析,推算出讓人一目了然的大選獲勝幾率;媒體和政治觀察家們則好比包裝與分銷商,把民調支持率和獲勝幾率預測等拿去報道評論,為自己的判斷提供佐證;媒體受眾則是這些信息的消費者。在這次美國大選中,主流媒體確實表現出一邊倒的傾向性,民眾憑直覺就可以感受到偏頗,我覺得問題主要出在大眾傳播層面,并不意味著民調被有意操縱,預測是故意誤導。
美國有數百個大大小小的民調機構參與了從個別州到全國的民意調查,這些機構有些隸屬于各大媒體,有些由兩黨資助,也有很多是獨立研究機構,比如隸屬于大學的,或者從事市場調研的專業公司。做統計預測模型的機構專業性更強,數量也要少很多,有跟媒體掛鉤的,如《紐約時報》的UPSHOT、《赫廷頓郵報》的模型,也有獨立機構,如著名的538和前面提到的普林斯頓模型。認為他們都背棄了專業精神,故意誤導民眾,于情理于邏輯都難以說通。
在許許多多的反思中,我最關注的是538網站(http://fivethirtyeight.com/)的解釋,因為在這次美國總統大選期間,我一直跟蹤538的數據分析,對他們的預測模型更加熟悉一些。
538的創始人兼總編Nate Silver運用概率學中的貝葉斯決策理論(Bayesian Theorem),用數學方法對未知事件進行概率分析。和絕大部分政治、新聞專業出身的預測者不同,Silver預測選舉結果的基礎并不是傳統意義上的經驗與直覺,而是通過搜集整理大范圍的數據和各種層面的民意調查,通過數學算法得出直觀的大選勝率。在2008年美國總統大選中,Silver正確預測了49個州的結果;在2012年,他對美國50個州的預測又全部正確,因此聲譽鵲起,成為預測模型界首屈一指的“大咖”兼“網紅”。
這次美國總統大選,538在選舉日早晨給出的最后勝率預測是希拉里71.4%(vs.特朗普28.6%)。這個預測遠低于普林斯頓的99%,《赫廷頓郵報》的98%,羅斯柴爾德的89%,《紐約時報》的85%,或可稍微為538和Nate Silver挽回一點顏面,但他們畢竟還是站在了錯誤的一邊,只能算一份不及格的答卷。
坦率地說,我對Silver迄今為止給出的分析并不十分滿意。他提出了很多精當的見解,但更多的是在強調民調的問題和客觀不確定性,尚沒有深入反思自己的預測模型有什么大的漏洞,似乎還在努力維護自己的面子。
我認為至少有一點是值得挖掘的,即傳統的隨機抽樣民意調查方式在今天已經越來越困難(回答率低,隨機性差,代表性存疑),難以反映出人們未定的/變化的/隱藏的想法,建立在民調數據基礎上的預測模型也難免無用輸入無用輸出(garbage in, garbage out,計算機用語)。相反,很多真實的情緒想法卻彌漫在Twitter、Facebook、微信這樣的社交媒體中,那是真正的數據金礦,實在不能視而不見。對紛雜的社交媒體數據進行分析,如何識別信號與噪聲是更大的挑戰,還期待Silver和Sam Wang這樣的數據科學家能在這方面更有作為。
人們把民調數據或預測模型當成窺探未來的水晶球,實在是個不小的誤會??捎惺裁崔k法呢?人們總希望能提前預知未來,消除身在未知中的迷茫和困頓。
要真說起來呢,“預測帝”也不是沒有。先說遠的——早在1987年,普利策獎得主Garry Trudeau就在他的漫畫系列《Doonesbury》中,描繪特朗普要競選總統,可能那時候連特朗普本人都還沒生出過這個念頭吧。
再說近的——美國總統大選前的2016年11月3日,中國湖南長沙石燕湖,紅布鋪起一個總統預測臺,特朗普和希拉里的硬紙板畫像分列左右,兩人畫像前面都放著香蕉。一只名叫“哥大”的5歲猴子身穿印有“預測帝”字樣的黃馬褂,走上前去,經過深思熟慮,不但吃掉了特朗普身邊的香蕉,而且給了他一個熱烈的吻。
哈哈,玩笑歸玩笑,我給大家介紹一位真正的預測帝吧——Scott Adams,著名漫畫系列《Dilbert》的作者(奇怪,怎么又是個漫畫家)。我跟蹤Adams關于美國總統大選的博客近一年,他從2015年8月起,就預言特朗普將拿下共和黨內提名,并將一路贏得最后總統大選,而那時候剛剛宣布參選的特朗普還是很多人眼中的笑料。2016年3月,Adams又預言特朗普將會在總統選舉中大勝,而那時候特朗普還沒有拿到共和黨候選人提名。怎么樣,夠厲害吧!
更有意思的是,Adams聲稱自己對政治、經濟、移民等方針政策與影響之類的東西并不在行。
Adams對特朗普的預測乃是基于一條非常獨特的判斷,即特朗普是一個天才的說服大師,其異常出眾的說服力對其目標聽眾具有催眠般的控制和影響力。
Adams的說服力預測模型,好比他看待事物的獨特棱鏡。對這個棱鏡,我一直將信將疑,但他有幾個重要觀點還是令我印象深刻:
——聰明而充分了解各種信息的人們,幾乎在所有重大問題上都意見相左??梢姡阍俾斆?,擁有的信息再多,都不能讓你如希望的那樣準確把握現實。
——在真實的世界中,唯有情感才是重要的,因為情感驅動人們的行為。
——事實如何,并不影響人們的決策。人們首先形成決定,然后再挑選數據,為他們的非理性選擇尋找理由。如果你發現人們總是對你睿智的觀點不以為然,記住,那是因為他們也在你身上看到了同樣的非理性。
這些觀點,也許值得Nate Silver和Sam Wang等數據英雄們體會、借鑒。