

美國歷史學家利希特曼使用蘇聯地震學家波洛克設計的預測地震的算法預測美國大選,從1984年到2016年的九次大選中,預測對了八次。他還用這個方法來預測美國的中期選舉,命中率也很高。遺憾的是,這個算法在地震預測中卻沒有取得同樣的成功。
南方周末特約撰稿 陳希
人們自古以來就對公共職位的選舉結果抱有極大的興趣。古羅馬凱撒在選舉大祭司的時候,已經負債累累,一旦失敗,鐵定破產。但是仍然有人愿意借大量資金給他。這些人可以說是最早的預測者和博彩者。中世紀的人們更青睞樞機主教們選舉教皇,在1503年就出現了關于教皇候選人的投注賠率。在近現代民族國家出現后,在人民主權原則下,選舉成為普遍的政治活動,也催生了民意調查這種預測技術。
有史料可查的第一次民意調查是1824年美國賓夕法尼亞州的一個報社做的欄目。該報在1824年7月對威爾明頓市的公民群體進行了調查,調查他們心目中最喜歡的總統。這個335人的民意調查顯示,安德魯·杰克遜以70%的優勢領先國務卿約翰·昆西·亞當斯(23%)。但是1824年的總統選舉結果是對這個預測的反諷:根據美國憲法第十二修正案,只有競選人贏得相對多數、且過半數的選舉人票才可以當選,當時四位候選人沒有一人票數過半,所以最終交付眾議院裁決,原本遙遙領先的杰克遜在眾議院投票環節慘敗給亞當斯。就是這么一個滿足讀者好奇心的欄目,持續到現在。
這種民意調查在1936年發生了巨大改變,一家默默無聞的輿論研究所成功預測了羅斯福的當選,橫掃當時流行的各家民意調查機構,其創始人喬治·蓋洛普將統計學方法引入民意調查,這個機構日后發展成了蓋洛普公司。隨著統計技術的發展,選舉數據變得越來越容易處理。選舉預測已經成為民意調查公司、新聞機構和博彩市場以及政治學研究的寵兒。
然而科學的方法還是經常會被復雜的現實打臉,美國1948年和2016年的總統選舉,英國1970年、1974年、1992年的大選,讓很多民意調查機構的專家大跌眼鏡。人們不禁要問,有沒有一種更加準確的預測方法呢?
美國美利堅大學的政治史教授艾倫·利希特曼(Allan Lichtman)和蘇聯科學院院士、數學地球物理學家弗拉基米爾·基里斯-波洛克(Vladimir Keilis-Borok,1921-2013)合作,將后者設計的地震預測算法加以改過,發展出一套總統選舉預測算法,由此衍生出“白宮鑰匙”(The Keys to the White House)系列叢書。從1984年至2016年,共舉行了九次美國總統選舉,兩人關于實際當選者的預測對了八次,準確率不可謂不高。惟一出錯的年份還是2000年,利希特曼預測戈爾能當選美國總統,結果戈爾也的確贏得了普選票,這次選舉后來被稱為“最難產的一次大選”,佛羅里達州的重新計票官司幾次打到最高法院,最后小布什贏得271張選舉人票,戈爾贏得266張選舉人票,一波三折,奈何!
歪打正著的波洛克
兩位學者,一位研究歷史,一位研究地震,可謂風馬牛不相及也,他們是如何走到一起的?
艾倫·利希特曼是華盛頓的美利堅大學政治史教授,曾擔任該校歷史系主任。他還做過前副總統戈爾和參議員愛德華·肯尼迪的顧問。
弗拉基米爾·基里斯-波洛克的來頭要大得多,他曾先后當選為美國人文與科學院(1969)、美國國家科學院(1971)、蘇聯科學院(后為俄羅斯科學院,1988)、英國皇家天文學會(1989)、奧地利科學院(1992)、歐洲學術院(1999)正式成員,還是一系列國際科學組織,如國際大地測量學與地球物理學聯合會(1987-1991)、國際地震學與地球內部物理學聯合會(1983-1987)、國際科學理事會(1988-1991)的領導人。
波洛克1921年7月31日出生于莫斯科一個猶太商人家庭。二戰中,他被派往蘇德戰爭前線當通信兵。這需要時刻冒著炮火保障通信線路暢通,無疑是一項非常危險的工作。幸運的是,他的文化水平較高,所以被送到烏拉爾山以東為國家尋找石油。在那里,實際勘探工作激發了他對地球物理學的興趣。戰爭結束后,他前往蘇聯科學院學習,于1948年獲得數學地球物理學博士學位。在20世紀60年代,波洛克研究地下核爆炸產生的地震波,并將它們與天然地震波進行比較,為1963年美蘇軍控談判提供了專業知識。大約在同一時期,他開始前往西方旅游,隨后在美國和意大利的大學擔任客座教授。到了20世紀80年代,他轉向了地震預測研究,并在莫斯科建立了“地震預測理論和數學地球物理學國際研究所”。
地震預測被公認為是地震學界的“圣杯”,很多科學家都無比向往,但是又覺得這是一個不可能的任務。波洛克則認為,基于最基本的因果關系的研究就可以找到答案。如果我們以一個對立狀態來觀察地震,那么就是“穩定-地震”,地震破壞現有地質狀態的穩定性,出現新的穩定。大地震發生之前會發生很多活躍的地質活動,從中總結出一些有指標性的事件,建立模型,然后就可以從指標性事件發生的頻率,來推斷下一場大地震發生的可能性。
早在1985年,波洛克就預測在美國加利福尼亞的圣安德烈亞斯斷層將發生地震。蘇聯當局非常認真地對待這個預測,在那年的日內瓦峰會上,蘇聯領導人戈爾巴喬夫特意向美國總統羅納德·里根提到了這一點。1989年10月17日,美國加利福尼亞洛馬·普雷塔(Loma Prieta)圣克魯斯山附近發生了一場里氏6.9級的大地震,造成63人死亡,3757人受傷,波洛克的預測似乎得到了證實。正好1989年棒球世界大賽就在加州奧克蘭的體育場舉行,大批記者把鏡頭轉向了災區,這場地震也成為美國第一次在全國電視臺直播的大地震。
波洛克1998年加入了加州大學洛杉磯分校。真正讓他在地震預測領域名聲大噪的,是他準確預測了2003年的加州圣西蒙地震和日本北海道地震,他因此上了很多報紙的頭條。但是隨后又遭遇了重大失敗。2004年他又預測了一次加州的地震。公共部門不敢怠慢,馬上發布緊急預告,要求居民準備物資和飲用水,這造成了民眾不同程度的恐慌。結果這次被證明是一次預測失誤。這似乎證明,地震預測的確是一個“不可能完成的任務”。
從地震預測到大選預測
波洛克的職業生涯中有個有趣的插曲,成就了大選預測。
1981年,利希特曼和波洛克恰好都在加州理工學院訪問。一次晚宴中,兩人被安排坐在了一起。波洛克提出兩人合作,利用他的地震預測方法來預測總統大選。利希特曼后來回憶,當時聽到這個創意時覺得很奇怪,但是很快就意識到:政壇也是會發生“地震”的,與地質活動“穩定-地震”的關系類似,“現任-挑戰”的關系時刻存在:現任政黨被挑戰,現任官員被挑戰,每一次挑戰的成功實現,也就是政壇的地震;同時,挑戰者也就變成了現任。
兩人的重大理論成果是1981年發表于《美國國家科學院院刊》第11期的論文:《美國總統選舉中的模式識別應用:整體社會、經濟和政治特征的作用,1860-1990》。其中的原理和分析比較復雜,這里簡單介紹一下他們的算法。在這篇文章里他們提出12個問題:
1.現任政黨的任期是否超過一個任期?
2.現任政黨獲得超過上次選舉投票數的50%嗎?
3.大選年期間是否有重大的第三黨活動?
4.現任政黨候選人的提名是否存在嚴重的競爭?
5.現任總統屬于現任政黨嗎?
6.選舉年是否經濟衰退且蕭條?
7.現任政府治下實際國民生產總值(GNP)的年人均增長率,是否等于或大于過去8年的平均水平,并且等于或大于1%?
8.現任總統是否對國家政策進行了重大改變?
9.現任政府治下,全國是否存在重大的社會動蕩?
10.現任政府是否因重大丑聞而受到負面影響?
11.現任政黨候選人是否具有卡里斯瑪氣質或者是民族英雄?
12.挑戰現任的政黨候選人是否具有卡里斯瑪氣質或者是民族英雄?
以上12個問題,回答“是”賦值為1,回答“否”賦值為0。兩人通過對1860年到1980年歷次大選的歷史數據進行梳理,分別給每個選舉年的12個問題賦值打分。
第一步,將所有選舉年份分為兩組,“現任勝利組”和“挑戰勝利組”。兩個組內,分別將每個問題歷年得分總數除以勝利總數。例如“挑戰勝利組”中在此期間勝利了13次,在第一個問題累計得了10,10除以13得到約0.769,這也就是“挑戰勝利組”中年均得到的賦值。
第二步,將“現任勝利組”和“挑戰勝利組”中12個問題年均得到的賦值進行比較,把比較的結果當作“核心值”。如果“挑戰勝利組”大于“現任勝利組”,那么“核心值”賦值為0,反之賦值為1。舉例說明,第一個問題的年均賦值,“挑戰勝利組”為0.769,“現任勝利組”為0.500,那么第一個問題的“核心值”就是0。
第三步,將特定年份的12個問題的賦值,與12個問題的“核心值”進行比較,等于“核心值”賦值0,反之賦值1。最后,將此年份12個問題與“核心值”比較后的得分進行求和,這個得分也就是通往白宮的鑰匙數量。
通過研究,兩人發現在既有的大選歷史數據中,最后得分大于5的,全是挑戰者獲勝,小于5的,全是現任者獲勝。等于5的情況下,挑戰者勝利1次,現任者勝利2次。通俗來說,如果挑戰者獲得5把鑰匙以上,那么白宮的大門就已經向他敞開了。雖然利希特曼在1990年出版的《總統之路的十三把鑰匙》一書中,將問題從12個增加到了13個,并且希望將此預測法更加簡化,核心的算法還是沒有改變。這種修改也引起質疑,特別是關于外交軍事的重大成功或失敗問題,缺乏客觀標準,容易受到預測者主觀感受的影響。例如,特朗普上臺后退出奧巴馬的標志性外交成果伊朗核協議,從一開始的評價就是兩極分化,很難評價。
無論如何,利希特曼用這個方法從1984年到2016年幾乎準確地預測了每一屆總統選舉,甚至是最難預測的2016年大選。該算法沒有對普選票獲勝者和選舉人票獲勝者分開預測。它只是預測現任政黨是否會保留白宮。從1984年至2016年,共舉行了九次美國總統選舉,利希特曼有八次對實際當選人的預測是準確的。
惟一美中不足的是2000年,利希特曼預測在任政黨候選人戈爾勝出。結果戈爾贏得了普選票,挑戰者黨候選人喬治·W。布什贏得了選舉人票。普選票中布什得票率為47.87%,戈爾為48.38%,但是最終布什得到271張選舉人票,勝過了戈爾的266票,當選了總統。
2016年,利希特曼成功預測了挑戰者唐納德·特朗普的勝利。在任政黨希拉里·克林頓贏得了普選票;特朗普贏得了選舉人票。2016年希拉里的普選票得票率為48.2%,遠遠超過特朗普的46.1%,但是特朗普贏得了更多的州,所以在選舉人票上以304票碾壓了希拉里的227票。閱讀《白宮鑰匙》系列叢書,不光是對美國政治生態能夠有較深的理解,更重要的是該書提供了一個方法論來預測選舉。
失之東隅,收之桑榆
與預測人類事務大獲成功相反,波洛克的地震預測卻難以保持成功。這也毫不奇怪,人類能觀察到的地質現象始終是有限的,世界上最深的科拉超深鉆孔也才12公里,還沒有達到平均地殼深度的一半。一些觸發大地震的關鍵性、指標性的地質活動,很有可能我們到現在都沒有觀察到,或者已有觀察卻低估了其重要性。在評估波洛克關于2004年加州地震的預測時,美國地質調查局(USGS)說,波洛克團隊的方法是合理的,但無法證明是有效的。加州地震預測評估委員會(CEPEC)指出,波洛克的預測太少,達不到統計學上的有效性要求,迄今沒有證據表明有任何方法能做到有用的地震中期預測,包括波洛克的方法在內。
波洛克去世后,《洛杉磯時報》發表悼文說,在1980年代,地震預測是地震研究中的邊緣學科,受到很多科學家的鄙視。波洛克這兩次準確的預測扳回了一局,讓科學共同體不再認為地震預測全是胡說八道。失之東隅,收之桑榆,波洛克的地震預測雖然沒有取得預期的成功,但能讓地震預測重新回到科學家的視野之中,也算功不唐捐了。
敬請關注南方周末APP了解本文續篇:《我們用地震學家的算法,“算”了一下2018美國中期選舉》。