如何理解“所有的模型都是錯誤的”？

2020-06-04 04:23:34袁曦

上海保險 2020年5期

關鍵詞：模型

袁曦

一、背景與問題

《精算通訊》邀我談談“計量”在風險決策中的作用，我的心情是蠻復雜的。從哲學角度的方法論說，量化是觀察世界的重要手段之一，而我們選擇用于認識世界的這種方法，正面臨著各種錯誤的解讀，其中之一便是“所有的模型都是錯誤的（All models are wrong）”。

比如在《風險與好的決策》這本書中，列舉了很多讓“計量經濟學者崩潰的事實”，然而作者也仍然認同好的決策需要運用統計學思維、經驗法則和風險行為心理學。

筆者的觀點是：量化和模型是對復雜現象的簡化處理和描述，是人們在工業化社會中賴以工作的基礎。但也正因為是一種對復雜事物的簡化，必然會有考慮不足的地方，由此造成一種稱為“假性精確”(pseudo accuracy)的現象，也確實可能損害、違背初衷。因此，應用者需要對模型有通透的理解，只有了解模型的起因、結果以及局限性，才能透過現象看到本質，從而作出合理決策。

二、因果與統計

在我們面對的紛繁世界中，每一個結果都是由多個因素合成的，并隨時間的變化而變化。身處大數據時代，我們透過數據分析事實的能力是否加強了？

這個問題還待商榷。在美劇《量子疑云》中，宇宙在無限擴展的時候，每一個事實發展都會包括該事件的所有可能，并將每一個可能無限延續，就像一棵無限生長的樹，在每個樹杈分出多個分支并繼續下去。我們所看到的因與果，是否有直接的聯系，或是其直接影響已經在互相作用中彌散，這是需要仔細考究的。

在社交網絡時代，簡單的、吸引眼球的、有時候驚世駭俗的結論往往得到更廣泛的傳播，分析能力反而退步了，雜音更多了?？觳臀幕?、武斷結論、先入立場，都阻擋了我們追求真相的腳步。自媒體拉平了交流的平臺，但是投入資源的、全面調查的、覆蓋統計各個角度的結論反而被湮沒了。不知道是幸還是不幸。

在統計學家的世界里，現象是各種統計結果匯總的結果，沒有一個因素能起決定性的作用，除非顯著（significant）到一定程度。不能因為幾個單獨的事件得出一個普遍結論，即使在某個階段非常緊跟潮流、媒體大量傳播的事也一樣。馬云曾經說過，每個國家都有1%的混蛋，如果我們糾結于這1%的混蛋而忘記99%的善良，這將是人類的災難。馬云顯然是一個有統計思維的大咖。對于平常人來說，因為那1%說話聲音更響，說的次數更多，很可能看不見那99%。這就是為什么統計思維很重要。

三、導致模型錯誤的內因

回到“所有的模型都是錯誤的”這個命題，如果將其看作“果”，我們探討“因”，為什么所有的模型都是錯誤的呢？

典型模型錯誤的原因，有的來自模型的內部，有的來自模型的外部。內部原因能歸結為三類：

（一）模型樣本不周全，所謂幸存者偏差（Survivorship bias bias）

如果從一個房間里連續出來五個人都是穿紅衣服的，我們是否可以認定這房間里的人都穿紅衣服？假設事實是房間里有60個人均勻分布在紅黃藍三種顏色衣服上面，以上現象發生的概率大概為0.3%。大數據工具的增加并不等于有效數據觀測點的增加，就好像用大炮打蚊子。在未來數據科學中除了發現更有效和有力的處理工具，如何去偽存真、如何摒棄雜音同樣重要。精算師致力于研究各種算法的利與弊，從手寫到繩結、到表格、到計算機，再到現在更先進的工具，核心是找到數據后面的實際因果。

（二）模型未能囊括所有可能的狀況

帝國理工大學新冠肺炎預測模型最大的問題在于，它假設不管傳播的快慢，感染病毒的人數總量是不變的并且不可重復。打破次元壁，需要大量的假設和想象力，沒有在模型中的變量可造成根基性的錯誤（model error）。我們對冠狀病毒的很多醫學特性不清楚，是否免疫了就不再復陽，免疫能夠持續多久等。

（三）使用模型的立場是錯誤的

比如傳播甚廣的“搞垮華爾街”的模型，以李祥林教授應用高斯連接（Gaussian copula）作為尾部風險量化工具：李教授的模型因為專攻尾部相關性希望能更好地考慮到極端事件的影響，雖然沒有使用更加保守的Weibull copula，但是也強勝一般的VaR。然而，為了授信次貸產品并通過公司的風險審核，借用李教授公式固化部分風險并予以推廣，用看上去非常復雜的模型掩蓋了實際的風險事實，可以看到，搞垮華爾街的是貪婪，以及對模型背后事實的忽視。因此，在精算師的職業操守里面，“正直（integrity）”是放在最前面的，這才是模型的最終基礎。

四、導致模型錯誤的外因

外部原因，主要來自使用者對模型的誤讀和誤用。

最常見的誤讀是媒體的斷章取義、搏眼球、蹭熱點、語不驚人死不休，實際并沒有從頭到尾閱讀嚴謹的論文，導致失之毫厘，謬之千里。

舉例而言，前段時間牛津大學有學者采用模型來預測新冠病毒感染規律，其中提到68%的人已經“暴露在（exposed）”病毒之下（原文是“It also estimated that，as of last week，68%of the population had been exposed to the virus”），而媒體的解讀是“超過一半的人感染了新冠病毒”。

“暴露”是指可能發生的病毒接觸。同時，該數據只是在有疫苗和無疫苗的情景測試中的一個結果，還有其他影響情景存在，比如最好的情景是只有小部分嚴重患者，媒體則沒有提及。

誤用，則是在不適合的場合使用模型（mis-use the model）。

模型往往是對現實世界的簡化，每個模型都有其應用目的，為了達到目的，統計學家會在模型中對與結論不重要的部分進行簡化，并集中力量探討需要論述的問題。因此，脫離模型原有應用目的的使用可能會導致災難。比如精算師用于評估準備金充足性的模型，就不能用作公司的整體估值。所以，精算師要注意保護自己的報告使用的語境。

五、結語

模型及量化，是探尋真理的重要工具之一，但不是全部。

能否用好模型及量化工具，首先需要對這套工具有正確的理解，需要將“管理大局觀”與對一個具體事實的追尋統一起來，既能對大趨勢作出判斷，又能將其與其他因素進行妥協。

就算“模型是錯誤”的，但我們每跑一次模型，都是一次糾偏，離真理更近一步。

希望在這個變化多端的世界里，更多人能夠更好地使用量化作為工具之一來探尋真理，尤其在其他工具缺失的情況之下。