999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

如何理解“所有的模型都是錯誤的”?

2020-06-04 04:23:34
上海保險 2020年5期
關鍵詞:模型

袁 曦

一、背景與問題

《精算通訊》邀我談談“計量”在風險決策中的作用,我的心情是蠻復雜的。從哲學角度的方法論說,量化是觀察世界的重要手段之一,而我們選擇用于認識世界的這種方法,正面臨著各種錯誤的解讀,其中之一便是“所有的模型都是錯誤的(All models are wrong)”。

比如在《風險與好的決策》這本書中,列舉了很多讓“計量經濟學者崩潰的事實”,然而作者也仍然認同好的決策需要運用統計學思維、經驗法則和風險行為心理學。

筆者的觀點是:量化和模型是對復雜現象的簡化處理和描述,是人們在工業化社會中賴以工作的基礎。但也正因為是一種對復雜事物的簡化,必然會有考慮不足的地方,由此造成一種稱為“假性精確”(pseudo accuracy)的現象,也確實可能損害、違背初衷。因此,應用者需要對模型有通透的理解,只有了解模型的起因、結果以及局限性,才能透過現象看到本質,從而作出合理決策。

二、因果與統計

在我們面對的紛繁世界中,每一個結果都是由多個因素合成的,并隨時間的變化而變化。身處大數據時代,我們透過數據分析事實的能力是否加強了?

這個問題還待商榷。在美劇《量子疑云》中,宇宙在無限擴展的時候,每一個事實發展都會包括該事件的所有可能,并將每一個可能無限延續,就像一棵無限生長的樹,在每個樹杈分出多個分支并繼續下去。我們所看到的因與果,是否有直接的聯系,或是其直接影響已經在互相作用中彌散,這是需要仔細考究的。

在社交網絡時代,簡單的、吸引眼球的、有時候驚世駭俗的結論往往得到更廣泛的傳播,分析能力反而退步了,雜音更多了??觳臀幕?、武斷結論、先入立場,都阻擋了我們追求真相的腳步。自媒體拉平了交流的平臺,但是投入資源的、全面調查的、覆蓋統計各個角度的結論反而被湮沒了。不知道是幸還是不幸。

在統計學家的世界里,現象是各種統計結果匯總的結果,沒有一個因素能起決定性的作用,除非顯著(significant)到一定程度。不能因為幾個單獨的事件得出一個普遍結論,即使在某個階段非常緊跟潮流、媒體大量傳播的事也一樣。馬云曾經說過,每個國家都有1%的混蛋,如果我們糾結于這1%的混蛋而忘記99%的善良,這將是人類的災難。馬云顯然是一個有統計思維的大咖。對于平常人來說,因為那1%說話聲音更響,說的次數更多,很可能看不見那99%。這就是為什么統計思維很重要。

三、導致模型錯誤的內因

回到“所有的模型都是錯誤的”這個命題,如果將其看作“果”,我們探討“因”,為什么所有的模型都是錯誤的呢?

典型模型錯誤的原因,有的來自模型的內部,有的來自模型的外部。內部原因能歸結為三類:

(一)模型樣本不周全,所謂幸存者偏差(Survivorship bias bias)

如果從一個房間里連續出來五個人都是穿紅衣服的,我們是否可以認定這房間里的人都穿紅衣服?假設事實是房間里有60個人均勻分布在紅黃藍三種顏色衣服上面,以上現象發生的概率大概為0.3%。大數據工具的增加并不等于有效數據觀測點的增加,就好像用大炮打蚊子。在未來數據科學中除了發現更有效和有力的處理工具,如何去偽存真、如何摒棄雜音同樣重要。精算師致力于研究各種算法的利與弊,從手寫到繩結、到表格、到計算機,再到現在更先進的工具,核心是找到數據后面的實際因果。

(二)模型未能囊括所有可能的狀況

帝國理工大學新冠肺炎預測模型最大的問題在于,它假設不管傳播的快慢,感染病毒的人數總量是不變的并且不可重復。打破次元壁,需要大量的假設和想象力,沒有在模型中的變量可造成根基性的錯誤(model error)。我們對冠狀病毒的很多醫學特性不清楚,是否免疫了就不再復陽,免疫能夠持續多久等。

(三)使用模型的立場是錯誤的

比如傳播甚廣的“搞垮華爾街”的模型,以李祥林教授應用高斯連接(Gaussian copula)作為尾部風險量化工具:李教授的模型因為專攻尾部相關性希望能更好地考慮到極端事件的影響,雖然沒有使用更加保守的Weibull copula,但是也強勝一般的VaR。然而,為了授信次貸產品并通過公司的風險審核,借用李教授公式固化部分風險并予以推廣,用看上去非常復雜的模型掩蓋了實際的風險事實,可以看到,搞垮華爾街的是貪婪,以及對模型背后事實的忽視。因此,在精算師的職業操守里面,“正直(integrity)”是放在最前面的,這才是模型的最終基礎。

四、導致模型錯誤的外因

外部原因,主要來自使用者對模型的誤讀和誤用。

最常見的誤讀是媒體的斷章取義、搏眼球、蹭熱點、語不驚人死不休,實際并沒有從頭到尾閱讀嚴謹的論文,導致失之毫厘,謬之千里。

舉例而言,前段時間牛津大學有學者采用模型來預測新冠病毒感染規律,其中提到68%的人已經“暴露在(exposed)”病毒之下(原文是“It also estimated that,as of last week,68%of the population had been exposed to the virus”),而媒體的解讀是“超過一半的人感染了新冠病毒”。

“暴露”是指可能發生的病毒接觸。同時,該數據只是在有疫苗和無疫苗的情景測試中的一個結果,還有其他影響情景存在,比如最好的情景是只有小部分嚴重患者,媒體則沒有提及。

誤用,則是在不適合的場合使用模型(mis-use the model)。

模型往往是對現實世界的簡化,每個模型都有其應用目的,為了達到目的,統計學家會在模型中對與結論不重要的部分進行簡化,并集中力量探討需要論述的問題。因此,脫離模型原有應用目的的使用可能會導致災難。比如精算師用于評估準備金充足性的模型,就不能用作公司的整體估值。所以,精算師要注意保護自己的報告使用的語境。

五、結語

模型及量化,是探尋真理的重要工具之一,但不是全部。

能否用好模型及量化工具,首先需要對這套工具有正確的理解,需要將“管理大局觀”與對一個具體事實的追尋統一起來,既能對大趨勢作出判斷,又能將其與其他因素進行妥協。

就算“模型是錯誤”的,但我們每跑一次模型,都是一次糾偏,離真理更近一步。

希望在這個變化多端的世界里,更多人能夠更好地使用量化作為工具之一來探尋真理,尤其在其他工具缺失的情況之下。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 国产午夜无码片在线观看网站| 亚洲bt欧美bt精品| 亚洲视频在线青青| 午夜精品一区二区蜜桃| 国产成人av一区二区三区| 一级毛片中文字幕| 国产成人亚洲无码淙合青草| 国产亚洲欧美在线专区| 日韩AV无码免费一二三区| 亚洲综合久久成人AV| 视频二区中文无码| 国产迷奸在线看| 老司国产精品视频91| 粉嫩国产白浆在线观看| 精品91视频| 亚洲欧美一区二区三区蜜芽| 亚洲人成亚洲精品| 久久国产精品电影| 日韩欧美成人高清在线观看| 亚洲日本中文字幕乱码中文| 久久中文字幕不卡一二区| 99爱在线| 免费观看无遮挡www的小视频| 国产日韩欧美在线视频免费观看| 国产精品成人第一区| 欧美日本在线观看| 强奷白丝美女在线观看| 免费观看欧美性一级| 97一区二区在线播放| 五月婷婷精品| 精品国产Av电影无码久久久| 中文成人在线| 欧美激情首页| 999国内精品久久免费视频| 毛片免费视频| 国产97视频在线观看| 漂亮人妻被中出中文字幕久久| www.精品视频| 欧美另类视频一区二区三区| 欧美激情视频在线观看一区| 久久综合婷婷| 国产精品制服| 91黄色在线观看| 成AV人片一区二区三区久久| 亚洲一区国色天香| 亚洲丝袜中文字幕| 日韩一级毛一欧美一国产| 国产福利2021最新在线观看| 久久久精品无码一二三区| 国产成人成人一区二区| 久草视频精品| 国产成人综合亚洲网址| 欧美视频在线观看第一页| 99精品这里只有精品高清视频| 国产精品伦视频观看免费| 2021天堂在线亚洲精品专区 | 国产成人盗摄精品| 日韩欧美国产精品| 亚洲精品无码不卡在线播放| 国产男人天堂| 欧美色综合网站| 亚洲国产精品日韩欧美一区| 中文纯内无码H| 91黄视频在线观看| 国产国拍精品视频免费看| 全部免费毛片免费播放| 国产69精品久久久久孕妇大杂乱| 这里只有精品国产| 青青草一区| 91蜜芽尤物福利在线观看| 精品久久人人爽人人玩人人妻| 日韩在线视频网站| 久久久久青草大香线综合精品| 国产福利一区二区在线观看| 91午夜福利在线观看| 亚洲欧美天堂网| 国产一级做美女做受视频| 日韩免费中文字幕| 就去吻亚洲精品国产欧美| 伊在人亚洲香蕉精品播放| 亚洲AV电影不卡在线观看| 青青青国产精品国产精品美女|