[摘要]得分規則(scoring rules)可以很好地對預測結果的“質量”進行評價,它是一種可以用來衡量和測評預測結果好壞程度的方法。它可以通過給定一種“規則”,對各種預測方案進行賦值打分,選擇其中得分最少的來確定最佳預測方案,這一方法在諸如天氣、比賽結果等方面的預測有著很好的應用。
[關鍵詞]預測;得分規則;正規得分規則;應用
一、正規得分規則的定義
“得分規則”一詞的首次出現是Good在1952年發表的一篇關于“合理決策”問題的文章中,而后Winkler于1969年討論了得分規則在被用來評估概率預測和被用來推導方面的區別,而正式的關于得分規則被用來做推導的研究可以在Savage和Lindley的文章中看到, Bernardo和Smith于1994年做了相關的補充[2]。此外,正規得分規則還可以用來引導出個人的主觀概率,Savage運用數學的方法推導出了可以用來推導出個人主觀概率的正規得分規則的一般表達式,也就是所謂的球形得分規則。
Giovanni Parmigiani等[1]在《決策理論與方法》中提到針對一件未知事件θ設定一個賭局,在保證賭局設定方一定獲利的前提下給出一個賠付比q:(1-q),雙方按照按設定的賠付比各自支付賭金,賭金之和作為一次賭局的獎金總額S,最終由賭贏的一方獲得獎金。顯然,從賭局制定者的角度考慮,如果θ最終發生了,即θ=1,那么賣方將有收益-(1-q)S,如果θ最終沒有發生,收益為qS。而作為賭局的賠付比制定者,他自己也有著對于事件θ是否發生的一個主觀概率π,那么在這種情況下賭局制定者的期望收益為,顯然,當取q=π時,賭局制定者的期望收益為0,此時的q=π是期望收益的一個臨界值,而根據預期效用最優化原則,此時賭局制定者的預期效用最大。在這種得分規則下的賭局制定者的期望得分也達到最小。因此,正規得分規則的定義為當且僅當存在一個正數π,使得成立時,我們稱之為正規得分規則,且當π為唯一值時,此時的得分規則被稱為嚴格正規得分規則。
二、幾種常見的正規得分規則
自Good于1952年首次提出了正規得分規則這一概念并給出了第一個正規得分規則的數學形式以來,諸多學者根據不同的統計分析需要不斷提出了一系列的其他的正規得分規則,如二次得分規則、球形得分規則等。
①對數得分規則(logarithmic rule),最早由古德于1952年提出來的,也是最早的一種正規得分規則,其數學形式為:該得分規則最初是被用來計算負熵值對得應的一種得分規則。這種得分規則的計分方法只與眾多狀態中最終發生的狀態有關,而與其他未發生的狀態無關。實際上,這種得分規則也是一種較為嚴格的得分規則—局部得分規則的典型代表。
②二次得分規則(Quadratic scoring rule ),是正規得分規則中最著名的一種得分規則。它最初是由Brier在研究天氣預測問題中的證明時所提出來的,而它的數學形式則是由Savage(1971)推導出來的,具體形式為:,其中,,。這種得分規則的最大優點是可以通過修改系數A,B的值來實現其靈活應用。Selten于1998年對它進行了公理化的論證[4]。
③球形得分規則(Spherical rule),它是由Savage于1971年首次提出的,它是球面得分規則下的一種特殊情況,其具體數學公式為: 。
三、正規得分規則在預測問題上的應用
正規得分規則在預測問題上的應用非常廣泛。本文選取了NBA2013-2014季后賽總冠軍的歸屬作為預測事件θ,某博彩公司將為兩支球隊的奪冠可能性設定賭局,使得博彩公司的盈利最大。總決賽的對陣雙方為邁阿密熱隊和圣安東尼奧馬刺隊,這一事件只存在兩種狀態θ1和θ2(θ1表示熱隊奪冠,θ2表示馬刺隊奪冠)。博彩公司要根據兩隊的球員實力和狀態、教練的經驗、主場優勢、以及個人的偏好等因素給出兩隊的勝率。此處,將每個預測人員給出的兩隊的勝率預測表示為q1和q2,而每個預測者的個人主觀勝率表示為π1和π2,那么博彩公司到底應該根據哪個預測者的預測結果去設定一個賠付比,才能使期望受益最大呢?而預測者應該怎樣給出自己的預測概率才能使自己的預測結果最為精確呢?我們可以為每個預測者設定一個得分(q-θ)2以表示預測結果與實際情況的偏差,那么按照這種得分規則下的每個預測者的期望得分為:
顯然,取q1=π1時,預測者的期望得分最少,那么博彩公司到底應怎樣從中選取最合理的預測結果呢?為此,本文選擇了具有代表性的ESPN部分專家的預測結果代替并選擇最具代表性的二次得分規則作為計算每個預測者的期望得分的方法。因為事件θ有兩種狀態,因此,并取。那么此處的得分規則為。
我們不難算出在此得分規則下的每個預測專家的期望得分,得分結果如表1所示:
表1在二次得分規則下每個專家預測的兩隊勝率及期望得分
顯然,前后分別有四位專家是預測熱隊和馬刺隊將會奪得總冠軍,前四位專家中Thorpe得分最低,后四位專家中Torres的得分最低,按照得分最少預測效果最好的原則,應分別取這兩位專家的預測概率作為設定兩支球隊是否奪冠的賠付比,而根據正規得分規則的定義,我們認為每個專家所給出的預測概率均為個人的主觀概率,那么博彩公司最終為熱隊和馬刺隊設定的賠付比應為2.45:1和3.17:1。按照這樣的賠付比來設定賭局能保證博彩公司能夠始終盈利。
四、總結
得分規則作為決策理論中的一個重要方法在對未知事件的預測方面有著廣泛的應用。本文將正規得分規則的原理運用到NBA等體育賽事結果的預測上。在研究過程中,部分假設合理化了一些因素,且未能考慮到不同預測者之間的綜合影響,所以可能與實際情況有所偏差,這些也正是今后還需改進的地方。
參考文獻
[1]G. Parmigiani., Y. T. Inoue. Decision Theory: Principles and Approaches, pp.191-198
[2]T Gneiting and A. Raftery. Strictly Proper Scoring Rules, Prediction, and Estimation
[3]ESPN中文網. http://www.espnstar.com.cn
[4]Stein. Estimation of the mean of a multivariate normal distribution, Annals of Statistic 9: 1135~1151.
作者簡介
錢昆 單位:南京財經大學 省市 :江蘇南京。