李翰芳 羅幼喜
摘 要: 本文從信息加工的角度分析了貝葉斯公式的核心思想,闡述了公式如何將“歷史信息”和“當前信息”相結合,并可以連續進行“信息”加工的動態過程.文章利用兩個實例進行了詳細分析,不僅讓學生深刻理解了公式的內涵,而且讓學生靈活掌握了公式的外延.
關鍵詞: 貝葉斯公式 歷史信息 當前信息 信息加工器
1.引言
貝葉斯公式是英國數學家托馬斯·貝葉斯(ThomasBayes)在1763年最早發表的,但當時其結果沒有受到應有重視,后來法國數學家拉普拉斯在貝葉斯基礎上進一步總結,人們才逐漸認識到這個公式的重要性.雖然這個公式形式上只不過是條件概率與乘法公式及全概率公式的推論,但理論本身蘊含了深刻的思想,而且有重要的現實應用.由該公式思想發展起來的“貝葉斯學派”在統計學歷史發展過程中占據著不可或缺的地位.
在傳統的教學過程中,大多是將該公式看做是一種計算概率的方法,沒有深層次地挖掘該公式所蘊含的思想,故學生理解起來比較困難,因而不能夠靈活掌握并應用.本文繞過貝葉斯公式繁雜的數學表達式,另辟蹊徑,從“信息加工”的角度理解貝葉斯,讓學生更直觀而深刻地理解此公式背后隱含的思想和功能.
2.貝葉斯公式
這個公式也稱為逆概率公式.
其中P(A)稱為先驗概率,可以看成是人們對事件A發生概率的初步判斷或歷史經驗信息,P(A|B)稱為后驗概率,是指在當前某個事件B發生后,即有了“當前信息”后對A發生概率的重新評估.從上式可以看到,P(A|B)是綜合了“歷史信息”和“當前信息”之后得到的結果.貝葉斯方法的推斷正是基于后驗概率進行的,從而使該方法能夠有效地將歷史經驗和當前數據相結合,做出更科學全面的決策.更難能可貴的是,該公式具有連續“信息”加工的能力,即我們可以進一步將P(A|B)作為先驗,等到有另一個事件B′發生后對可以發生概率再做重新評估,從而一步一步地積累信息,不斷加深對事件的認識.下面,我們就從幾個生活中的實際例子闡述貝葉斯公式是如何對“歷史信息”和“當前信息”進行逐步加工的.
3.案例分析
例1:設某銀行根據客戶的還款情況及時調整對客戶的信用評價(信用良好的可信度).以往統計資料表明,信用良好的客戶按期還款率為95%,信用不足的客戶按照還款率為50%,某同學向銀行辦了張信用卡,辦卡時的信用評價為0.9,問為什么該學生連續幾次刷卡不還款后,最后終身都不享受向銀行貸款的資格.
解:設事件A={信用良好},事件B={按期還款},根據題意分別有:
下面分別討論2次刷卡沒有按期還款的情況下,銀行對該學生的信用評價.
第一次:
下面以0.47為銀行對學生的信用評價,此學生第二次刷卡未按期還款,求銀行對此學生的信用評價.
在上述例子中,辦卡時的信用評價為0.9,這個可以看做是銀行根據資料得到的客戶“歷史信息”.當學生有一次刷卡沒有按期還款這個事件發生后,銀行就會根據“當前信息”對學生信用作重新評價,即上述第一次有貝葉斯公式得到的后驗概率0.47.于是銀行將0.47作為學生的信用評價先驗概率,等到如果有再次有刷卡未按期付款事件發生后,則可利用貝葉斯公式再次對學生信用進行評價,即第二次得到后驗概率0.081.整個過程很好地體現了貝葉斯公式根據歷史和當前資料,一步一步連續加工信息的能力.
從上面計算的結果我們也不難看出,第二次未還款后,銀行對該學生的信用評價非常小,幾乎為0,再經過連續幾次故意不還款銀行會將此學生打入黑名單,在以后將不能申請銀行貸款.
例2:設根據往年調查資料表面,某地區患某種疾病的概率約為千分之一,假設患者對該種疾病化驗反應是陽性的概率為0.95.正常人對該種疾病化驗反應是陽性的概率為0.04,現抽查了一個人,其化驗反應呈陽性,問此人確患該疾病的概率有多大?如果要對此人是否患該疾病進行確診,還是否需要做再次化驗檢查?
此問題中,如果不做化驗,抽查一人,那么他是患者該種疾病的概率P(A)=0.001,這個可以看成是先驗信息,即根據歷史調查資料所獲得的信息.當某次體檢化驗呈陽性反應這個事件發生后,我們需要將“歷史調查信息”與“當前化驗信息”相結合,對此人患病概率進行重新估計,利用貝葉斯這個信息加工器,我們很容易計算出此人患該病的概率為P(A|B)≈0.023,從0.001增加到0.023,化驗結果表明該人患病風險增加將近23倍,說明當前的化驗對于診斷一個人是否患有該疾病非常有意義.
但從另一方面來看,此人患此疾病的概率也僅為P(A|B)≈0.023,這說明即使化驗呈陽性,確實患此種疾病的可能性也只有2.3%.所以通常在這種情況下,醫生也不會立即給病人下結論,而是建議重新做化驗,下面我們來看如果此人接著做第二次化驗后仍呈陽性的話,他確患此病的概率.則此時我們可將P(A|B)≈0.023來代替原來的P(A)=0.001作為患該疾病的先驗概率,于是在第二次檢測還呈陽性的情況下該人確實患此疾病的概率:
這進一步提高了檢測的準確性,如果覺得還不精確,則可再化驗一次,在進行第三次化驗還是陽性的情況下該人確實患此疾病的概率:
這時醫生就已經有很大的把握判定此人患有該疾病了,從上面的例子可以看到,醫學上對于病人患病的確診,就是借用貝葉斯公式這個“連續信息加工器”,將病人當前化驗檢查結果同歷史資料信息相結合,一步一步對病人患病概率進行重新估計,逐步確診.
4.結語
本文主要從信息加工的角度看待貝葉斯公式,分析了公式中先驗概率即可看成是“歷史信息”,當某個事件發生后,公式就將“歷史信息”與“當前信息”相結合,對事件發生概率進行重新估計,得到后驗概率,再通過后驗概率做進一步的統計推斷.并且,還分析了貝葉斯公式連續動態處理信息的能力,即將上一次得到的后驗概率作為下一次的先驗概率,結合下一次事件的發生對問題進行重新評估以做出更準確的決策.這樣逐步積累“歷史信息”,逐漸加深了解事物發生概率的過程符合人們的思維習慣.這樣的解析可以讓學生更容易、更清晰地理解和掌握貝葉斯公式.本文利用日常生活中常見的實例進行分析,將知識性與趣味性相結合,既讓學生學到理論知識,又讓學生學會理論知識在現實生活中的應用,加深對貝葉斯公式的理解和靈活運用.
參考文獻:
[1]李子強.概率論與數理統計教程(第三版)[M].2011.
[2]費錫仙.概率論與數理統計習題集[M].國防科技大學出版社,2011.
[3]燕建梁.用貝葉斯公式解釋化驗結果[J].大學數學,2012,VOL28(3):111-113.