劉玉清


摘 要:貝葉斯統計理論是現代數理統計學中較具影響力的理論,其在長期發展中逐漸成為了一種學派,對現代數理統計有著巨大的影響。本文為了了解該理論的形成與嬗變將展開研究,對該理論的起源、發展歷史進行論述。通過分析了解到,貝葉斯統計理論來源于概率論的思想背景與機會學理論,在后續發展中該理論被廣泛應用,且逐漸與經典學派分離,形成了一種獨立的學派。
關鍵詞:貝葉斯統計理論;形成;嬗變
數理統計學本身就是一種通用性的學術領域,在現代各大領域中都需要通過數理統計學手段來開展工作,而貝葉斯統計理論作為樹立統計學的理論手段,自然受到了人們的廣泛關注與采納。但現代多數人對貝葉斯統計理論的形成與嬗變并不了解,使得使用相關手段時不知變通,限制了理論的作用發揮,因此對其形成與嬗變進行研究具有一定現實意義。
一、貝葉斯統計理論的形成
(一)概率論的思想背景
概率論最早出現在“賭博”活動中,活動參與者會通過各種非數學的方法對自身行為的獲勝概率進行統計,這種統計結果比較主觀,且不科學,因此當時概率并不屬于數學范疇,是一個非數學觀念。但這種非數學范疇的概率統計方法引起了當時數學界的關注,多數數學家都發現了概率中隱含的數學規律,而這種規律在當時還模糊不清,這也引起了數學家們的研究,隨后出現了很多有關于概率論的研究。例如1657年,荷蘭科學家克里斯蒂安·惠更斯(Christiaan Huygens)發表了《論賭博中的計算》文章,此舉成功將概率論帶入到了數學范疇,奠定了概率數學邏輯。而這些關于概率論的研究中,不少研究并不能清晰展示概率論的邏輯,因此在貝葉斯統計理論出現之前,概率論中依舊存在很多模糊的地方,計算方法也不完全可靠。這種模糊不清的現象一直持續到托馬斯·貝葉斯的出現,他受前人影響對以往模糊不清的概率論進行研究,撰寫了對概率進行深入探討的著作《機會學說中一個問題的解》,該文章由貝葉斯好友普萊斯在貝葉斯逝世后發表,這篇文章中貝葉斯針對概率論基礎理論使用了歸納推理法,這種方法成功讓概率論有據可依,至少可以解決當時大部分無法用以往方法無法進行概率計算的問題,而這也是貝葉斯統計理論的起源。
(二)機會學理論
在貝葉斯統計理論當中,機會學理論是該理論體系的核心概念,即《機會學說中一個問題的解》就是以機會學為核心來撰寫的。在《機會學說中一個問題的解》中,貝葉斯希望找到一種可以在給定、假定情況下對事件的發生概率進行判斷的方法,這種方法的重點在于“假定”,即假定是指我們對事件情況完全不了解的情況下,根據事件曾經發生的次數、失敗的次數進行計算,計算結果代表了該事件在假定情況下其發生概率在任意二值之間的機會,在貝葉斯的描述中該方法所計算的問題被稱為“逆概率問題”,這一問題也是《機會學說中一個問題的解》文章所論述的核心。
在研究當中,貝葉斯首先提出了他要研究的問題“給定一個未知事件發生和失敗的次數,求其在一次試驗中發生的概率在任意指定的概率度之間的機遇”,其次針對這一問題貝葉斯展開了n重伯努利試驗,試驗步驟見下文。
1.步驟一,問題假設
在n重伯努利試驗中,貝葉斯將事件發生的次數設為X、每次試驗的事件發生概率為θ,隨后給出了問題假設表達式,見公式(1)。
2.步驟二,問題定義
單純圍繞問題假設公式,其中θ就會成為一個隨機變量,而這種變量顯然會造成結果上的爭議,說明計算結果不可靠,這時貝葉斯也發現了這一問題,隨后在文章中進行了問題定義:在多個相互獨立事件同時存在的條件下,其中任意事件發生后,其他事件都不可發生;兩個對立的事件中,任意事件一旦發生,則另外事件不能同時發生;若事件1未發生或對立的事件2發生,則代表事件1發生失敗;當事件發生或失敗,則事件被確認;事件的發生概率代表了它發生的期望價值除以它發生時得到的價值;機會即概率;任意事件如果不會對其他事件的發生概率造成影響,則說明該與其他事件相互獨立。這種定義代表貝葉斯通過公理化的演繹式推理使問題變得清晰。
3.步驟三,問題計算
在問題假設與問題定義基礎上,貝葉斯開始對問題進行計算,目的在于解決逆概率問題。他提到,當未知事件M的發生概率為θ,且θ未知時,M在n次試驗中的成功次數為r,失敗次數為n-r,因此通過公式(3)能夠對θ在常數a、b之間的概率進行計算。
通過貝葉斯定理公式,我們可以在不知道事件發生概率,但知道在相同情況下事件發生次數、失敗次數的條件下,通過積分對事件發生概率進行判斷,同時這種規則適用于任何事件,說明貝葉斯統計理論使用范圍廣泛。
二、貝葉斯統計理論的嬗變
(一)嬗變的起源
貝葉斯統計理論的形成時間很早,可追溯到18世紀至19世紀期間,但在當時該理論并沒有得到大家的重視,多數人依舊非常依賴傳統方法所代表的經典學派。這種現象一直延續到20世紀,當時大量數理統計領域學者發現傳統方法難以得出令人滿意的結果,而嘗試性地使用了貝葉斯統計理論方法,結果出人意料,因此在20世紀很多人對貝葉斯統計理論進行了研究,如英國學者哈羅德·杰弗里斯、倫納德·吉米·薩維奇等,對弗蘭克·拉姆齊在1931年提出的主觀概率概念進行了研究,研究中就采用了貝葉斯理論對主觀概率的結構進行了描述與分析;1955年赫伯特·羅賓斯在基礎貝葉斯統計理論上提出了經驗貝葉斯方法,該方法至今仍受學術界關注;1958年貝葉斯《機會學說中一個問題的解》被英國某統計雜志刊登發表。這既為貝葉斯統計理論嬗變起源。
(二)嬗變歷程
貝葉斯統計理論作為一個發源于18世紀的理論,距今已經300余年,在冗長的歷史時間當中,它的嬗變歷程大體可以分為三個階段,即主觀概率、“后驗概率∝先驗概率*似然”概率論釋義、經驗貝葉斯方法,各階段具體內容見下文。
1.主觀概率
主觀概率由弗蘭克·拉姆齊提出,這種概率論與貝葉斯概率觀點相符,因此被認為是貝葉斯概率觀點之一。根據弗蘭克·拉姆齊描述可知,主觀概率與經典概率論學派最大的不同在于前者反對后者提出的頻率理論,即不能以頻率的結構與分析概率,但主觀概率非常強調“信任”,如在弗蘭克·拉姆齊的著作《真理與概率》當中,他提出了一種基于信任的“打賭”概念:在生活中我們時常會進行打賭,而打賭就是對概率的賭博,但賭博必須建立在信任基礎上,如我與某人打賭今日某個商店是否開門,若我認為商店不開門,就代表我對商店開門的不信任,否則反之,或者我對商店開門與否都不信任,則我會拒絕打賭,脫離對商店開門概率的追究。這種理論就來源于人主觀意識上的信任,與貝葉斯理論所表述的觀點一致。
2.“后驗概率∝先驗概率*似然”概率論釋義
“后驗概率∝先驗概率*似然”概率論釋義來源于哈羅德·杰弗里斯,他將概率論視作理解科學方法的必要條件,并根據貝葉斯統計理論提出了“后驗概率∝先驗概率*似然”概率論釋義,認為貝葉斯對概率論的意義重大,值得推廣。
3.經驗貝葉斯方法
經驗貝葉斯方法來源于赫伯特·羅賓斯,他在1955年提出了這種方法。經驗貝葉斯方法中,采取了貝葉斯統計理論的統計推斷過程,且具有歸納性,符合貝葉斯的歸納推理法,過程中需要先采集先驗樣本,再通過客觀方法將樣本代入到主觀的貝葉斯理論中,通過這種方法所得出的結果與原始貝葉斯統計方法高度一致。該方法的出現基本奠定了貝葉斯統計理論在數理統計理論中的地位,即原始貝葉斯統計方法被認為過于主觀,在樣本分布上太過隨意,因此結果不可靠,這一點常被經典學派人員詬病,而經驗貝葉斯方法則消除了這一缺陷,該方法以客觀為主導再轉向主觀,使得原始貝葉斯統計方法具有客觀屬性,結果自然更加可靠,因此經驗貝葉斯方法一直流傳至今,現行統計學方法一般具有該方法的影子。
三、結語
綜上,本文對貝葉斯統計理論的形成與嬗變進行了分析,通過分析闡述了貝葉斯統計理論形成背景與起源,描述了該理論在數理統計中的觀點與操作方法,該理論中的方法成功突破了傳統概率論模糊不清的現象,因此意義重大,而在后期發展中,人們還是發現了原始貝葉斯統計理論的不足,使得大量研究人員對貝葉斯統計理論進行了研究,促使該理論發生嬗變,最終形成了經驗貝葉斯方法,該方法對現代數理統計研究影響重大,可消除以往缺陷、確保統計結果質量。
參考文獻:
[1]蘇巖.貝葉斯統計的發展及其爭鳴[J].保定師范專科學校學報,2003(2):1-3.
[2]謝宏斌.貝葉斯公式的應用和推廣[J].數學學習與研究,2017(10):8.
[3]王彩琴.貝葉斯公式的推廣[J].數學學習與研究,2017(11):9.
[4]朱慧明.現代貝葉斯統計理論的基本觀點與研究現狀[J].江蘇統計,2003(1):12-13.