摘 要: 國際數(shù)理統(tǒng)計主要有兩大學(xué)派:Bayes學(xué)派和經(jīng)典學(xué)派。越來越多的人支持Bayes學(xué)派的觀點,其相關(guān)思想、內(nèi)容及其起源、發(fā)展和應(yīng)用,成了在一開始他們就必須了解的內(nèi)容;同時,越來越多的業(yè)余統(tǒng)計愛好者希望能夠有比較全面又淺顯易懂的資料以幫助他們了解該學(xué)科。
關(guān)鍵詞: Bayes統(tǒng)計 起源 發(fā)展 應(yīng)用
一、Bayes統(tǒng)計的起源、發(fā)展
國際數(shù)理統(tǒng)計主要有兩大學(xué)派:Bayes學(xué)派和經(jīng)典學(xué)派。他們之間既有共同點,又有不同點。經(jīng)典統(tǒng)計學(xué)是基于總體信息(即總體分布或總體所屬分布族的信息)和樣本信息(即從總體抽取的樣本的信息)進行的統(tǒng)計推斷,而Bayes統(tǒng)計是基于總體信息、樣本信息和先驗信息(即在抽樣之前有關(guān)統(tǒng)計問題的一些信息,主要來源于經(jīng)驗或歷史資料)進行的統(tǒng)計推斷,與經(jīng)典統(tǒng)計的本質(zhì)區(qū)別在于是否利用先驗信息。
Bayes統(tǒng)計起源于英國學(xué)者托馬斯·貝葉斯(Thomas Bayes,1702—1761)死后發(fā)表的一篇論文“論有關(guān)機遇問題的求解”[31](An essay towards solving a problem in the doctrine of chances)。在此論文中,他提出著名的Bayes公式和一種歸納推理方法。隨后拉普拉斯[32](Laplace,P.C,1749—1817)不僅重新發(fā)現(xiàn)了Bayes定理,闡述得遠比貝葉斯更為清晰,而且用它來解決天體力學(xué)、醫(yī)學(xué)統(tǒng)計和法學(xué)問題。之后雖有一些研究和應(yīng)用,但由于其理論尚不完整,應(yīng)用中出現(xiàn)一些問題,致使Bayes方法長期未被接受。直到二戰(zhàn)后,瓦爾德[33](Wald,A,1902—1950)提出統(tǒng)計決策函數(shù)論后,又引起很多人對Bayes研究方法的興趣。因為在這個理論中,Bayes解被認為是一種最優(yōu)決策函數(shù)。Savage,L.J[34](1954),Berger,J.O[2]等Bayes學(xué)者通過努力,對Bayes方法在觀點、方法和理論上不斷地完善。1984年史密斯教授曾預(yù)言:“到本世紀末,Bayes理論加上計算機的圖示,將成為現(xiàn)代統(tǒng)計實踐中最受歡迎的形式。”不論這一預(yù)言是否偏頗,但如今Bayes統(tǒng)計日趨成熟,有關(guān)Bayes統(tǒng)計方面的研究與著作也越來越多,Bayes學(xué)派已發(fā)展成為一個有影響的統(tǒng)計學(xué)派,打破了經(jīng)典統(tǒng)計學(xué)一統(tǒng)天下的局面。
二、Bayes學(xué)派的觀點
Bayer學(xué)派最基本的觀點是:總體分布中的未知參數(shù)是一隨機變量,用一個概率分布去描述對的未知狀況,這個概率分布是在抽樣前就有的關(guān)于先驗信息的概率陳述,被稱為先驗分布(prior-distribution)。為什么采用概率的形式呢?因為任一未知量都有不確定性,而在表述不確定性時,概率和概率分布是最好的語言。例如產(chǎn)品的不合格率是未知量,但每天都有一些變化,把它看作一個隨機變量是合理的,用一概率分布去描述它也是恰當(dāng)?shù)摹ayes統(tǒng)計就是基于所具有的知識用概率(或概率分布)來度量對一個不確定事件的真實度的相信程度。
Bayes統(tǒng)計存在的主要問題是先驗分布問題。例如如何在具體的問題中定出“合適的”先驗分布?先驗分布是一個純主觀的隨意性的東西,那還有什么科學(xué)意義?到目前為止,Bayes統(tǒng)計未能提出一個放之四海皆準(zhǔn)的確定先驗分布的方法,且看來在今后也難以做到這一點,因而,這確實是Bayes統(tǒng)計的一個重大弱點。但在承認這一點的同時應(yīng)清晰地看到,Bayes學(xué)贊成主觀概率,并不等于說可以用主觀隨意的方式去選取先驗分布,而是要求研究者對所考察的事件有較透徹的了解和豐富的經(jīng)驗,甚至是這一方面的專家。事實上,對如何確定先驗分布Baye,學(xué)者作了不少的探討,并且在實用范圍內(nèi),對一些常見的分布都已得到了較好的回答。
三、Bayes統(tǒng)計的應(yīng)用
隨著Bayes統(tǒng)計的興起和發(fā)展,Bayes統(tǒng)計得到了廣泛的應(yīng)用。
1.經(jīng)濟方面
國外已出版了Bayes統(tǒng)計在經(jīng)濟學(xué)的某一領(lǐng)域的應(yīng)用專著。其中,芝加哥大學(xué)的Zellner,A教授是Bayes學(xué)派在經(jīng)濟方面應(yīng)用的主要領(lǐng)導(dǎo)人,東京大學(xué)的兩位知名學(xué)者鈴木雪夫和國友直人是日本Bayes統(tǒng)計在經(jīng)濟學(xué)中應(yīng)用的領(lǐng)導(dǎo)人。而在國內(nèi),經(jīng)濟界的學(xué)者結(jié)合我國實際研究“三角債”的博弈理論分析時,把Bayes方法、博弈論和經(jīng)濟學(xué)的“均衡理論”結(jié)合起來,提出了“Bayes博弈均衡理論”。
2.計算機科學(xué)方面
Bayes統(tǒng)計在計算機科學(xué)中的“統(tǒng)計模式識別”中用得最多,已經(jīng)使用“修正的Bayes公式”作為開發(fā)Prospeetor地質(zhì)礦藏勘探專家系統(tǒng)的概率推理方法,軟件可靠中的L-V模型就是一個Bayes隨機模型,從這一模型出發(fā),可以確定軟件投放市場的最佳時間,有利于軟件生產(chǎn)的質(zhì)量管理,提高軟件產(chǎn)業(yè)的經(jīng)濟效益。
3.可靠性方面
1982年,美國出版了Martz和Walter的專著Bayesian Reliability Analysis。該書系統(tǒng)地介紹了Bayes方法在可靠性中的應(yīng)用。國內(nèi)的許多刊物也經(jīng)常可看到Bayes方法在可靠性方面應(yīng)用的文章。另外,Bayes方法在可靠性中的一個有代表性的例子是,美國研制MZ導(dǎo)彈時,應(yīng)用Bayes方法把發(fā)射試驗從原來的36次減少為25次,可靠性卻從0.72提高到0.93,節(jié)省費用二億五千萬美元。
另外,Bayes統(tǒng)計在醫(yī)學(xué)、法律,以及體育運動等方面都有廣泛的應(yīng)用,它已逐步滲透到現(xiàn)實中的各個領(lǐng)域。它既可以用于質(zhì)量控制,軟件質(zhì)量評估,核電站可靠性評價和緩慢周轉(zhuǎn)物品的存儲問題,又可以應(yīng)用于水文事件頻率的估計,犯罪學(xué)不完全記數(shù)的估計和保險精算。這里就不一一詳述。
4.Bayes方法應(yīng)用的關(guān)鍵
Bayes推斷方法的關(guān)鍵在于所作出的任何推斷都必須也只須根據(jù)后驗分布π(θ|x),而不能再涉及x的樣本分布P。例如,在奈曼—皮爾遜理論中,為了確定水平a的檢驗的臨界值C,必須考慮x的樣本分布P,這在Bayes推斷中是不允許的。但Bayes推斷在如何使用π(θ|x)上,有一定的靈活性,例如作為θ的點估計,可用后驗分布密度π(θ|x)關(guān)于θ的最大值點,也可用π(θ|x)的均值或中位數(shù)等。作為θ的區(qū)間估計,可以取區(qū)間[A(X),B(X)],使π(A(x)≤θ≤B(x)|x)等于事先指定的數(shù)1-a(0 參考文獻: [1]Berger.J.o著.賈乃光譯.統(tǒng)計決策理論及貝葉斯分析[M].北京:中國統(tǒng)計出版社,1998. [2]Kotz.S著.吳喜之譯.現(xiàn)代貝葉斯統(tǒng)計學(xué)[M].北京:中國統(tǒng)計出版社,2000. [3]Press,S.J.(1989)著.廖文,陳安貴等譯.貝葉斯統(tǒng)計學(xué),原理,模型及應(yīng)用.中國統(tǒng)計出版社,1992. [4]陳希孺.數(shù)理統(tǒng)計引論.科學(xué)出版社,1997. [5]陳希孺.高等數(shù)理統(tǒng)計學(xué).中國科學(xué)技術(shù)大學(xué)出版社,1999. [6]峁詩松.貝葉斯統(tǒng)計.中國統(tǒng)計出版社,1999. [7]張堯庭,陳漢峰.貝葉斯統(tǒng)計推斷.科學(xué)出版社,1991. [8]張金槐,唐雪梅.Bayes方法(修改版).國防科技大學(xué)出版社,1993. [9]陳希孺.數(shù)理統(tǒng)計中的兩個學(xué)派——頻率學(xué)派和Bayes學(xué)派.數(shù)理統(tǒng)計和應(yīng)用概率,1990,5(4).