朱喜安,陳巧玉,2
(1.中南財經政法大學 統計與數學學院,武漢 430073;2.河南科技大學 數學與統計學院,河南 洛陽471003)
貝葉斯方法是基于貝葉斯定理而發展起來用于解決統計問題的方法,貝葉斯分析包括先驗信息的確定、數據及似然函數模型的構造、效用函數的選擇、后驗分布的確定和貝葉斯決策。貝葉斯推斷的思想是將未知參數的先驗信息與樣本信息綜合;然后利用貝葉斯定理,得出參數的后驗分布;最后依據后驗分布對未知參數進行估計和檢驗等推斷。
20世紀90年代,由于高維計算的困難,貝葉斯方法的應用受到了很大的限制。但隨著計算機技術的發展和貝葉斯方法的改進,特別是MCMC方法的發展及WinBUGS等軟件的開發應用,使原來復雜異常的數值計算問題變得非常簡單,參數后驗分布的模擬也趨于方便,所以現代貝葉斯理論和應用得到了迅速的發展[1]。貝葉斯方面的研究論文越來越多,貝葉斯學派已發展成為一個有影響的統計學派,打破了經典統計一統天下的局面[2]。
貝葉斯方法作為科學科研究前沿領域,已得到國內各界的廣泛關注。本文借助南京大學中國社會科學研究評價中心《中文社會科學引文索引》(Chinese Social Science Citation Index,簡稱CSSCI)數據庫1998~2010的有關“貝葉斯”收錄論文進行計量分析,本文檢索方法是在CSSCI來源數據庫中檢索論文題名或關鍵字中含“貝葉斯”或“bayes”的論文,共從CSSCI來源數據庫中檢索到來源文獻377篇[3]。在此基礎上,本文從統計論文的年代分布、期刊分布、基金項目統計、作者與機構分布以及主題分布與研究熱點等方面進行計量分析;文章還利用共被引分析方法對論文所引的參考文獻進行作者被引和著作共引分析。通過這些分析,可以深入了解我國貝葉斯發展的進展和存在的不足,以及貝葉斯領域研究前沿的知識基礎,對于更好的去研究這一前沿學科提供足夠的數據支持,利于更好地去把握當前的研究熱點。
由圖1可以看出,1998年CSSCI期刊僅有6篇關于貝葉斯的文章刊載,1998~2002年期間每年的發文數量都不超過10篇,總計發文量為41篇,說明我國貝葉斯研究起步較晚且我國在貝葉斯研究領域尚處于起步階段,但也正是這一時期的研究為貝葉斯在我國的進一步發展奠定了基礎。2002年之后,發文數量呈現不斷遞增的趨勢,到2010年發文累積量已達377篇,說明貝葉斯研究在我國不斷發展、完善,步入蓬勃興起的階段。圖1中的論文累計篇數的擬合線近似為指數曲線,由此可以看出,按照普賴斯(D.Price)的邏輯曲線增長理論,現階段我國“貝葉斯”論文數量以指數方式快速增長,說明仍處于發展時期。

圖1 年代分布與累計數
1998年至今,CSSCI中共有96種期刊收錄了貝葉斯方面的論文,論文總量為377篇。其中《統計與決策》、《數理統計與管理》等27種期刊收錄了3篇及以上貝葉斯方面的論文,收錄論文達286篇,占全部CSSCI期刊收錄的貝葉斯方面論文的75.86%。《統計與決策》刊載論文比例最大,占總載文量的27.32%;另外,《數理統計與管理》(占7.69%)和《中國管理科學》(占4.24%)所占比例較大;《統計研究》、《預測》、《心理科學》和《數量經濟技術經濟研究》載文數量均超過10篇,均達到載文總量的3%。《經濟研究》、《金融論壇》等期刊僅刊載1篇相關論文,其載文總量(45篇)占總刊文量的11.94%;《生產力研究》、《中國軟科學》等期刊僅刊載2篇相關論文,其載文總量(46篇)占總刊文量的12.20%。

表1 發文量超過3篇的期刊
從期刊所屬研究學科來看絕大部分論文所屬的刊物都是統計學類,如《統計與決策》、《統計研究》、《數理統計與管理》,我國統計學界對貝葉斯理論發展與繼承做出了重要的貢獻;除此之外,管理類權威期刊如《中國管理科學》《預測》《管理工程學報》《管理科學學報》《管理世界》,以及經濟類權威期刊《數量經濟與技術經濟研究》《財經研究》《金融研究》《經濟理論與經濟管理》,也刊載了相當數量的貝葉斯方面論文,說明經濟與管理是貝葉斯重要的應用領域;情報學、心理學與哲學等相關領域也有較多論文應用貝葉斯方法結合各自研究領域解決實際問題。由此可以看出,隨著貝葉斯方法在多學科交叉應用的發展,貝葉斯方法擁有廣闊的應用領域與發展空間。
在377篇相關論文中,共有652位作者,其中第一作者310位。發文量超過2篇(第一作者或獨撰)的作者如表2所示。在310位作者中,有269位作者僅發過1篇貝葉斯方面的論文,占全部作者的86.77%,說明貝葉斯在我國學者群內仍未獲得足夠重視,很多作者只是偶然性的研究和關注。發文2篇的作者共32位,占全部作者的10.32%,說明這32人對貝葉斯進行了較為持續的研究。發文3篇以上的作者共9位,占全部作者的2.90%,他們對貝葉斯進行了更為深入、持續的研究,為目前我國貝葉斯方面的主要研究者;發文量最多的為朱慧明,達15篇,為我國貝葉斯領域的發展傳播作出了貢獻。

表2 發文量超過2篇的作者(第一作者或獨撰)
上述310位第一作者來源于165個機構單位,發文量超過4篇以上的機構及機構發文篇數如表3所示。
由表3可以看出,發文量超過4篇以上的機構共有30個,且集中分布在高校,這30個高校的在貝葉斯方面的發文量(78篇)占全部發文量(377篇)的20.69%。在貝葉斯方面發文最多的機構是湖南大學,共發文18篇,是貝葉斯研究領域的領頭羊;發文10篇以上的有5所高校,它們都是貝葉斯研究領域的中堅力量。可以看出,高校是我國貝葉斯領域的研究基石,是貝葉斯在我國發展、完善及日益廣泛應用中不可或缺的力量。

表3 發文量超過4篇的作者機構(第一作者或獨撰)
一篇文獻的關鍵詞是論文核心內容的濃縮和提煉,如果某一關鍵詞在某領域的研究文獻中反復出現,則稱其為高頻詞,高頻詞反映了該領域的研究熱點。因而可以通過詞頻分析法,利用能夠揭示或表達文獻核心內容的關鍵詞或主題詞在期刊中出現的頻次高低來確定該領域的研究熱點和發展動向,從而對其學術特征與動態發展有一個比較準確、全面的把握[4]。本文根據文獻關鍵詞,對CSSCI(1998~2010年)收錄的有關貝葉斯的377篇學術論文的關鍵詞進行詞頻統計[5],且僅保留頻數大于3的高頻關鍵詞,如表4所示。

表4 頻數大于3的高頻詞
貝葉斯相關學術論文的頻數大于20的高頻主題詞主要有貝葉斯估計(36)、貝葉斯推理(30)、貝葉斯網絡(26)、貝葉斯方法(23)與MCMC模擬(23);頻數介于10到20之間的高頻詞主要有Gibbs抽樣(12)、貝葉斯均衡(12)、貝葉斯統計(11)、貝葉斯決策(10)、先驗分布(10)。可以看出,目前貝葉斯領域的研究焦點是利用貝葉斯方法進行估計、推理及網絡分析;貝葉斯決策、貝葉斯均衡和先驗分布的確定也是目前的研究熱點;同時,可以看出Gibbs抽樣和MCMC模擬是目前主要的估計方法,也正是這些方法的出現,極大的解決了貝葉斯中的高維積分等難題,進而推動了貝葉斯在各領域的應用。
在貝葉斯學術論文高頻關鍵詞統計的基礎上,為了更清晰地展示我國貝葉斯研究的熱點,本文利用樣本文獻的標題,借助可視化技術和Netdraw軟件,繪制如圖3所示的高頻主題詞共現網絡,從而體現其近13年來的研究熱點與關聯,以期了解熱點主題詞之間的關聯[6,7],為相關學者提供參考。

圖1 高頻主題詞共現網絡
圖1節點間的矢量線說明主題詞間的共現情況,連線粗細或權重大小體現了共現頻次,反映高頻主題詞的關聯緊密程度。由圖1可以明顯看出我國貝葉斯研究的特點:
第一,與貝葉斯有關的方法主要涉及企業、金融、銀行、市場、信用、管理、分類和算法等領域;
第二,利用貝葉斯方法進行推斷、評估、抽樣、組合、評價、分類、預測、實證、影響、決策、理論、博弈和損失等是當前研究的主要目的;
第三,貝葉斯方法、推理、預測為我國博弈、決策和分類等分析問題提供了新的研究視角;
第四,利用實證分析研究企業風險、金融、管理方面的推理、預測等分析研究,以及模型參數的分布是我國現階段貝葉斯領域的研究熱點。
1998~2010 期間CSSCI來源數據庫中,我國貝葉斯研究領域方面的377論文中所引用的所有的參考文獻(引文),構成了我國貝葉斯研究的知識基礎[8]。本文利用CiteSpace軟件使用共引分析方法對這些論文及其引文進行作者共引和文獻共引分析,以進一步分析貝葉斯領域研究前沿的知識基礎,找出在推動我國貝葉斯發展過程中,有著杰出貢獻的作者和有著重要影響的著作。

圖2 貝葉斯研究領域重要作者的科學知識圖譜
作者共引分析的科學知識圖譜如圖2所示,其中節點代表被引作者,連線代表作者共被引關系,較大的節點集代表在貝葉斯研究領域中有突出貢獻的作者群。頻次反應節點被引得頻繁程度,中心性反應了節點在網絡中處于怎樣的中心地位,即在網絡中的影響力。由圖4所示的頻率及中心性可以看出,對我國貝葉斯研究影響較大的作者主要有茆詩松、張維迎、張堯庭、陳希孺、朱慧明、Amold Zellner、王春峰、Berger J.O.、周茜和江天驥等。
被引頻次多于5次的文獻如表5所示,這些重要文獻構成我國貝葉斯研究最重要的知識基礎。

表5 文獻共引科學知識圖譜中的關鍵節點
由圖2和表5可以看出,茆詩松是國內貝葉斯研究領域被引次數最多(38次)、網絡影響最大(中心性0.54)的作者,他的《高等數理統計》和《貝葉斯統計》也是該領域的重要文獻。1998年茆詩松教授著作了《高等數理統計》,1999年又編著出版了《貝葉斯統計》,用生動有趣的例子說明貝葉斯統計的基本思想和方法,為實際中使用和研究貝葉斯統計打下良好基礎,是一門很不錯的入門教材,該書的出版引發了讀者的學習貝葉斯興趣及使用貝葉斯方法去認識和解決實際問題的愿望和動力[2]。兩本著作均是我國貝葉斯研究領域早期的文獻之一,出版后即被國內學者迅速引用且一直保持較高的被引頻次。
朱慧明也是國內貝葉斯研究領域被引次數(5次)較多、網絡影響較大(0.4)的作者。朱慧明教授等在2006年出版了《貝葉斯多元統計推斷理論》和2009年出版的《貝葉斯計量經濟學模型》,書中均附有實際案例的理論與結果分析,對從事貝葉斯計量和推斷理論研究和實際工作的讀者具有一定的參考價值,對貝葉斯推斷和貝葉斯計量的普及也做出了貢獻[9,10]。
2002年度美國經濟學聯合會將“杰出資深會員獎”授予芝加哥大學的Amold Zellner教授,以表彰他在“貝葉斯方法”方面對計量經濟學方面的杰出貢獻。1971年,他的名著《An Introduction to Bayesian Inference in Econometrics》問世,在貝葉斯計量經濟學的發展史上具有里程碑的意義;1985年他在Econometrica上發表的論文“Bayesian Econometrics”再次引發了貝葉斯計量經濟學研究的狂潮[11]。隨后逐漸形成貝葉斯計量經濟學這一方向。在貝葉斯領域,Amold Zellner至今仍是在網絡中保有較高的影響力的學者之一。2005年,張堯庭教授將該著作翻譯成中文并添加了一些材料,《計量經濟學-貝葉斯推斷引論》一書的引入,必將引導國人更進一步的了解貝葉斯方法的本質[12]。
綜合全文的分析結果可以看出,我國貝葉斯研究有以下特點:
第一,我國貝葉斯研究進程具有自己的特點。我國貝葉斯研究起步較晚,目前正經歷不斷發展、完善,步入蓬勃興起的階段。統計學類期刊在我國貝葉斯研究中起著重要的推動作用。高校是我國貝葉斯研究的中堅力量。國家級基金等各類項目的資助學術論文也有效地保證了論文的學術水平和創新水平。茆詩松、Zellner Amold等眾多學者及其文章和著作也是貝葉斯研究進程中不可或缺的讀物。
第二,貝葉斯主要應用及關注領域。貝葉斯方法在經濟學、管理學、情報學、心理學以及哲學等學科領域都有其重要的應用。與貝葉斯有關的方法、推理、預測、決策,以及在企業、金融、銀行、市場等領域的應用是貝葉斯研究的重點關注領域。
第三,貝葉斯主要研究方法及研究熱點。Gibbs抽樣和MCMC模擬成為目前貝葉斯領域的主流方法。貝葉斯方法進行估計、推理、預測及網絡分析為我國博弈、決策和分類等分析問題提供了新的研究視角。貝葉斯方法對企業風險、金融、管理方面的推理、預測等實證分析研究,以及模型參數的分布是我國現階段貝葉斯領域的研究熱點。國際上,無論是在理論研究還是應用研究,貝葉斯方法都顯示出迅猛的發展勢頭。盡管我國CSSCI收錄的各領域的貝葉斯方面的論文數量逐年上升,但是在國內,對貝葉斯的研究似乎還處于蓬勃發展的前期階段,大多還處于對國外研究方法等成果的引入及消化中,尚未形成系統的理論及自己的特色。我國貝葉斯理論及應用研究的空間依然很廣闊,如何推動貝葉斯方法在我國的全面發展還需要不懈的努力。
[1]Brooks S.Markov Chain Monte Carlo Method and its Applicatoin[J].The Statistcian,Part 1,1998,47(1).
[2]茆詩松.貝葉斯統計[M].北京:中國統計出版社,2005.
[3]劉樂平,袁衛.現代貝葉斯分析與現代統計推斷[J].經濟理論與經濟管理,2004,(6).
[4]南京大學中國社會科學評價中心.中國社科引文索引(CSSCI)[EB/OL].http://cssci.nju.edu.cn.
[5]馬費成,張勤.國內外知識管理研究熱點——基于詞頻的統計分析[J].情報學報,2006,(2).
[6]湯建民.2006年國內科學學研究的詞頻分析與計量研究[J].科學學研究,2007,(S2).
[7]蔣永新,詹華清.基于共現關鍵詞統計的圖書館學情報學學科研究趨勢分析[J].圖書情報工作,2008,(9).
[8]陳超美,陳悅,侯劍華,等.CiteSpaceII:科學文獻中新趨勢與新動態的識別與可視化[J].情報學報,2009,(3).
[9]朱慧明,韓玉啟.貝葉斯多元統計推斷理論[M].北京:科學出版社,2009.
[10]朱慧明,林靜.貝葉斯計量經濟學模型[M].北京:科學出版社,2009.
[11]Zellner Bayesian Econometrics[J].Econometrica,1985,53(2).
[12]張堯庭.計量經濟學-貝葉斯推斷引論[M].上海:上海財經大學出版社,2005.