趙 越,茹婷婷
(吉林建筑工程學院 a.計算機科學與工程學院;b.基礎科學部,長春 130118)
貝葉斯網絡結構學習方法新探
趙 越a,茹婷婷b
(吉林建筑工程學院 a.計算機科學與工程學院;b.基礎科學部,長春 130118)
從大型數據庫中學習網絡結構一直是貝葉斯網絡學習的研究熱點.針對此問題提出了一種基于預測能力的學習算法,通過預測能力建立并調整貝葉斯網絡結構,把變量之間弧的存在性與方向有機地結合在一起。
貝葉斯網絡;結構學習;預測能力
0引言
貝葉斯網絡是近幾年發展起來的處理不確定信息和進行概率推理最有力的工具,是一種對概率關系的有向圖解描述。它結合了數據信息和真實世界的信息(先驗信息),具有描述事件多態性和信號邏輯關系非確定性的能力。貝葉斯網絡使用概率理論來描述不同信號之間的條件相關性,運用貝葉斯定理計算出后驗概率,并可應用于有條件地依賴多種控制因素的決策,它已成為人工智能領域處理不確定性問題的主要方法。
貝葉斯網絡學習主要包括參數學習和結構學習兩部分內容。結構學習比參數學習要難得多,實際中由專家給出貝葉斯網絡結構是費時、費力的,在很多情況下甚至是不可能的,因此貝葉斯網絡結構學習方法是一項有益的研究。
貝葉斯網絡數學描述為:給定一個有向無環圖G和一個在離散變量集合V={v1,v2,…,vn}上的聯合概率分布P,如果在V中的變量和G節點之間存在一一對應關系,并滿足P(v1,v2,…,vn)=∏ip(vi|pai)。其中,Pai是G中Vi的直接祖先節點,將圖G和概率P的聯合稱為貝葉斯網絡,要求P(v1,v2,…,vi|ζ)= ∏ip(vi|v1,v2,…vi-1,ζ),且各變量需滿足馬爾科夫獨立性條件 P(vi|v1,v2,…,vi-1,ζ)=p(vi|pa(vi),ζ)[1-2]。
在數據完備情況下,結構學習算法可以分為基于統計測試的方法和基于搜索記分的方法。統計測試尤其是指條件獨立性測試;搜索記分的方法是選定一個適當的記分函數,通過不斷地改變網絡結構計算出相應的記分值,結合一些優化算法在結構空間進行啟發搜索,直至搜索到的結構具有最高記分為止[3]。由于貝葉斯網絡結構是一個組合空間,找到一個最高記分的網絡結構已證實為NP難問題,因此需要進行啟發式搜索。




本文在對貝葉斯網絡的原理和學習方法等進行介紹的基礎上,著重對貝葉斯網絡的結構學習機制進行了研究。對基于預測能力的離散貝葉斯網絡結構學習方法進行探討。由于預測能力就是預測正確率,預測能力相同是條件獨立性的充分必要,這樣通過預測能力的引入把變量之間弧的存在性與方向有機地結合在一起,得到了良好的效果。
[1]許麗佳,黃建國,王厚軍,龍兵.混合優化的貝葉斯網絡結構學習[J].計算機輔助設計與圖形學學報,2009(5):634-636.
[2]胡學鋼,胡春玲.一種基于依賴分析的貝葉斯網絡結構學習算法[J].模式識別與人工智能,2006(4):446-448.
[3]張什永,彭云,王曉蒲.一種改進的貝葉斯網絡知識合成算法[J].中國科學技術大學學報,2011(1):88-92.
[4]楊善林,胡笑旋,毛雪岷.融合知識和數據的貝葉斯網絡構造方法[J].模式識別與人工智能,2006(1):32-33.
責任編輯:吳旭云
Research on structure learning of Bayesian network
ZHAO Yuea,RU Ting-tingb
(a.School of Computer Science and Technology;b.Department of Basic Science,Jilin Institute of Architecture and Civil Engineering,Changchun 130118,China)
Learning structure from large database has been a research focus of learning Bayesian Network.A learning algorithm is presented based on prediction ability,and through which Bayesian network structure is built and adjusted.The existence and direction of arcs among variables are combined organically.
Bayesian Network;structure learning;prediction ability
TP391
A
1009-3907(2011)06-0032-03
2011-05-10
吉林省教育廳“十一五”科學技術研究項目(吉教科合字2010第314號)
趙越(1982-),男,吉林通化人,講師,碩士,主要從事機器學習方面的研究。