摘要:結(jié)合模糊關(guān)系的理論,對(duì)粗糙集理論的屬性約簡算法進(jìn)行研究,提出了一個(gè)新的屬性約簡算法,并給出了一個(gè)應(yīng)用實(shí)例。
關(guān)鍵詞:粗糙集; 模糊集; 屬性約簡算法
中圖分類號(hào):TP311文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1001-3695(2007)11-0093-03
波蘭數(shù)學(xué)家Z. Pawlak[1]于1982年提出的粗糙集理論是一種新的處理不精確、不完全與不相容的數(shù)學(xué)方法,能有效地處理各種不完備信息,并從中發(fā)現(xiàn)隱含知識(shí),揭示潛在的規(guī)律。粗糙集以不可分辨關(guān)系為基礎(chǔ),研究不同類中對(duì)象組成的集合之間的關(guān)系。屬性約簡是粗糙集理論的核心問題和重要課題之一。
隨著數(shù)據(jù)挖掘(data mining,DM)和知識(shí)發(fā)現(xiàn)(knowledge discovery in database,KDD)的概念在1989年被提出,隨之出現(xiàn)了新一代的技術(shù)和工具用于DM和KDD領(lǐng)域。在DM和KDD的諸多方法中,粗糙集理論與方法是復(fù)雜系統(tǒng)中一種較為有效的方法。因?yàn)樗c概率方法、模糊集方法和證據(jù)理論方法等其他處理不確定性問題理論最顯著的區(qū)別是它無須提供問題所需處理的數(shù)據(jù)集合之外的任何先驗(yàn)信息,所以它對(duì)數(shù)據(jù)的不確定性描述和處理一般來說是比較客觀的。
信息系統(tǒng)約簡主要是使信息量減少,將一些無關(guān)或多余的信息丟棄,而不影響其原有的功能。目前粗糙集應(yīng)用的有效算法的研究主要集中在信息系統(tǒng)屬性約簡和用以規(guī)則提取的值約簡方面。屬性約簡是指在保持信息系統(tǒng)分類或決策能力不變的條件下,刪除冗余屬性,用以得出正確的、簡潔的規(guī)則。求解最小屬性約簡是NPhard
問題[2]。不過在實(shí)際應(yīng)用中,得出相對(duì)屬性約簡就可以了。
研究人員已經(jīng)提出很多屬性約簡算法[2~7]。其中,不論是基于約簡后屬性數(shù)最少還是約簡后規(guī)則最簡,都沒有考慮到數(shù)據(jù)領(lǐng)域知識(shí)的特殊性和用戶要求的靈活性。正如前
面所說粗糙集不依賴任何先驗(yàn)信息比較客觀一樣,本文結(jié)合模糊關(guān)系讓它具有一定的領(lǐng)域知識(shí),讓本文屬性約簡算法具有更實(shí)際的決策需要和用戶要求。實(shí)驗(yàn)證明,用戶可以根據(jù)專家領(lǐng)域知識(shí)調(diào)整閾值,得到用戶滿意的屬性約簡結(jié)果。
5結(jié)束語
本文在粗糙集和模糊集理論的基礎(chǔ)上提出一種處理粗糙數(shù)據(jù)的屬性約簡算法,探討了基于粗糙集屬性約簡算法在決策領(lǐng)域的應(yīng)用,對(duì)數(shù)據(jù)挖掘和決策分析都是一個(gè)有益的嘗試。由于其中引入了模糊關(guān)系和模糊集中的復(fù)合矩陣運(yùn)算,用戶可以根據(jù)決策的需要和領(lǐng)域知識(shí)更改閾值,得到用戶滿意的屬性結(jié)果。通過在家庭用車的應(yīng)用實(shí)例驗(yàn)證了改進(jìn)算法的可行性、有效性。在粗糙集中如何更好地離散化數(shù)據(jù)和與其他的軟計(jì)算方法結(jié)合使用等方面,有待進(jìn)一步研究。
參考文獻(xiàn):
[1]PAWLAK Z. Rough sets[J]. International Journal of Computer and Information Science, 1982,11(5):341-356.
[2]WONG S K M, ZIARKO W. On optional decision rules in decision tables [J]. Bulletin of Polish Academy of Sciences, 1985,33(11/12):693-696.
[3]DU Weifeng, LI Haiming. Another kind of fuzzy rough sets[C]//Proc of IEEE International Conference on Granular Computing. 2005:145148.
[4]苗奪謙. Rough Set理論中連續(xù)屬性的離散化方法[J]. 自動(dòng)化學(xué)報(bào), 2001,27(3):296-302.
[5]常犁云, 王國胤, 吳渝. 一種基于Rough Set 理論的屬性約減及規(guī)則提取方法[J]. 軟件學(xué)報(bào),1999,10(11):12061211.
[6]代建華,李元香. 粗集中屬性約簡的一種啟發(fā)式遺傳算法[J]. 西安交通大學(xué)學(xué)報(bào),2002,36(12):12861290.
[7]張文修,吳偉志,梁吉業(yè),等.粗糙集理論與方法[M]. 北京:科學(xué)出版社, 2001.
[8]胡寶清. 模糊理論基礎(chǔ)[M].武漢:武漢大學(xué)出版社,2004.
“本文中所涉及到的圖表、注解、公式等內(nèi)容請以PDF格式閱讀原文”