李星星
摘 ?要:在模式識別系統中,隨著計算機技術和網絡技術的飛速發展,使得各個行業領域的信息急劇增加。鑒于信息的不確定性,這里就涉及模糊的概念。 模糊粗糙集理論作為一種處理不精確(imprecise)、不一致(inconsistent)、不完整(incomplete)等各種不完備的信息有效的工具。
關鍵詞:模式識別;模糊集;粗糙集
一、模糊粗糙集理論的引入
粗糙集理論作為一種處理不精確(imprecise)、不一致(inconsistent)、不完整(incomplete)等各種不完備的信息有效的工具,鑒于信息的不確定性,這里就涉及模糊的概念。模糊的概念來源于自然環境中各種模糊的現象。像“粗”與“細”二者定義,倘若得知某顆樹的直徑大約為15cm,那么很難明確其為“粗”或者“細”,因為“粗”與“細”這兩個概念之間并沒有一個明確的界限,這兩個概念之間是具有模糊性的、是不精確的。
最早提出模糊性概念是在1965年,美國非常著名的控制論學者,加利福尼亞大學的L.A.扎德教授提出了模糊集(fuzzy sets)的概念以及談到了用來表示模糊性概念的隸屬函數,從此建立了模糊集理論,并探索了模糊性或者說是不確定性等問題的研究方法及策略,為后續模糊集理論的發展奠定了堅實的基礎。近幾十年以來,模糊集理論得到了飛速的發展。1982年,波蘭數學家Z. Pawlak提出了粗糙集理論思想,該理論也是作為數據分析處理的一種工具。粗糙集理論涉及大量且十分好的處理技術,深層次地應用于信息處理、智能計算范疇。粗糙集理論主要作為一種用來處理不確定性、不一致性等一系列不完整信息而存在的有效手段,其不需要什么先驗知識,能夠直接將它用來分析和處理數據,以至于挖掘出隱藏的知識以及潛在的規律,廣泛的應用于機器學習與數據挖掘范疇。
二、模糊粗糙集理論概述
粗糙集理論是一種用來處理不確定性信息的強有力的工具,其思想主要體現在某一集合中一組對象之間的不可分辨性,并且該理論廣泛的應用于屬性約簡、數據壓縮、數據挖掘、規則提取以及粒度計算領域。在數學范疇內,粗糙集所涉及的對象為集合;在編程范疇內,粗糙集所研究的對象則是一些特殊的矩陣;而在機器學習領域內,粗糙集所研究的對象則是一系列的決策表。在決策表中有條件屬性(condition attribute)和決策屬性(decision attribute),這些屬性都是清晰、確定的,這些屬性所對應的則是等價關系,在特征降維(屬性約簡)過程中,樣本的屬性值必須要經過離散化處理;然模糊集卻說明著集合內子類邊界的無界定性。模糊性則是精確性的一個相反的概念,在現實生活中,人們經常用模糊性的術語來表達自己的觀點以及解決一些問題。在模糊集理論中的條件屬性(condition attribute)和決策屬性(decision attribute)均可以是模糊的,所對應的則是相似關系,在特征降維過程中,這些屬性值并不需要離散,可以直接用來進行后續處理。將粗糙集和模糊集兩者相結合,就有了模糊粗糙集的概念,既考慮了模糊集的粗糙近似,而且又用相似關系或者模糊劃分來得到子集的近似。模糊粗糙集模型適用于樣本關系和對象子集都是模糊近似的場合[1]。在模糊粗糙集模型中,我們可以用模糊等價關系(fuzzy equivalence relation)來進行聚類分析,最終可用于判別分類。接下來給出關于模糊粗糙集的幾個重要定義:
定義1:若 為一個非空有限集合,R為 的一個二值關系矩陣,若R符合如下三個條件,即可認為R為集合 上的一個模糊等價關系。
(1)反身性:
(2)對稱性:
(3)傳遞性:
定義2:假設U是一個論域,R是一個模糊等價關系,那么U上的模糊劃分可表示為 ,其中, 是由模糊等價關系R和樣本 所誘導的模糊等價類別(fuzzy equivalence class)。 意味著論域U被R劃分, 則是基于模糊等價關系的模糊劃分。
這與經典的Pawlak粗糙集模型不同。經典的Pawlak粗糙集模型中的等價關系則為易脆的等價關系(crisp equivalence relation),詳細的情況見參考文獻[2]。
三、模糊粗糙集理論的主要研究方向
目前,模糊粗糙集理論的研究方向主要是三個方面:
理論上,①利用抽象代數來研究粗糙集代數空間這種特殊的代數結構。②利用拓撲學描述粗糙空間。③還有就是研究粗糙集理論和其他軟計算方法或者人工智能的方法相接合,例如和模糊理論、神經網絡、支持向量機、遺傳算法等。④針對經典粗糙集理論框架的局限性,拓寬粗糙集理論的框架,將建立在等價關系的經典粗糙集理論拓展到相似關系甚至一般關系上的粗糙集理論。
應用上,模糊粗糙集理論在許多領域得到了應用,①臨床醫療診斷;②電力系統和其他工業過程故障診斷;③預測與控制;④模式識別與分類;⑤機器學習和數據挖掘;⑥圖像處理;⑦其他。
算法上,一方面研究了模糊粗糙集理論屬性約簡算法和規則提取啟發式算法,例如基于屬性重要性、基于信息度量的啟發式算法,另一方面研究和其他智能算法的結合,是當前國內外研究的一個熱點之一。
參考文獻
[1] ?Wang C,Qi Y,Shao M,et al. A Fitting Model for Feature Selection With Fuzzy Rough Sets[J]. IEEE Transactions on Fuzzy Systems,2017,25(4):741-753.
[2] ?Dubois D,Prade H. ROUGH FUZZY SETS AND FUZZY ROUGH SETS*[J]. International Journal of General Systems,1990,17(2-3):191-209.