楊習(xí)貝,於東軍,竇慧莉
(1.南京理工大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,南京210094;2.江蘇科技大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院,江蘇鎮(zhèn)江212003)
近年來(lái),隨著實(shí)際工程應(yīng)用的需要,使用粗糙集理論[1-2](Rough Set Theory,簡(jiǎn)稱 RST)從不完備信息系統(tǒng)[3-7](Incomplete Information System,簡(jiǎn)稱IIS)中獲取知識(shí)已成為一個(gè)熱點(diǎn)研究問(wèn)題。由于數(shù)據(jù)填充或刪除處理IIS中的未知屬性值(間接處理方法)會(huì)影響到原有的數(shù)據(jù)分布情況,使得挖掘出來(lái)的規(guī)則具有較大的不確定性,因此將傳統(tǒng)RST中的不可分辨關(guān)系(等價(jià)關(guān)系)拓展為其他較弱的二元關(guān)系,從而使用各種拓展的粗集模型處理IIS(直接處理方法)正受到越來(lái)越多的學(xué)者的關(guān)注。
一般來(lái)說(shuō),IIS中的未知屬性值可能具有兩種不同的解釋。首先,所有的未知屬性值僅僅是被遺漏的,但又是確實(shí)存在的,根據(jù)這樣的解釋,Kryszkiewicz構(gòu)建了滿足自反和對(duì)稱性的容差關(guān)系,并研究了IIS中的知識(shí)約簡(jiǎn)問(wèn)題。另一方面,所有的未知屬性值被認(rèn)為是丟失的,是不允許被比較的,據(jù)此,Stefanowski等人構(gòu)建了非對(duì)稱相似關(guān)系并建立了近似集的概念。
另一方面,值得注意的是經(jīng)典粗糙集理論是建立在等價(jià)關(guān)系的基礎(chǔ)上的,它并未考慮信息系統(tǒng)中屬性值之間的順序關(guān)系,為了解決這個(gè)問(wèn)題,Greco提出了基于優(yōu)勢(shì)關(guān)系的粗糙集模型[8-11]。在優(yōu)勢(shì)關(guān)系粗糙集模型中,分類是建立在優(yōu)勢(shì)關(guān)系的基礎(chǔ)上的,并且被近似的集合不再是單純的等價(jià)類,而是等價(jià)類的上并集和下并集。
Shao首先研究了不完備序值信息系統(tǒng)中的粗糙數(shù)據(jù)分析問(wèn)題,在他的不完備序值信息系統(tǒng)中,所有的未知屬性值被認(rèn)為是遺漏的,并且屬性值之間存在序關(guān)系,根據(jù)這種語(yǔ)義解釋,Shao提出了一種擴(kuò)展優(yōu)勢(shì)關(guān)系及相關(guān)的粗糙集模型。……