馮琴榮,溫瑋華
(山西師范大學(xué)數(shù)學(xué)與計算機科學(xué)學(xué)院 山西 臨汾 041004)
粗糙集理論是由Pawlak[1]于1982 年提出的,它是一種處理不一致、不完備和不精確信息的有效工具。近年來,粗糙集理論已被成功地應(yīng)用于諸多領(lǐng)域,如知識發(fā)現(xiàn)、數(shù)據(jù)挖掘及模式識別等。
Shannon[2]提出的信息熵是一種度量不確定性的重要工具,已被廣泛地應(yīng)用于許多領(lǐng)域。在粗糙集理論中,針對劃分情形,文獻[3-4]給出了粗糙集理論中主要概念與運算的信息表示,研究了知識的粗糙性與信息熵之間的關(guān)系。文獻[5]研究了粗糙集理論的香農(nóng)熵度量和哈特萊熵度量,并給出了公理化性質(zhì)。文獻[6]利用信息熵的最小描述長度原則,提出了3 種模型選擇準(zhǔn)則,且定義了3 種條件熵來預(yù)測屬性重要性。文獻[7]研究了粗糙集和粗糙關(guān)系數(shù)據(jù)庫的粗糙熵度量。文獻[8]提出了一種基于信息增益互補的信息熵并驗證了其合理性,并在此基礎(chǔ)上,引入了條件熵和互信息。文獻[9]從信息熵、粗糙熵和知識粒度角度研究了粗糙集理論的不確定性。文獻[10]研究了劃分情形的信息熵與補熵,并將其擴展到覆蓋情形,雖然覆蓋情形下的熵是香農(nóng)熵的形式,但其不滿足單調(diào)性。目前,劃分情形的熵度量已得到了完善解決。
區(qū)間值信息系統(tǒng)作為單值信息系統(tǒng)的一種推廣,能很好地描述不精確的對象和保存數(shù)據(jù)的特征。在區(qū)間值信息系統(tǒng)中,基于區(qū)間值的相似度構(gòu)建相容關(guān)系,由相容關(guān)系產(chǎn)生的相容類構(gòu)成論域的覆蓋。關(guān)于該情形下的熵度量,文獻[11]研究了區(qū)間值和集值信息系統(tǒng)基于模糊偏序關(guān)系的模糊粗糙熵和模糊知識粒度,并研究了熵度量與粒度度量之間的關(guān)系。文獻[12]通過引入相似度的概念定義了基于相容關(guān)系的θ-相容類,并提出用θ-相似熵來度量區(qū)間值信息系統(tǒng)的不確定性。文獻[13]定義了α-弱相似關(guān)系,建立了基于α-弱相似關(guān)系的粗糙集模型,并給出不完備區(qū)間值信息系統(tǒng)的精度、粗糙度和近似精度,用以度量不完備區(qū)間值信息系統(tǒng)的不確定性。雖然學(xué)者們對區(qū)間值信息系統(tǒng)的不確定性度量進行了研究,但仍缺少香農(nóng)熵形式的熵度量。鑒于此,本文給出了一種由覆蓋導(dǎo)出劃分的方法,并證明了覆蓋越細,由其導(dǎo)出的劃分越細,進而構(gòu)造了區(qū)間值信息系統(tǒng)的信息熵與補熵,并且證明了它們的單調(diào)性和有界性。









區(qū)間值信息系統(tǒng)是單值信息系統(tǒng)的一種推廣形式,雖然學(xué)者們對其不確定性度量進行了大量研究,但仍缺少香農(nóng)熵形式的熵度量。為此,本文給出了一種由覆蓋導(dǎo)出劃分的方法,并證明了覆蓋越細,由其導(dǎo)出的劃分越細,進而用導(dǎo)出的劃分分別構(gòu)造了區(qū)間值信息系統(tǒng)的熵和補熵,并證明了其單調(diào)性和有界性。進一步可以繼續(xù)研究區(qū)間值信息系統(tǒng)的聯(lián)合熵和條件熵及其它們的性質(zhì)。