摘要:首先描述了粗糙集理論的基本概念,包括粗糙集知識(shí)表示方法和粗糙集約簡(jiǎn)理論;敘述了粗糙集理論及其與其他非線性理論相結(jié)合在圖像處理中的應(yīng)用情況;最后指出了粗糙集理論應(yīng)用于圖像處理的基本思路,并指出將粗糙集理論與其他非線性理論相結(jié)合應(yīng)用于圖像處理,將會(huì)產(chǎn)生更加有效的結(jié)果。
關(guān)鍵詞:粗糙集; 知識(shí)系統(tǒng); 不確定性; 圖像處理
中圖分類號(hào):TP18; TP391文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1001-3695(2007)04-0176-03
RS(Rough Sets,粗糙集,又稱為粗集)理論是一種刻畫(huà)不完整性和不確定性的數(shù)學(xué)工具,能有效分析和處理不精確、不一致、不完整等各種不完備信息,并從中發(fā)現(xiàn)隱含知識(shí),揭示潛在的規(guī)律[1]。粗集理論是由波蘭學(xué)者Zdzislaw Pawlak在1982年[2]提出的。1991年P(guān)awlak Z.出版了專著[3],系統(tǒng)全面地闡述了RS理論,奠定了嚴(yán)密的數(shù)學(xué)基礎(chǔ)。該書(shū)與1992年出版的RS理論應(yīng)用專集[4]較好地總結(jié)了這一時(shí)期RS理論與實(shí)踐的研究成果,促進(jìn)了它的發(fā)展。
Rough Sets的生命力在于它具有較強(qiáng)的實(shí)用性,目前已經(jīng)在人工智能、知識(shí)與數(shù)據(jù)發(fā)現(xiàn)、模式識(shí)別與分類、故障檢測(cè)等方面得到了較為成功的應(yīng)用。目前,大量學(xué)者將粗糙集理論應(yīng)用于圖像處理的各個(gè)方面,取得了較好的效果。
1粗糙集理論基本概念
粗糙集理論的出發(fā)點(diǎn)在于:根據(jù)目前已有的對(duì)給定問(wèn)題的知識(shí)將問(wèn)題的論域進(jìn)行劃分;然后對(duì)劃分后的每一個(gè)組成部分確定其對(duì)某一概念的支持程度,即肯定支持此概念、肯定不支持此概念和可能支持此概念。基本粗糙集理論包括兩方面的內(nèi)容,即RS知識(shí)表示方法和粗糙集約簡(jiǎn)理論。
1.1RS知識(shí)表示方法
基于Rough Sets理論的知識(shí)發(fā)現(xiàn),主要是借助于信息表這樣一種有效的數(shù)據(jù)表知識(shí)表達(dá)方式。信息表知識(shí)表達(dá)系統(tǒng)的基本成分是研究對(duì)象的集合。關(guān)于這些對(duì)象的知識(shí)是通過(guò)指定對(duì)象的屬性(特征)和它們的屬性值(特征值)來(lái)描述的。一般地,一個(gè)信息表知識(shí)表達(dá)系統(tǒng)S可以表示為一個(gè)四元組S=(U,R,V, f )。這里,U是對(duì)象的集合,也稱為論域;R是屬性的非空有限集合;V=∪a∈A,Va表示屬性a的值域; f ∶U×R→V是一個(gè)信息函數(shù),它指定U中每一個(gè)對(duì)象x的屬性值。 在粗集理論中,知識(shí)被認(rèn)為是一種分類能力,即根據(jù)事物的特征差別將其分門(mén)別類的能力。分類過(guò)程中相差不大的個(gè)體被歸于同一類,它們的關(guān)系就是不可分辨關(guān)系,即等價(jià)關(guān)系。其定義為:對(duì)于每個(gè)屬性子集BR,本文定義一個(gè)不可分辨關(guān)系(Indiscernibility Relation)IND(B),即
顯然,IND(B)是一個(gè)等價(jià)關(guān)系(滿足自反性、對(duì)稱性和傳遞性)。
粗糙集理論的不確定性是建立在上、下近似的概念之上的。給定知識(shí)表達(dá)系統(tǒng)S=(U,R,V, f),對(duì)于每個(gè)子集XU和不可分辨關(guān)系B,X的上近似(Upper Approximation)和下近似(Lower Approximation)分別定義如下:
X的上近似B-(X)=∪{Yi|Yi∈U|IND(B),Yi∩X≠φ}
X的下近似B-(X)=∪{Yi|Yi∈U|IND(B),YiX}
集合BNB(X)=B-(X)-B-(X)稱為X的B邊界(Boundary);POSB(X)=B-(X)稱為X的B正域(Positive Region);NEGB(X)=U-B-(X)稱為X的B負(fù)域(Negative Region)。
B-(X)是根據(jù)知識(shí)B(屬性子集B)、U中所有一定能歸入集合X的元素構(gòu)成的集合,即所有包含于X的基本集Yi的并;B-(X)是根據(jù)知識(shí)B、U中所有一定和可能歸入集合X的元素構(gòu)成的集合,即所有與X的交不為空集的基本集Yi的并;BNB(X)是根據(jù)知識(shí)B、U中既不能肯定歸入X,又不能肯定歸入集合X的元素構(gòu)成的集合;正域POSB(X)是根據(jù)知識(shí)B、U中所有能確定一定歸入X的元素的集合;負(fù)域NEGB(X)是根據(jù)知識(shí)B、U中所有不能確定一定歸入X的元素的集合;邊界域BNB(X)是某種意義上論域上的不確定域,邊界域中的元素既不能肯定地屬于集合X,也不能肯定地屬于X。
集合的不精確性正是由于邊界域的存在而引起的。集合的邊界域越大,其精確性則越低。如果BNB(X)是空集,則X關(guān)于R是清晰的(Crisp),稱集合X為精確集;反之如果BNB(X)不是空集,則稱集合X為關(guān)于R的粗糙集(Rough Sets)。
1.2RS約簡(jiǎn)理論
RS約簡(jiǎn)理論是粗糙集的核心內(nèi)容。其主要思想是:保持相對(duì)分類能力不變的條件下,刪除冗余的、不必要的屬性或?qū)傩灾担_(dá)到知識(shí)簡(jiǎn)化的目的。
知識(shí)庫(kù)中的知識(shí)(屬性)并不是同等重要的,甚至其中某些知識(shí)是冗余的。所謂知識(shí)約簡(jiǎn),就是在保持知識(shí)庫(kù)分類能力不變的條件下,刪除其中不相關(guān)或不重要的知識(shí)。
令R為由特征集定義的一等價(jià)關(guān)系族。對(duì)于任一屬性a∈R,如果IND(R)≠I(mǎi)ND(R-{a}),則稱a為R中不可省略的(Indispensable);否則a為R中可省略的(Dispensable)。R中所有不可省略關(guān)系的集合稱為R的核,記為CORE(R),即CORE(R)=∩RED(R)。這里RED(R)是R的所有簡(jiǎn)化族。核中的屬性是影響分類的重要屬性。
約簡(jiǎn)和核這兩個(gè)概念很重要,是RS方法的精華。RS理論提供了搜索約簡(jiǎn)和核的方法。
綜上所述,粗糙集理論的基本框架可歸納為:以不可分辨關(guān)系劃分所研究論域的知識(shí),形成知識(shí)表達(dá)系統(tǒng);利用上、下近似集逼近描述對(duì)象,通過(guò)知識(shí)約簡(jiǎn),從而獲得最簡(jiǎn)知識(shí)。
2粗糙集理論在圖像處理中的應(yīng)用
由于圖像信息本身的復(fù)雜性和較強(qiáng)的相關(guān)性,圖像處理過(guò)程中的各個(gè)層次可能出現(xiàn)不完整和不精確的問(wèn)題。將粗糙集理論應(yīng)用于圖像處理,在一些場(chǎng)合具有比硬計(jì)算方法(即精確、固定的算法) 更好的效果。目前,粗糙集理論已應(yīng)用于圖像處理的各個(gè)方面,產(chǎn)生了較好的效果。下面對(duì)國(guó)內(nèi)外關(guān)于粗糙集理論及其與其他理論相結(jié)合應(yīng)用于圖像處理的各個(gè)方面加以闡述。
2.1粗糙集應(yīng)用于圖像處理
(1)圖像濾波
粗糙集理論應(yīng)用于圖像濾波的基本思想是將每一幅圖像表達(dá)的信息作為一個(gè)知識(shí)系統(tǒng),利用粗糙集中的近似集合概念檢測(cè)并處理圖像中的噪聲像素[5]。胡小梅等人[6]在此基礎(chǔ)上,提出了一種基于粗糙集理論的彩色圖像濾波算法。該算法可以有效地去除彩色圖像中的椒鹽噪聲,并能較好地保持圖像的邊緣細(xì)節(jié)信息。為更好地保護(hù)邊緣,楊平先等人[7]根據(jù)噪聲和邊緣的特征以粗集方法劃分噪聲和邊緣,并分別予以不同的處理,得到一個(gè)改進(jìn)的粗集方法中值濾波器。由此,將粗糙集理論用于圖像濾波,不僅能有效地抑制噪聲,又能更好地保護(hù)邊緣信息。
(2)圖像增強(qiáng)
粗糙集理論用于圖像增強(qiáng)是將知識(shí)系統(tǒng)看做圖像近似空間。其基本步驟為:①對(duì)圖像根據(jù)不同特性利用不可分辨關(guān)系的等價(jià)概念進(jìn)行子圖劃分;②對(duì)各個(gè)子圖進(jìn)行適當(dāng)?shù)臑V波增強(qiáng)操作;③最后進(jìn)行子圖合并得到增強(qiáng)后的圖像。很多學(xué)者[8~12]根據(jù)此方法對(duì)不同圖像作增強(qiáng)處理,取得了較好的效果。
(3)圖像分割
圖像分割是把目標(biāo)從背景中提取出來(lái),為更高層次的圖像處理和理解打下基礎(chǔ)。劉巖等人[13]將原圖像按等價(jià)關(guān)系進(jìn)行劃分,基于屬性約簡(jiǎn)的概念對(duì)不同區(qū)域按照不可分辨關(guān)系分類。通過(guò)綜合不同分類所得到的等價(jià)關(guān)系得到滿意的分割結(jié)果。Akash Mohabey等人[14]將粗糙集的思想應(yīng)用到彩色圖像分割中,采用待分割圖像直方圖的上逼近和下逼近來(lái)分割原圖像,提出了將粗糙集應(yīng)用于彩色文本圖像區(qū)域特征的軟分類算法。而萬(wàn)長(zhǎng)明等人[15]在一種改進(jìn)的RGB橢圓彩色模型[16]上,對(duì)每一個(gè)分量進(jìn)行若干次小波變換后的高頻小波系數(shù)塊進(jìn)行直方圖特征分析,并應(yīng)用粗糙集的分類思想,將彩色文本圖像分割為相應(yīng)的區(qū)域,得到了較好的分割效果。
(4)圖像特征提取與分類
特征選擇是圖像識(shí)別中一個(gè)至關(guān)重要的問(wèn)題。在圖像處理中,圖像可以看成是一個(gè)知識(shí)表達(dá)系統(tǒng)。其像素是對(duì)象,像素的各種特征,如灰度、紋理、幾何特征等則視為其屬性。根據(jù)這些屬性進(jìn)行分類的過(guò)程實(shí)質(zhì)上是一種知識(shí)的表達(dá)過(guò)程,而研究知識(shí)的約簡(jiǎn)是粗集理論的核心內(nèi)容之一。潘勵(lì)等人[17]把知識(shí)約簡(jiǎn)的思想應(yīng)用到圖像特征選擇中,結(jié)合粗集理論提出了一種圖像特征選擇算法。該算法先把抽象的特征搜索空間變?yōu)橐环N意義明確的知識(shí)表達(dá)系統(tǒng),利用Kohonen網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)離散化、歸一化;然后根據(jù)人的邏輯推理思想進(jìn)行知識(shí)約簡(jiǎn)。其算法能有效地進(jìn)行圖像特征的約簡(jiǎn)。
圖像分類屬于模式識(shí)別的范疇。其主要內(nèi)容是圖像經(jīng)過(guò)某些預(yù)處理(增強(qiáng)、復(fù)原、壓縮)后,進(jìn)行圖像特征提取,從而進(jìn)行判決分類。 粗集理論應(yīng)用于圖像分類,可以把圖像分類問(wèn)題看做是簡(jiǎn)化知識(shí)表達(dá)與信息分類處理問(wèn)題。基于此,陳添丁[18]通過(guò)聚類分析,利用直方圖計(jì)算,獲取顏色特征。通過(guò)計(jì)算二值映射操作后的二值圖像的共生矩陣,獲取能量的紋理特征。利用MATLAB進(jìn)行這些特征提取的預(yù)處理計(jì)算工作,并利用粗糙集理論進(jìn)行分類,取得了較好的分類效果。董廣軍等人[19]將粗糙集理論引入遙感影像的處理中,充分利用了粗糙集處理不確定性問(wèn)題的優(yōu)點(diǎn),提出了一種新的遙感圖像知識(shí)分類算法,即粗糙分類法,取得了較好的效果。
2.2粗糙集理論與其他非線性理論相結(jié)合應(yīng)用于圖像處理
粗糙集是一種描述不完整性和不確定性知識(shí)的方法。其優(yōu)勢(shì)是它不需要任何預(yù)備的、額外的有關(guān)數(shù)據(jù)信息;但是粗糙集也有其局限性。單純地使用粗糙集理論不一定能完全有效地描述不精確或不確定問(wèn)題。粗糙集理論和其他軟計(jì)算方法的結(jié)合,能夠提高數(shù)據(jù)開(kāi)采能力。目前,已經(jīng)有大量學(xué)者將粗糙集理論與其他非線性理論相結(jié)合應(yīng)用于圖像處理領(lǐng)域,彌補(bǔ)了單一理論研究的不足,產(chǎn)生了可觀、有效的結(jié)果。其中粗糙集與神經(jīng)網(wǎng)絡(luò)相結(jié)合是當(dāng)前研究的熱點(diǎn)。
神經(jīng)網(wǎng)絡(luò)利用復(fù)雜的非線性系統(tǒng)對(duì)圖像中大量不準(zhǔn)確而且不完整的數(shù)據(jù)進(jìn)行處理,并且克服網(wǎng)絡(luò)本身的不精確性,有較強(qiáng)的魯棒性和容錯(cuò)能力。但是冗余信息甚至錯(cuò)誤信息的干擾,容易導(dǎo)致神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜、訓(xùn)練時(shí)間過(guò)長(zhǎng)、收斂速度過(guò)慢、計(jì)算量急劇增加等問(wèn)題。而粗糙集理論提供了一個(gè)知識(shí)發(fā)現(xiàn)的框架,從事實(shí)中抽取規(guī)則,用決策表的形式來(lái)獲取更簡(jiǎn)單的知識(shí)表示,從而實(shí)現(xiàn)從樣本數(shù)據(jù)中進(jìn)行特征選擇,加快概念學(xué)習(xí)和分類,減少分類的代價(jià),提供分類的質(zhì)量。因此,將粗糙集與神經(jīng)網(wǎng)絡(luò)結(jié)合,揚(yáng)長(zhǎng)避短,將更加有效地解決實(shí)際問(wèn)題,目前已有了大量的成果。
粗糙集和神經(jīng)網(wǎng)絡(luò)最常用的結(jié)合方式是粗糙集作為神經(jīng)網(wǎng)絡(luò)的前端處理器。這不僅可以減少網(wǎng)絡(luò)學(xué)習(xí)所需的數(shù)據(jù)量,濃縮數(shù)據(jù)蘊(yùn)涵的規(guī)律,改善網(wǎng)絡(luò)因數(shù)據(jù)量大帶來(lái)的效率問(wèn)題,同時(shí)使網(wǎng)絡(luò)有較好的泛化能力和預(yù)測(cè)精度[20]。Wang Yu等人[21]將粗糙集與神經(jīng)網(wǎng)絡(luò)相結(jié)合應(yīng)用于圖像恢復(fù),使用粗糙集作為系統(tǒng)的預(yù)處理,簡(jiǎn)化分類規(guī)則,約簡(jiǎn)圖像的特征;然后再用簡(jiǎn)化后的樣本集訓(xùn)練神經(jīng)網(wǎng)絡(luò);通過(guò)實(shí)驗(yàn)發(fā)現(xiàn),圖像恢復(fù)性能大為提高。余春艷等人[22]將其應(yīng)用于遙感圖像識(shí)別中。首先使用粗糙集對(duì)特征進(jìn)行處理,形成輸入數(shù)據(jù),然后利用處理特征時(shí)產(chǎn)生的規(guī)則,進(jìn)一步指導(dǎo)識(shí)別網(wǎng)絡(luò)的構(gòu)造,從而提高網(wǎng)絡(luò)的效率。實(shí)驗(yàn)表明,針對(duì)基于神經(jīng)網(wǎng)絡(luò)的模式識(shí)別在冗余數(shù)據(jù)處理上的不足,結(jié)合粗糙集理論,對(duì)神經(jīng)網(wǎng)絡(luò)的輸入樣本特征集進(jìn)行一定的約簡(jiǎn),利用粗糙集推導(dǎo)知識(shí)的能力來(lái)構(gòu)造神經(jīng)網(wǎng)絡(luò)是可行的,并且能夠提高整個(gè)系統(tǒng)的效率。
另外,還有一些學(xué)者將粗糙集理論與其他非線性理論相結(jié)合,如粗糙集與模糊集相融合,提出了模糊粗糙集與粗糙模糊集[23~25]。文獻(xiàn)[26,27]將其應(yīng)用到圖像增強(qiáng)中,產(chǎn)生了比傳統(tǒng)圖像增強(qiáng)方法更好的效果。
3總結(jié)與展望
粗糙集理論是一種處理不精確、不確定或不完全數(shù)據(jù)的新的數(shù)學(xué)方法。這一理論處理不確定性問(wèn)題的獨(dú)特思想以及它與其他理論較好的融合性,使其在眾多領(lǐng)域,特別是在智能信息處理中得到了廣泛的關(guān)注和成功的應(yīng)用。圖像處理過(guò)程中的各個(gè)層次可能出現(xiàn)不完整和不精確的問(wèn)題。將粗糙集理論應(yīng)用于圖像處理,在一些場(chǎng)合產(chǎn)生了更好的效果。
粗糙集理論應(yīng)用于圖像處理。其基本思路是將圖像所表達(dá)的信息作為一個(gè)知識(shí)系統(tǒng),其像素是對(duì)象;利用粗糙集中的不可分辨概念、近似集合和知識(shí)約簡(jiǎn)的思想,對(duì)圖像進(jìn)行相關(guān)的操作(檢測(cè)噪聲、特征選擇與約簡(jiǎn)、分類等)。
值得說(shuō)明的是,粗糙集理論仍是一個(gè)處在發(fā)展中的學(xué)科,還有不少有意義且極具挑戰(zhàn)性的研究方向及應(yīng)用領(lǐng)域。因此,如何將不斷完善中的粗糙集理論應(yīng)用于圖像處理,利用粗糙集理論的知識(shí)約簡(jiǎn)性質(zhì)對(duì)已有的圖像處理方法進(jìn)行優(yōu)化,或者將粗糙集理論與現(xiàn)有的其他理論,如模糊理論、神經(jīng)網(wǎng)絡(luò)、數(shù)學(xué)形態(tài)學(xué)等理論相結(jié)合處理數(shù)字圖像。這樣的探索將是有益的,而且也一定會(huì)產(chǎn)生更加有效的結(jié)果。
本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文。