任蘊麗 宋佳霖 鄭存芳 洪文學(xué)



摘要:屬性偏序形式結(jié)構(gòu),作為一種基于人類認(rèn)知原理和粒計算思想的知識發(fā)現(xiàn)和知識表示新理論,目前已有廣泛的應(yīng)用,但其理論基礎(chǔ)缺乏抽象化數(shù)學(xué)化,這勢必影響該理論的系統(tǒng)發(fā)展。針對上述問題,研究了屬性偏序形式結(jié)構(gòu)的數(shù)學(xué)形式化描述問題。首先,基于粒計算的思想提出了知識表示的形式化框架。在此基礎(chǔ)上,通過定義對象集合的覆蓋和最簡覆蓋,給出屬性偏序形式結(jié)構(gòu)的粒和粒群的概念,進而通過對粒衍生出粒群的充要條件的討論,給出了屬性偏序形式結(jié)構(gòu)中的知識結(jié)構(gòu),從而完成屬性偏序形式結(jié)構(gòu)的數(shù)學(xué)形式化描述。最后,通過具體實例展示了利用數(shù)學(xué)形式化描述構(gòu)造屬性偏序形式結(jié)構(gòu)的過程,并揭示了該過程所體現(xiàn)的人類認(rèn)知規(guī)律。
關(guān)鍵詞:形式背景;數(shù)學(xué)形式化;屬性偏序形式結(jié)構(gòu);粒計算;概念認(rèn)知學(xué)習(xí)
中圖分類號: TP391.4? 文獻標(biāo)識碼: ADOI:10.3969/j.issn.1007-791X.2024.02.004
0引言
知識表示是認(rèn)知科學(xué)領(lǐng)域的基礎(chǔ)問題[1]。從認(rèn)知計算的角度看,知識表示的基本認(rèn)知單元是概念[2]。概念在學(xué)習(xí)、推理等幾乎所有認(rèn)知過程中都有一定意義[3]。形式概念分析創(chuàng)始人德國數(shù)學(xué)家Wille[4]于1982年首先提出了概念的數(shù)學(xué)定義,即形式概念是由內(nèi)涵和外延所組成的二元有序組。在形式概念分析理論中,一個形式背景的所有概念依據(jù)其泛化和例化關(guān)系,構(gòu)成一個完備格結(jié)構(gòu),即概念格,它是形式概念分析理論的核心知識結(jié)構(gòu)。概念格的Hasse圖是其所構(gòu)成的知識結(jié)構(gòu)的可視化表達(dá)。目前形式概念分析理論廣泛應(yīng)用于數(shù)據(jù)屬性約簡[5-7]、規(guī)則提取[8]、知識挖掘[9-10]等領(lǐng)域。然而,由于概念格的Hasse圖是有交叉的網(wǎng)狀圖,所以當(dāng)數(shù)據(jù)量較大時,其所表達(dá)的知識結(jié)構(gòu)可視化效果不理想。同時,在形式概念分析理論中,內(nèi)涵和外延通過屬性冪集和對象冪集間的一對閉包算子來相互唯一確定,這就將人們認(rèn)知事物的過程看作是一次完成的,然而在現(xiàn)實生活中,人們對客觀事物的認(rèn)知往往是一個漸進的過程,一開始人們的認(rèn)知是模糊的片面的,但隨著學(xué)習(xí)到事物更多的特征,人們對其認(rèn)識才逐漸清晰和完善。因此,為了更好地反映人類認(rèn)知的實際過程,迫切需要一種符合人類認(rèn)知原理的知識發(fā)現(xiàn)和知識表示的方法。
屬性偏序形式結(jié)構(gòu)是洪文學(xué)教授[11-12]在形式概念分析的基礎(chǔ)上,根據(jù)人類認(rèn)知原理和粒計算思想提出來的知識發(fā)現(xiàn)和知識表示的可視化新理論。在事物所具有的多種屬性(特征)中,有些屬性可以覆蓋較多的對象(事物),稱其為共有屬性,而有些屬性則僅為個別對象所具有,稱這樣的屬性是獨有屬性。在認(rèn)知過程中,人們往往將具有共有屬性的事物聚在一起,而將具有獨有屬性的對象彼此遠(yuǎn)離,從而達(dá)到區(qū)分事物的目的。在屬性偏序形式結(jié)構(gòu)中,以屬性覆蓋對象的多少來刻畫屬性的普遍性的強弱,普遍性強的屬性置于結(jié)構(gòu)的上層,特異性強的屬性置于下層,從上往下屬性的普遍性逐層遞減,特異性逐層增強,從而達(dá)到認(rèn)識和區(qū)分事物的目的,從下往上,屬性的普遍性逐層增強,達(dá)到聚類的目的。屬性偏序形式結(jié)構(gòu)中的粒(節(jié)點)并不要求是形式概念,而是由屬性決定的屬性對象有序多元組。隨著該結(jié)構(gòu)中層次的加深,粒中的屬性集和對象集逐漸實現(xiàn)相互唯一確定,從而很好地刻畫人類對事物(對象)的認(rèn)知過程。該結(jié)構(gòu)的可視化表達(dá)即屬性偏序形式結(jié)構(gòu)圖,是一個無交叉的圖,可以將形式背景中蘊含的知識清晰地呈現(xiàn)出來。鑒于屬性偏序形式結(jié)構(gòu)理論符合人類認(rèn)知原理,并且具有良好的可視化效果,該理論在概念認(rèn)知學(xué)習(xí)領(lǐng)域吸引了學(xué)者們的關(guān)注,并且廣泛地應(yīng)用于中醫(yī)藥知識發(fā)現(xiàn)[13-17]、語義排歧[18-19]、醫(yī)學(xué)診斷數(shù)據(jù)挖掘[20-21]等領(lǐng)域。
在屬性偏序形式結(jié)構(gòu)的應(yīng)用研究發(fā)展迅速的同時,偏序形式結(jié)構(gòu)的理論研究卻相對薄弱。文獻[22-24]主要是從計算機算法優(yōu)化和可視化等角度對屬性偏序形式結(jié)構(gòu)進行研究。文獻[25]基于粒計算和三支決策的思想,探討了三支屬性偏序形式結(jié)構(gòu)的構(gòu)造方法。而有關(guān)屬性偏序形式結(jié)構(gòu)理論的基礎(chǔ)研究,特別是該理論的數(shù)學(xué)形式化則很少有相關(guān)的研究成果。數(shù)學(xué)形式化框架可以為屬性偏序形式結(jié)構(gòu)的很多基本問題的系統(tǒng)研究提供堅實的基礎(chǔ),比如基于屬性偏序形式結(jié)構(gòu)的知識發(fā)現(xiàn)算法與解釋、相關(guān)理論與概念認(rèn)知學(xué)習(xí)的結(jié)合與進一步發(fā)展等。因此對該理論基本原理和方法的抽象的數(shù)學(xué)形式化描述是非常有價值的科學(xué)問題。
本文旨在探索屬性偏序形式結(jié)構(gòu)基本理論的數(shù)學(xué)形式化描述。首先,基于粒計算思想給出知識表示的形式化框架。在此基礎(chǔ)上,通過定義對象集合的覆蓋、最簡覆蓋,屬性偏序形式結(jié)構(gòu)中的粒、粒群等,討論粒群構(gòu)成的知識結(jié)構(gòu)、簇集等,進而完成屬性偏序形式結(jié)構(gòu)(圖)的數(shù)學(xué)形式化描述。
1基于粒計算思想的知識表示形式化框架
粒計算[26]的思想與人們在解決問題或認(rèn)識客觀事物時將部分事物不加區(qū)分地看作一個整體的處理方式是一致的。客觀世界中的事物紛繁復(fù)雜,人們認(rèn)識客觀世界時,由于信息不完備、認(rèn)知能力有限、所要解決的問題精度要求不高等原因,人們會很自然地將客觀事物分成若干組、群或簇集,也就是說按照一定的準(zhǔn)則將相似的或者相關(guān)的事物看作一個整體而不加區(qū)分,這些整體稱為“粒”,這個過程可稱為粒化。人們一般對粒內(nèi)的事物不加區(qū)分,而關(guān)注不同粒間的關(guān)系。粒化時的標(biāo)準(zhǔn)不同,人們會得到精度不同的粒。粒的精度的大小可以稱為粒度,粗粒度的粒涵蓋較多的對象,粒化時所使用的標(biāo)準(zhǔn)較粗,反之,細(xì)粒度的粒則涵蓋較少的對象,粒化的標(biāo)準(zhǔn)也更精細(xì)。每一次粒化所形成的粒都處在同一個粒層,同一個粒層中的粒構(gòu)成對論域的一個覆蓋或劃分。人們對論域施以不同的粒化,會得到不同的粒層,將這些粒層按粒度從粗到細(xì)排列,可以得到多層次的知識體系。人們在認(rèn)識客觀世界或解決問題時,可以很自由地在不同的粒層間進行切換。
根據(jù)粒計算的思想,知識體系的表示形式可以是知識粒構(gòu)成的分層次的結(jié)構(gòu)。知識表示的形式化框架是三元組(D,G,R),其中D是數(shù)據(jù),它包含了研究對象及其所具有的屬性與特征,例如形式概念分析中的形式背景、粗糙集理論中的信息表等;G是根據(jù)某些標(biāo)準(zhǔn)由D中的對象生成的粒的集合;R是粒間的關(guān)系或在此基礎(chǔ)上所生成的粒結(jié)構(gòu)。
譬如,在形式概念分析中,數(shù)據(jù)D是由對象集、屬性集及二者之間的二元關(guān)系組成的三元組,它能夠反映每一個對象所具有的屬性;形式概念分析中G里的粒是形式概念,即由外延和內(nèi)涵組成的有序二元組,二者由對象冪集和屬性冪集間的兩個閉包算子相互唯一確定;形式概念分析中R是所有形式概念的集合上的偏序關(guān)系,它通過形式概念的外延(或內(nèi)涵)的包含關(guān)系來定義,在此偏序關(guān)系基礎(chǔ)上,全體粒(形式概念)構(gòu)成了多層次的網(wǎng)狀結(jié)構(gòu)。這一結(jié)構(gòu)就是形式背景(數(shù)據(jù))中所蘊含的知識的表示,并且Hasse圖可以將這一知識結(jié)構(gòu)以圖形的方式可視化表達(dá)。
此外,決策樹、商空間等都符合上述知識表示的形式化框架。
2屬性偏序形式結(jié)構(gòu)的數(shù)學(xué)形式化描述
2.1屬性偏序形式結(jié)構(gòu)的基本思想
人類在認(rèn)知客觀世界時,往往會根據(jù)事物所具有的屬性或特征,將相似或相近的事物聚集在一起,而使差異較大的事物遠(yuǎn)離相近的事物。同時,人類對客觀事物的認(rèn)知往往不是一次完成的,開始的認(rèn)知比較模糊,隨著獲取事物越來越多的屬性和特征,人們對它的認(rèn)識才逐漸清晰。
為了反映人類認(rèn)知的這一特征,將粒定義為屬性(或?qū)傩约希┘捌渌枋龅膶ο蠹纤M成的有序二元組。粒中的屬性(或?qū)傩约希┑钠毡樾詮娙跤休^大差別,有些屬性(或?qū)傩约希檩^多對象所具有,從而有較強的普遍性,此時粒的粒度較大(粗);而有些屬性則僅有較少的對象才具有,所以它的普遍性較弱而特異性較強,此時粒的粒度較小(細(xì))。在構(gòu)造知識體系時,人們會自上而下地通過對普遍性強的屬性(或?qū)傩约希┘尤胄聦傩远鴧^(qū)分不同的事物,另一方面,人們還可以自下而上地通過去除特異性強的屬性而將相似的事物聚類。因此,人類的知識體系的組織結(jié)構(gòu),一定是多層次的,在這一結(jié)構(gòu)中,普遍性強的粗粒度的粒在上層,隨著更多屬性的加入,層次逐漸加深,粒的普遍性逐漸降低特異性逐漸加強,粒的粒度也逐漸加細(xì),不同粒度的粒之間依據(jù)偏序關(guān)系相連接。
2.2屬性偏序形式結(jié)構(gòu)中的數(shù)據(jù)——形式背景及相關(guān)基礎(chǔ)知識與形式概念分析類似,屬性偏序形式結(jié)構(gòu)所處理的數(shù)據(jù)也是以形式背景的形式呈現(xiàn)。為此,本小節(jié)先介紹形式概念分析中形式背景、形式概念等相關(guān)基礎(chǔ)知識,并在此基礎(chǔ)上,給出屬性(屬性集)的覆蓋基數(shù)的概念及性質(zhì)。
定義 1[4]形式背景K=(U,A,I)是由對象集U、屬性集A及二者間的二元關(guān)系I所組成的三元組。對于x∈U,a∈A,表達(dá)式(x,a)∈I或xIa表示對象x具有屬性a。
通常,形式背景可由形如表1的二值表格來表示。在表1中所示的形式背景中,U={1,2,3,4,5,6,7},A={a,b,c,d,e,f,g},第一行列出了所有的屬性,第一列列出了所有的對象,在行列交叉點處的數(shù)字“1”表示相應(yīng)行中的對象具有相應(yīng)列中的屬性,空白則表示相反的情形。
f(V)={a∈A|(u,a)∈I,u∈V},
g(B)={u∈U|(u,b)∈I,b∈B}。
為了描述屬性的普遍性強弱,給出屬性的覆蓋基數(shù)的概念。
性質(zhì)1設(shè)K=(U,A,I)是一個形式背景,則有以下結(jié)論成立:
G(B∪C)≤min{G(B),G(C)},
G(B∩C)≥max{G(B),G(C)};
|g(B)∪g(C)|=G(B)+G(C)-G(B∪C);
0,進而有|g(B)∪g(C)|=G(B)+G(C);
G(B)+G(C)=|U|。
G(B∪C)≤min{G(B),G(C)}。
同理,G(B∩C)≥G(B)且G(B∩C)G(C),從而
G(B∩C)≥max{G(B),G(C)}。
3) |g(B)∪g(C)|=
|g(B)∪[g(C)-g(B)]|=
|g(B)|+|[g(C)-g(B)]|=
G(B)+|g(C)-g(B∪C)|=
G(B)+|g(C)|-|g(B∪C)|=
G(B)+G(C)-G(B∪C)。
4) 當(dāng)B和C為互斥的屬性集合時,G(B∪C)=|g(B∪C)|=|g(B)∩g(C)|=0。進一步由3)知|g(B)∪g(C)|=G(B)+G(C)。
5) 當(dāng)B和C為對立的屬性集合時,由4)可知G(B∪C)=0,代入3)中的公式可知G(B)+G(C)=|g(B)∪g(C)|=|U|。
由性質(zhì)1的1)和2)可知,屬性集的覆蓋基數(shù)隨著屬性的增多而減小,隨著屬性的減少而增大,因此,屬性集的覆蓋基數(shù)可以作為衡量屬性集普遍性強弱的一個度量。
為了方便表達(dá),稱g(B)是屬性集B所覆蓋的對象。
定義5在形式背景K=(U,A,I)中,如果屬性a∈A滿足G(a)=|U|,則稱a為K中的一個最大共有屬性。
性質(zhì)2在形式背景K=(U,A,I)中,屬性a是最大共有屬性,當(dāng)且僅當(dāng)對任意的u∈U,有uIa,即g(a)=U。
2.3屬性偏序形式結(jié)構(gòu)中粒的數(shù)學(xué)形式化描述
對于任意BA,由于對象集合g(B)中的對象都具有B中的所有屬性,所以它們可以聚成一個由屬性集合B所決定的粒。但是為了表達(dá)形式背景中的知識結(jié)構(gòu),在屬性偏序形式結(jié)構(gòu)中,僅選取其中的一部分粒。為了描述粒選取的標(biāo)準(zhǔn),給出對象集合的覆蓋和最簡覆蓋的定義。
如果屬性b1,b2,…,bk構(gòu)成U1相對于A1的一個覆蓋,可以說屬性b1,b2,…,bk覆蓋U1(相對于A1),或者{b1,b2,…,bk}是U1相對于A1的一個覆蓋。
1) 屬性b1,b2,…,bk構(gòu)成U1相對于A1的一個覆蓋;
2) 對于任意i∈{1,2,…,k},{bj|1≤j≤k,j≠i}不構(gòu)成U1相對于A1的一個覆蓋;
對于U1相對于A1的最簡覆蓋b1,b2,…,bk,如果b1,b2,…,bk是U1相對于A1的完全覆蓋,則稱該覆蓋是最簡完全覆蓋,否則為最簡非完全覆蓋。
下面給出屬性偏序形式結(jié)構(gòu)中粒的數(shù)學(xué)表達(dá)。
由于屬性偏序形式結(jié)構(gòu)中的粒涉及粒的選擇問題,所以其中的粒以粒群的形式出現(xiàn)。
i=2,3,…,s,屬性b1,b2,…,bs是O相對于Bc的最簡覆蓋。稱bi是子粒Ni的核心屬性,i=1,2,…,s。
在粒群(N;N1,N2,…,Ns)中,從對象的角度而言,子粒N1,N2,…,Ns構(gòu)成頂點粒N的一個劃分,如下圖1所示。圖1中虛線所示部分只有在最簡非完全覆蓋的情形才存在。從圖中可以看到,粒群中頂點粒和子粒是通過子粒的核心屬性建立聯(lián)系的。
對于每一個子粒Ni(i=1,2,…,s),當(dāng)Oi存在相對于Bic的最簡覆蓋時,還可以得到以Ni為頂點粒的新的粒群,依次下去可得到粒群構(gòu)成的結(jié)構(gòu),如圖2所示。圖中虛線框住的每一部分都是一個粒群,從上往下,粒群對對象的描述逐漸加細(xì)。
2.4屬性偏序形式結(jié)構(gòu)中粒間關(guān)系及知識結(jié)構(gòu)的數(shù)學(xué)形式化描述屬性偏序形式結(jié)構(gòu)中的粒通過最簡覆蓋構(gòu)成一個雙層的粒群,以粒群的子粒為頂點粒可以繼續(xù)向下衍化出新的粒群……因此,目前組成屬性偏序形式結(jié)構(gòu)的關(guān)鍵問題有兩個:1)確定首粒,這是整個結(jié)構(gòu)構(gòu)成的開端;2)確定粒群向下展開的終止條件。
關(guān)于首粒的確定,可以分成兩種情況:如果形式背景K存在最大共有屬性a,則首粒為(a,U,U);否則,首粒為(,U,U)。這里為表達(dá)上的簡便,以a代替{a},后續(xù)類似的簡化不再贅述。
關(guān)于粒群向下展開的終止條件,有如下定理和推論。
充分性:如果存在u∈O,使得f(u)B,記
cs(s≤m)。進而可得以粒N=(B,g(B),O)為頂點粒的粒群(N;N1,N2,…,Ns),其中子粒為Ni=(Bi,g(Bi),Oi),i=1,2,…,s。這里,
不可展開成粒群的粒稱為終點粒。
至此,可以得到屬性偏序形式結(jié)構(gòu):從首粒出發(fā),按照定理1充分性證明中的方法得到第一個粒群,其中的子粒是對論域U的一個粗糙的劃分,進而再以子粒為頂點粒繼續(xù)向下衍生出新的粒群,可得論域U的更細(xì)的劃分。繼續(xù)這個過程,直至子粒的對象僅具有該粒中的屬性,此時的子粒即為終點粒,不會繼續(xù)向下衍生新粒。
將粒群中的子粒置于頂點粒的下方,每個粒群中頂點粒與子粒間建立連接邊,終點粒與底層粒(A,)間建立連接邊,即得屬性偏序形式結(jié)構(gòu)圖,記作APOSD(K)。在屬性偏序形式結(jié)構(gòu)圖中,節(jié)點即為屬性偏序形式結(jié)構(gòu)中的粒,以后可以對兩種說法不加區(qū)分。從橫向看,屬性偏序形式結(jié)構(gòu)圖中的每一層都是對論域U的一個劃分,處在上層的劃分粒度較粗,隨著層次的加深,對論域U的劃分逐層加細(xì);從縱向看,每一條支路代表一個對象,每一個對象通過唯一的一條支路表達(dá),支路上的各節(jié)點(粒)的核心屬性即為該對象所具有的全部屬性。屬性偏序形式結(jié)構(gòu)圖是一個多層次的無交叉圖,在形式背景中蘊含的知識結(jié)構(gòu)的表示方面,具有良好的可視化效果。
定義9在形式背景K=(U,A,I)的屬性偏序形式結(jié)構(gòu)圖中,以粒N=(B,g(B),O)為頂點粒的粒群及其向下衍生出的全部粒構(gòu)成的結(jié)構(gòu)稱為簇集,記作Cluster(N)。
在簇集Cluster(N)中,對象的一個共同點是具有屬性集B中的所有屬性。當(dāng)O=g(B)時,該簇集即為屬性集B所覆蓋(或者說描述)的全部對象所成的簇集,這是APOSD(K)的一個子圖;當(dāng)Og(B)時,該簇集是屬性集B所覆蓋的部分對象所組成的,為了得到屬性集B所描述的全部對象所組成的簇集,只需取O=g(B),以N*=(B,g(B),g(B))為首粒,逐層向下衍生即可。
由于在屬性偏序形式結(jié)構(gòu)圖中,除首粒之外,每一個粒N=(B,g(B),O)都是某個粒群的子粒,其中的O可通過式(1)計算得出。因此,粒N=(B,g(B),O)主要是由其屬性集B決定的,所以有時可僅用粒三元組中的前兩個元素作成的二元組來表示粒,即將圖中的節(jié)點簡記為N=(B,g(B));進一步,屬性集B是通過在頂點粒的屬性集合上添加該粒的核心屬性而得到的,因此,有時在屬性偏序形式結(jié)構(gòu)圖中,僅以節(jié)點的核心屬性標(biāo)示節(jié)點。
3屬性偏序形式結(jié)構(gòu)數(shù)學(xué)形式化構(gòu)造實例
表2所示的是著名的“生物和水”形式背景K=(U,A,I),其中對象1至8分別為水蛭、娃娃魚、青蛙、狗、水草、蘆葦、豆子和玉米。屬性a至i分別表示需要水、水中生活、陸地上生活、需要葉綠素、雙子葉植物、單子葉植物、能運動、有四肢和哺乳。
下面將按照第2章介紹的屬性偏序形式結(jié)構(gòu)的數(shù)學(xué)形式化描述,從首粒開始通過確定最簡覆蓋,構(gòu)造粒和粒群,逐層向下衍生出該形式背景的整個屬性偏序形式結(jié)構(gòu)。
首先,由于屬性a滿足g(a)=U,所以首粒為N1=(a,U,U)。在子形式背景K1=(U,A-{a},I|U×(A-{a}))下,G(b)=G(c)=5,G(d)=G(g)=4,G(f)=G(h)=3,G(e)=G(i)=1,取定覆蓋基數(shù)最大的屬性b。接下來,在子形式背景(U-g(b),A-{a,b},I|(U-g(b))×(A-{a,b}))下覆蓋基數(shù)最大的屬性為屬性c。由于g(b)∪g(c)=U,所以{b,c}是U相對于{a}c的一個覆蓋。由于b和c都不能單獨覆蓋U,并且二者的覆蓋基數(shù)在子背景K1下是最大的,所以{b,c}是U相對于{a}c的一個最簡覆蓋。因此可得首粒N1下的子粒為N1,1=(ab,g(ab),U∩g(b))=(ab,12356,12356),N1,2=(ac,g(ac),U∩g(c)-g(b))=(ab,34678,478)。這里為了簡便,用12356來代替集合{1,2,3,5,6},類似的簡化不再贅述。三者構(gòu)成的粒群為(N1;N1,1,N1,2),如圖3所示。
此時,將形式背景中的生物分成N1,1所代表的水生生物和N1,2所代表的陸生生物兩大類。
從而可得N1,1為頂點粒的粒群(N1,1;N1,1,1,N1,1,2),如圖4所示。
此時,將水生生物分為N1,1,1所代表的水生動物和N1,1,2所代表的水生植物兩類。
同樣地,分別以N1,1,1和N1,1,2為頂點粒,可以繼續(xù)向下衍生出新的粒群。下面以N1,1,1向下衍生為例。粒N1,1,1包含的對象為O1,1,1={1,2,3},由于f(1)={a,b,g},所以得到O1,1,1相對于{a,b,g}c的最簡非完全覆蓋{h}。從而N1,1,1的子粒為N1,1,1,1=(abgh,23,23)。二者構(gòu)成的粒群為(N1,1,1;N1,1,1,1),如圖5所示。
此時將水生動物分為N1,1,1,1所代表的有四肢的水生動物和O1,1,1-g(h)所表示的沒有四肢的水生動物兩類。
同理可得O1,1,1,1相對于{a,b,g,h}c的最簡非完全覆蓋{c},從而N1,1,1,1向下衍生出子粒N1,1,1,1,1=(abghc,3,3)。由于f(3)={a,b,g,h,c},所以根據(jù)推論1知N1,1,1,1,1是一個終點粒,至此不能再向下衍生出粒群了。同時,將N1,1,1,1,1所代表的有四肢的兩棲動物“青蛙”和O1,1,1,1-g(c)所表示的有四肢的非兩棲水生動物“娃娃魚”區(qū)分開來。
對于其他粒也可類似討論,最終的屬性偏序形式結(jié)構(gòu)圖如圖6所示。
以上展示了對于給定的形式背景,如果根據(jù)數(shù)學(xué)形式化描述來構(gòu)造屬性偏序形式結(jié)構(gòu)。同時,通過對“青蛙”和“娃娃魚”的區(qū)分和認(rèn)識的過程,可以認(rèn)識到,在屬性偏序形式結(jié)構(gòu)中,隨著層次的加深,粒中的屬性不斷疊加,粒所描述的對象范圍逐漸縮小,最終實現(xiàn)對具體對象的認(rèn)識和區(qū)分的目的,這與人類認(rèn)知客觀事物的規(guī)律是一致的。
4結(jié)論
屬性偏序形式結(jié)構(gòu)是一種具有可視能力的知識發(fā)現(xiàn)和知識表示的理論。本文針對該理論的研究多集中在算法和應(yīng)用方面,而基礎(chǔ)理論的抽象數(shù)學(xué)化研究不足的問題,探討了屬性偏序形式結(jié)構(gòu)的數(shù)學(xué)形式化描述。首先,基于粒計算的思想提出了知識表示的形式化框架,即數(shù)據(jù)、粒和粒間結(jié)構(gòu)所組成的三元組。在此基礎(chǔ)上,通過定義屬性的覆蓋基數(shù)、對象集合的覆蓋和最簡覆蓋,給出了屬性偏序形式結(jié)構(gòu)的粒和粒群的概念,即粒群是由頂點粒所包含的對象集的最簡覆蓋所確定的雙層多元組,并且粒群中的子粒在一定條件下有衍生出新粒群的能力。最終,通過給出屬性偏序形式結(jié)構(gòu)中的粒衍生出粒群的充要條件,解決了屬性偏序形式結(jié)構(gòu)的構(gòu)造,從而完成了該理論的數(shù)學(xué)形式化描述。最后,通過具體實例展示了利用數(shù)學(xué)形式化描述構(gòu)造屬性偏序形式結(jié)構(gòu)的過程,以及其中體現(xiàn)的人類認(rèn)知客觀事物的規(guī)律。
參考文獻
[1] 李金海, 閆夢宇, 徐偉華, 等. 概念認(rèn)知學(xué)習(xí)的若干問題與思考 [J]. 西北大學(xué)學(xué)報(自然科學(xué)版), 2020, 50(4): 501-515.
LI J H,YAN M Y, XU W H, et al. Some problems and thoughts on concept-cognitive learning [J]. Journal of Northwest University (Natural Science Edition), 2020, 50(4): 501-515.
[2] 李金海, 米允龍, 劉文奇. 概念的漸進式認(rèn)知理論與方法 [J]. 計算機學(xué)報, 2019, 42(10): 2233-2250.
LI J H, MI Y L, LIU W Q. Incremental cognition of concepts: theories and methods [J]. Chinese Journal of Computers, 2019, 42(10): 2233-2250.
[3] LI J H, MEI C L, XU W H, et al. Concept learning via granular computing: a cognitive viewpoint [J]. Information Sciences, 2015, 298:447-467.
[4] WILLE R. Restructuring lattice theory: an approach based on hierarchies of concepts [M]// RIVAL I. Ordered Sets. Dordrecht, Holland: D. Reidel Publishing Company, 1982: 445-470.
[5] LI K W, SHAO M W, WU W Z. A data reduction method in formal fuzzy contexts [J]. International Journal of Machine Learning and Cybernetics, 2017, 8(4): 1145-1155.
[6] SHAO M W, LI K W. Attribute reduction in generalized one-sided formal contexts [J]. Information Sciences, 2017, 378: 317-327.
[7] LI J, WANG X, WU W, et al. Attribute reduction in inconsistent formal decision contexts [J]. International Journal of Machine Learning and Cybernetics, 2017, 8(1): 81-94.
[8] WU W Z, QIAN Y H, LI T, et al. On rule acquisition in incomplete multi-scale decision tables [J]. Information Sciences, 2017, 378: 282-302.
[9] MI Y L, LIU W Q, SHI Y, et al. Semi-supervised concept learning by concept-cognitive learning and concept space [J]. IEEE Transactions on Knowledge and Data Engineering, 2022, 34(5): 2429-2442.
[10] MI Y L, SHI Y, LI J H, et al. Fuzzy-based concept learning method: exploiting data with fuzzy conceptual clustering [J]. IEEE Transactions on Cybernetics, 2022, 52(1):582-593.
[11] HONG W X, LI S X, YU J P, et al. A new approach of generation of structural partial-ordered attribute diagram [J]. ICIC Express Letter, Part B: Applications, 2012, 3(4): 823-830.
[12] 洪文學(xué), 李少雄, 張濤, 等. 大數(shù)據(jù)偏序結(jié)構(gòu)生成原理 [J]. 燕山大學(xué)學(xué)報, 2014, 38(5): 388-393.
HONG W X, LI S X, ZHANG T, et al. The generation principle of partial-ordered structure towards big data [J]. Journal of Yanshan University, 2014, 38(5): 388-393.
[13] FAN F J, HONG W X, SONG J L, et al. A method of attribute partial-ordered structure diagram for the composition structures of prescription and knowledge discovery [J]. ICIC Express Letters, 2016, 10(3): 593-600.
[14] YAN E L, SONG J L, HONG W X. Knowledge discovery and visualization of kidney-related pattern and treatment based on attribute partial-ordered structure diagram [J]. ICIC Express Letters, Part B: Applications, 2017, 8(9): 1331-1338.
[15] YAN E L, SONG J L, LIU C N, et al. A research on syndrome element differentiation based on phenomenology and mathematical method [J]. Chinese Medicine, 2017, 12: 19.
[16] 李亞希, 劉超男, 洪文學(xué). 基于屬性偏序理論探討李坤寅治療子宮腺肌病用藥規(guī)律[J]. 山東中醫(yī)雜志, 2020, 39(6): 560-564.
LI Y X, LIU C N, HONG W X. Discussion on Li Kunyin′s law of medication in treating adenomyosis based on attribute partial order theory [J]. Shandong Journal of Traditional Chinese Medicine, 2020, 39(6): 560-564.
[17] 張曉希, 洪文學(xué), 王曉穎,等. 基于屬性偏序原理的老年2型糖尿病患者舌象特征研究[J]. 糖尿病新世界, 2021, 24(23): 1-4.
ZHANG X X, HONG W X, WANG X Y, et al. Study on tongue features of elderly patients with type 2 diabetes based on attribute partial order principle [J]. New World of Diabetes, 2021, 24(23): 1-4.
[18] YU J P, HONG W X, QIU C L, et al. A new approach of attribute partial order structure diagram for word sense disambiguation of English prepositions [J]. Knowledge-Based Systems, 2016, 95: 142-152.
[19] YU J P, LI C, HONG W X, et al. A new approach of rules extraction for word sense disambiguation by features of attributes [J]. Applied Soft Computing, 2015, 27: 411-419.
[20] 梁懷新, 宋佳霖, 鄭存芳, 等. 腫瘤參數(shù)屬性偏序結(jié)構(gòu)可視化實現(xiàn)乳腺癌診斷[J]. 中國生物醫(yī)學(xué)工程學(xué)報, 2018, 37(4): 404-413.
LIANG H X, SONG J L, ZHENG C F, et al. Diagnosis of breast cancer based on tumor parameters and visualization of the attribute partial order structure diagram [J]. Chinese Journal of Biomedical Engineering, 2018, 37(4): 404-413.
[21] LIU J, WANG X, ZHANG Y, et al. A method of image mining based on the attribute partial order structure diagram [J]. ICIC Express Letters, Part B: Applications. 2014, 5(5): 1473-1479.
[22] 孫良剛. 基于屬性偏序原理的屬性偏序結(jié)構(gòu)圖表示算法研究 [D]. 秦皇島: 燕山大學(xué), 2012.
SUN L G. Research on representation algorithm of attribute partial order structure graph based on attribute partial order principle [D]. Qinhuangdao: Yanshan University, 2012.
[23] 李少雄, 閆恩亮, 宋佳霖, 等. 偏序結(jié)構(gòu)圖的一種計算機生成算法[J]. 燕山大學(xué)學(xué)報, 2014, 38(5): 403-408.
LI S X, YAN E L, SONG J L, et al. Computational generation algorithm of partial ordered structure diagram [J]. Journal of Yanshan University, 2014, 38(5): 403-408.
[24] 鄭存芳, 李少雄, 欒景民, 等. 偏序結(jié)構(gòu)環(huán)形圖: 一種大數(shù)據(jù)偏序結(jié)構(gòu)可視化新方法[J]. 燕山大學(xué)學(xué)報, 2014, 38(5): 409-415.
ZHENG C F, LI S X, LUAN J M, et al. Structural partial-ordered circular diagram: structural partial-ordered visualization method of big data [J]. Journal of Yanshan University, 2014, 38(5): 409-415.
[25] YAN E L, SONG J L, REN Y L, et al. Construction of three-way attribute partial order structure via cognitive science and granular computing [J]. Knowledge-Based Systems, 2020, 197: 105859.
[26] YAO Y Y. Three-way granular computing, rough sets, and formal concept analysis [J]. International Journal of Approximate Reasoning, 2020, 116: 106-125.
Mathematical formalization of attribute partial order formal structure
Abstract: Attribute partial order formal structure, as a new theory of knowledge discovery and knowledge representation based on human cognitive principles and granular computing ideas, has been widely used at present. However, its theoretical basis is lack of abstraction and mathematization, which is bound to affect the systematic development of this theory. Regarding the above problem, the mathematical formal description of attribute partial order formal structure is studied. Firstly, a formal framework of knowledge representation is proposed based on the idea of granular computing. On this basis, by defining the cover and the simplest cover of an object set, the concepts of granule and granular group of attribute partial order formal structure are given. And then through the discussion of the sufficient and necessary condition for a granule to derive a granular group, the knowledge structure in attribute partial order formal structure is given, so as to complete the mathematical formal description of attribute partial order formal structure. Finally, through specific examples, the process of constructing attribute partial order formal structure by using mathematical formal description is demonstrated, and the human cognitive law embodied in this process is revealed as well.
Keywords: formal context; mathematical formalization; attribute partial order formal structure; granular computing; concept cognitive learning