曹儀銘,崔 慧,車 璐,鄒 麗
形式概念分析(FormalConceptAnalysis,F(xiàn)CA)理論是由德國(guó)科學(xué)家Wille[1]在1982年提出的,主要用于機(jī)器學(xué)習(xí)、模式識(shí)別、專家系統(tǒng)、計(jì)算機(jī)網(wǎng)絡(luò)、數(shù)據(jù)分析,決策分析等領(lǐng)域[2-5].FCA的核心是形式概念和概念格,概念格的每一個(gè)節(jié)點(diǎn)是一個(gè)形式概念,概念格結(jié)構(gòu)模型是形式概念分析中的核心數(shù)據(jù)結(jié)構(gòu),它本質(zhì)上描述了對(duì)象和屬性(特征)之間的關(guān)系.由于在現(xiàn)實(shí)生活中我們接觸的大部分情況是不確定的,王國(guó)胤[6]闡述了Rough集理論的模型、算法以及基于Rough集理論的知識(shí)獲取技術(shù),Yao[7]和 Yao and Chen[8]研究了粗糙集理論框架下的概念格理論,張文修等[9]進(jìn)一步研究了粗糙集與信息系統(tǒng)的屬性約簡(jiǎn)和規(guī)則提取問(wèn)題,胡明涵等[10]介紹了模糊概念分析理論,建立模糊背景下的模糊概念格,李金海等[11]首次在決策形式上進(jìn)行規(guī)則提取,楊麗等[12]在有限鏈所形成的格蘊(yùn)含代數(shù)上,建立能夠直接用于處理自然語(yǔ)言的語(yǔ)言真值概念格模型.
在實(shí)際生活中,由于客觀事物的復(fù)雜性及人類思維的模糊性,使人們更習(xí)慣于用模糊語(yǔ)言值進(jìn)行表達(dá),Xu[13]提出了模糊語(yǔ)言集和模糊語(yǔ)言集中任意兩個(gè)語(yǔ)言值之間的距離測(cè)度,將語(yǔ)言信息引入到模糊多屬性決策問(wèn)題中,利用語(yǔ)言值處理模糊決策問(wèn)題.
基于上述工作,為了處理語(yǔ)言模糊決策形式背景下的問(wèn)題,盡量減少信息損失,貼近人類思維過(guò)程,實(shí)現(xiàn)決策過(guò)程的智能化,提出基于模糊語(yǔ)言概念格的相似度推理方法.
定義1[14]設(shè) (U,A,S)是一個(gè)模糊語(yǔ)言形式背景,其中U={x1,x2,…,xn}為對(duì)象集,稱每個(gè)為一個(gè)對(duì)象;非空集合為屬性集,稱每個(gè)aj(j≤m)為一個(gè)屬性;S為U到A上的二元關(guān)系,S?U?A.其中,S={si|i=0,1,2,…,g}為語(yǔ)言集,g為偶數(shù).對(duì)于模糊語(yǔ)言形式背景(U,A,S),在對(duì)象集X?U和屬性集B?SA上定義運(yùn)算:

其中,X?表示對(duì)象滿足的每個(gè)屬性對(duì)應(yīng)的語(yǔ)言值交集的集合;B?表示每個(gè)屬性對(duì)應(yīng)的語(yǔ)言值所滿足的對(duì)象交集的集合.
定義 2[14]設(shè) (U,A,S)是一個(gè)模糊語(yǔ)言形式背景,如果一個(gè)二元組(X,B)滿足X?=B且則稱為一個(gè)模糊語(yǔ)言概念.其中,X為概念的外延,B為概念的內(nèi)涵.用表示模糊語(yǔ)言形式背景(U,A,S)下的全體概念,并稱FLL(U,A,S)為模糊語(yǔ)言概念格.
定義3[14]設(shè)FLL(U,A,S)與FLL(U,C,K)是2個(gè)模糊語(yǔ)言概念格,若對(duì)于任意概念(Y,D)∈總有且有X=Y,則稱細(xì)于FLL(U,C,K),記作
定義4[14]設(shè) (U,A,S,C,K)是一個(gè)模糊語(yǔ)言決策形式背景若對(duì)于Y≠?且Y≠U,有且X=Y,則稱B→C是一個(gè)規(guī)則,記為if B,then C,將所有規(guī)則記入規(guī)則集中.

(1)0<sim(B,G)≤1;
(2)sim(B,G)=1當(dāng)且僅當(dāng)B=G;
(3)sim(B,G)=sim(G,B);
(4)設(shè)R=(sr1,sr2,…,srn)為任意一個(gè)模糊語(yǔ)言集,B?G?R,則
證明(1)對(duì)任意一個(gè)ik、jk(k=1,…,n),有

(3)顯然得證.
(4)因?yàn)锽?G?R,則ik≤jk≤rk(k=

綜上所述,定理1成立.
定義6設(shè)(U,A,S)是一個(gè)模糊語(yǔ)言形式背
其中X=U,
是權(quán)重
給定一個(gè)模
則模糊語(yǔ)言形式
背景下的模糊語(yǔ)言集之間的加權(quán)相似度為

定 理2設(shè)B=(si1,si2,…,sin),G=
是權(quán)重向量,其中ωk∈[0 ,1]
則模糊語(yǔ)言形式背景下的模糊語(yǔ)言集之間的加權(quán)相似度simω(B,G)滿足如下性質(zhì):
(1)0<simw(B,G)≤1;
(2)simw(B,G)=1當(dāng)且僅當(dāng)B=G;
(3)simw(B,G)=simw(G,B);
為任意一個(gè)模糊
證明 證明過(guò)程同定理1.
注:當(dāng)權(quán)重向量中的每個(gè)元素平均分配時(shí),
時(shí),加權(quán)相似度退化為相
似度,即相似度是加權(quán)相似度的一種特殊情況.
在模糊語(yǔ)言決策形式背景下,進(jìn)行模糊語(yǔ)言推理.具體步驟為:
Step1:在模糊語(yǔ)言形式背景(U,A,S)上生成所有概念(X,B),構(gòu)造模糊語(yǔ)言概念格FLL(U,A,S);
Step2:在模糊語(yǔ)言形式背景(U,C,K)上生成所有概念(Y,D),構(gòu)造模糊語(yǔ)言概念格
設(shè)(U,A,S,C,K)是模糊語(yǔ)言決策形式背景,U={u1,u2,u3,u4}表示患者集,A={a,b,表示癥狀集,C={f,g,h,j}表示疾病集.病癥A的具體意義如下:a為發(fā)熱,b為頭痛,c為胃痛,d為咳嗽,e為胸痛;疾病集C的具體意義如下:f為病毒性發(fā)熱,g為傷寒,h為胃病,j為胸肺病.語(yǔ)言集
S={s0=極少,s1=很少,s2=偶爾,s3=很多,s4= 極多} 表示患者具有某個(gè)癥狀的頻率,語(yǔ)言集K={d0=極小,d1=很小,d2=中等,d3=很大,表示患者患有某種病癥的可能性.將四個(gè)患者的病例進(jìn)行數(shù)據(jù)分析,得到語(yǔ)言直覺(jué)模糊決策形式背景如表1所示.

表1 模糊語(yǔ)言決策形式背景(U ,A,S,C,K)
Step 1:由表1可得在(U,A,S)形式背景下的概念如下:

構(gòu)造的模糊語(yǔ)言概念格如圖1所示.

圖1 模糊語(yǔ)言概念格FLL(U ,A,S)
Step 2:由表1可得在(U,C,K)形式背景下的概念如下:


構(gòu)造的模糊語(yǔ)言概念格FLL(U,C,K)如圖2所示.

圖2 模糊語(yǔ)言概念格FLL(U ,C,K)
Step 3:由圖1和圖2可知,F(xiàn)LL(U,A,S)≤FLL(U,D,P),可得到規(guī)則集:


則

綜上可知,G與規(guī)則前件B7的加權(quán)相似度最大,可得到相應(yīng)規(guī)則即該患者患有病毒性發(fā)熱的可能性為d3.同理,給定傷寒對(duì)應(yīng)的權(quán)重w2={0 .3,0.4,0.1,0.1,0.1},胃病對(duì)應(yīng)的權(quán)重w3={0.1,0.2,0 .5,0.1,0.1},胸肺病對(duì)應(yīng)的權(quán)重經(jīng)計(jì)算分別為最大 相似度,因此取閾值為d2,該患者患有病毒性發(fā)熱和傷寒的可能性較大,應(yīng)該引起注意.
上述實(shí)例可以看出,其結(jié)果與實(shí)際生活中的分析結(jié)果一致,說(shuō)明本算法是有效的和實(shí)用的.由于大多數(shù)患者的病癥不在規(guī)則集中,本文提出的方法能夠?qū)σ?guī)則集外的模糊語(yǔ)言集進(jìn)行推理,推理結(jié)果更加全面.
由于現(xiàn)實(shí)生活中的不確定性,且在疾病診斷專家系統(tǒng)中人們習(xí)慣用語(yǔ)言值表達(dá).本文在模糊語(yǔ)言概念格規(guī)則提取的基礎(chǔ)上,提出模糊語(yǔ)言概念格相似度推理方法,從而診斷出患者患有某種疾病的可能性.本文所提出的決策方法可操作性強(qiáng),適合在實(shí)際中應(yīng)用.下一步考慮在權(quán)重未知的情況下,在直覺(jué)模糊語(yǔ)言概念格上進(jìn)行多屬性決策問(wèn)題.
通化師范學(xué)院學(xué)報(bào)2019年4期