鄒 麗 馮凱華 劉 新
1(遼寧師范大學計算機與信息技術學院 遼寧大連 116081)2 (遼寧師范大學數學學院 遼寧大連 116029) (zoulicn@163.com)
概念格于1982年由德國數學家Wille提出[1],也叫做形式概念分析(formal concept analysis, FCA).它是一種表達概念和概念層次關系的數學理論,是進行數據分析和知識處理的數學工具.概念格理論中有2個基本元素,分別是形式背景和形式概念,其中形式背景是概念格的數據表現方式,由對象集、屬性集以及兩者上的一個關系構成.基于形式背景,通過一對派生算子可以構造形式概念[2],即構造概念的外延和內涵.目前概念格已廣泛應用于眾多領域[3-8].Yao等人[9-10]研究了粗糙集理論框架下的概念格理論.張文修、王國胤等人[11-13]進一步研究了粗糙集與信息系統的屬性約簡和規則提取問題.李金海等人[14-15]從概念外延的角度研究了合理刻畫屬性重要性的指標,給出了概念格屬性約簡的判定定理,并以這些指標作為啟發式信息設計了一種概念格啟發式屬性約簡算法.
在確定的形式背景中,形式概念及其概念格都是精確的,但是現實應用中,大多數對象與屬性的關系都是模糊的,研究學者使用隸屬度來表示對象與屬性的模糊關系,提出了模糊形式概念分析,模糊概念格[16]已成為新的研究領域.Burusco等人[17]首先提出了使用三角模對傳統的伽羅瓦聯系進行模糊擴展的方法.Bělohlvek等人[18-20]基于剩余格理論在模糊形式背景下提出了模糊概念的定義,并證明所提出的概念幾乎滿足所有經典形式背景下概念的性質.Krupka等人[21]把形式概念分析引入到模糊集上,將形式背景中的值由最初的0或1的二元數據,擴充為可以是[0,1]區間的任意數值.Krupka通過把不完備的不確定信息轉化為不完備的模糊形式背景,提出了在不完備模糊形式背景下的建格算法.
直覺模糊集從隸屬和不隸屬2個方面刻畫人們認知過程中的模糊性,為處理模糊性問題提供了更豐富的信息.通過直覺模糊集刻畫對象與屬性的直覺模糊關系,進一步進行直覺模糊概念分析具有重要的理論意義和實際應用價值.朱憲杰等人[22]利用直覺模糊邏輯算子構造了直覺模糊概念格,通過直覺模糊集的水平截集定義了可辨識屬性矩陣,給出了直覺模糊概念格的一種屬性約簡方法;馬明華等人[23]研究了直覺模糊信息系統的約簡問題,從正關系和負關系兩方面考慮了對象與屬性間的直覺模糊信息,并根據直覺模糊關系中的正負信息將屬性值進行排序,得到了對象集和屬性集之間的支配關系,構造了新的概念格模型,并提出了概念格的屬性約簡方法;李磊軍等人[24]在三支決策視角下進行了直覺模糊形式背景和模糊形式背景中概念格之間的分析與比較,探究了它們之間的內在聯系,分析了直覺模糊形式背景中的概念格具有數據存儲所占空間更小、屬性約簡更簡潔的優勢.
實際中大量的問題常常無法用精確的數值表示,模糊語言值在這些問題的表示中具有簡單、易于理解等優勢,例如在中醫疾病診斷過程中,主要通過望聞問切來進行診斷,而病人也是用“有點疼”、“很嚴重”等自然語言來進行癥狀的描述.模糊語言值信息處理是目前智能信息處理的熱點研究方向,徐澤水等人[25]提出了虛擬語言術語的語法和語義,將該語言決策方法應用于語言信息融合等應用中;鄒麗等人[26-27]建立了2n元語言真值直覺模糊代數,并基于語言真值格蘊涵代數建立了語言真值直覺模糊格,從正反兩方面處理語言值模糊信息,且可同時處理語言值信息的可比性和不可比性,并分析其不可約元的蘊涵性質;裴崢等人[28]提出了加權不平衡的語言聚合算子,通過綜合評價語言信息的價值、信念程度和專家權重,該算子可以處理不完整或不確定的語言信息,可用于解決不平衡的語言多屬性群決策問題.徐揚等人[29-32]提出了語言真值格蘊涵代數及語言真值格值命題邏輯系統.在語言真值格蘊涵代數中,對語氣算子的繼承性進行修正,使得語言值之間序的關系更貼近自然語言的語義.語言值處理方面的研究對控制理論、模式識別、決策理論、機器學習等領域具有非常重要的意義[29].
在上述工作的基礎上,本文將語言值直覺模糊對與直覺模糊形式背景結合,定義了語言值直覺模糊形式背景,構造語言值直覺模糊概念格,研究了語言值直覺模糊概念之間以及語言值直覺模糊概念格之間的貼近度,并提出了語言值直覺模糊概念格的模式識別方法,將其應用于中醫疾病診斷識別中,說明此方法的有效性.
定義1[29]. 語言真值直覺模糊格.基于2n元語言真值格蘊涵代數建立語言真值直覺模糊格LV2n=(LV2n,∪,∩).其中,((hn,t),(hn,f))和((h1,t),(h1,f))分別為LV2n的最大元和最小元;t表示為真,即肯定的評價;f表示為假,即否定的評價.如圖1所示,對任意((hi,t),(hj,f)),((hk,t),(hl,f))∈LV2n,((hi,t),(hj,f))≤((hk,t),(hl,f))當且僅當i≤k,j≤l,且
1) ((hi,t),(hj,f))′=((hn-j+1,t),(hn-i+1,f));
2) ((hi,t),(hj,f))→((hk,t),(hl,f))=((hmin(n,n-i+k,n-j+l),t),(hmin(n,n-i+l),f));
3) ((hi,t),(hj,f))∪((hk,t),(hl,f))=((hmax(i,k),t),(hmax(j,l),f));
4) ((hi,t),(hj,f))∩((hk,t),(hl,f))=((hmin(i,k),t),(hmin(j,l),f)).

Fig. 1 Hasse diagram of linguistic truth-valued intuitionistic fuzzy lattice LV2n圖1 語言真值直覺模糊格LV2n的哈斯圖
定理1[29]. 對任意(hi,t)(hj,f)∈LV2n,(i,j=1,2,…,n,i≤j),((hi,t),(hj,f))是一個語言真值直覺模糊對當且僅當i≤j.
令語氣詞集H={hi|i=1,2,…,n},語氣詞hi則表示“略,一般,很,…”等描述程度的語氣詞,評價詞集為{t,f}.

Fig. 2 Hasse diagram of 10-element linguistic truth- valued intuitionistic fuzzy lattice LV10圖2 十元語言真值直覺模糊格LV10的哈斯圖
本文以十元語言真值格蘊涵代數為前提,即語氣詞集H={hi|i=1,2,3,4,5},其中語氣詞h1表示“略”,h2表示“有點”,h3表示“一般”,h4表示“很”,h5表示“絕對”,評價詞集為{t,f},則基于十元語言真值格蘊涵代數的語言真值直覺模糊格LV10如圖2所示:






XΔ={|a∈A},
?b∈B},
規定?Δ={a,1,0},另外,如果b?B,則


本節給出語言值直覺模糊形式背景的定義及其形式概念分析.






Table 1 Linguistic-Valued Intuitionistic Fuzzy Formal Context表1 語言值直覺模糊形式背景

基于定義5,6和文獻[16-21]中的方法,容易證明語言值直覺模糊概念的定理2成立.






根據定理2,我們有推論1.


基于定理2和定義7,可以得到定理3.

例2. 在例1中,基于圖2、定義7和表1,({1,2,3},{a,c})和({3},{a,b,c})是γ=((h4,c1),(h4,c2))水平下的語言值直覺模糊概念,({({1,2,3},{a,c}),({3},{a,b,c})},∨,∧)是一個完備格.
本節給出語言值直覺模糊概念及其語言值直覺模糊概念格之間的貼近度公式.直觀地,語言值直覺模糊概念格刻畫了語言值直覺模糊形式背景中概念的層次關系,若語言值直覺模糊概念理解為對象集和屬性集之間的一種知識表達,則本節提出的貼近度用來刻畫給定知識與已有知識之間的相似性并用于決策分析中.
1) 語言值直覺模糊概念之間的貼近度


(1)
其中,w1和w2為權重,即w1,w2∈[0,1]且w1+w2=1;|·|表示集合的勢,即集合中的元素個數.
直觀地,γ水平下2個語言值直覺模糊概念之間的貼近度D((X1,B1),(X2,B2))通過其外延和內涵之間的相似性刻畫,其中權重體現了外延和內涵在貼近度中的重要性,D((X1,B1),(X2,B2))越大,表示(X1,B1)與(X2,B2)越相似.
性質1. 對LVIFLγ中的任意2個語言值直覺模糊概念(X1,B1)和(X2,B2),
① 0≤D((X1,B1),(X2,B2))≤1;
②D((X1,B1),(X2,B2))=D((X2,B2),(X1,B1));
③D((X1,B1),(X1,B1))=1.



證畢.
2) 語言值直覺模糊概念與語言值直覺模糊概念格之間的貼近度

(2)





證畢.
3) 語言值直覺模糊概念格之間的貼近度

(3)




證明. 根據性質1和2,性質3顯然成立.
證畢.
基于語言值直覺模糊概念及其語言值直覺模糊概念格之間的貼近度,多個語言值直覺模糊形式背景下的模式識別按以下步驟完成:



Step4. 將各γ水平下語言值直覺模糊概念格的貼近度求和,即?j∈{1,2,…,k},

(4)
D(LVIFL0,LVIFLj)=max{D(LVIFL0,
LVIFLj′)|j′=1,2,…,k}.
(5)


Table 2 Linguistic-Valued Intuitionistic Fuzzy FormalContext of the Common Cold

Table 3 Linguistic-Valued Intuitionistic Fuzzy FormalContext of the Viral Pharyngitis

Table 4 Linguistic-Valued Intuitionistic Fuzzy FormalContext of the Pneumonia

Table 5 Linguistic-Valued Intuitionistic Fuzzy FormalContext of the Symptoms of a Patient
根據表2~5的形式背景描述,語言值直覺模糊形式背景下的模式識別步驟為:
Step1. 普通感冒、病毒性咽炎與肺炎的各γ水平下語言值直覺模糊形式概念見表6~8.
Step2. 按定義7,病人癥狀的各γ水平下語言值直覺模糊形式概念見表9.
Table6γLevelLinguistic-ValuedIntuitionisticFuzzyFormalConceptLatticeoftheCommonCold

表6 普通感冒的γ水平下的語言值直覺模糊概念格
Table7γLevelLinguistic-ValuedIntuitionisticFuzzyFormalConceptLatticeoftheViralPharyngitis

表7 病毒性咽炎的γ水平下的語言值直覺模糊概念格
Table8γLevelLinguistic-ValuedIntuitionisticFuzzyFormalConceptLatticeofthePneumonia

表8 肺炎的γ水平下的語言值直覺模糊概念格

Table9γLevelLinguistic-ValuedIntuitionisticFuzzyFormalConceptlatticeoftheSymptomsofaPatient

表9 病人癥狀的γ水平下的語言值直覺模糊概念格


表與和的貼近度
Step4. 基于表10,利用式(4),可得到D(LVIFL0,LVIFL1),D(LVIFL0,LVIFL2)和D(LVIFL0,LVIFL3),見表11.基于表11和式(5),可得到和病人癥狀貼近度最高的是肺炎,即根據病人癥狀,其為肺炎的可能性最大,其次是病毒性咽炎,是普通感冒的可能性最小.

Table 11 Degree of Similarity Between LVIFL0 andLVIFL1,LVIFL2 or LVIFL3
本文方法與文獻[33]的區別是:文獻[33]使用模糊形式背景描述了一個診斷病例,通過構建模糊形式概念格,給出了智能診斷方法.由于未使用語言值刻畫各種癥狀,導致文獻[33]的屬性集合較大,增加了生成模糊形式概念格的難度.本文運用語言值在中醫疾病診斷領域進行智能診斷,屬性集規模較小且能夠更好地表達病人對病情的描述,減少數據損失,從而得到更智能的診斷結果.
語言值直覺模糊概念格相對于直覺模糊概念格,減少了將語言轉換為數值計算的過程,從根本上減少了處理數據的誤差,用非常貼近自然語言的語言值對各個對象的屬性進行描述,不僅可以使問題描述更貼近人類語言,而且可以從正反兩方面描述模糊信息.本文利用語言值直覺模糊集,定義了語言值直覺模糊形式背景,給出了基于語言值直覺模糊集的形式概念定義,并利用語言值直覺模糊格生成了語言值直覺模糊概念格,通過語言值直覺模糊概念及其語言值直覺模糊概念格之間的貼近度,給出了基于語言值直覺模糊概念格的模式識別方法,該方法計算病人癥狀語言值直覺模糊概念格與可能患得疾病語言值直覺模糊概念格之間的貼近度,從而診斷最有可能患得疾病類型.該方法更有效地處理由人類自然語言描述的決策分析問題,符合人類的思考方式,為中醫疾病領域提供智能化診斷方法.
在語言值直覺模糊概念格的研究中,對于不可比的語言值直覺模糊對需進行更深的研究.中醫智能診斷領域疾病的自動診斷識別還需要進一步研究,我們將更深層次地研究每一種疾病的癥狀權重計算,對中醫診斷專家系統進行完善,使語言值直覺模糊概念格在中醫疾病智能診斷方面更好地發展.

ZouLi, born in 1971. PhD, professor, master supervisor. Her main research interests include multi-valued logic, uncertain reasoning and intelligent information processing, etc.

FengKaihua, born in 1993. Master candidate. Her main research interests include multi-valued logic, uncertain reasoning and intelligent information processing, etc.

LiuXin, born in 1967. Associate professor. His current research interests include intelligent information processing, decision making.