999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于WordNet的概念格間語(yǔ)義相似度計(jì)算方法

2015-11-01 09:18:57伍振興
中國(guó)科技信息 2015年9期
關(guān)鍵詞:語(yǔ)義詞匯概念

伍振興

基于WordNet的概念格間語(yǔ)義相似度計(jì)算方法

伍振興

本文提出了一種基于WordNet的概念格間語(yǔ)義相似度計(jì)算方法,該方法利用WordNet中各詞匯之間的結(jié)構(gòu)關(guān)系,參考其各詞匯間的距離、密度、深度來(lái)計(jì)算各概念間的語(yǔ)義相似度來(lái)反映概念間的語(yǔ)義關(guān)系,然后根據(jù)概念與其他的概念格中的語(yǔ)義相似度來(lái)計(jì)算兩個(gè)概念格間的語(yǔ)義相似度,為以后的研究做準(zhǔn)備。但是這種方法尚不完善,需進(jìn)一步進(jìn)行擴(kuò)展與改進(jìn)。

概念格具有良好的概念與概念之間的層次結(jié)構(gòu),已經(jīng)被廣泛應(yīng)用于軟件工程、信息檢索、數(shù)據(jù)挖掘等領(lǐng)域。但現(xiàn)如今對(duì)于各概念格之間的相似度計(jì)算和匹配的研究則相對(duì)較少。本文提出了一種基于WordNet的概念格間語(yǔ)義相似度計(jì)算方法,該方法利用WordNet中各詞匯之間的結(jié)構(gòu)關(guān)系,研究?jī)蓚€(gè)概念格之間的語(yǔ)義相似度計(jì)算,為以后概念格間的語(yǔ)義匹配做準(zhǔn)備。

概念格

概念格,又稱(chēng)為Galois格,是德國(guó)數(shù)學(xué)家Wille R.于1982年首次提的。概念格是根據(jù)數(shù)據(jù)集中對(duì)象與屬性之間的二元關(guān)系建立的一種概念層次結(jié)構(gòu),體現(xiàn)了概念之間的泛化和特化關(guān)系。

定義 稱(chēng)(U,A,I)為一個(gè)形式背景,其中U={x1,x2,…,xn}為對(duì)象集,每個(gè)xi(i≤n)稱(chēng)為一個(gè)對(duì)象;A={a1,a2,…,am}為屬性集,每個(gè)ai(i≤m)稱(chēng)為一個(gè)屬性;I 為U 和A之間的二元關(guān)系,I?U ×A .若(x,a) ∈I ,則說(shuō)x 具有屬性a ,記為xIa 。

若用1表示(x,a )∈I ,用0表示(x,a)?I ,這樣的形式背景就可以表示為只有0和1的表格。

對(duì)于形式背景(U,A,I),在對(duì)象集X?U 和屬性集B?A上 分別定義運(yùn)算:

?x∈U ,記{x}*為x*;?a∈A, 記{a}*為a*.若?x∈U ,x*≠?,x*≠A, 且?a∈A, a*≠?,a*≠U則稱(chēng)該形式背景(U,A,I)是正則的。

定義 2 設(shè)(U,A,I)為形式背景。如果一個(gè)二元組(X,B)滿(mǎn)足X?=B ,且B?=X ,則稱(chēng)(X,B)是一個(gè)形式概念,簡(jiǎn)稱(chēng)概念。其中X 稱(chēng)為概念的外延,B稱(chēng)為概念的內(nèi)涵。

概念格的每個(gè)節(jié)點(diǎn)是一個(gè)形式概念,由兩部分組成:外延,即概念所覆蓋的實(shí)例;內(nèi)涵,即該概念所覆蓋實(shí)例的共同特征。概念格可以圖形化形式表示為有標(biāo)號(hào)的線(xiàn)圖,圖中的節(jié)點(diǎn)表示一個(gè)概念,節(jié)點(diǎn)間的連線(xiàn)表示節(jié)點(diǎn)間存在泛化與特化關(guān)系,這種線(xiàn)圖也稱(chēng)為Hasse圖。它是概念格的可視化表示。

WordNet簡(jiǎn)介

WordNet是一個(gè)大型的英語(yǔ)詞匯數(shù)據(jù)庫(kù),它來(lái)源于美國(guó)Princeton大學(xué)GeorgeA.Miller教授所主持的一項(xiàng)知識(shí)工程的項(xiàng)目。WordNet是按照詞匯的語(yǔ)義關(guān)系來(lái)組織詞匯,它使用同義詞集合來(lái)表示概念,而這些概念集合則通過(guò)其中的某一特定的關(guān)系或者結(jié)構(gòu)來(lái)相互連接,形成一個(gè)大型的樹(shù)形結(jié)構(gòu)。目前WordNet中的詞匯數(shù)量已經(jīng)近20萬(wàn)條,并且每月超千條的速度不斷的增長(zhǎng)。

WordNet之間存在著兩種關(guān)系:語(yǔ)義關(guān)系和詞匯關(guān)系。其中詞匯關(guān)系指詞形之間所存在的關(guān)系,語(yǔ)義關(guān)系指詞義之間存在的關(guān)系。這些關(guān)系中比較重要的是同義關(guān)系、近似關(guān)系、反義關(guān)系、上下位關(guān)系和部分整體關(guān)系。

(1)同義關(guān)系是WordNet中最基本的關(guān)系,它屬于詞匯關(guān)系,是形成同義詞集的基礎(chǔ)。在WordNet中,同義關(guān)系并不是說(shuō)兩個(gè)詞匯在任何語(yǔ)境下都可以相互交換的,而是指在某一特定的語(yǔ)境下,這兩個(gè)詞可以交換。

(2)反義關(guān)系和近似關(guān)系是指形容詞集之間的關(guān)系,它是語(yǔ)義關(guān)系。在WordNet中形容詞集的組織結(jié)構(gòu)主要依靠反義關(guān)系和近似關(guān)系。形容詞集是按簇(Cluster)組織的,每個(gè)簇都包含一個(gè)主節(jié)點(diǎn)(Head Synset),大多數(shù)的主節(jié)點(diǎn)都有一個(gè)或多個(gè)附屬節(jié)點(diǎn)(Satellite Synset),主節(jié)點(diǎn)和附屬節(jié)點(diǎn)間通過(guò)近似關(guān)系連接。其中每個(gè)主節(jié)點(diǎn)中至少存在一個(gè)詞和另外一個(gè)簇中的主節(jié)點(diǎn)所包含的詞間存在反義關(guān)系。

(3)上下位關(guān)系是WordNet中最重要的關(guān)系之一,是屬于語(yǔ)義關(guān)系,指在動(dòng)詞集和名詞集上的關(guān)系,基于這種關(guān)系形成了動(dòng)詞集和名詞集上的層次結(jié)構(gòu)。相對(duì)于下位詞,上位詞是一個(gè)通用術(shù)語(yǔ),它表示由所有實(shí)例構(gòu)成的一個(gè)類(lèi)的整體;相對(duì)于上位詞,下位詞是一個(gè)具體術(shù)語(yǔ),它表示類(lèi)中的一個(gè)實(shí)例。

(4)部分整體關(guān)系是WordNet中另外一種重要的關(guān)系,和上下位關(guān)系一樣同屬語(yǔ)義關(guān)系,是指在名詞集上的關(guān)系。在WordNet中,部分整體關(guān)系通常被分成三類(lèi):即對(duì)于任意給定的兩個(gè)名詞集S1和S2,若S1是整體,S2是部分,則S2或者是S1的成員,或者是構(gòu)成S1的材料,或者是S1的組成部分。

一種基于WordNet的概念格間語(yǔ)義相似度計(jì)算方法

概念間的語(yǔ)義相似度計(jì)算

從語(yǔ)義上講,概念格中的概念關(guān)系主要有分為以下四種:(1)part-of關(guān)系,概念間整體與部分的關(guān)系;(2)kind-of關(guān)系,概念間的超概念和子概念的關(guān)系,(3)instance-of關(guān)系,概念中的具體和抽象的關(guān)系,(4)attribute-of關(guān)系;概念與屬性的關(guān)系。但是也有些學(xué)者將概念間的語(yǔ)義關(guān)系拓展到概念間的行為關(guān)系和因果關(guān)系等。

依據(jù)參照WordNet本體來(lái)判斷概念之間的語(yǔ)義和結(jié)構(gòu)關(guān)系,利用概念間的關(guān)系組成的圖形結(jié)構(gòu),參考概念間的距離、密度、深度來(lái)計(jì)算各概念間的語(yǔ)義相似度來(lái)反映概念間的語(yǔ)義關(guān)系為后期的工作做準(zhǔn)備。概念間的距離越近、深度越深,密度越大,那么相似度越大。同等情況之下,離根遠(yuǎn)的概念間的語(yǔ)義相似度和結(jié)構(gòu)肯定要比離根近的概念要大而且結(jié)構(gòu)越相似。因此本文相似度的計(jì)算將深度、密度和距離作為參考因素之一。

其中simd表示概念間距離的相似度計(jì)算,參數(shù)dist表示兩個(gè)概念在WordNet中的距離,θ是一個(gè)閾值參數(shù)。距離越大,simd的值就越小,當(dāng)兩個(gè)概念間的距離超過(guò)θ時(shí),那么就認(rèn)為相似度為0。

其中simm表示概念間密度的相似度,NUM表示從當(dāng)前兩個(gè)概念往上找到最近的超概念,然后統(tǒng)計(jì)從超概念到當(dāng)前兩個(gè)概念間的所有概念的個(gè)數(shù)(含當(dāng)前兩個(gè)概念和超概念)。若當(dāng)前兩個(gè)概念與超概念間沒(méi)有其他概念,則simm為1。

其中sims表示概念間深度的相似度計(jì)算,參數(shù)DeepTotal表示在WordNet整棵語(yǔ)義樹(shù)中深度,參數(shù)deepth是兩個(gè)概念的深度最深的那個(gè)值。深度越大,sims的值就越大。

綜合考慮概念間的密度,深度和距離三個(gè)因素,根據(jù)(3)(4)(5)三個(gè)計(jì)算方式,基于WordNet中的兩個(gè)概念的語(yǔ)義相似度為:

其中α+β+μ=1,α、β、μ分別為距離、密度和深度的權(quán)重。

概念與另外概念格語(yǔ)義相似度的計(jì)算

根據(jù)上述公式(3)(4)(5)(6)來(lái)計(jì)算兩個(gè)概念格中的概念基于WordNet的語(yǔ)義相似度計(jì)算方法,本文可以計(jì)算得出概念格L1中的概念Ci到另外一個(gè)概念格L2中所有概念的相似度,找出相似度最大的語(yǔ)義相似度的候選概念結(jié)點(diǎn),根據(jù)概念格的特性,可以找出與其最近的候選概念的子結(jié)點(diǎn),層層迭代,可以得出概念Ci到概念格L2關(guān)系最緊密的一條路徑Ri,那么該概念結(jié)點(diǎn)Ci到概念格L2的相似度計(jì)算如下:

其中n為路徑Ri上各概念結(jié)點(diǎn)的個(gè)數(shù),θi為路徑Ri上各概念結(jié)點(diǎn)的權(quán)重。越是概念相似度越高的概念,兩結(jié)點(diǎn)之間的語(yǔ)義關(guān)系或詞匯關(guān)系越近,θi的值越大,其中

概念格間的語(yǔ)義相似度計(jì)算

本文可以根據(jù)公式(7)得出的概念Ci到另外一個(gè)概念格L2中的相似度計(jì)算度,而后將此計(jì)算方法擴(kuò)展到概念格L1中的所有概念結(jié)點(diǎn),然后選取所有相似度的平均值作為概念格L1和L2的相似度。

其中n為概念格L1上概念結(jié)點(diǎn)的個(gè)數(shù)。

結(jié)束語(yǔ)

本文提出了一種基于WordNet的概念格間語(yǔ)義相似度計(jì)算方法,該方法利用WordNet中各詞匯之間的結(jié)構(gòu)關(guān)系,參考其各詞匯間的距離、密度、深度來(lái)計(jì)算各概念間的語(yǔ)義相似度來(lái)反映概念間的語(yǔ)義關(guān)系,然后根據(jù)概念與其他的概念格中的語(yǔ)義相似度來(lái)計(jì)算兩個(gè)概念格間的語(yǔ)義相似度,為以后的研究做準(zhǔn)備。但是這種方法尚不完善,需進(jìn)一步進(jìn)行擴(kuò)展與改進(jìn)。

10.3969/j.issn.1001-8972.2015.09.011

猜你喜歡
語(yǔ)義詞匯概念
Birdie Cup Coffee豐盛里概念店
本刊可直接用縮寫(xiě)的常用詞匯
一些常用詞匯可直接用縮寫(xiě)
語(yǔ)言與語(yǔ)義
幾樣概念店
本刊可直接用縮寫(xiě)的常用詞匯
學(xué)習(xí)集合概念『四步走』
聚焦集合的概念及應(yīng)用
“上”與“下”語(yǔ)義的不對(duì)稱(chēng)性及其認(rèn)知闡釋
認(rèn)知范疇模糊與語(yǔ)義模糊
主站蜘蛛池模板: 国产H片无码不卡在线视频| 国产日韩欧美在线播放| 亚洲精品自拍区在线观看| 国产成人高清在线精品| 欧美国产日韩另类| 无码专区在线观看| 国产成人综合亚洲欧美在| 午夜高清国产拍精品| 午夜精品一区二区蜜桃| a天堂视频| 色综合热无码热国产| 精品久久国产综合精麻豆| 国内精品视频| 国产人在线成免费视频| 国产丰满成熟女性性满足视频| 一本大道无码高清| 蜜桃视频一区二区三区| 国产精品专区第一页在线观看| 中文字幕日韩久久综合影院| 国产精品999在线| 国产国产人成免费视频77777| 日韩AV手机在线观看蜜芽| 亚洲精品国产综合99久久夜夜嗨| 亚洲三级成人| 波多野结衣一区二区三视频 | 国产91精品最新在线播放| 欧美成人日韩| 色偷偷av男人的天堂不卡| 亚洲午夜国产精品无卡| 日韩色图在线观看| 国产打屁股免费区网站| 成人在线观看不卡| 97影院午夜在线观看视频| 久久6免费视频| 亚洲香蕉久久| 又爽又大又黄a级毛片在线视频| 午夜精品福利影院| 在线色国产| 亚洲天堂首页| 九九热精品视频在线| 77777亚洲午夜久久多人| 亚洲日韩高清在线亚洲专区| 亚洲另类国产欧美一区二区| 久久免费精品琪琪| 亚洲成肉网| 97青青青国产在线播放| 国产性精品| 91小视频版在线观看www| 国产成人亚洲无吗淙合青草| 亚洲自拍另类| 亚洲欧美色中文字幕| 国产经典在线观看一区| 国产手机在线ΑⅤ片无码观看| 国产成人免费视频精品一区二区 | 免费A级毛片无码无遮挡| 国产资源免费观看| 青青青国产视频| 亚洲AV无码久久精品色欲| 久久精品人人做人人爽| 91香蕉视频下载网站| hezyo加勒比一区二区三区| 天堂网国产| 久久美女精品| 欧美日本激情| 2021天堂在线亚洲精品专区| 国产无码性爱一区二区三区| 欲色天天综合网| 亚洲a免费| 日韩黄色大片免费看| 911亚洲精品| 亚洲另类国产欧美一区二区| 国产精品播放| 免费一级α片在线观看| 无码高清专区| 欧美亚洲网| 四虎精品黑人视频| 国内精品自在自线视频香蕉| 丝袜高跟美脚国产1区| 亚洲综合色在线| 成人一级免费视频| 老熟妇喷水一区二区三区| 日本欧美一二三区色视频|