999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向領(lǐng)域本體非分類關(guān)系的語義相關(guān)度計算方法

2016-12-26 08:14:22樊紅杰
計算機(jī)應(yīng)用與軟件 2016年11期

王 紅 樊紅杰 孫 康

(中國民航大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院 天津 300300)

?

面向領(lǐng)域本體非分類關(guān)系的語義相關(guān)度計算方法

王 紅 樊紅杰 孫 康

(中國民航大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院 天津 300300)

針對民航突發(fā)事件領(lǐng)域本體非分類關(guān)系的語義查詢擴(kuò)展問題,提出一種面向領(lǐng)域本體非分類關(guān)系的語義相關(guān)度計算方法。該方法在數(shù)據(jù)屬性方面,提出基于屬性類型和屬性值的語義相關(guān)度計算方法;在對象屬性方面,針對查詢詞與本體概念或?qū)嵗嬖诙喾N對象屬性問題,提出基于對象屬性的語義相關(guān)度計算方法,并結(jié)合領(lǐng)域本體在民航突發(fā)事件案例的語義查詢過程給出了該方法的實(shí)現(xiàn)效果分析。該方法不僅有效地提高了語義查詢的準(zhǔn)確率和查全率,也為民航突發(fā)事件的應(yīng)急決策提供了更好的方法支持。

民航突發(fā)事件 領(lǐng)域本體 非分類關(guān)系 語義相關(guān)度

0 引 言

本體是共享概念模型的明確的規(guī)范說明[1]。領(lǐng)域本體是用于描述指定領(lǐng)域知識的一種專門本體,它將與特定領(lǐng)域相關(guān)的概念以及概念間的關(guān)系以形式化的說明進(jìn)行了嚴(yán)格的規(guī)范,明確描述了概念的含義以及概念間語義的關(guān)系。民航突發(fā)事件領(lǐng)域本體是以民航突發(fā)事件應(yīng)急救援計劃、民航應(yīng)急管理相關(guān)規(guī)定、民航突發(fā)事件應(yīng)急救援預(yù)案,民航突發(fā)事件歷史案例為基礎(chǔ),通過概念以及概念間關(guān)系的形式化描述,明確了領(lǐng)域中概念及概念間的語義關(guān)系。之前開展的基于領(lǐng)域本體的語義檢索方法[2]是基于概念間的分類關(guān)系實(shí)現(xiàn)的,雖然有效解決了傳統(tǒng)的基于關(guān)鍵詞查詢方法所存在的語義偏差和語義歧義等問題,但在查全率和查準(zhǔn)率方面依然存在不足。非分類關(guān)系是指除分類關(guān)系以外的所有其他關(guān)系,是概念間語義關(guān)系的重要組成部分,影響著語義查詢擴(kuò)展的效率。因此,本文面向領(lǐng)域本體對基于非分類關(guān)系的語義相關(guān)度計算方法展開了研究。

目前,針對本體非分類關(guān)系的語義相關(guān)度計算方法的研究主要集中在數(shù)據(jù)屬性[3-6]方面,在對象屬性方面的研究[7,8]還比較少。本文結(jié)合民航突發(fā)事件應(yīng)急救援的特殊性,通過深入分析已構(gòu)建的民航突發(fā)事件領(lǐng)域本體[9,10]的特征,提出一種面向領(lǐng)域本體非分類關(guān)系的語義相關(guān)度計算方法。該方法不僅提高了語義查詢的準(zhǔn)確率和查全率,同時也為民航突發(fā)事件的應(yīng)急決策與救援提供了輔助作用。

1 語義相關(guān)度

1.1 語義相關(guān)度定義

在本體領(lǐng)域,語義相關(guān)度是指概念間語義相互關(guān)聯(lián)程度[11]。語義相關(guān)的兩個概念可能不存在相似關(guān)系,但它們可以通過某些其他關(guān)系相關(guān)聯(lián)形成相關(guān)關(guān)系。語義相似度是語義相關(guān)度的特例,通常情況下,相似概念一般是相關(guān)的,但相關(guān)概念卻不一定相似。

本文依據(jù)語義相關(guān)度的一般定義和已構(gòu)建的民航突發(fā)事件領(lǐng)域本體的特點(diǎn),給出了以下基于民航突發(fā)事件領(lǐng)域本體的語義相關(guān)度的定義:

語義相關(guān)度是指本體中概念在非分類關(guān)系上的相關(guān)程度,記概念ci、cj之間的相關(guān)度為Sim(ci, cj),它需滿足以下條件:

(1) 相關(guān)度的值是區(qū)間[0,1]內(nèi)的一個實(shí)數(shù),即Sim(ci, cj)?[0,1];

(2) 如果兩個概念完全相似,則相關(guān)度值為1,即Sim(ci, cj)=1(當(dāng)且僅當(dāng)ci=cj);

(3) 如果兩個概念之間不存在任何連通路徑,則相關(guān)度值為0,即Sim(ci, cj)=0;

(4) 概念之間的相關(guān)度是對稱的,即Sim(ci, cj)= Sim(cj, ci)。

1.2 語義相關(guān)度計算方法

在民航突發(fā)事件領(lǐng)域本體中,非分類關(guān)系分為數(shù)據(jù)屬性關(guān)系和對象屬性關(guān)系。本文通過對數(shù)據(jù)屬性和對象屬性語義相關(guān)度的研究,提出了一種基于非分類關(guān)系的語義相關(guān)度計算方法,并將其應(yīng)用于領(lǐng)域本體中事故案例的語義查詢擴(kuò)展中,其實(shí)現(xiàn)模型如圖1所示。

圖1 面向領(lǐng)域本體非分類關(guān)系的語義相關(guān)度計算方法模型

圖1中:

相關(guān)定義:負(fù)責(zé)語義相關(guān)度、數(shù)據(jù)屬性權(quán)重和對象屬性權(quán)重的定義。

相關(guān)度計算:實(shí)現(xiàn)查詢詞與本體概念、實(shí)例基于非分類關(guān)系的語義相關(guān)度計算。

相關(guān)度應(yīng)用:將該基于非分類關(guān)系的語義相關(guān)度計算方法應(yīng)用于民航突發(fā)事件領(lǐng)域本體中的事故案例語義查詢擴(kuò)展中。

2 領(lǐng)域本體數(shù)據(jù)屬性的語義相關(guān)度計算

2.1 數(shù)據(jù)屬性的權(quán)重

當(dāng)民航突發(fā)事件發(fā)生時,救援指揮中心根據(jù)獲取的各種事故信息和救援信息制定相應(yīng)的救援方案并通知各救援部門實(shí)施及時、有效的救援。在突發(fā)事件的應(yīng)急決策與救援中,突發(fā)事件案例對實(shí)現(xiàn)事故的及時、有效救援起到了重要的借鑒和指導(dǎo)作用。已構(gòu)建的民航突發(fā)事件領(lǐng)域本體中與突發(fā)事件案例相關(guān)的數(shù)據(jù)屬性如表1所示,這些數(shù)據(jù)屬性實(shí)現(xiàn)了對突發(fā)事件案例的特征描述。

表1 領(lǐng)域本體中與突發(fā)事件案例相關(guān)的數(shù)據(jù)屬性及取值

由于突發(fā)事件案例對事故的應(yīng)急決策與救援具有重要的借鑒和指導(dǎo)作用,本文依據(jù)突發(fā)事件案例的各種信息在事故應(yīng)急決策與救援中起到的重要程度,為上述數(shù)據(jù)屬性分配了一定的權(quán)重。數(shù)據(jù)屬性的權(quán)重越大,該數(shù)據(jù)屬性越重要,越不可缺失。

對于各屬性權(quán)重的具體取值,需要結(jié)合民航突發(fā)事件應(yīng)急決策與救援的實(shí)際需求。由于Event_Level直接決定了應(yīng)急救援響應(yīng)等級,因此其權(quán)重應(yīng)最大。Operation_Stage、Weather_Type、Event_Location對事故評估、救援實(shí)施具有重要作用,因此要為其分配次大的權(quán)重值。Plane_Type、Plane_Task和Event_Time對事故救援起到的輔助作用相比其他屬性要弱一些,因此其權(quán)重值應(yīng)較小。本文將上述各數(shù)據(jù)屬性權(quán)重值限定在區(qū)間[0,1]內(nèi),并對其進(jìn)行歸一化處理,最終為各數(shù)據(jù)屬性分配如表2所示的權(quán)重值。

表2 數(shù)據(jù)屬性的權(quán)重

2.2 數(shù)據(jù)屬性類型的語義相關(guān)度

在本體中,數(shù)據(jù)屬性將本體概念與屬性值類型、本體實(shí)例與具體屬性值相關(guān)聯(lián),它實(shí)現(xiàn)了對本體概念和實(shí)例的特征描述,起到了語義標(biāo)簽的作用。

目前,基于數(shù)據(jù)屬性的語義相關(guān)度計算方法中最經(jīng)典且最常被引用的是Tversrvy[3]方法,其公式如下:

(1)

其中,f(ci, cj)表示本體概念ci、cj擁有的相同數(shù)據(jù)屬性的數(shù)量,f(ci- cj)表示ci擁有但cj沒有的數(shù)據(jù)屬性數(shù)量,f(cj-ci)表示cj擁有但ci沒有的數(shù)據(jù)屬性數(shù)量。α是調(diào)節(jié)因子,它與ci、cj的深度有關(guān),其取值如下:

(2)

該方法在語義相關(guān)度計算中將比較的兩概念視為同等重要,但語義查詢擴(kuò)展是利用目標(biāo)概念在本體中查詢擴(kuò)展出與其語義相似或相關(guān)的其他本體概念,上述方法削弱了目標(biāo)概念的重要性。同時,該方法使用的是典型的特征匹配方法,忽略了屬性值之間的語義相關(guān)度問題。因此,本節(jié)以目標(biāo)概念具有的數(shù)據(jù)屬性為基準(zhǔn),對概念在數(shù)據(jù)屬性類型和數(shù)據(jù)屬性值上的語義相關(guān)度分別進(jìn)行了研究。

在數(shù)據(jù)屬性類型方面,兩概念擁有的相同屬性類型的個數(shù)越多,它們越相關(guān);反之,兩概念擁有的相同屬性類型的個數(shù)越少,它們越不相關(guān)[12]。以目標(biāo)概念或?qū)嵗哂械臄?shù)據(jù)屬性為基準(zhǔn),提出了以下基于數(shù)據(jù)屬性類型的語義相關(guān)度計算:

(3)

(4)

其中,ci、cj是任意本體概念或?qū)嵗琧i作為目標(biāo)概念或?qū)嵗琧j作為源概念或?qū)嵗ik表示ci的第k個數(shù)據(jù)屬性;cjl表示cj的第l個數(shù)據(jù)屬性。type(cik)表示ci的第k個數(shù)據(jù)屬性的屬性類型。Simtype(cik, cjl)表示數(shù)據(jù)屬性cik、cjk基于屬性類型的語義相關(guān)度。wk是數(shù)據(jù)屬性cik的權(quán)重值。n、m分別表示ci、cj擁有的數(shù)據(jù)屬性的個數(shù)。

2.3 數(shù)據(jù)屬性值的語義相關(guān)度

在民航突發(fā)事件領(lǐng)域本體中,數(shù)據(jù)屬性值有三種:有序枚舉型屬性值、無序枚舉型屬性值和混合枚舉型屬性值。數(shù)據(jù)屬性值的類型不同,對屬性值的語義相關(guān)度計算方法也應(yīng)不同。因此,根據(jù)數(shù)據(jù)屬性值的特點(diǎn)提出了三種基于屬性值的語義相關(guān)度計算。

1) 有序枚舉型屬性值的語義相關(guān)度

有序枚舉型屬性值是指屬性在給定的一個數(shù)據(jù)集中進(jìn)行取值,該數(shù)據(jù)集中的數(shù)據(jù)存在有序關(guān)系,例如Event_Level的取值有1(特別重大)、2(重大)、3(較大)和4(一般)。

對于有序枚舉型屬性值,屬性值相差越大,其語義相關(guān)度越小;反之,屬性值相差越小,其語義相關(guān)度越大。在有序枚舉型屬性值的語義相關(guān)度計算方面,目前最常用的是海明距離法,其計算公式如下:

(5)

其中,Pi、Pj表示數(shù)據(jù)屬性,xi、xj是Pi、Pj的數(shù)值型屬性值。

該方法雖然解決了對有序枚舉型屬性值的語義相關(guān)度計算問題,但是計算結(jié)果受取值個數(shù)的影響較大。為了增強(qiáng)有序枚舉型屬性值之差對相關(guān)度的影響,進(jìn)行了以下改進(jìn):

(6)

其中,ci、cj是任意本體實(shí)例,SimValue(cik, cjk)表示ci、cj在第k個數(shù)據(jù)屬性上基于屬性值的語義相關(guān)度。xk、yk分別表示ci和cj的第k個數(shù)據(jù)屬性的數(shù)值型屬性值。m是第k個數(shù)據(jù)屬性的取值個數(shù)。

2) 無序枚舉型屬性值的語義相關(guān)度

無序枚舉型屬性值是指屬性在給定的一個數(shù)據(jù)集中進(jìn)行取值,該數(shù)據(jù)集中的所有數(shù)據(jù)之間無關(guān)聯(lián)關(guān)系,例如數(shù)據(jù)屬性Weather_Type的取值有“適航”、“臺風(fēng)”、“雷暴”、“冰雹”等。

無序枚舉型屬性值一般都是字符型,因此,對于該屬性值的語義相關(guān)度計算使用字符匹配法,即:

(7)

其中,ci、cj是任意本體實(shí)例,SimValue(cik, cjk)表示ci、cj在第k個數(shù)據(jù)屬性上基于無序枚舉型屬性值的語義相關(guān)度。xk、yk分別表示ci和cj的第k個數(shù)據(jù)屬性的屬性值。

3) 混合枚舉型屬性值的語義相關(guān)度

混合枚舉型屬性值是指屬性在給定的多個數(shù)據(jù)集中進(jìn)行取值,這些數(shù)據(jù)集之間存在分類關(guān)系,各數(shù)據(jù)集內(nèi)部所有數(shù)據(jù)之間無關(guān)聯(lián)關(guān)系。由于混合枚舉型屬性值通常是字符型,所以最常使用的方法是字符匹配法。但是該方法忽略了屬性值之間的隱性語義關(guān)系,在一定程度上影響了語義相關(guān)度計算的準(zhǔn)確度,因此本文依據(jù)該屬性值的特點(diǎn),提出了一種針對混合枚舉型屬性值的語義相關(guān)度計算方法。

對于混合枚舉型屬性值的語義相關(guān)度計算,在計算前先對屬性的取值數(shù)據(jù)集進(jìn)行有序編號。如數(shù)據(jù)屬性Plane_Task的取值數(shù)據(jù)集有商用航空數(shù)據(jù)集和通用航空數(shù)據(jù)集,商用航空數(shù)據(jù)集包含“客運(yùn)”、“貨運(yùn)”、“客貨運(yùn)”,通用航空數(shù)據(jù)集包含“工業(yè)航空”、“農(nóng)業(yè)航空”、“航空科研和探險活動”等。商用航空數(shù)據(jù)集的序號為1,通用航空數(shù)據(jù)集的序號為2,Plane_Task的屬性值“客運(yùn)”、“貨運(yùn)”、“飛行訓(xùn)練”間的語義相關(guān)度關(guān)系為Sim(客運(yùn),客運(yùn))>Sim(客運(yùn),貨運(yùn)) > Sim(客運(yùn),飛行訓(xùn)練)。

依據(jù)混合枚舉型屬性值的特點(diǎn),基于混合枚舉型屬性值的語義相關(guān)度計算如下:

(8)

其中,ci、cj是任意本體實(shí)例,SimValue(cik, cjk)表示ci、cj在第k個數(shù)據(jù)屬性上基于混合枚舉型屬性值的語義相關(guān)度。Xk、Yk分別表示ci和cj的第k個數(shù)據(jù)屬性的屬性值所在數(shù)據(jù)集的序號,如Plane_Task的屬性值“客運(yùn)”所在數(shù)據(jù)集的序號為1,“飛行訓(xùn)練”所在數(shù)據(jù)集的序號為2。m是第k個數(shù)據(jù)屬性的取值數(shù)據(jù)集的個數(shù)。xk、yk分別表示ci和cj的第k個數(shù)據(jù)屬性的屬性值。

2.4 基于數(shù)據(jù)屬性的語義相關(guān)度計算

通過上述對屬性類型的語義相關(guān)度和屬性值的語義相關(guān)度的研究,提出了以下基于數(shù)據(jù)屬性的語義相關(guān)度計算:

(9)

其中,ci、cj是任意本體概念或?qū)嵗琧i作為目標(biāo)概念或?qū)嵗琧j作為源概念或?qū)嵗ik表示ci的第k個數(shù)據(jù)屬性。SimDat(ci,cj)表示ci、cj基于數(shù)據(jù)屬性的語義相關(guān)度。SimType(cik,cjl)表示cik、cjl在屬性類型上的語義相關(guān)度。SimValue(cik,cjl)表示cik、cjl在屬性值上的語義相關(guān)度。wk是屬性cik的權(quán)重值。n、m分別是ci、cj擁有的數(shù)據(jù)屬性的個數(shù)。

3 領(lǐng)域本體對象屬性的語義相關(guān)度計算

3.1 對象屬性的權(quán)重

本體中,對象屬性將不同的概念、實(shí)例依據(jù)語義相關(guān)性關(guān)聯(lián)在一起,構(gòu)成了非分類關(guān)系。通常情況下,相似概念一般是相關(guān)的,但相關(guān)概念卻不一定相似。

目前,通過對象屬性計算語義相關(guān)度的方法主要依賴于概念間的語義距離來實(shí)現(xiàn)。許多研究者將基于詞語距離的相似度計算方法引入了本體領(lǐng)域,成為了一種常用的基于對象屬性的語義相關(guān)度計算方法,其計算公式如下:

(10)

其中,ci、cj是任意本體概念或?qū)嵗琹ength(ci, cj)是ci、cj之間包含對象屬性關(guān)系邊的路徑長度。α是調(diào)節(jié)參數(shù)。

后來一些研究者對概念間的對象屬性通過關(guān)系權(quán)重進(jìn)行了量化,進(jìn)而產(chǎn)生了利用權(quán)重路徑計算本體概念基于對象屬性的語義相關(guān)度的方法,其中最常用的方法為:

(11)

其中,ci、cj是任意本體概念或?qū)嵗瑆(ei)是ci、cj之間包含對象屬性關(guān)系邊的路徑中第ei條邊的權(quán)重。

雖然該方法通過對象屬性實(shí)現(xiàn)了語義相關(guān)度的計算,但是它僅考慮了本體概念或?qū)嵗g只存在一種對象屬性的情況,對于本體概念或?qū)嵗g擁有多種對象屬性的情況并不適用。因此,本文基于民航突發(fā)事件領(lǐng)域本體對上述方法進(jìn)行了改進(jìn)。

在民航突發(fā)事件領(lǐng)域本體中,與突發(fā)事件案例相關(guān)的對象屬性主要有PlanOwn、ActionOwn、RelatedCause、RelatedEffect、RelatedExperience、Keyfacor。由于突發(fā)事件案例對事故的應(yīng)急決策與救援具有重要的借鑒和指導(dǎo)作用,本文依據(jù)突發(fā)事件案例的各種信息在事故應(yīng)急決策與救援中的重要程度,為上述對象屬性分配了一定的權(quán)重。對象屬性的權(quán)重越大,該對象屬性越重要,越不可缺失。

由于對象屬性是將概念、實(shí)例進(jìn)行語義相關(guān)聯(lián)的一種非分類關(guān)系,所以對象屬性的權(quán)重也與分類關(guān)系的權(quán)重相關(guān)。對于各對象屬性權(quán)重的具體取值,需要結(jié)合民航突發(fā)事件應(yīng)急決策與救援的實(shí)際需求、專家經(jīng)驗(yàn)和下文改進(jìn)的基于對象屬性的語義相關(guān)度計算方法進(jìn)行實(shí)驗(yàn)驗(yàn)證。實(shí)驗(yàn)中,將所有對象屬性的權(quán)重初值設(shè)為0.1且取值范圍為[0,1],同時以增值為0.1的方式對權(quán)重值進(jìn)行遞增,計算不同權(quán)重值下本體概念、實(shí)例基于對象屬性的語義相關(guān)度。實(shí)驗(yàn)發(fā)現(xiàn),當(dāng)對象屬性權(quán)重小于0.6時,會導(dǎo)致概念間的語義相關(guān)度值過小;當(dāng)對象屬性權(quán)重大于0.8時,會導(dǎo)致概念間的語義相關(guān)度值過大,與實(shí)際情況不符。最終,通過對不同對象屬性權(quán)重下的實(shí)驗(yàn)結(jié)果的分析和對比,得到如表3所示的各對象屬性的權(quán)重值。

表3 民航突發(fā)事件領(lǐng)域本體中對象屬性權(quán)重值

3.2 基于對象屬性的語義相關(guān)度計算

設(shè)集合R={r1,r2,…,rm}為對象屬性非分類關(guān)系的集合,其中ri(i=1,2,…,m)是領(lǐng)域本體中已定義的某種對象屬性非分類關(guān)系。

定義任意本體概念或?qū)嵗齝i和cj在對象屬性非分類關(guān)系ri上的相關(guān)值Vri(ci, cj)為:

其中,weight(ri)是對象屬性非分類關(guān)系ri的權(quán)重值。

在領(lǐng)域本體中,由于本體概念或?qū)嵗g可能存在多種對象屬性非分類關(guān)系,因此定義ci和cj在對象屬性非分類關(guān)系上的關(guān)系權(quán)重為:

(12)

其中,m為集合R中元素的個數(shù)。n為ci與cj間存在且不重復(fù)的對象屬性非分類關(guān)系的個數(shù)。

將本體中通過對象屬性相關(guān)聯(lián)的概念或?qū)嵗闯墒怯梢粭l加權(quán)的非分類關(guān)系邊直接相連,則基于式(12)的關(guān)系權(quán)重計算,ci和cj在對象屬性上的語義相關(guān)度為:

(13)

其中,α、 β為調(diào)節(jié)參數(shù)。

4 實(shí)現(xiàn)過程與效果分析

4.1 實(shí)現(xiàn)過程

通過上述對基于數(shù)據(jù)屬性和對象屬性的語義相關(guān)度的研究,提出了以下面向領(lǐng)域本體非分類關(guān)系的語義相關(guān)度計算方法。該方法將數(shù)據(jù)屬性和對象屬性的語義相關(guān)度進(jìn)行了結(jié)合,其計算方法如下:

Sim(ci,cj)=?1SimDat(ci,cj)+?2SimNl(ci,cj)

(14)

其中,ci、cj是任意本體概念或?qū)嵗琧i作為目標(biāo)概念或?qū)嵗琧j作為源概念或?qū)嵗琒im (ci, cj)表示 ci、cj基于非分類關(guān)系的語義相關(guān)度。?1、?2是調(diào)節(jié)因子,且?1+?2=1。

在基于非分類關(guān)系的語義相關(guān)度計算方法中,通過設(shè)定一個閾值λ來限制查詢結(jié)果集的大小,將領(lǐng)域本體中與目標(biāo)查詢詞的語義相關(guān)度大于閾值λ的本體概念和實(shí)例加入查詢結(jié)果集中,該方法的具體實(shí)現(xiàn)過程如圖2所示。

圖2 基于非分類關(guān)系的語義相關(guān)度算法

如圖2所示,基于民航突發(fā)事件領(lǐng)域本體將關(guān)鍵詞qk與本體概念、實(shí)例相匹配, 計算匹配的關(guān)鍵詞qk與其他任意本體概念或?qū)嵗齝j在數(shù)據(jù)屬性和對象屬性上的語義相關(guān)度值。確定調(diào)節(jié)因子?1、?2的值,計算出關(guān)鍵詞qk與cj基于非分類關(guān)系的總相關(guān)度值,將總相關(guān)度值大于閾值λ的本體概念或?qū)嵗尤氩樵兘Y(jié)果集OntoSet。

4.2 實(shí)現(xiàn)效果與分析

已構(gòu)建的民航突發(fā)事件領(lǐng)域本體主要包含了與民航突發(fā)事件相關(guān)的應(yīng)急預(yù)案、應(yīng)急案例、應(yīng)急救援處置方法等領(lǐng)域概念和實(shí)例,并對它們之間的各種語義關(guān)系進(jìn)行了描述。圖3是已構(gòu)建的民航突發(fā)事件領(lǐng)域本體的一部分。

圖3 領(lǐng)域本體中的數(shù)據(jù)屬性和對象屬性

圖3中,橢圓表示本體概念或?qū)嵗匦伪硎緦傩灾担瑢?shí)線空箭頭表示KindOf分類關(guān)系,實(shí)線實(shí)箭頭表示InstanceOf分類關(guān)系,虛線空箭頭表示數(shù)據(jù)屬性非分類關(guān)系,虛線實(shí)箭頭表示對象屬性非分類關(guān)系,邊上的權(quán)值是該關(guān)系邊對應(yīng)的關(guān)系權(quán)重。

對于參數(shù)α、β的取值,依據(jù)已構(gòu)建的民航突發(fā)事件領(lǐng)域本體和基于對象屬性的相關(guān)度計算方法,首先進(jìn)行了多組相關(guān)實(shí)驗(yàn)。實(shí)驗(yàn)中將α、β的初值都設(shè)為0.5,并以增值為0.5的方式對α、β的值進(jìn)行遞增,計算不同的α、β值下本體概念、實(shí)例基于對象屬性的語義相關(guān)度。通過對所有相關(guān)度計算結(jié)果的分析和對比,最終確定α值為0.5、β值為1時,結(jié)果最符合實(shí)際情況。

為了驗(yàn)證本文提出的方法的有效性,將傳統(tǒng)的基于數(shù)據(jù)屬性的相關(guān)度計算方法Tversky方法[3]和P.W方法[13]作為對比方法,展開了以下實(shí)驗(yàn)。

實(shí)驗(yàn)中,將數(shù)據(jù)屬性和對象屬性視為同等重要,因此參數(shù)?1、?2的取值分別為0.5、0.5。對于閾值λ的取值,需要考慮實(shí)際情況。如果λ值過大,會導(dǎo)致查詢結(jié)果集過小,影響語義查詢的查全率。如果λ 值過小,會將許多與查詢詞的語義相關(guān)度較小的本體概念和實(shí)例加入查詢結(jié)果集中,影響語義查詢的查準(zhǔn)率。本文結(jié)合實(shí)際情況及需求,將閾值λ的取值設(shè)為0.38。基于已構(gòu)建的民航突發(fā)事件領(lǐng)域本體,以“AF358號航班事故案例”為例,實(shí)驗(yàn)結(jié)果的部分對比情況如表4所示。

表4 AF358航班事故案例相關(guān)度計算實(shí)驗(yàn)結(jié)果對比

由于民航突發(fā)事件領(lǐng)域本體中,數(shù)據(jù)屬性是根據(jù)概念或?qū)嵗哂械奶卣鬟M(jìn)行定義的,因此同類概念、實(shí)例的數(shù)據(jù)屬性相關(guān),不同類概念、實(shí)例的數(shù)據(jù)屬性完全不相關(guān)。同時,由于領(lǐng)域本體中對象屬性主要存在于不同類的概念、實(shí)例之間,因此通過對象屬性相關(guān)聯(lián)的概念或?qū)嵗跀?shù)據(jù)屬性上的相關(guān)性非常小,所以上述實(shí)驗(yàn)結(jié)果普遍偏小。

為驗(yàn)證方法的有效性,共做了10組查詢對比實(shí)驗(yàn)。對得到的實(shí)驗(yàn)結(jié)果,使用信息檢索最常用的兩個基本評價指標(biāo)—查全率Recall和查準(zhǔn)率Precision進(jìn)行評測。用N表示領(lǐng)域本體中所有相關(guān)概念和實(shí)例總數(shù),A表示檢索出的概念和實(shí)例總數(shù),NC表示檢索出的所有相關(guān)概念和實(shí)例總數(shù),相關(guān)計算公式如下:

(15)

(16)

將本文提出的語義相關(guān)度計算方法與對比方法的查全率Recall和查準(zhǔn)率Precision進(jìn)行了對比,對比結(jié)果如表5所示。

表5 平均查全率和查準(zhǔn)率對比

實(shí)驗(yàn)結(jié)果表明,Tversky方法通過將查詢詞與本體概念、實(shí)例的數(shù)據(jù)屬性值進(jìn)行字符匹配來計算它們間的語義相關(guān)度。該方法不僅忽略了屬性值間的語義關(guān)系,同時也忽略了查詢詞與本體概念、實(shí)例間的對象屬性,因此查全率和查準(zhǔn)率都較低。P.W方法基于多路徑長度計算查詢詞與本體概念、實(shí)例間的語義相關(guān)度,該方法忽略了它們在數(shù)據(jù)屬性上的語義相關(guān)問題,因此查全率和查準(zhǔn)率也較低。本文提出的方法在數(shù)據(jù)屬性方面,既考慮了查詢詞與本體概念、實(shí)例在屬性類型上的語義相關(guān)性,又考慮了它們在屬性值上的語義相關(guān)性;在對象屬性方面,其解決了查詢詞與本體概念或?qū)嵗嬖诙喾N對象屬性非分類關(guān)系時的語義相關(guān)度問題,在一定程度上提高了語義查詢的查全率和查準(zhǔn)率。

5 結(jié) 語

本文面向已構(gòu)建的民航突發(fā)事件領(lǐng)域本體,提出了一種基于非分類關(guān)系的語義相關(guān)度計算方法。該方法在數(shù)據(jù)屬性方面,提出了一種將數(shù)據(jù)屬性類型與屬性值相結(jié)合的語義相關(guān)度計算;該方法在對象屬性方面,解決了查詢詞與本體概念或?qū)嵗嬖诙喾N對象屬性非分類關(guān)系時的語義相關(guān)度計算問題。實(shí)驗(yàn)結(jié)果表明,該方法不僅有效提高了語義查詢的查全率和查準(zhǔn)率,同時也為民航突發(fā)事件的應(yīng)急決策與救援提供了輔助作用。但該方法仍存在不足,下一步的研究工作將針對查詢關(guān)鍵詞集與本體概念不匹配問題,進(jìn)行相關(guān)概念推薦,進(jìn)一步提高查詢效率。

[1] Studer R, Benjamins V R, Fensel D.Knowledge Engineering Principles and Methods[J].Data and Knowledge Engineering,1998,25(1-2):161-197.

[2] 王紅,肖志偉,李剪,等.基于民航機(jī)場應(yīng)急資源語義檢索方法的研究[J].計算機(jī)應(yīng)用與軟件,2014,31(1):73-76,153.

[3] Tversky A. Features of Similarity[J]. Psychological Review,1977,84(4):327-352.

[4] David Sánchez, Montserrat Batet, David Isern,et al. Ontology-based Semantic Similarity:A New Feature-based Approach[J].Expert Systems with Applications, 2012, 39(9):7718-7728.

[5] Amel Yessad, Catherine Faron-Zucker, Rose Dieng-Kuntz,et al. Ontology- based Semantic Relatedness for Detecting the Relevance of Learning Resources[J].Interactive Learning Environments, 2011,19(1):63-80.

[6] Cai Yingfang, Qiu Wanghua.Research on Retrieval of Multi-Attribute Instance Knowledge Based on Ontology[C]//Proceedings of International Conference on Uncertainty Reasoning and Knowledge Engineering, 2012:13-17.

[7] Huacheng Chen, Xuehui Du, Xingyuan Chen,et al.Query Expansion Model Based on Interest Ontology[C]//Proceedings of International Conference on Information Management, Innovation Management and Industrial Engineering, 2012:474-478.

[8] Neda Alipanah, Pallabi Parveen, Sheetal Menezes,et al.Ontology-driven Query Expansion Methods to Facilitate Federated Queries[C]//Proceedings of IEEE International Conference on Service-Oriented Computing and Applications, 2010:1-8.

[9] 王紅,高斯婷,潘振杰,等.基于NNV關(guān)聯(lián)規(guī)則的非分類關(guān)系提取方法及其應(yīng)用研究[J].計算機(jī)應(yīng)用研究, 2012,29(10):3665-3668.

[10] 王紅,楊璇,王靜,等.基于本體的民航應(yīng)急決策知識表達(dá)與推理方法研究[J].計算機(jī)工程與科學(xué), 2011, 33(4):129-133.

[11] 王旭陽,蕭波.基于概念關(guān)聯(lián)度的智能檢索研究[J].計算機(jī)工程與設(shè)計, 2013,34(4):1415-1419.

[12] 劉宏哲,須德.基于本體的語義相似度和相關(guān)度計算研究綜述[J].計算機(jī)科學(xué), 2012,39(2):8-13.

[13] Paul Witherell, Sundar Krishnamurty, Ian Grosse,et al.A Meronomic Relatedness Measure for Domain Ontologies Using Concept Probability and Multiset Theory[C]//Proceedings of the 28th North American Fuzzy Information Processing Society Annual Conference, 2009:1-6.

SEMANTIC RELEVANCY CALCULATION METHOD FOR NON-CLASSIFICATION RELATIONSHIP OF DOMAIN ONTOLOGY

Wang Hong Fan Hongjie Sun Kang

(School of Computer Science and Technology, Civil Aviation University of China, Tianjin 300300, China)

Aiming at the problem of semantic query expansion in regard to non-classification relationships of civil aviation emergency domain ontology (CAEDO), we proposed a semantic relevancy calculation method for the non-classification relationships of domain ontology. In this method, on the aspect of data properties, we proposed a semantic relevancy calculation method which is based on the property type and property value; on the aspect of object properties, aiming at the problem that there are multiple object properties in query words and ontology concept or example, we proposed the object property-based semantic relevancy calculation method. Furthermore, in combination with the semantic query process of domain ontology in civil aviation emergency cases, we gave the analysis of the implementation effect of the method. The method not only effectively improves the precision and the recall of semantic query, it also provides better methods support for emergency decision-making in regard to civil aviation emergencies as well.

Civil aviation emergency Domain ontology Non-classification relationship Semantic relevancy

2015-05-31。國家自然科學(xué)基金委員會與中國民用航空總局聯(lián)合基金項(xiàng)目(61079007);國家自然科學(xué)青年基金項(xiàng)目(61201414)。王紅,教授,主研領(lǐng)域:本體技術(shù),數(shù)據(jù)挖掘與智能信息處理。樊紅杰,碩士生。孫康,碩士生。

TP391

A

10.3969/j.issn.1000-386x.2016.11.004

主站蜘蛛池模板: 国产av剧情无码精品色午夜| 99re精彩视频| 色视频国产| 国产一区二区三区夜色| 国产欧美日韩综合在线第一| 国内精品久久久久久久久久影视| 亚洲伊人天堂| 国产高清毛片| 五月丁香在线视频| 亚洲水蜜桃久久综合网站| 久久综合五月| 亚洲一区二区三区在线视频| 中国黄色一级视频| 这里只有精品在线播放| 日韩免费无码人妻系列| 国产一区二区三区精品欧美日韩| 在线视频亚洲色图| 亚洲精品无码AV电影在线播放| 青青青视频91在线 | 免费 国产 无码久久久| 免费人成视网站在线不卡| 四虎影视国产精品| 欧美日韩免费在线视频| 永久在线播放| 中文字幕第4页| 日韩色图区| 久久综合丝袜长腿丝袜| 青青草国产在线视频| 视频在线观看一区二区| 亚洲天堂视频在线观看| 欧美中出一区二区| 亚洲欧美在线精品一区二区| 18禁影院亚洲专区| 国产激情在线视频| 全免费a级毛片免费看不卡| 色综合久久无码网| 亚洲毛片一级带毛片基地| 亚洲欧美另类中文字幕| 国产69囗曝护士吞精在线视频| 欧美专区在线观看| 99这里只有精品免费视频| 中文字幕第4页| 亚洲第一视频区| 国产精品视频系列专区| 色有码无码视频| 免费三A级毛片视频| 国产精品美女自慰喷水| 四虎精品免费久久| 欧美国产综合色视频| AV熟女乱| 国产精品网址你懂的| 国产精品亚洲一区二区三区在线观看| 福利一区在线| 国产白浆在线观看| 国产小视频a在线观看| 国产精品微拍| 无码福利视频| 国产乱人乱偷精品视频a人人澡 | 在线观看亚洲人成网站| 四虎精品国产AV二区| 国产成人精品一区二区不卡| 91久久偷偷做嫩草影院电| 日韩精品无码免费专网站| 国产精品嫩草影院av| 国产一国产一有一级毛片视频| 国产va在线观看| 免费播放毛片| 国产精品美女自慰喷水| 精品伊人久久大香线蕉网站| 久久黄色视频影| 亚洲激情99| 日韩精品无码免费一区二区三区| 国产精品v欧美| 久久这里只有精品23| 国产精品无码久久久久久| 欧美一级高清片久久99| 素人激情视频福利| 国产精品亚洲精品爽爽| 日韩av在线直播| 久久婷婷五月综合色一区二区| 强奷白丝美女在线观看| 无码专区国产精品一区|