999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于本體的農業數據語義關聯發現技術*

2012-08-08 00:51:34徐曉文陳維斌李海波
網絡安全與數據管理 2012年19期
關鍵詞:關聯語義定義

徐曉文,陳維斌,李海波

(華僑大學 計算機科學與技術學院,福建 廈門 361000)

傳統的檢索大都是基于關鍵字的檢索,這種檢索只是在字面匹配上處理,不能充分表達語義信息,用戶的滿意度不高。針對這些問題,國內外一些學者提出采用語義檢索的方法來解決。劉群等人提出對董振東先生創建的《知網》的研究,將每個詞的語義用多維義原表示,從義原相似度的角度出發解決詞語間相似性和相關性[1];翟裕忠等人在語義網檢索方面開展了研究工作,開發了一個面向領域的語義搜索系統,該系統采用基于圖的查詢機制檢索出與被檢概念相關聯的語義對象列表[2];田萱等人設計了一種計算語義相關度的模型,采用權重的思想描述概念間的聯系程度,通過在不同領域本體中的實驗證明,語義相關度計算在查詢擴展方面有顯著優點[3]。國內外對語義檢索及語義關聯發現技術的研究已逐步預熱。本文主要研究基于農業本體的語義關聯發現技術,從領域本體的角度出發,融入關聯關系發現算法,實現較普通檢索更合理的語義關聯檢索。

1 語義關聯發現技術相關理論

1.1 本體

本體(ontology)源自哲學上的一個概念,關注的是存在的本質。斯坦福大學的 Gruber最早給出本體的定義:“本體是大多數人認同、對概念體系的明確的、形式化的規范說明”[4]。W3C推薦的 OWL語言 (Web Ontology Language,Web本體語言)是用戶可清晰編寫、機器可理解的、用于描述本體的形式化語言。

本文結合斯坦福大學提出的七步法[5]和農業情報部編制的《農業科學敘詞表》,對農業領域本體的構建過程描述如下:

(1)確定研究領域為農業,根據《農表》中的敘詞及關系描述,抽取類及子類;

(2)定義類間的等同、等級和相關關系;

(3)定義類的屬性和屬性類型等;

(4)采用 OWL 語言描述本體。

1.2 語義相關

基于本體的概念間的語義關系主要分為3種:父子關系、相等關系和相關關系。對于前2種關系,在構建本體的時候就可以定義;對于第3種關系,根據關聯的緊密程度,又分為直接相關和間接相關。直接相關指本體中直接定義了概念間的關系,沒有經過任何其他的概念;間接相關指某兩概念在本體中雖然沒有直接定義關系,卻通過其他概念產生了關聯。如在農業本體中,“茶”和“肥料”是其中定義的相關的兩概念,“茶”和“產量”也是其中定義的相關的兩概念,依據間接相關,“肥料”和“產量”也是相互關聯的。

本文引用語義相關度來衡量概念之間的關聯度。定義若兩個概念沒有任何關聯,則其語義相關度為0;反之若兩個概念是完全相關的,則其語義相關度為1;若兩個概念存在一定的聯系,但聯系程度是未知的,定義其相關度的取值范圍為(0,1)。

2 基于本體的語義關聯發現技術

語義檢索的目標在于關聯發現,即從語義的角度發現與檢索概念相關的概念。本文在傳統檢索模型的基礎上,以語義相關度作為概念間相互關系的度量,提出了基于本體的語義關聯發現模型。該模型依據語義關聯發現算法發現相關概念,返回一系列滿足條件的結果。

2.1 基于本體的語義關聯發現模型

本文用一個四元組<Q、O、F、S(q,o)>表示語義關聯發現模型,該模型結構如圖1所示。

圖1 基于本體的語義關聯發現模型

模型中各元素表示含義如下:

(1)Q是查詢入口,即用戶輸入的查詢請求;

(2)O是領域本體庫,包含領域專家定義的本體中的任何信息;

(3)F是構建O與Q關系的機制,即用于發現與檢索概念相關概念的語義關聯算法;

(4)S(q,o)是模型出口,是經由模型發現按相關度排序輸出的相關概念。

2.2 基于本體的語義關聯發現算法

2.2.1 傳統的概念相關度計算方法

傳統的基于本體的概念相關度計算方法是以本體的結構信息為依據進行計算。

中國科學院軟件研究所的朱禮軍[6]提出,兩個概念i與j之間的路徑距離越大,則其相關度就越低,由式(1)可知:

其中,dij指概念 i與 j的相關度,|Dij|表示概念 i與 j的路徑距離,α是當i與j相關度為0.5時的路徑距離。

Rocha[7]等借鑒信息檢索中常用的IDF方法,采用式(2)計算概念間的相關度:

其中,dij是概念 i與 j的語義相關度,Dij是概念 i與 j在本體層次樹中的路徑長度。

2.2.2 本文提出的概念相關度計算方法

本文借鑒Rocha等人提出的概念間的長度越長,其關聯程度則越弱,以及共有屬性越多,相關度就越大的思想,改進了計算概念A、B的相關度的方法,如式(3):

其中,Rel(A,B)是檢索概念 A與目標概念 B的語義相關度;WAtB代表概念 A、B共有的相關概念數 (若相關,則增1),WtA是所有與概念A相關的概念數,DAB是檢索概念A和B在本體定義中的路徑長度(從0開始,若經過概念數增 1,則長度增1)。

2.2.3 語義關聯發現算法

本文定義概念A、C在以概念B為條件下的相關度Rel(A,C)計算如式(4):

為了比較實驗結果和清晰顯示便于用戶選擇,需要對數據進行歸一處理,方法如式(5):

其中,Rel(M,i)代表歸一化后與概念 M相關的概念 i的語義相關度,Rel′(M,i)代表由式(3)或式(4)計算出的檢索概念M與概念i的相關度。

語義關聯發現算法處理步驟如下:

步驟(1):輸入檢索概念 A;

步驟(2):根據領域專家定義的領域知識庫,得出與概念A直接相關的概念BList,及相關度BValueList;

步驟(3):以檢索到的概念 BList為檢索條件,繼續查詢知識庫,得到與BList有關的概念CList,及相關度CValueList;

步驟(4):根據間接語義相關度計算方法,得出與檢索概念A有關的間接相關概念CList并計算修正相關度CValueList;

步驟(5):查看是否有已知概念或參照概念,若有則輸入已知概念D,若無則跳入步驟(8);

步驟(6):由專家知識庫,計算概念 A、D的相關度大小 DValue;

步驟(7):采用間接相關度計算方法得出在概念 D為參照的前提下,與檢索概念A相關的概念DList,并將DList加入CList中,修正其參照后的相關度CValueList;

步驟(8):歸一處理 BValueList、CValueList與檢索概念A的相關度;

步驟(9):由排序函數將相關概念按照相關度從大到小的順序輸出。

2.3 算法性能與實驗結果比較

本文根據1.1節的方法構建了茶葉領域本體。選取朱禮軍提出的路徑距離計算方法(見式(1),簡稱朱禮軍法)、Rocha提出的方法(見式(2),簡稱 Rocha法)進行實驗參照對比。挑選10對概念,分別計算這10對概念的相關度,并將計算結果與傳統的語義相關度計算方法比較,結果如圖 2所示。

通過圖2在茶葉知識庫中三種方法對以“產量”為檢索目標的與其相關的一系列相關概念的對比發現,朱禮軍法和Rocha法除了圖表中列出的相關概念外,不能檢索出其他的相關概念,而本文方法還能檢索出1.65%的其他概念,因此,本文方法在發現隱含資源方面,比傳統方法有很大改進。

觀察圖2數據,本文方法與朱禮軍法和Rocha法計算出的茶葉“產量”與“色澤”的相關度存在明顯差異,它們計算出來的這個值均是與“產量”相關的最大值,這是有悖于專家經驗的,且它們在綜合計算與“產量”相關的概念時,除了“色澤”(與常理相悖的誤差結果),其他結果均無明顯的差異,沒有關系的權重的分配。在經驗知識中,茶葉的“產量”與“水”存在很大關聯,從數據對比顯示說明本文方法計算出的結果不僅符合專家經驗,而且各個相關值權重分配清晰明顯。由結果可知,該方法符合領域相關性,計算得出的結果可用于完善領域知識庫。

3 茶葉語義檢索原型系統的實現

3.1 系統結構模型設計

采用 MVC(Model View Controller)設計模型的思想,將系統分為三層,分別為模型層、表現層和邏輯層。模型層是數據模型,包含本體知識庫和用戶信息庫;表現層包含用戶注冊登錄模塊和檢索結果的展示模塊;運行層包含本體解析模塊、關鍵詞匹配模塊以及語義關聯發現模塊。

3.2 系統運行結果

采用Java語言實現,調用開源工具包jena,對owl語言描述的本體進行語義計算,檢索系統如下。輸入查詢請求 Q:產量,如圖 3所示。

采用排序函數 S(q,o)輸出與檢索概念“產量”相關的概念,如圖4所示。得出的結果是在茶葉領域,與“產量”相關的按照從大到小的順序排列的一些概念及對應的相關度大小。結果表明,該語義檢索系統能夠將語義檢索融入到語義Web的實際應用系統中,為各自的領域活動進行指導作用。

本文從本體語義深度及廣度方面,提出了基于本體的語義關聯發現模型,并將此模型應用于農業領域檢索,改進了語義相關度計算方法。實驗數據表明,新模型得到的結果與傳統的計算相關度的方法得到的結果相比,更符合人們對領域的認識,結果更合理。但是還存在一些不足,如檢索效率的提高和智能問答如何實現等,這些不足有待在后續工作中得到改進。

[1]劉群,李素建.基于《知網》的詞匯語義相似度計算[J].中文計算語言學,2002,7(2):59-76.

[2]李景,孟憲學,蘇曉路.領域本體的構建方法與應用研究[M].北京:中國農業科學技術出版社,2009.

[3]TIAN X, DU X, LI H.Computing degree of association based on different semantic relationships[C].Database and Expert Systems Applications of 2007.DEXA 07.18th International Workshop.IEEE Press,2007.

[4]GRUBER T R.Toward principles forthe design of ontologiesused forknowledge sharing [J].International Journal of Human Computer Studies,1995,43(5):907-928.

[5]NOY N F,MCGUINNESSD L.Ontologydevelopment 101:A guide to creating your first ontology[C].Standford Knowledge Systems Laboratory Technical report KSL-01-05 and Standford Medical Informatics Technical Seport SMI-2001-0880,March 2001.

[6]朱禮軍,陶蘭,劉慧.領域本體中的概念相似度計算[J].華南理工大學學報(自然科學版).2004,32(11):148-149.

[7]ROCHA C, SCHWABE D, ARAGAO M P.Ahybrid approach for searching in the semantic web[C].Proceedings of the 13th International Conference on World Wide Web.ACM,2004.

猜你喜歡
關聯語義定義
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
語言與語義
奇趣搭配
智趣
讀者(2017年5期)2017-02-15 18:04:18
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
成功的定義
山東青年(2016年1期)2016-02-28 14:25:25
認知范疇模糊與語義模糊
修辭學的重大定義
當代修辭學(2014年3期)2014-01-21 02:30:44
山的定義
公務員文萃(2013年5期)2013-03-11 16:08:37
語言學與修辭學:關聯與互動
當代修辭學(2011年2期)2011-01-23 06:39:12
主站蜘蛛池模板: 国产精品手机在线观看你懂的| 操国产美女| 欧美日韩国产高清一区二区三区| www亚洲天堂| 中国一级毛片免费观看| 亚洲精品视频网| 蜜桃视频一区二区三区| 国产情精品嫩草影院88av| 67194在线午夜亚洲| 香蕉eeww99国产在线观看| 亚洲精品视频网| 日韩午夜片| 制服丝袜在线视频香蕉| 成人亚洲天堂| 国内嫩模私拍精品视频| 国产精品无码制服丝袜| 99久久免费精品特色大片| 久久国产精品嫖妓| 在线观看精品国产入口| 国产免费观看av大片的网站| 亚洲国产在一区二区三区| 不卡网亚洲无码| 亚洲—日韩aV在线| 国产国语一级毛片在线视频| 成人在线观看不卡| 久久人搡人人玩人妻精品| 欧美人在线一区二区三区| 高清不卡毛片| 无码AV高清毛片中国一级毛片| 日韩成人高清无码| 少妇精品网站| 亚洲免费三区| 欧美成a人片在线观看| 国产三级毛片| 久久夜色精品国产嚕嚕亚洲av| 日本日韩欧美| 亚洲综合久久成人AV| 日本一区二区三区精品AⅤ| 91日本在线观看亚洲精品| 污视频日本| 亚洲视频黄| 91精品最新国内在线播放| 怡春院欧美一区二区三区免费| 日韩精品无码免费一区二区三区| 亚洲色无码专线精品观看| 日韩欧美亚洲国产成人综合| 久久久久国产精品熟女影院| 天堂亚洲网| 免费久久一级欧美特大黄| 试看120秒男女啪啪免费| 欧美成人精品欧美一级乱黄| 久久亚洲日本不卡一区二区| 亚洲第一中文字幕| 国产欧美高清| 久久国产精品无码hdav| 毛片网站在线看| 91色综合综合热五月激情| 日本国产精品| 国产精品亚洲专区一区| 国产真实自在自线免费精品| 美女国内精品自产拍在线播放| 国产精品免费入口视频| 亚洲黄网在线| 国产美女久久久久不卡| 91亚洲视频下载| 亚洲伦理一区二区| 在线观看国产黄色| 99这里只有精品在线| 国产激爽爽爽大片在线观看| 欧美精品在线观看视频| 日韩在线网址| 国产成人精品日本亚洲77美色| 国产成人你懂的在线观看| 亚洲色中色| 蝴蝶伊人久久中文娱乐网| av色爱 天堂网| 狠狠做深爱婷婷综合一区| 亚洲性影院| 四虎国产在线观看| 国产国语一级毛片| 国产在线视频自拍| 亚洲最大情网站在线观看 |