999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于本體的語義信息檢索的研究

2010-01-01 00:00:00李桂華汪學明
電腦知識與技術 2010年5期

摘要:針對傳統信息檢索在查詢準確度方面的問題,在信息檢索中引入了語義網的思想,對網絡信息的進行語義描述,從而出現了語義信息檢索。該文提出了一種語義信息檢索的框架,并針對該框架結構,給出了實現語義檢索的算法,可以實現對信息的精確檢索。

關鍵詞:語義網;信息檢索;框架;算法

中圖分類號:TP311文獻標識碼:A 文章編號:1009-3044(2010)05-1027-02

Research on Semantic Information Retrieval Based on Ontology

LI Gui-hua,WANG Xue-ming

(College of Computer Science and Information,Guizhou University,Guiyang 550025,China)

Abstract: In order to resolve the problem of the accuracy on traditional information retrieval, which bring the concept of Semantic Web into information retrieval and process the web resource in a semantic way. Therefore, semantic retrieval has emerged. This paper put forward a framework of semantic retrieval and proposes the algorithm in order to implement semantic retrieval.

Key words: Semantic Web; Information Retrieval; Framework; algorithm

萬維網改變了人們彼此的交流方式和商業運作方式,隨著社會逐漸向知識經濟和知識社會轉型,萬維網正進行一場革命。數字信息正在極速膨脹,主要是數字文檔目錄信息的組織、處理和搜索相關問題而引起的信息過剩。盡管信息檢索時有搜索引擎的輔助,用戶在網上搜索相關信息是極其復雜的,由于技術的發展速度似乎落后于網上內容量的增長速度,他們通常不完全滿意想要查詢的結果[1]。從信息檢索的觀點來說,用戶想要精確的結果,需要花費相當多的時間來完成檢索,出現這種不合理的現象是由于傳統的搜索引擎僅有那么幾種返回結果的方法。快速檢索往往返回的結果是大量的網頁,但是這些結果通常是錯誤的或不精確的,因為它們與用戶查詢的條件并不相符。例如用戶想找到“林肯”(著名的汽車商標)的信息,在搜索引擎中輸入“林肯”,則結果中有關于汽車的網頁,也有歷史和政治的網頁。

針對傳統信息檢索的不足,專家們提出了一條新的途徑來解決,即用一種更容易被機器處理的表示方法來描述網上內容。這個革命性方案也成為語義網運動,語義網并不是與現有萬維網平行的新的全球化信息高速公路,它將在現有萬維網的基礎上組建成長。語義網的目標是為因特網上的信息提供具有計算機可以理解的語義,它的發展和成熟,使得高效高質的語義信息檢索成為可能。

本文提出了一種提高信息檢索精確度的方案,該方案是基于語義信息表示的,用戶采用自然語言來描述查詢請求,通過將查詢請求轉化成與本體概念相匹配的關鍵詞,運用推理機或者SPARQL查詢語言對本體庫進行檢索,給出一個精確的查詢,以完成語義信息檢索。

1 基于語義的信息檢索

語義Web提供了一種新的信息表達方式,使信息具有了語義,也使得數據具有更加良好定義的結構。從語義Web的角度尋求搜索引擎技術的新突破,構造基于語義的信息檢索模型,使其充分利用數據的語義信息和結構化特點進行檢索,從根本上改變傳統搜索引擎檢索的準確率和查全率不高的缺點。本體是語義Web的核心概念,因此基于語義的信息檢索從根本上來說是基于本體的信息檢索。

語義信息檢索實際上就是要將Ontology所反映的語義關系應用到對信息資源的標注和檢索中,具體是要通過對相關文檔的解析和推理在語義層面實現信息檢索,并以適當的形式和友好的界面與用戶進行交流[2]。語義信息檢索包括本體文檔檢索、實例檢索和語義關系檢索。

本體文檔檢索就是找到含有特定類和屬性的本體文檔[3]。實現本體文檔檢索一種思路是對本體文檔進行適用于普通搜索引擎的改造處理,即通過對RDF文檔進行一定的處理使其可被普通搜索引擎索引和檢索,同時又能在某種意義上發揮其語義信息的作用。另一種思路是探索新的本體搜索方法和技術,如針對某個特定網站的搜索器或是基于Jena2的搜索器。系統將搜索到的語義網文檔中抽取的元數據與原結構信息一起存入數據庫,支持對含有某一特定類或屬性的本體的查詢。

實例檢索的目的是在基于本體的知識庫中發現與搜索關于某一指定類的所有實例信息,它主要是基于結構化查詢和推理的,并且基于RDF(S)、OWL等底層知識模型的圖遍歷與圖模式得到廣泛的應用。用語義網數據來補充傳統檢索結果的這一部分就屬于實例檢索,其語義網資源包括正式的語義網文檔和語義標注信息?!罢Z義網”資源包括正式的語義網文檔和語義標注信息。在執行傳統檢索的同時,系統會針對查詢概念在RDF知識庫中通過圖遍歷搜索所有相關的數據信息。

語義關系檢索關注的不僅是簡單的屬性鏈關系,更是概念間各種復雜關聯關系。目前,一些研究已開始關注針對語義關系的檢索問題,如文獻[4-5]等進行的有關語義關聯檢索(Semantic association search)的研究。它所關注的不僅是簡單的屬性鏈關系,更是概念間的各種復雜關聯關系。研究的主要貢獻是分析了語義關系檢索所面臨的三大主要挑戰(即對關系的理解不夠通用和全面、缺少以關系而非概念為對象的查詢語言和系統、檢索結果排序問題),并提出了相應的解決方法(將關系分為語義關聯和語義相似性兩類并形式化、設計了ρ-query以支持關系查詢、基于用戶指定的上下文來進行結果排序)。

2 語義信息檢索的框架設計

該文就實例查詢設計了語義檢索系統的框架,其主要包括兩個部分:本體的處理模塊與形式化查詢模塊。當創建好本體庫被看作知識庫時,本體處理模塊就會自動對信息資源進行索引,形式化查詢模塊以關鍵詞作為輸入,輸出則是一條SPARQL查詢記錄。語義檢索系統的框架結構如圖1所示。

2.1 術語匹配

術語匹配的目的就是在進行關鍵詞查詢時為每個關鍵詞的術語找到相應的本體信息(如:類,實例,屬性等)。本體信息的名稱和標記的匹配方法有兩種:1)形式匹配,就是運用字符串匹配技術在知識庫中找到形式上相似的術語;2)語義匹配,主要使用像WordNet這樣的通用本體庫來查詢語義相關的術語(比如同義詞等)。經過術語匹配處理,在知識庫K中的術語都可以通過不同的匹配方法找到與其相匹配的術語。各種匹配方法都有選定的預定義的可信值,來決定匹配的質量,通常直接匹配的可信值要比基于同義詞的匹配的可信值要高。術語匹配使得知識庫中的概念與關鍵詞查詢中的術語進行聯系,這樣,進行術語的匹配后,術語就不在是一串字符,而被解釋成用戶需要的一串信息資源。

2.2 語義檢索

語義檢索主要借助于本體和查詢條件,用Jena提供的推理機進行語義推理或是SPARQL查詢語言進行檢索,得到查詢結果,然后將結果輸出到客戶端。

由上一小節設計的語義信息檢索框架可以知道,知識庫(K.B.)就是構建好的領域本體,而且在本體中的概念以圖形結構存儲;查詢條件就是經過信息提取后得到的關鍵詞集,而這些關鍵詞可能與本體中標準的概念都不匹配,但是可能與某個概念相似,于是對這些關鍵詞進行查詢擴展,得到新的關鍵詞集;語義檢索就是針對查詢條件對構建好的領域本體圖形結構進行遍歷,查找與關鍵詞相匹配的概念或是關系,主要是對圖進行深度優先遍歷。這一過程運用Jena提供的推理機對查詢條件進行語義推理,找到與查詢條件相匹配的概念,然后針對這些概念運用Jena所提供的SPARQL查詢語言對本體的RDF實例文件進行查詢匹配,找到這些概念所對應的實例,將最終得到的實例轉化成用戶可理解的信息,按照本體的索引順序輸出在用戶界面上。

3語義信息檢索的實現

在上節中詳細介紹了語義信息檢索的框架設計,針對該框架設計語義信息檢索系統,該系統包括了檢索入口、查詢請求處理、本體庫、信息組織模塊幾個部分構成,各司其職組成一個有機整體,給用戶提供強大的信息檢索服務。

其中檢索入口模塊負責接受用戶提出的查詢請求的輸入;檢索請求處理模塊負責將輸入的查詢請求進行信息提取,看是否可與本體概念集匹配,以便進行語義檢索;本體庫模塊負責領域的知識表示以及作為領域的信息庫;語義檢索模塊負責對查詢請求進行檢索;信息組織模塊負責把信息轉化為用戶容易理解和閱讀的形式。

根據設計的語義信息檢索框架以及系統功能結構,在此提出一種基于本體的語義查詢算法。用戶采用自然語言來描述查詢請求,增加了查詢關鍵詞的數量,該算法能幫助系統更好地理解用戶的查詢需求。

基于本體的語義信息檢索的優勢主要表現在兩點:一是系統利用用戶查詢式中多個關鍵詞之間的聯系,借助領域本體論可以對存在語義概念上歧義的關鍵詞進行概念歧義的消除,保證返回文檔的正確性。另一個是系統借助領域本體可以更好地理解用戶的檢索需求,并根據用戶的檢索查詢式中關鍵詞之間存在的關系進行相應的推理,回答用戶的提問,挖掘出用戶的真正需求所在。

基于語義網的查詢算法具體過程大致如下:

1)用戶用自然語言表達查詢請求,系統通過一定的分詞算法從用戶查詢請求表達式中抽取出一組關鍵詞集(k1,k2,…,kn)。

2)對于抽取出的這組關鍵詞(k1,k2,…,kn),系統借助領域本體庫和本體解析器判斷其中的概念、屬性以及關系等。在判別的過程中,某個關鍵詞ki與領域本體的概念集(C1,C2,…,Cn)中概念都不匹配,但可能是與某個概念相似,此時對查詢條件進行擴展是非常必要的。

3)為擴展查詢條件,先找到與本體概念中與這組關鍵詞匹配的概念結點Ci,激活該結點,然后以此結點為源結點,依次激活與其相關的其他概念結點,直到沒有新的概念被激活為止。根據概念結點被激活的頻率和結點間相互關系的重要程度確定概念與用戶查詢請求的相關度,最后選取與用戶需求相關度較高的概念作為查詢關鍵詞返回關鍵詞集(k1,k2,…,kn)。

4)擴展查詢條件后,要進一步判斷關鍵詞集(k1,k2,…,kn)中是否含有關系,若某一關鍵詞Ki是一種關系,則需要利用領域本體庫在概念和屬性間進行推理,最后得到符合查詢請求的概念。

5)找到與查詢請求關鍵詞集(k1,k2,…,kn)相匹配的概念Cj后,可以用推理機得到概念Cj相關的所有實例,或者用SPARQL查詢語言來進行語義查詢,同樣可以得到Cj相關的所有實例。

6)對得到的查詢結果進行索引,將得到的三元組轉化成用戶可理解的信息,按照索引順序輸出。語義信息檢索中創建的本體是帶有向邊的結點集,檢索時以有向圖的結點集作為輸入,沿著開始結點有向邊的正向邊直接查找與關鍵字匹配的概念,然后查找該概念的子概念的所有概念及其實例,采用以“深度優先”為基礎的算法進行搜索。

為了檢索一個描述的所有實例,首先找出基本類(與K完全一樣的類),并且檢索出這些類的所有實例個體。如果這一描述是等價于一個基本概念,我們同樣需要返回這一等價概念的實例。否則,系統需要檢索這一描述直接父類的所有實例個體,并且檢測這些實例是否是給定描述的實例,如果它們是這一描述的實例,那么這些實例也應該返回。這些實例所有的記錄就是最后的查詢結果,對這些記錄進行排序輸出,就完成整個語義檢索。

4 總結

隨著自然語言處理、人工智能的發展,尤其是語義網技術的興起與發展,語義信息檢索頁得以迅速發展。盡管目前對語義檢索在概念上仍沒有統一的界定,但不同的研究卻有著共同之處,就是基于對信息資源的語義處理事項效率更高的檢索。語義信息的提取和處理可以是基于語義網方法與技術的,也可以是基于自然語言處理技術的。本文提出的語義信息檢索的框架也是基于語義網方法與技術的,利用語義網中的本體技術對網絡資源進行描述,然后將用戶端所給定的關鍵詞與本體中信息資源進行匹配,得到檢索的查詢條件,針對該查詢條件,對本體模型進行遍歷,最終找到與關鍵詞相匹配的本體的實例,這些實例就是最終所要查詢的結果。本文還提出了實現語義查詢的算法,在未來的工作中,將針對該算法設計出語義查詢系統,實現與用戶的交互。

參考文獻:

[1] 宋煒,張銘.語義網簡明教程[M].北京:機械工業出版社,2004.6.

[2] 丁晟春,顧德訪.Jena在實現基于Ontology的語義檢索中的應用研究[J].現代圖書情報技術,2005(10).

[3] 黃敏,賴茂生.語義檢索研究綜述[J].圖書情報工作,2008(6).

[4] Anyanwu K, Sheth A. ρ-Queries: Enabling querying for semantic associations on the semantic web// IW3C2, MTA SZTAKI. Proc.of the 12th int'l Conf. on WWW. New York: ACM, 2003:690-699.

[5] Aleman-Meza B, Halaschek C, Arpinar I B. Context-aware semantic association ranking// Cruz I F, Kashyap V, Decker S,et al, Eds.. Proc. of the 1th int'l Workshop on Semantic Web and Databases. Co-located with VLDB 2003. Berlin, Germany:Humboldt-University,2003: 33-50.

[6] 李學慶.本體論在網絡信息檢索中的應用研究[D].遼寧師范大學,2008(5).

主站蜘蛛池模板: 中文成人无码国产亚洲| 91香蕉视频下载网站| 婷婷99视频精品全部在线观看| 91福利免费| 亚洲第一黄片大全| 国产成人高清精品免费5388| 香蕉精品在线| 成人毛片免费观看| www精品久久| 亚洲欧美激情小说另类| 狠狠色综合网| 日本a级免费| 亚洲人成色77777在线观看| 亚洲无码视频图片| 伊人成人在线| 狠狠色狠狠综合久久| 在线a网站| 呦女亚洲一区精品| 久99久热只有精品国产15| 99中文字幕亚洲一区二区| 国产精品视频a| 波多野结衣二区| 五月天综合婷婷| 国产理论一区| 日日拍夜夜操| 天天躁夜夜躁狠狠躁躁88| 欧美激情首页| 色综合久久久久8天国| 成人蜜桃网| 久久精品国产在热久久2019| 18禁黄无遮挡网站| 国产成人免费手机在线观看视频| 青青青亚洲精品国产| 无码精油按摩潮喷在线播放 | 啪啪永久免费av| 国产国语一级毛片| 国产va在线观看| 五月婷婷激情四射| 免费aa毛片| 国产AV毛片| 国产综合精品一区二区| 亚洲男人在线天堂| 日韩色图区| 国内99精品激情视频精品| 欧美日韩国产系列在线观看| 国产福利微拍精品一区二区| 国产精品爽爽va在线无码观看| 亚洲第一福利视频导航| 久久婷婷色综合老司机| 日韩在线影院| 欧美亚洲国产精品久久蜜芽| 午夜性爽视频男人的天堂| 国产精品无码翘臀在线看纯欲| 午夜日本永久乱码免费播放片| 欧美有码在线| 99视频免费观看| 久久久久久久蜜桃| 91原创视频在线| 999国内精品视频免费| 国产综合另类小说色区色噜噜| 亚洲 欧美 中文 AⅤ在线视频| 亚洲成a人片| 亚洲美女一区| 亚洲AV无码不卡无码 | 综合亚洲网| 中文字幕无线码一区| 国产在线91在线电影| 中文字幕 91| 亚洲欧美天堂网| 国产99在线观看| 精品丝袜美腿国产一区| 欧美日韩在线第一页| a级毛片免费网站| 久996视频精品免费观看| 色首页AV在线| 香蕉在线视频网站| 国产欧美视频在线观看| 日本91在线| 国产视频只有无码精品| 亚洲成年网站在线观看| 日本人又色又爽的视频| 97成人在线观看|