999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

語義知識(shí)庫存儲(chǔ)方案研究

2012-02-28 05:10:38殷浪
關(guān)鍵詞:語義模型

殷浪

(武漢理工大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,湖北 武漢 430063)

隨著網(wǎng)絡(luò)的發(fā)展,當(dāng)今社會(huì)已經(jīng)步入了信息時(shí)代。網(wǎng)絡(luò)資源呈指數(shù)增長(zhǎng),互聯(lián)網(wǎng)己成為一個(gè)巨大的信息源,如何提高檢索質(zhì)量,尋求令人滿意的檢索模式和技術(shù)已經(jīng)是全球的研究重點(diǎn)。當(dāng)前基于關(guān)鍵詞的信息檢索由于數(shù)據(jù)缺乏語義信息及其查詢處理缺乏語義支持,只能查找出與用戶在語法層上匹配的信息,而無法給出與其在語義層上具有相關(guān)性的其他信息,從而導(dǎo)致信息查詢結(jié)果質(zhì)量低下。Tim Berners-Lee提出了語義網(wǎng),使網(wǎng)上信息提供具有計(jì)算機(jī)可以理解的語義,它的發(fā)展和成熟使得高效、高質(zhì)的語義檢索成為可能,以克服基于關(guān)鍵詞的信息檢索技術(shù)的缺陷。但是基于知識(shí)庫的語義查詢通常比較緩慢。本文研究了語義知識(shí)庫的相關(guān)存儲(chǔ)方案,并采用LUBM測(cè)試集從查詢時(shí)間和存儲(chǔ)空間這兩個(gè)方面比較幾種不同的存儲(chǔ)方案[1-3]。

1 語義檢索技術(shù)

1.1 Protégé

Protégé是一款基于Java的圖形界面本體工具,是由美國(guó)斯坦福大學(xué)開發(fā)的免費(fèi)開源平臺(tái)。它為用戶提供了一系列的工具支持構(gòu)建領(lǐng)域本體模型和基于本體的知識(shí)庫應(yīng)用,常用于定義本體模式。

1.2 Jena

Jena是惠普實(shí)驗(yàn)室提供的針對(duì)語義Web應(yīng)用的開源Java開發(fā)包[4]。它支持應(yīng)用程序調(diào)用Jena提供的接口操作本體數(shù)據(jù);支持主流的本體描述語言,如RDF、RDFS和OWL;支持多種本體的存儲(chǔ)模型,如內(nèi)存模型和數(shù)據(jù)庫模型等。Jena常用于定義實(shí)例并對(duì)本體數(shù)據(jù)進(jìn)行查詢維護(hù)等。本文將使用Jena API進(jìn)行相關(guān)查詢分析。

1.3 Sparql

Sparql(Simple Protocol and RDF Query Language)是為RDF開發(fā)的一種查詢語言和數(shù)據(jù)獲取協(xié)議,它為W3C所開發(fā)的RDF數(shù)據(jù)模型所定義,但是能用于任何可以用RDF來表示的信息資源[5]。RDF的三元模式構(gòu)成了圖形模式,而Sparql的查詢解決方案試圖將每個(gè)圖形模式變量的綁定與查詢模型節(jié)點(diǎn)進(jìn)行匹配。

Sparql協(xié)議和 RDF查詢語言(Sparql)目前是 W3C的工作草案或推薦標(biāo)準(zhǔn),還在討論中。Sparql構(gòu)建在以前的 RDF查詢語言(例如 rdfDB、RDQL和 SeRQL)之上,擁有一些有價(jià)值的新特性。

2 本體知識(shí)庫存儲(chǔ)方案

2.1 文件系統(tǒng)

Jena可以在文件系統(tǒng)中持久化本體知識(shí)庫,即基于文件系統(tǒng)的存儲(chǔ)。該方式實(shí)現(xiàn)起來比較簡(jiǎn)單,很多本體相關(guān)工具都支持對(duì)文件格式的本體進(jìn)行存取。但是,這種方法不僅效率低,而且很難適應(yīng)數(shù)據(jù)量較大的情況。基于文件系統(tǒng)的存儲(chǔ)方式一般只適用于規(guī)模較小的本體。

早期的本體數(shù)據(jù)管理工作是基于文件系統(tǒng)實(shí)現(xiàn)的,它們用簡(jiǎn)單的文件格式存儲(chǔ)本體數(shù)據(jù)并支持一些基本的操作。這類工作主要用來編輯和建立本體,并不是為大規(guī)模本體數(shù)據(jù)的存儲(chǔ)和查詢管理服務(wù)的,如Protégé。

2.2 關(guān)系數(shù)據(jù)庫

由于關(guān)系數(shù)據(jù)庫技術(shù)發(fā)展成熟,大多數(shù)現(xiàn)有的本體數(shù)據(jù)管理工作使用關(guān)系或?qū)ο?關(guān)系數(shù)據(jù)庫管理系統(tǒng)作為后臺(tái)存儲(chǔ)。Jena就可以在關(guān)系數(shù)據(jù)庫(Relational Database)中持久化本體知識(shí)庫。當(dāng)前支持的數(shù)據(jù)庫引擎有 Oracle、PostgreSQL和 MySQL。 以 MySQL為例,下面的代碼說明了如何將OWL文件導(dǎo)入到MySQL持久化模型。

在持久化到數(shù)據(jù)庫后,可以通過ModelMaker.openModel(modelName)來訪問該模型。

2.3 TDB

TDB是Jena的一個(gè)組件,可大規(guī)模地存儲(chǔ)和查詢RDF數(shù)據(jù)集,且支持Sparql查詢[6]。TDB是一個(gè)具有高性能、非事務(wù)性的RDF數(shù)據(jù)存儲(chǔ)器,可以通過命令腳本和Jena API來訪問和管理TDB存儲(chǔ)。以下代碼是說明如何將OWL文件存儲(chǔ)為TDB的。

DatasetGraphTDB graph =TDBFactory.createDatasetGraph(TDBlocation);

TDBLoader.load(graph, "file:///"+owlfile);

3 實(shí)驗(yàn)設(shè)計(jì)和性能評(píng)估

3.1 實(shí)驗(yàn)設(shè)計(jì)

3.1.1 硬件環(huán)境

本實(shí)驗(yàn)測(cè)試是在個(gè)人電腦上進(jìn)行的。具體環(huán)境是:2.20 GHz Intel(R)Core(TM)2 Duo CPU T6600,2 GB 內(nèi)存,250 GB的硬盤,WindowsXP操作系統(tǒng),JavaSDK 1.6.1。

3.1.2 測(cè)試數(shù)據(jù)集

LUBM是Lehigh大學(xué)提出的語義Web數(shù)據(jù)測(cè)試集。它基于大學(xué)這個(gè)領(lǐng)域,采用機(jī)器自動(dòng)生成的數(shù)據(jù)作為測(cè)試數(shù)據(jù),提供14個(gè)測(cè)試查詢和一套性能指標(biāo)[7]。它可以根據(jù)用戶指定的參數(shù)產(chǎn)生不同規(guī)模的數(shù)據(jù),由此測(cè)試在不同規(guī)模的環(huán)境下,系統(tǒng)的實(shí)例查詢性能。LUBM測(cè)試集是目前最流行的語義Web測(cè)試集。它生成的數(shù)據(jù)滿足本體層的規(guī)范,因此,也可以作為推理系統(tǒng)的測(cè)試數(shù)據(jù)集。但是LUBM測(cè)試結(jié)果也存在一個(gè)問題,即生成的數(shù)據(jù)中屬性的個(gè)數(shù)是固定的,僅有64個(gè)。隨著數(shù)據(jù)量的增加,數(shù)據(jù)會(huì)失去語義Web的一大特點(diǎn)——稀疏性,導(dǎo)致測(cè)試的結(jié)果不能反映實(shí)際應(yīng)用的效果。

這14個(gè)測(cè)試查詢,有的涉及推理機(jī),由于篇幅有限,只做了部分測(cè)試。以下是3個(gè)測(cè)試查詢語句。

3.2 實(shí)驗(yàn)結(jié)果對(duì)比

庫容量和轉(zhuǎn)載時(shí)間的比較如表1所示。其中,庫容量是指各種不同的存儲(chǔ)方式所占用的磁盤空間的大小;轉(zhuǎn)載時(shí)間是指從文件形式的知識(shí)庫轉(zhuǎn)換到其他存儲(chǔ)方式所需要的時(shí)間。

由于關(guān)系型數(shù)據(jù)庫會(huì)保存知識(shí)庫中所有的三元關(guān)系,因此耗時(shí)會(huì)比較多。對(duì)于1個(gè)50 MB左右的OWL文件,就已經(jīng)耗時(shí)4個(gè)多小時(shí)。因此,如果是較大的本體知識(shí)庫,想借關(guān)系數(shù)據(jù)庫來改善檢索效率的話,其可行性需要斟酌。相對(duì)于關(guān)系數(shù)據(jù)庫,TDB所用時(shí)間要少很多,值得借鑒。

表1 庫容量和轉(zhuǎn)載時(shí)間比較

對(duì)于上面提到的3個(gè)Sparql查詢語句,在用文件系統(tǒng)、關(guān)系數(shù)據(jù)庫和TDB這3種不同的存儲(chǔ)方式存儲(chǔ)時(shí),查詢所消耗的時(shí)間和查詢結(jié)果如表2所示。

表2 查詢測(cè)試結(jié)果

由表2可知,TDB在查詢方面要比文件系統(tǒng)和關(guān)系數(shù)據(jù)庫的效率高。

針對(duì)目前語義檢索領(lǐng)域中基于文件或者關(guān)系數(shù)據(jù)庫存儲(chǔ)方案下檢索效率慢的問題,本文分析了這幾種存儲(chǔ)方案在查詢響應(yīng)時(shí)間和存儲(chǔ)空間上的區(qū)別,并提出了基于TDB的知識(shí)庫存儲(chǔ)方案。實(shí)驗(yàn)證明,該方法能較大程度上提高用戶檢索效率,并且能降低存儲(chǔ)所需空間。基于本體的語義檢索的知識(shí)中,推理機(jī)還沒有涉及。如果添加了推理機(jī),語義檢索的速度將會(huì)更慢,因不屬于本文研究?jī)?nèi)容,故沒有作比較。

本體知識(shí)庫的存儲(chǔ)方案其實(shí)還有很多方式,如4store、BigData和BigOwlim等。由于能力有限,無法對(duì)每種方式進(jìn)行比較,只對(duì)研究項(xiàng)目所用到的存儲(chǔ)方式比較。這些將是以后研究工作中的重點(diǎn)。

[1]JARRAR M,MEERSMAN R.Ontologyengineering-the DOGMA approach[C].AdvancesinWebSemanticsI.Lecture Notes in Computer Science, 2009,4891:7-34.

[2] MILLER E. Semantic web applications[J]. INTAP Interoperability Technology Association for Information Processing, 2003(34):210-212.

[3] GRUBER T R. A translation approach to portable ontologies[J].Knowledge Acquisition, 1993,5(2):199-220.

[4]欒艷,丁二玉,駱斌.基于Ontology的語義檢索技術(shù)[J].計(jì)算機(jī)工程與應(yīng)用,2005,28(41):156-159.

[5]于水明.基于本體的語義檢索的應(yīng)用研究[D].大連:大連海事大學(xué),2007.

[6]謝圣獻(xiàn),謝光.語義檢索在電子商務(wù)中的應(yīng)用研究 [J].微計(jì)算機(jī)信息,2008,24(12):50-56.

[7]Gao Yuanbo, Pan Zhengxiang, HEFLN J.An evaluation ofknowledge base systems for large owl datasets[C].Third International Semantic Web Conference,2004:6-7.

猜你喜歡
語義模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
語言與語義
3D打印中的模型分割與打包
“上”與“下”語義的不對(duì)稱性及其認(rèn)知闡釋
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
認(rèn)知范疇模糊與語義模糊
“深+N季”組配的認(rèn)知語義分析
語義分析與漢俄副名組合
主站蜘蛛池模板: 婷婷成人综合| 国产女人综合久久精品视| 亚洲无码日韩一区| 国产精品无码一二三视频| a色毛片免费视频| 亚洲aaa视频| 国产粉嫩粉嫩的18在线播放91| 国产成在线观看免费视频| a免费毛片在线播放| 亚洲欧美精品一中文字幕| 国产视频一二三区| 亚洲精品第一页不卡| 国产美女在线观看| 99视频只有精品| 中文字幕亚洲综久久2021| 国产特级毛片aaaaaaa高清| 國產尤物AV尤物在線觀看| 天天色天天操综合网| 无码福利日韩神码福利片| 3D动漫精品啪啪一区二区下载| 亚洲最新地址| AV天堂资源福利在线观看| 午夜国产精品视频| 亚洲成a人片| 国产精品免费入口视频| 丁香婷婷在线视频| 国产成本人片免费a∨短片| 全部毛片免费看| 亚洲视频色图| 亚洲永久色| 亚洲无码视频一区二区三区| 中文一级毛片| 亚洲综合第一页| 性欧美久久| 国产又大又粗又猛又爽的视频| 午夜成人在线视频| 久久福利片| 国产一级特黄aa级特黄裸毛片| 亚洲综合色婷婷| 亚洲乱码视频| 亚洲精品色AV无码看| 國產尤物AV尤物在線觀看| 国内99精品激情视频精品| 亚洲日本www| 国产精品爽爽va在线无码观看| 国产真实乱人视频| 日韩欧美国产精品| 国产特级毛片| 中文字幕资源站| 欧美另类图片视频无弹跳第一页| 欧美色伊人| 极品私人尤物在线精品首页| 国产乱人乱偷精品视频a人人澡| 不卡午夜视频| 99在线免费播放| 亚洲男人的天堂视频| 精品国产成人三级在线观看| 久久亚洲中文字幕精品一区| 波多野结衣视频网站| 园内精品自拍视频在线播放| 亚洲最黄视频| 精品国产免费第一区二区三区日韩| 日本一区高清| 国产精品浪潮Av| 国产中文一区a级毛片视频| 无码电影在线观看| 综合色亚洲| 国产美女一级毛片| 国产无码精品在线播放| 久久中文电影| 亚洲91在线精品| 久久久精品久久久久三级| 中文字幕日韩欧美| 国产成人一区免费观看| 精品色综合| 亚洲乱伦视频| 国产一区在线视频观看| 青青青视频蜜桃一区二区| 欧美激情二区三区| 国产精品福利导航| 免费毛片a| 欧美 亚洲 日韩 国产|