999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于本體的旅游產品映射的應用研究

2015-09-26 02:02:00王衛東張琳
現代計算機 2015年17期
關鍵詞:概念旅游信息

王衛東,張琳

(上海海事大學,上海 262500)

基于本體的旅游產品映射的應用研究

王衛東,張琳

(上海海事大學,上海262500)

0 引言

近年來,線下旅游與線上旅游相互交融旅游行業信息大量分散的遍布在網絡中,使得傳統的旅游行業也得到了快速的發展。"傳統+聯網”模式的飛速發展,隨著阿里去啊、上海真旅、去哪兒、不夜城、美團及中國旅游信息網等旅游門戶網站的不斷發展,通過在各大旅游網站上進行需求搜索成為旅客獲得旅游信息的主體方式。然而大量網站在信息構建都是基于傳統的方式,已有的信息無法很好地實現共享和重用,計算機無法智能地識別網絡中的信息使得用戶在搜索旅游信息時不易及時找到自己想要的信息。由于本體論在解決信息交互和共享方面具有明顯的優勢,本體相關技術在實現旅游信息共享和重用方面也得到的大量研究者的重視。

1 本體

本體(ontology)最初是指對事物本質研究的一種存在論,在計算機中用來表示將信息形式概念化的,用來表示領域知識中對象,概念和和各個實體間的關系[1]。隨著互聯網時代的到來和不斷成長,本體己有由原來的哲學領域知識運用到計算機領域來領域如人工智能、電子工程、遠程教育、電子商務等。本體論在信息領域一直沒有一個明確的規定,比較有代表的是Borst指出的:“本體是共享概念模型的形式化規范的說明”[2]。這個定義從以下四個方面來完善了本體在計算機科學領域的定義[3]:

①概念模型(Conceptualization):通過抽象出客觀世界中事物具有的共同特征得到的一些抽象模型,概念模型表達的信息和實際的狀態信息有直接的關聯。

②明確化(Explicit):所使用的概念信息都具有明確的約束和完備性。

③形式化(Formal):本體化的信息能被計算機智能化獲取和處理。

④共享(Share):本體化得到的信息是可以被相關領域人士所認可的,可實現重用的。

(1)旅游業為游客提供旅程中的各種服務,隨著生活質量的不斷提高,人們對于旅游要求的多樣性和各大旅游網站針對個性化旅游路線的推出,這些服務涉及到不同行業。通過在網絡上搜索和“2014-2018年中國網上旅行預訂行業未來發展及投資研究報告”得到,旅游本體大概可以分為如下幾類:旅行路線、旅客概況,住宿、交通、飲食、景點、購物等,旅游本體庫如圖1:

圖1 旅游本體庫

2 本體映射

在構建本體過程中不同的時刻有著不同的需求,導致在相同領域內存在許多構建在不同技術上的本體。由此導致了在同一個領域中存在多個本體的現象,使得在實現不同本體間相互重用產生許多問題[4]:(1)用不同的名稱代表相同意義的信息,即同義異音,以及不同含義的信息用相同的名稱來表示,即同音異義;(2)在構建本體時不同的本體表達形式,造成本體數據的沖突;(3)不同的需求導致在創建本體是導致不同本體的層次沖突。

為了實現異構本體間的復用,在解決上述提到的三個導致不同本體沖突問題主要采用以下三種方法[5]:

(l)在異構本體間建立從屬關系,使得源本體包含目標本體。這種方法的缺點是在修改源本體信息后需要重新建立從屬關系。

(2)將源本體和目標本體進行合成形成一個大型的公用本體,但是由于不同本體技術構建得到的本體不一樣使得合成后的本體實用性差,而且不宜于修改和維護。

(3)在異構本體間通過相似度計算的橋梁實現異構本體的映射,實現源本體到目標本體的轉換。

本體映射是一種常用的解決本體異構的方法。在旅游本體中對于不同時間不同地點等要求本體需要對應的修改,將異構本體進行合成使得合成后的大型本體不宜于修改和維護,所以基于相似度計算實現本體間重用是一種相對較好的方式。在本體映射相似度計算過程中,不同領域的本體有著不同的一些特性,對于旅游領域的本體,對于時間、數字、地點等要求都嚴格,所以在進行相似度計算過程中不能只考慮單一的相似度計算方面,采用一種綜合的方法進一步改善計算的過程,從本體概念名稱、屬性、實例、結構等方面計算概念的相似度,尋找更加有效的概念相似度計算方法。通過將一個國內和一個國際的旅游本體進行相似度計算得到的結果和人們的主觀得到的結果相近。證明了綜合相似度計算的實際可用性。

層次聚類也稱為樹聚類,通過一定的準則將信息對象劃分到不同的組之中。同一組內的信息有著較高的相似度和相關度。不同組之間關聯性小。將數據對象進行數據結構上的分解合并形成一個樹結構,在樹結構中每個節點與其父節點、孩子節點,和兄弟節點存在一定的相似性。從而形成層次樹的結構。一般來說,有兩種類型的層次聚類算法[7]:

凝聚的層次聚類:通過自下而上將每個數據作為一個節點,然后合并節點從而形成一個節點組。

分裂的層次聚類:通過自上而下的方法,首先將所有的節點至于一個節點組中,通過閾值的選定將一個節點組分裂成為幾個內部高度相似度的小節點組。

在層次聚類中確定兩個節點組距離有以下四種方法[8~9]:

(1)最小距離:指兩個節點組中所有節點最近距離表示兩個節點組的最小距離:

(2)最大距離:指兩個節點組中所有節點最近距離表示兩個節點組的最大距離:

(3)平均值距離:指兩個節點組中所有節點中兩個中心節點表示兩個節點組的距離:

(4)平均距離:指兩個節點組中所有節點距離的平均值所表示的距離:

其中aibj分別表示a,b兩個節點組中的節點。

(1)基于聚類的的概念相似度計算方法

目前在不同本體間相似度的計算大多是通過一種綜合的相似度計算方法如通過計算概念名稱的相似度、概念屬性的相似度、概念實例的相似度等通過加權的方法得到最終的結果,在和采用單一的計算方法上有了很大的提高。但是在這其中無法避免計算量的增大,而且整個過程中聯系在一起,使得計算過程十分的復雜。

針對上述提到的問題,提出了一種基于聚類的概念相似度計算方法,在計算本體相似度時,通過聚類算法將本體O1中的數據進行劃分得到幾個數據樹,在進行與本體O2的概念B進行相似度計算映射時,如果O1中的A與其的相似度大于給定的閾值,則認為A所在的數據樹所有信息與B的相似度大,可以將A所在組的信息所為相似度計算的候選集合,如果小于給定的閾值則在計算機計算過程中忽略不考慮兩者的相似度將其過濾掉。最終可以得到一個完整的相似度計算候選集合,通過相似度計算中用候選集合來進行計算減少本體映射過程的計算量。

通過確定一個閾值,將本體O1中的概念o和O2中的得到的一組過濾后得到的概念組進行比較計算。過濾后得到的概念組通過概念名稱的相似度進行判斷。假設本體O1中的概念是X,本體O2中的概念是Y,若果得到的結果sim(Xname,Yname)大于閾值則X所在的節點組就成為相似度計算的候選集合,概念X、Y名字相似性度量公式為:

概念名稱相似度:概念的名稱相似度是最能直接反應概念結構也是最基本的方法之一,但是這種方法僅僅作用在字符串上不能很好地將概念的語義信息考慮進去,將名稱按照字符串來計算相似度。常用的方法有Edit Distance,通過計算一個字符串到另一個需要經過的插入和刪除等步驟[10]。

其中ci和cj分別表示O1和O1的概念集合,最終的名稱相似度可表示為:

概念屬性相似度:概念屬性在一定層次上決定了概念的內在結構,在進行相似度計算過程中是不能忽略的一部分。而屬性的語義貼近度反映了屬性值之間的相似程度,。屬性x,y的類型相似度記為sp(x,y),它滿足以下三個基本條件[11]:(1)sp(x,y)=1;(2)sp(x,y)=sp(y,x);(3)0≤sp(x,y)≤1。如果兩個屬性的類型相同則相似度較高,類型不同的相似度較小。不同屬性值類型的類型相似度可根據表1結果來計算。

表1

如不同本體概念A,B分別有多個屬性。要計算A,B的之間的屬性相似度,首先要通過屬性的類型進行類型匹配進行屬性的相似度計算。把可比較的屬性對匹配記為(x1,y1),(x2,y2),…,(xk,yk)(k≤(m,n))。設A有m個屬性,B有n個屬性,則A與B的屬性相似度計算公式如下[11]:

概念實例相似度:進行概念的實例相似度計算過程中有以下理論:一個孩子概念的實例也是其父概念和祖先概念的實例。如果概念所具有的實例全部都相同,那么這兩個概念可能是相同的;如果兩個概念具有相同實例的比重是相同的,那么這兩個概念可能是相似的。用具體實例來計算概念C1和C2的相似度,記為:

基于實例的相似度計算是一種建立在機器學習的基礎上實現的。本體Wi中的實例集合用Ui表示,N(Ui)表示實例集中的實例個數。用表示既屬于A又屬于B的實例個數。以P(A,B)為計算用例,有以下六個步驟[12]:

(1)用U1表示本體W1的全部實例集,分別用和表示屬于A概念的實例集和不屬于A的實例集;

(3)用U2表示本體W2的全部實例集,分別用和表示屬于B概念的實例集和不屬于B的實例集;

(5)將兩個本體W1,W2進行位置的互換,重復(1)(2)(3)(4)四個步驟,最終得到p(A,B)和

(6)求得N(U1),N(U2),求得p

采用同樣的方式求得:

然后用公式(3)計算A,B的實例相似度siminstance(A,B)。

概念關系相似度:在相似度計算過程中概念的類型關系和名稱關系具有重要的作用是不能忽視的。由于類型關系和名稱關系都是用字符串來表示的在類型相似度上唯一,所以可以用字符串匹配直接計算[13]。

其中w1,w2表示權值,表示關系和名稱在關系相似度中起到的作用大小w1+w2=1。

設概念A和概念B之間共計算出n個RSim(Si,Tj),權值為Wi,所以A和B的關系相似度可有下公式求得,表示為:

綜合相似度:將上述四個相似度進行合并求和結果相似度時子相似度的權值時隨著子子相似度的變化而變化,合并公式如下:

其中 Xi分別表示 simname(A,B),simproperty(A,B),siminstance(A,B),simrelation(A,B)概念結構的相似度。其中δ表示權值由函數sigmoid[14]得到的:

3 實驗工具與結果

在運用一個國際旅游本體和國內旅游本體上對該方法進行了實驗:第一組測試數據是源本體,該數據本體旅游產品針對國內旅游進行了描述,第二組測試數據是目標本體,該數據本體旅游產品針對國際旅游進行了描述。實驗是使用Java語言基礎上在Eclipse IDE環境和Protege工具軟件完成。將實驗結果得到的結果和旅游領域專家主觀得到的相似度進行對比如表2。

表2 實驗結果

4 結語

文中源本體和目標本體分別是國內旅游和國外旅游的本體。由實驗數據結果可知通過相似度計算和權值的設定得到源本體的概念映射到目標本體計算出概念相似度的表現力較強,具有較好的分辨能力,實驗表明,本算法在計算概念間相似度方面得到的結果比較理想。和通過旅游領域專家得到的結果相近。本體的引入為解決旅游產品過程中的知識交互、共享混亂等問題提供了新的思路。將旅游產品只是共享融入本體相關技術,使現有知識、經驗知識等共享與重用得到進一步的發展。

[1]鄧志鴻,唐世渭,張銘,等.Ontology研究綜述[J].北京大學學報(自然科學版),2002,38(5):730~738

[2]鄭麗萍.本體映射的研究[D].濟南:山東科技大學,2005

[3]Perez G A,Benjamins R V.Overview of Knowledge Sharing and Reuse Components:Ontologies and Problem-Solving Methods[A].In:Stockholm V R,Benjamins B,Chandrasekaraneds.Proceedings of the IJCAI-99 Workshop on Ontologies and Problem-Solving Methods (KRRS),1999:1~15

[4]史忠植.Ontology科技譯名[J].科學術語研究(季刊),2004,6(4):13~14

[5]鄧志鴻,唐世渭,張銘,等.Ontology研究綜述[J].北京大學學報(自然科學版),2002,38(5):730~738

[6]Jiawei Han,Micheline Kamber著.數據挖掘概念與技術.范明,孟小峰等譯.北京:機械工業出版社,2004.1~262

[7]張承立.基于語義網的語義相似度算法改進[J].計算機工程與應用,2006,42(17):165~166

[8]朱俊武.面向企業本體復用的語義貼近度算法[J].計算機應用研究,2006(10):46~49

[9]朱莉.基于SVM和sigmoid函數的字符識別自適應學習算法[J].電子技術應用,2006(4)

[10]Alexnader Meadehe,Boris Motik.Ontologies for Enterpeise Knowledge Management[J].IEEE Intelligent Systemes,2003:26~33

Ontology;Tourism;Ontology Mapping;Similarity

Research on the Application of Tourism Product Mapping Based on Ontology

WANG Wei-dong,ZHANG Lin
(Shanghai Marititme University,Shanghai 262500)

1007-1423(2015)17-0054-05

10.3969/j.issn.1007-1423.2015.17.012

王衛東(1990-),男,安徽黃山人,碩士研究生,研究方向為本體映射在旅游品產中相似度的計算

2015-04-14

2015-05-25

目前旅游信息量大,且在網絡在分布不均勻。這就導致信息架構方法的多樣化,計算機不能很好自動識別旅游信息,使得旅游業在信息的分享和重用上遇到各式各樣的問題。旅游業是對信息及時性和可靠性有著高度的依賴行業。在分析領域需求和旅游信息的基本需求后建立本體,通過一種選取候選集合實現本體映射相似度計算的方法在減少計算量的前提下實現不同本體間的共享和復用。通過一個國內和國際的本體進行映射得到的結果和人們主觀上的結果相近,驗證這種綜合本體映射相似度在旅游本體上映射的正確性和有效性。

本體;旅游;本體映射;相似度

張琳(1973-),女,博士,副教授,碩士生導師,研究方向為港航信息化技術、智能信息處理、信息檢索、本體與知識工程等

At present,tourism information of the network and large amount of distributed,heterogeneous computer knowledge,can't understand the semantic information,a large amount of information to achieve better sharing and reuse.The tourism industry is highly depended on the information industry.The establishment of the basic functions of tourism ontology based ontology modeling and analysis of tourism information,by means of an ontology mapping similarity calculation to realize comprehensive sharing and reuse between different ontology.Finally by the domestic and international ontology,the mapping results and effectiveness of the integrated ontology mapping similarity in ontology mapping of tourism.

猜你喜歡
概念旅游信息
Birdie Cup Coffee豐盛里概念店
現代裝飾(2022年1期)2022-04-19 13:47:32
幾樣概念店
現代裝飾(2020年2期)2020-03-03 13:37:44
學習集合概念『四步走』
聚焦集合的概念及應用
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
旅游
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
旅游的最后一天
出國旅游的42個表達
海外英語(2013年8期)2013-11-22 09:16:04
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: jizz国产视频| 亚洲色无码专线精品观看| 一级毛片在线播放免费| 国产欧美综合在线观看第七页| 天堂亚洲网| 日韩精品中文字幕一区三区| 欧美国产成人在线| 久久久精品国产SM调教网站| 国产主播喷水| 91美女在线| 久久久久88色偷偷| 国产真实自在自线免费精品| 欧美在线三级| 青青草一区二区免费精品| 亚洲成人黄色在线观看| 国产激情无码一区二区免费 | 亚洲国产一成久久精品国产成人综合| 国产精品99久久久| 福利一区三区| 亚洲香蕉久久| 视频二区中文无码| 91人人妻人人做人人爽男同| 久久久受www免费人成| 一本色道久久88综合日韩精品| 亚洲中文精品人人永久免费| 欧美日韩国产精品va| 美女扒开下面流白浆在线试听| 亚洲国产综合第一精品小说| 色悠久久久| 91亚洲精品国产自在现线| a级毛片一区二区免费视频| 国产精品亚洲天堂| 午夜国产精品视频| 亚洲一区二区成人| 亚洲视频二| 日韩123欧美字幕| 孕妇高潮太爽了在线观看免费| 国产午夜精品鲁丝片| 日韩毛片在线播放| 精品久久香蕉国产线看观看gif| 99视频精品在线观看| 国产99视频免费精品是看6| 伊人国产无码高清视频| 国产精品手机在线观看你懂的| 国产va在线| 午夜精品福利影院| 日韩精品一区二区三区视频免费看| 欧美伊人色综合久久天天| 一本色道久久88亚洲综合| 91精品最新国内在线播放| 朝桐光一区二区| 亚洲国产精品VA在线看黑人| 99久久无色码中文字幕| 精品人妻一区二区三区蜜桃AⅤ| 欧美日韩国产系列在线观看| 欧美午夜理伦三级在线观看| 四虎精品免费久久| 91福利免费视频| 91网站国产| 重口调教一区二区视频| 国产网友愉拍精品视频| 午夜国产精品视频| 亚洲日韩欧美在线观看| 成人无码一区二区三区视频在线观看| 国产偷倩视频| 在线看国产精品| 在线观看国产精品日本不卡网| 国内精品久久九九国产精品| 亚洲成综合人影院在院播放| 亚洲人成网18禁| 露脸国产精品自产在线播| 日韩东京热无码人妻| 中文字幕无线码一区| 国产精品手机在线观看你懂的| 欧美高清三区| 亚洲h视频在线| 精品一区二区三区水蜜桃| 久久久亚洲色| 欧美天堂久久| 国产好痛疼轻点好爽的视频| 国产在线一区二区视频| 中文字幕 欧美日韩|