999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于知識圖譜的個性化甘肅旅游線路推薦方法研究

2021-09-06 12:15:42潘祿生
電子制作 2021年17期
關鍵詞:旅游信息

潘祿生

(甘肅畜牧工程職業(yè)技術學院智能與信息學院,甘肅武威,733006)

0 引言

隨著互聯(lián)網(wǎng)技術滲透到生活的各個方面,信息過載導致有效數(shù)據(jù)被淹沒在海量信息中,降低了信息利用率[1]。推薦系統(tǒng)就是為了解決這種問題應運而生,但隨著互聯(lián)網(wǎng)的普及,網(wǎng)絡數(shù)據(jù)呈現(xiàn)出隨意化,個性化等特點,傳統(tǒng)推薦系統(tǒng)面臨著數(shù)據(jù)稀疏的問題[2]。以旅游信息為例,不同人對相同景點的評價差異較大,且與游客的年齡,性別,興趣愛好等各種因素息息相關,這就導致了旅游信息的離散化程度非常高。如何根據(jù)現(xiàn)有知識信息實現(xiàn)旅游信息的個性化推薦,對提升甘肅省旅游產(chǎn)業(yè)的發(fā)展具有重大意義。

在旅游網(wǎng)站中,旅游線路信息包括大量的景點信息,如地點,門票,酒店,交通線路,旅游線路特色等。針對傳統(tǒng)推薦算法對離散數(shù)據(jù)推薦不準確的問題,提出了基于知識圖譜的旅游線路推薦方法。

1 旅游線路領域知識圖譜構建

■1.1 旅游線路領域知識圖譜構建總體流程

個性化推薦方法的優(yōu)劣取決于旅游線路領域知識圖譜的完善程度,然而由于旅游線路信息分布于各旅游信息網(wǎng)站中,因此需要對旅游網(wǎng)站信息采集,而采集到的數(shù)據(jù)是否滿足旅游路線知識圖譜構建的需求,需要采用大數(shù)據(jù)技術進行分析,然后與已有的數(shù)據(jù)進行相似度計算,滿足閾值的數(shù)據(jù)才可以作為有效數(shù)據(jù)存儲數(shù)據(jù)庫中。旅游線路領域知識圖譜構建總體流程如圖1所示。

圖1 旅游線路領域知識圖譜構建流程

在旅游線路領域知識圖譜的構建過程中,數(shù)據(jù)采集負責從旅行網(wǎng)站,點評網(wǎng)站,百科網(wǎng)站等采集相應的景點實體信息,通過在爬取數(shù)據(jù)過程中進行預處理,去除噪音數(shù)據(jù),然后通過數(shù)據(jù)的類型,如結構化數(shù)據(jù),非結構化數(shù)據(jù)和半結構化數(shù)據(jù)進行存儲。在數(shù)據(jù)抽取階段,將采集到數(shù)據(jù)按照數(shù)據(jù)抽取模型,抽取構建領域知識圖譜所需的實體數(shù)據(jù)、屬性數(shù)據(jù)和關系數(shù)據(jù)。在知識融合階段通過同義詞庫將抽取的實體,屬性和關系數(shù)據(jù)進行數(shù)據(jù)融合,包括實體歧義的消除,屬性歧義的消除以及同義關系的合并等[3]。最后利用這些數(shù)據(jù)構建實體/屬性/屬性值三元組,從而構建旅游線路領域知識圖譜。由于旅游線路信息本就離散且稀疏,因此高效的知識融合方案直接決定了旅游領域知識圖譜的完整性。領域知識圖譜的知識融合首先需要對實體,屬性和屬性值等知識結構主體進行擴充,以擴大領域知識圖譜的使用范圍,其次是對各知識結構主體值的融合,以提高知識圖譜的準確度。

■1.2 屬性知識擴充方法

1.2.1 屬性知識擴充流程

知識主體擴充是指通過信息采集技術持續(xù)將滿足領域知識圖譜構建所需信息納入知識圖譜的過程。知識圖譜中實體用三元組<實體E,屬性A,屬性值V>表示,關系用三元組<實體E1,關系R,實體E2>表示。知識主體擴充包括實體擴充,屬性擴充和關系擴充。本文主要研究知識圖譜的屬性擴充,針對旅游線路的特點,整理出10個典型的屬性,屬性名和說明如表1所示。

表1 旅游線路實體屬性名

為了實現(xiàn)知識圖譜的覆蓋范圍,提高知識圖譜的準確性,需要對屬性知識進行擴充。所謂的屬性知識擴充方法指對給定實體的屬性和屬性值進行擴充的過程。為了提高準確度,本文采用了基于模式匹配和詞義的混合屬性知識擴充方法,知識擴充方法的基本流程如圖2所示。

圖2 混合屬性知識擴充方法基本流程

在信息抽取和語料預處理階段,從攜程旅行網(wǎng)和馬蜂窩網(wǎng)站上抽取關于甘肅旅游領域的124個旅游景點實體的列表,對列表中的旅游景點,提取<實體,屬性,屬性值>三元組數(shù)據(jù)。語料的預處理包括對字符串的處理和自然語言處理,包括分詞,詞性標注等。基于模式匹配的主要任務是將抽取結果與給定模式的字符串作為候選屬性值,然后基于同義詞詞匯[4]進行擴展。對于不同候選屬性的詞性列表,將候選屬性值標記出來,并對這些屬性值進行人工標注。在模式匹配階段使用WEKA分析工具[5]中的分類器對部分符合屬性值特征屬性和不符合屬性值特征屬性的候選集進行訓練,并使用多分類器投票的集成式分類方式來預測結果。在基于詞義的屬性知識擴充方法中,屬性來源包括基本屬性及其同義詞,百科網(wǎng)站的infobox[6]的屬性名,屬性值以及模式匹配的屬性值。在基于詞義的屬性知識擴充方法中需要對每個詞根據(jù)來源賦予權重。在數(shù)據(jù)采集之后對候選語句中詞匯的屬性權重進行計算,計算方法就是將所有的屬性權重相加,然后計算該語句中詞匯的平均權重,然后決定該語句是否進入候選語句。

1.2.2 屬性知識擴充方法

(1)基于同義詞的屬性知識擴充方法

在旅游領域知識圖譜構建過程中,基于模式匹配的屬性知識擴充方法主要依靠人工構建模式和自動構建模式兩種方法實現(xiàn)模式匹配,而主要以人工構建模式為主,這種方式較為適合固定模式下屬性知識的構建。一個模式如“<月牙泉>位于<甘肅省敦煌市西南5公里鳴沙山北麓>”表示景區(qū)的位置信息,“<莫高窟>是<世界上現(xiàn)存規(guī)模最大、內(nèi)容最豐富的佛教藝術地>”表示景區(qū)的特色等,利用類似的模式可以獲得知識主體的屬性信息。同時為了增加模式匹配的適用性,可以對知識主體(景點)和知識屬性(地理位置,最大特色等)之間表示關系的同義模式進行擴展,如“位于”和“坐落于”,“地處”等。為此,本文對表1中提取的10個屬性構建了總計187條原始模式,同時使用同義詞擴展了873條擴展模式,且每個模式都有知識主體,知識屬性和知識關系三項構成。具體方法流程如圖3所示。

圖3 基于同義詞的屬性知識擴充方法

(2)基于模式匹配的屬性知識擴充方法

對于旅游信息網(wǎng)站和百科類網(wǎng)站的獲取的語料信息,需要將其抽取為<實體,屬性,屬性值>的三元組,在進行實體屬性抽取之前需要對同義或者連續(xù)實體屬性進行合并,合并完成之后就可以使用基于模式匹配的屬性知識[7]擴充方法,其具體過程如圖4所示。

圖4 基于模式匹配的屬性知識擴充方法

在使用模式匹配的方法后,最終獲取甘肅旅游線路信息的三元組24435條,經(jīng)過篩選,其中22187條三元組可以用于甘肅旅游領域知識圖譜的構建工作。

2 基于知識圖譜的用戶旅游線路建模

由于甘肅旅游資源非常豐富,且從區(qū)域到類別都非常廣泛,一般來說,甘肅旅游可以按距離分為短程,中程,遠程旅游,按時間可以分為一日,二日,三日或多日旅游,按旅游線路的性質可分為觀光游和專題游等。而不同的人群根據(jù)個人時間,經(jīng)濟能力,旅游性質等適合不同的旅游線路,比如在周末適合三人親子游,假期情侶適合多日旅游等。為了滿足個性化旅游線路推薦,需要根據(jù)用戶的類型和興趣,依靠旅游領域知識圖譜構建多條旅游線路供用戶選擇。

在規(guī)劃旅游線路過程中,除了景點的建議旅游時間外,景點與景點之間的距離也是必須考慮的問題,交通時間的計算時間如下:

圖5 基于知識圖譜的用戶旅游線路總體流程

對于speed來說,不同的距離使用不同的交通工具,通常以步行,公交,駕車三擋速度為基準。在規(guī)劃線路過程時,可以采用Dijkstra算法來規(guī)劃各景點之間的路線。

對于旅游線路的綜合體驗評分來說,旅游線路的體驗評分包括兩類:各景點的加分和交通路徑上的減分,一般來說,景點的加分以旅游景點的綜合評分為參考,交通路徑上的減分以交通時間為基準,時間越長,減分越多,旅游線路的綜合評分可用如下公式計算。

其中α和β分別表示旅游線路和交通時間的均衡參數(shù)。把所有推薦的旅游線路按照分數(shù)高低排名,并返回給用戶之后,用戶就可以根據(jù)個人的需求進行篩選。

3 實驗結果與分析

本實驗使用neo4j工具[8]構建甘肅旅游領域知識圖譜,從攜程,馬蜂窩,百度百科,大眾點評等網(wǎng)站總共抽取22187條<主體,屬性,屬性值>三元組構建甘肅旅游知識圖譜,以甘肅旅游領域知識圖譜如圖6所示。

圖6 甘肅旅游線路目的地圖譜模型(張掖局部)

為了表示該方法的效果,本文以敦煌出發(fā),家庭2日游為例,推薦的結果如表2所示。

表2 實驗結果

從推薦結果可看出來,對于家庭旅游而言,該個性化旅游推薦方案主要以游和玩兩個特點,且不同的線路適合不同的家庭類型,如線路1景點較多,線路較長,適合家庭三代人旅游,而線路2景點較少,且交通方便,適合于家庭中有較大年紀的老人旅游,而線路3更偏向于父母攜帶孩子旅游,而線路4更符合年輕家庭旅游。

4 結束語

針對傳統(tǒng)旅游推薦面臨的準確度不高,旅游線路單調的問題,提出了基于知識圖譜的個性化旅游線路推薦方法。通過使用屬性知識擴充方法增加知識獲取的廣度,提升旅游領域知識圖譜的覆蓋面和準確度,然后將用戶旅游時間,旅游類型需求,計算各旅游景點的評分和景點的距離計算評分,獲得合適的旅游線路,將旅游線路進行排序推薦給用戶,實現(xiàn)旅游線路個性化推薦。

猜你喜歡
旅游信息
我們一起“云旅游”
少兒科技(2022年4期)2022-04-14 23:48:10
小A去旅游
好孩子畫報(2018年7期)2018-10-11 11:28:06
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
旅游
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
旅游的最后一天
出國旅游的42個表達
海外英語(2013年8期)2013-11-22 09:16:04
信息
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
健康信息(九則)
祝您健康(1987年2期)1987-12-30 09:52:28
主站蜘蛛池模板: 日本手机在线视频| 福利视频一区| 麻豆国产原创视频在线播放| 国产黑丝视频在线观看| 国产日产欧美精品| 呦女精品网站| 国产日产欧美精品| 波多野结衣在线se| 国产亚洲欧美在线中文bt天堂| 久久精品91麻豆| 精品国产网| 91精品啪在线观看国产60岁 | 亚洲一区无码在线| 中文字幕66页| 国产精品夜夜嗨视频免费视频| www精品久久| 欧美不卡在线视频| 久久精品中文字幕免费| 欧美成人在线免费| 996免费视频国产在线播放| 九九香蕉视频| 午夜免费小视频| 国产9191精品免费观看| 婷婷激情亚洲| 国产美女在线免费观看| 欧美中出一区二区| yjizz视频最新网站在线| 特级aaaaaaaaa毛片免费视频 | 最新日韩AV网址在线观看| 直接黄91麻豆网站| 免费高清a毛片| 亚洲最猛黑人xxxx黑人猛交| 五月婷婷综合在线视频| 日韩在线成年视频人网站观看| hezyo加勒比一区二区三区| 国产成人高精品免费视频| a在线亚洲男人的天堂试看| 亚洲欧洲日韩久久狠狠爱| 国产性生大片免费观看性欧美| 婷婷综合色| 国产在线视频导航| 国产成年无码AⅤ片在线 | 国产玖玖视频| 国产精品尤物铁牛tv| 日韩欧美中文字幕一本| 日韩一区精品视频一区二区| 无码啪啪精品天堂浪潮av| 91九色最新地址| 国产成人1024精品下载| 日本精品αv中文字幕| 免费亚洲成人| 日韩欧美国产三级| 国产无码在线调教| 看国产毛片| 久久综合色88| 1024国产在线| 日韩国产精品无码一区二区三区| 国产无吗一区二区三区在线欢| 久久一级电影| 亚洲视频免| 国产白浆一区二区三区视频在线| 99视频在线看| 欧美午夜一区| 婷婷激情五月网| 国产在线97| 欧美激情综合| 欧美成人精品在线| 亚洲精品第一页不卡| 欧美精品v欧洲精品| 精品無碼一區在線觀看 | 亚洲精品无码日韩国产不卡| 国产精品永久在线| 在线观看热码亚洲av每日更新| 国产福利微拍精品一区二区| 亚洲不卡网| 色成人综合| 国产午夜在线观看视频| 毛片视频网| 国产精品任我爽爆在线播放6080 | 欧美一区二区三区国产精品| 色噜噜在线观看| 在线国产91|