999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于情感分析技術的蘇州旅游網(wǎng)絡評價研究

2021-10-21 02:39:29何威朱曉菲李翛
科教創(chuàng)新與實踐 2021年32期
關鍵詞:網(wǎng)絡評價

何威 朱曉菲 李翛

摘要:本文探討了在利用大數(shù)據(jù)技術爬取蘇州市主要景區(qū)和酒店網(wǎng)絡評價的基礎上,研究了采用情感分析技術對這些評價進行處理和分析的步驟和方法,得到了相對客觀的評價,且評價具有可比較性。

關鍵詞:情感分析技術;網(wǎng)絡;評價

一、背景和意義

在移動支付技術飛速發(fā)展的現(xiàn)代社會,網(wǎng)絡的觸角已經(jīng)深入到我們生活,不斷改變著我們的生活方式。通過網(wǎng)絡使人與人之間聯(lián)系的距離極大的縮短,即使是兩個陌生人也能通過網(wǎng)絡建立直接的聯(lián)系。人們在公共網(wǎng)絡上發(fā)表的各種言論可以被任何人獲知,并產(chǎn)生一定的影響。游客們也可以通過在線旅游網(wǎng)站發(fā)表自己對所游覽景區(qū)或酒店的相關體驗和評論,這些公布在在線旅游網(wǎng)站上的評論就會對所有關注此景區(qū)或酒店的游客的旅游決策產(chǎn)生影響。對于景區(qū)或酒店正面贊揚的評論會增強計劃前往游客的信心,吸引未計劃游客的興趣,對景區(qū)或酒店負面批評的評論會打擊計劃前往游客的積極性,降低游客的興趣。

近年來,由于越來越多的在線旅游用戶樂于在互聯(lián)網(wǎng)上分享自己的游玩體驗,導致景區(qū)或酒店網(wǎng)絡評論信息數(shù)量急劇增長,已經(jīng)難以靠人工判斷對景區(qū)或酒店網(wǎng)絡評論進行分析。因此迫切需要利用計算機幫助在線旅游網(wǎng)站及景區(qū)管理者來快速準確的獲取相關網(wǎng)絡評論中的所需信息。因此,關于蘇州旅游網(wǎng)絡評價有以下重要意義:一、為游客的計劃出行提供參考,從而優(yōu)化出行決策;二、對于景區(qū)或酒店管理者而言,通過研究網(wǎng)絡評論數(shù)據(jù)對景區(qū)或酒店進行綜合評價,可以使管理者更直觀更快捷的了解目前主要優(yōu)勢,以及可能存在問題的劣勢,便于管理者及時調(diào)整景區(qū)或酒店治理和發(fā)展工作;三、對于在線旅游網(wǎng)站而言,研究網(wǎng)絡評論數(shù)據(jù)對景區(qū)或酒店進行綜合評價,了解目前的優(yōu)勢劣勢,可以協(xié)助產(chǎn)品部門及時調(diào)整在線旅游產(chǎn)品的設計,突出宣傳優(yōu)勢,或者針對劣勢設計彌補性產(chǎn)品;四、對于政府部門而言,研究網(wǎng)絡評論數(shù)據(jù)對政府的管理決策提供依據(jù),有利于政策的調(diào)整和優(yōu)化。還可以實現(xiàn)對蘇州旅游網(wǎng)絡輿情監(jiān)測,為全面掌握輿論動態(tài),做出正確輿論引導,提供分析依據(jù)。

二、研究思路

目前,對蘇州旅游網(wǎng)絡評價的研究還較為缺乏。尤其是官方層面未發(fā)布過蘇州市主要景區(qū)和酒店網(wǎng)絡評價報告。由于缺少官方的報告,各方面均缺少權威的指引。對蘇州市主要景區(qū)和酒店網(wǎng)絡評價將有利于優(yōu)化旅游資源,對提升旅游質(zhì)量和城市魅力有著重要的意義。

本文立足于網(wǎng)絡評論文本分析技術中的情感分析技術,對蘇州市主要景區(qū)和酒店網(wǎng)絡評價進行研究分析,目的在于提取出游客所關注的景區(qū)或酒店的特征和游客對該特征的情感態(tài)度,為旅游景區(qū)或酒店、在線旅游網(wǎng)站及在線旅游用戶提供協(xié)助,優(yōu)化其決策行為,更為政府部門決策提供參考依據(jù)。

三、數(shù)據(jù)采集與整理

本研究選取了蘇州市主要的3A級以上景區(qū)41個,3星級以上酒店49個作為研究對象。利用大數(shù)據(jù)技術從攜程網(wǎng)、同程旅游網(wǎng)、去哪兒網(wǎng)、馬蜂窩網(wǎng)、驢媽媽網(wǎng)、途牛網(wǎng)等6個主要的OTA網(wǎng)站,主要爬取了2019年以來的網(wǎng)絡評價。景區(qū)類供爬取到包含當中的文化底蘊、建議游玩時間、如何快捷取票等評論1521條、酒店類共爬取到包含有所處位置、環(huán)境、停車、房間的安全設施、以及早餐的是否豐盛等評論2533條。經(jīng)過清洗處理,最終景區(qū)類采用有效評論1022條、酒店類采用有效評論2415條作為基礎數(shù)據(jù)樣本。

四、數(shù)據(jù)處理與評分

情感評分,也就是計算文本所表達的情感傾向的強烈程度。傳統(tǒng)上計算情感評分的方法是詞典法,是首先以人工的方式得出詞組的情感傾向,然后對句子進行語法和語義的分析,然后根據(jù)語法規(guī)則來計算各詞組的情感傾向,最后按不同語句的語義規(guī)則導出最終的情感分。考慮到詞典法的缺點,所以我們最終采取的是目前較為流行的深度學習法。該方法的一般步驟包括:人工定性、特征提取、計算分類模型(以上三個步驟為模型訓練)、用分類模型對新的評價文本進行分類、分類模型計算出的該文本和類的吻合度就是結果評分(以上兩個步驟為模型應用)。這種方法不再需要考慮句子的語法、語義等規(guī)則,而是通過計算各詞組以及不同詞組之間同時出現(xiàn)的概率和人工定性之間的匹配度。即以不同的詞組和詞組之間同時出現(xiàn)的現(xiàn)象為特征將文本分類到好、壞之類的定性評價中。

根據(jù)上述一般性步驟,結合我們的實際需要,清洗后的數(shù)據(jù),會進行如下的處理:

1.人工標記

人工標記的目的是通過對收集到的評論通過人的判斷分成好壞兩個基本分類。考慮到我們的評分用途,對每個評價,我們分別從八個主題進行了標記。分別是:總體評價、游玩體驗、環(huán)境、性價比、餐飲、購票便捷、設施、交通。如果某個評價未涉及到相關的主題則可不標記。然后將標記后的每個主題中的相關評價,標記為“好”的評價放入pos.txt文件中,標記為“不好”的評價放入neg.txt文件中。

2.分詞

標記后的訓練樣本,以及用訓練好的模型對新的評論進行評分時,都首先要對評論文本進行分詞。這是由于我們的模型找的是詞組以及詞組同時出現(xiàn)的概率和人工標記之間的關系。而眾所周知,中文不是英語,有自然的詞匯分隔符,所以對于中文句子,首先要做的就是將其切分為詞匯。IT的精髓就是不要重復發(fā)明輪子,所以我們直接采用了目前公認較為準確的jieba中文分詞包進行分詞。

3.訓練模型

訓練模型,其實就是采取不同的分類算法來計算不同詞匯和人工結果直接的分類強度。一般采取的分類技術包括:樸素貝葉斯分類、SVM(支持向量機)分類等,考慮到貝葉斯模型具有較強的直觀性,計算也比較方便,所以我們采取了貝葉斯分類算法來進行模型的訓練。

針對每個主題分別用pos.txt和neg.txt文件以貝葉斯分類模型進行計算,和分詞類似,我們直接選擇了snownlp這一針對中文情感詞分類訓練程序包進行分類模型的生成。然后將生成的該主題的分類模型放入model目錄下集中存放。

4.情感評分

我們選擇某個景點,然后將收集到的對其的所有評價逐條用訓練好的這八個模型進行評分,然后按主題將評分結果進行匯總。由于評價中可能未涉及到相關主題,所以我們對低于特定門限的評分視為無效評分,加以剔除,由于目前評價數(shù)量較少,所以我們將這一門限設得較高,為:0.1。

最后計算出來的平均分,就是按不同主題的情感評分。需要注意的是,由于目前我們收集到的評論數(shù)量較少,所以在針對游玩體驗、餐飲、設施、交通等評論較少的主題時,評分結果的準確度較差,后期正式實施擴大時間范圍和采集范圍增加評論后準確度會提升。

此外,由于大多數(shù)情況下,游客不會游完必評,所以我們收集到的評論在普遍性和客觀性方面是存在偏差的,所以我們開始還設置了一個可信度的主題以試圖對評論本身的可信性加以糾正,但由于最終被定性為不可信的評論數(shù)量過少,所以目前無法對此進行糾正。后期正式實施能實現(xiàn)糾正此問題。

5.評價定性

考慮到計算出的情感評分沒有直觀性,為便于對評價的打分結果有直觀感受,我們還對評價的評分進行了定性計算。我們將評價結果視為一個模糊集,該模糊集包含三個模糊性質(zhì),其隸屬函數(shù)用折線法進行表示:

依據(jù)該模糊集的隸屬度函數(shù),對計算出來的評分,我們分別計算該評分分別對應這三個模糊性質(zhì)的隸屬度值,取其隸屬度最大的為該值所對應的模糊性質(zhì)。

以蘇州市拙政園為例,通過程序運算可以看出對于拙政園的網(wǎng)絡評價,在總體評價、環(huán)境、游玩體驗方面為“好”,在性價比、餐飲、購票便捷、設施、交通方面為“不好”。后期可以結合以上結果再具體分析評論發(fā)現(xiàn)反映的具體問題。

五、結論與展望

將網(wǎng)絡評價通過人工標記、訓練模型、情感評分、評價定性等程序加工后,得到了相對客觀的評價,且評價具有可比較性。因為對不同的主題進行了標記,有利于發(fā)現(xiàn)存在問題的方面或者游客滿意度不高的方面,從而構建全面客觀的評價指標體系。總之,對蘇州旅游網(wǎng)絡評價分析技術上是完全可行的。主要展望是:一、考慮針對不同的評價對象類別有針對性地完善主題標記,從而實現(xiàn)全面客觀的評價;二、目前數(shù)據(jù)量偏少,可以擴大收集評論的時間范圍、擴大收集評論的網(wǎng)站范圍,增加評論數(shù)量,提升結果的準確度;三、基于以上評價分析方法和流程,可以實現(xiàn)景區(qū)與景區(qū)之間的評價分析比較、酒店與酒店之間的評價分析比較、跨地區(qū)同一類型評價對象之間的評價分析比較;四、可以實現(xiàn)對蘇州旅游網(wǎng)絡輿情監(jiān)測,形成簡報、報告、圖表等分析結果,為全面掌握輿論動態(tài),做出正確輿論引導,提供分析依據(jù)。

參考文獻:

[1] 張志雄、費理源、廖宇. 基于蟻群算法的蘇州古城徒步旅游線路規(guī)劃[J].看世界,2020(21)

[2] 陶潔.文本挖掘領域研究現(xiàn)狀與趨勢分析[J]. 武漢船舶職業(yè)技術學院學報. 2018(02)

基金項目:2021年度蘇州經(jīng)貿(mào)職業(yè)技術學院院級課題“基于大數(shù)據(jù)的情感分析技術在蘇州旅游網(wǎng)絡評價中的應用研究”,項目編號為701K703。2021年江蘇省高等學校大學生創(chuàng)新創(chuàng)業(yè)訓練計劃項目“基于大數(shù)據(jù)的情感分析法在蘇州旅游網(wǎng)絡評價中的應用研究” 。

猜你喜歡
網(wǎng)絡評價
SBR改性瀝青的穩(wěn)定性評價
石油瀝青(2021年4期)2021-10-14 08:50:44
中藥治療室性早搏系統(tǒng)評價再評價
計算機網(wǎng)絡管理技術探析
芻議計算機網(wǎng)絡信息化管理
油氣集輸系統(tǒng)信息化發(fā)展形勢展望
基于網(wǎng)絡的信息資源組織與評價現(xiàn)狀及發(fā)展趨勢研究
基于網(wǎng)絡的中學閱讀指導
考試周刊(2016年79期)2016-10-13 21:50:36
新形勢下地市報如何運用新媒體走好群眾路線
中國記者(2016年6期)2016-08-26 13:02:28
基于Moodle的學習評價
關于項目后評價中“專項”后評價的探討
主站蜘蛛池模板: 中文字幕丝袜一区二区| 91精品视频网站| 国产精品不卡片视频免费观看| 久久国产高清视频| 狠狠做深爱婷婷久久一区| 国产日产欧美精品| 性激烈欧美三级在线播放| 91免费观看视频| 亚洲人成网7777777国产| 国产成人综合日韩精品无码不卡| 亚洲精品久综合蜜| 久久精品丝袜| 99久视频| Jizz国产色系免费| 亚洲无码91视频| 日本一本正道综合久久dvd | 亚洲男人的天堂久久精品| 巨熟乳波霸若妻中文观看免费| 欧美在线精品一区二区三区| 一区二区在线视频免费观看| 情侣午夜国产在线一区无码| 日本不卡视频在线| 久久久久人妻精品一区三寸蜜桃| 久久91精品牛牛| 不卡午夜视频| 久久国产毛片| 国产男人的天堂| 亚洲综合精品香蕉久久网| 40岁成熟女人牲交片免费| 99r在线精品视频在线播放| 久久精品亚洲专区| 国产日韩AV高潮在线| 欧美精品在线免费| 91久久偷偷做嫩草影院免费看| 99久久精品国产综合婷婷| 久无码久无码av无码| 99热这里只有成人精品国产| 国产精品香蕉| 欧美在线一二区| 国产裸舞福利在线视频合集| 黄色网在线| 国产美女在线观看| 大香网伊人久久综合网2020| 又黄又湿又爽的视频| 国产真实乱人视频| 99伊人精品| 精品一區二區久久久久久久網站| 色老二精品视频在线观看| 国产乱子伦无码精品小说| 亚洲国产成人精品一二区| 国产一级精品毛片基地| 国产偷倩视频| 国产永久无码观看在线| 国产日韩欧美在线播放| 多人乱p欧美在线观看| 成人午夜天| 91成人免费观看| 亚洲一区二区在线无码| 国产丝袜第一页| 国产无套粉嫩白浆| 福利一区三区| 国产亚洲欧美在线中文bt天堂 | 在线观看无码a∨| 国产精品香蕉在线观看不卡| 婷婷在线网站| 久久久91人妻无码精品蜜桃HD| 亚洲国产欧美国产综合久久 | 九九热精品在线视频| 欧美国产菊爆免费观看| 日韩av在线直播| 999国产精品永久免费视频精品久久 | 国产欧美日韩va另类在线播放| 中国国产高清免费AV片| 在线看片国产| 在线无码av一区二区三区| 香蕉久久永久视频| 精品伊人久久久久7777人| 这里只有精品在线播放| 91久久偷偷做嫩草影院电| 在线人成精品免费视频| 亚洲欧美不卡| 欧美第一页在线|