葛 瑞 劉曉莉 萬云霞 潘立新
1.滁州學院地理信息與旅游學院,安徽滁州 239000;2.滁州學院外國語學院,安徽滁州 239000
隨著互聯網發展普及,在網上進行旅游預定、在線評論、分享交流越來越便捷,出現了海量的旅游數據信息,而網絡非實名制的存在,使得游客在交流評論時更能表達出真情實感和真實想法。伴隨著內容挖掘軟件的出現、數據采集技術的進步,很多學者開始收集旅游大數據信息進行研究,深入挖掘游客對旅游目的地的滿意程度、情感特征、旅游體驗評價及其相關需求,為旅游目的地產品、設施、管理等方面提出建設性的意見。
唐模風景區位于黃山市,是國家5A景區、黃山市十大景區之一,始建于唐、發展于宋、盛于明清,歷史傳說因其經濟活躍、民風淳樸,而被譽為“唐朝模范村”。
本文運用網絡文本分析方法進行情感特征研究。借助攜程網、大眾點評等網站收集關于唐模景區的在線點評文本,利用八爪魚軟件收集唐模景區的評論數據,用ROST Content Mining從高頻詞、語義網絡、情感分析等功能模塊挖掘文本中游客表達的情感特征。
本文的在線點評文本選自攜程旅游網、大眾點評、馬蜂窩旅游網、途牛旅游網。以“黃山市唐模景區”為關鍵詞,運用網絡搜索在線點評文本,共收集獲得900多條在線點評,其中攜程574條、大眾點評362條、途牛8條、馬蜂窩9條,這是唐模景區2015年—2020年幾乎包含所有網站的點評數據,其覆蓋面廣,具有可行性。
將數據導入表格后手動刪除2015年前的評論數據,數據去噪,統一格式,按2015—2020年升序排列。為確保評論對研究有實際意義,刪除部分旅游網站平臺設置的快速評價默認好評的內容以及用戶在評論區發布廣告等與景區無關的言論和重復數據,最后保留攜程554條、大眾點評347條、馬蜂窩3條、途牛8條,共912條。
利用高詞頻分析可以快速高效地從大量文本數據中找出關鍵詞。使用ROST Content Mining對收集到的網絡文本進行高頻詞分析,統計2015—2020年排名前100的詞匯及其頻次(見表1)。發現大部分游客的評論中都是積極的詞匯,存在較少的消極言論詞匯。詞云圖可以過濾掉大量的文本信息,更直觀地體現高頻詞數據,出現詞匯的大小代表詞頻的高低,詞匯所占越大詞頻越高,反之詞頻越低。將唐模景區排名前100的詞匯進行轉化制作詞云圖,運用Word Art詞云在線生成工具,制作唐模景區詞云圖(見圖1),直觀清楚地反映各高頻詞所出現的頻次及所占比重。詞頻率最高的是關于唐模景區的相關信息,例如“唐模”“景區”“徽州”“徽派”“村落”等詞匯,是游客游玩后對唐模景區整體(包括地理位置、風格、建筑及自身的旅游體驗感)的評價。游客在評論中提及“值得”“適合”“值得一見”等詞,表明游客對唐模景區的游玩感受普遍良好,給了比較高的評價。排名前100的詞匯中也有消極情感類的詞匯,但是占總體的極少數,其中“不值”這一詞匯出現了32次,查找相關評論,發現是游客認為門票貴,性價比不高,覺得不值。

表1 2015年—2020年唐模景區排名前100詞匯

圖1 唐模景區詞云圖
單純的高頻詞分析只能反映出各個詞出現的次數及其比重,語義網絡分析在此基礎上能表現出各個詞之間的內部聯系與結構,將文本轉換為圖片的形式,可以更加直觀地看出各個高頻詞之間的關系(見圖2)。可以看出語義結構圖有很多中心并向四周無規律的分散,其中以“唐模”“徽州”“景區”“徽派”為中心,除去這些中心詞匯外,“歷史”“西湖”“建筑”等詞匯是對中心詞匯的解釋及延伸。在語義網絡圖的最外層例如“特色”“悠久”“千年”“商業”“風光”“深厚”等詞匯,是對內部中心詞匯更進一步的解釋及延伸,通過這張圖可以看出各個詞匯之間的關聯程度,線條越集中的詞匯越重要。

圖2 唐模景區語義網絡結構圖
在ROST Content Mining軟件中選擇情感分析,得出游客情感特征分析的最終結果(見表2)。積極情緒的游客占85%以上,消極情緒的游客占8%左右,說明大部分游客表達了正向的情感特征,并對唐模景區給予了比較積極的情感評價和價值認同,這與高頻詞分析的結論相一致。處于中立立場的中性情緒的游客占7%,以客觀地陳述自己的旅游體驗為主。積極情感語義高頻詞匯有:“特色”“安靜”“方便”“值得”等,反映唐模景區作為傳統村落具有特色的徽派建筑吸引游客前往,且歷史文化氣息深厚、景色宜人,使游客產生積極情緒。而消極情感主要體現在“門票”“景區不大”上,原因主要在于交通基礎設施不完善,景區門票價格略高。將表格內的數據制作成圖表(見圖3),通過六年的比較發現游客的積極情緒具有很強的波動性,呈下降—上升—下降的波動趨勢,2015年至2016年下降,2016年至2019年持續遞增的狀態,2020年因疫情影響稍有下降。

表2 2015—2020年唐模景區情感分析表

圖3 2015—2020年唐模景區游客積極情緒柱狀圖
本文通過獲取唐模景區2015—2020年旅游網站游客評論,分析唐模景區游客情感特征,得出主要結論:游客情感以積極情感為主,要強化游客積極情緒,弱化消極情緒,關注基礎設施設備、門票的性價比方面的完善,通過六年的比較發現游客的積極情緒具有很強的波動性,呈下降—上升—下降的波動趨勢。