任艷敏
(合肥師范學院 外國語學院,安徽 合肥 230601)
據中國互聯網信息中心的統計數據,截至2018年12月,中國手機網民規模達8.18億,在線旅行預訂用戶規模達到4.1億,網上預定機票、酒店、火車票和旅游度假產品的網民比例分別為27.5%、30.3%、42.7%和14.5%[1]。在“互聯網+”時代,人們的生活與網絡緊密聯系。網民在網絡應用上通過講故事的形式,配以能展現旅游目的民俗風情的圖片或視頻表達真情實感,或使用OTA 消費后進行點評。這些網絡游記和評論為學者利用其進行內容分析提供了大量可保存的信息。在國家大力倡導發展“旅游+互聯網”和大數據背景下,基于網絡文本分析的旅游研究成為熱點。本文對2011年至2018年的國內網絡文本在旅游研究中的應用文獻進行梳理,分析其研究視角和內容、研究進展情況,為網絡文本在旅游研究中的應用提供借鑒。
網絡文本分析是基于web2.0技術的廣泛推廣而得以實現的,國外以web2.0 為依托的旅游網絡文本分析學術研究始于2005年,國內則稍晚一些。通過CNKI(知網)中文期刊全文數據庫檢索發現,網絡文本分析在中國旅游業的應用研究最早是2008年,之后兩年無相關論文。2011年以后出現寥寥數篇研究成果,從2014年開始,期刊數量開始增多(見圖1)。因此本文選取2011年至2018年這個時間段,檢索條件要求主題包含“網絡文本分析”,并且文章包含旅游或者游客,共得到有效論文37篇。另外,由于與網絡文本分析具有多種同義的表述方法,又補充了以下的一些搜索渠道:在全文含有“旅游”的同時,以“旅游博客文本”、“在線點評”、“在線文本分析”為主題分別獲得2 篇、3 篇、1 篇有效論文,本文的研究樣本量達到43篇,來源類別為核心期刊和CSSCI。發文期刊主要集中在《旅游學刊》(9 篇)、《資源開發和市場》(3篇)、《人文地理》(2篇)、《旅游科學》(2篇)和綜合性大學校報上,文獻樣本學術價值高。

圖1 近十年來文獻期刊時間分布
通過對這43 篇論文進行初步聚類分析,發現2011年至2018年中,學者們利用網絡文本分析所關注的視角主要是旅游業中的旅游主體和客體,即旅游者和旅游目的地,少量研究涉及飯店、重大事件、旅游流(見圖2)。學者主要是從游客滿意度、游客的行為和體驗角度來研究旅游者;從旅游地形象和游客感知旅游地形象、旅游地的產品開發的角度來研究旅游地。
1.關于旅游者的研究。在游客滿意度方面,肖星(2011)通過對國內具有重要影響力的網站的點評文本進行內容分析,得出了6 個城市公園滿意度評價因子,研究顯示城市公園游憩者滿意度評價存在顯著差異[2]。袁俊等(2016)通過構建深圳大芬油畫村文化創意旅游體驗評價的五大要素的四個維度,深入分析了其文化創意產業與旅游業的融合效果,認為游客對文化創意旅游高度認可[3]。王雨文(2018)采用網絡文本分析法探析了湄洲島總體游客滿意度情況,并進一步探論了湄洲島游客滿意度的影響因素[4]。

圖2 近十年來論文研究內容分布
旅游者行為方面,趙振斌(2011)通過對陜西省太白山相關網站論壇游記的文本內容分析,總結出太白山背包客行為特征的50 個高頻詞中,反映太白山高峻的特點和背包旅游的自主旅游特征的詞匯排名最高,背包客的自主性特點突出[5]。呂旭濤(2018)分析了自行車騎行者的騎行方式、騎行道路選擇偏好、騎行目的、騎行空間尺度4 個方面的行為特征[6]。萬惠等(2016)基于巴赫金的狂歡理論研究游客在傣族新年潑水節活動中的旅游體驗特征,認為游客在潑水節中的行為和巴赫金描述的狂歡行為有相似之處也有不同點[7]。馬麗君等(2017)分析了張家界游客旅游信息需求特征[8]。也有學者綜合分析了旅游者動機、行為和滿意度,如叢麗等[9]-[13]。
對旅游者的滿意度和旅游行為特征研究是基礎研究,基于此對旅游者體驗價值及特征的研究和旅游者體驗價值感知構建的研究也增多。萬惠等(2016)認為整個潑水節過程中充滿了快樂、炫耀、厭惡、驚奇和刺激感[7]。鄭華偉(2016)認為紅色旅游對紅色旅游者幸福感的內化構建以價值觀內化為主要心理過程,并通過學習的逆向正遷移得到強化,具有一定程度的傳遞性[14]。黃杰等(2017)構建了對新疆游客感知價值維度的相應模型,認為在宏觀層面上,游客體驗價值感知屬性層層遞進,依此表征為“知覺性”、“情感性”、“社會性”與“精神性”4大維度[15]。張天問等(2014)認為旅游幸福感生成過程是由不斷增強的旅游前熱切期盼、充滿激情的旅游中福樂體驗和逐漸回歸的旅游后溫馨回憶三部分構成[16]。宋振春等(2018)研究發現中國公民出境游時表現出比較明顯的國家民族認知意識,出境旅游的個體行為被看作是國家、民族的象征[17]。
2.關于旅游地和景區的研究?;诰W絡文本對旅游地和景區進行研究的論文最多。主要是對不同旅游目的地或旅游景區的旅游形象、意象或者旅游者感知形象進行研究。Hunt認為旅游地意象是人們對非居住地所持的印象,是外界作用于人腦所形成的意識流[18];旅游地形象是旅游者對旅游地吸引物、環境、服務等相關要素的感知印象與綜合評價[19]。兩者的研究角度是一致的。學者們在研究時構建了指標體系。張高軍(2011)通過網絡日志構建了7 個積極的感知因素和5個核心類屬、13小類的消極感知因素,研究發現華山的文化底蘊和地質旅游資源是會令游客產生積極形象感知的新因素[20]。王曉輝(2014)分析了中文互聯網傳播的西藏旅游形象,認為不同類別網站關注得對象和重點存在較大差異[21]。苗紅等(2014)對嘉峪關市旅游形象宣傳與游客實地感知形象對比分析,研究表明兩者具有較高的一致性[19]。鐘櫟娜(2015)定義了全國優秀旅游城市感知的22個要素、3個系統和3個層次,證明了旅游者對旅游地的感知順序是環境整體、功能性因素、探索價值因素、一般價值因素[22]。張珍珍等(2014)通過對比問卷調查和網絡評論兩種數據,分析了評價西安市的旅游形象[23]。最近幾年,王永明等(2015)、宋炳華等(2016)、方雨等(2017)、徐菲菲等(2018)、景秀麗等(2018)分別對我國歷史文化名城鳳凰古城[18]、平遙古城[24]和我國重要旅游城市武漢市[25]、南京市[26]、桂林市[27]等旅游地形象進行了研究。小尺度的旅游地的旅游感知形象也引起了旅游者的關注。景區知名度從世界遺產、國家5A級風景名勝區、國家森林公園到省級風景名勝區、鄉村旅游區域、市級文物保護單位,均有覆蓋,但主要以自然旅游資源為主。如許亞元等[28]-[35]。
此外,不同領域的學者嘗試結合旅游地感知形象從其他的角度對旅游地進行了研究,如演克武等(2018)通過對長三角經濟區三家旅游企業競爭力指標的綜合比較,提出了利用在線網絡評論數據建模分析旅游企業品牌競爭力的新視角[36]。孔曉東等(2018)認為游客對郵輪產品的形象感知表現出“核心層-次核心層-過渡層-邊緣層”的語義網絡結構,核心層要素反映了與國際郵輪市場基本一致的郵輪產品形象[37]。楊楊(2013)通過對海峽兩岸相關網站在傳播媽祖文化的數據比較得出:大陸網站更加突出海峽兩岸在媽祖文化交流方面的聯系,臺灣網站更加突出時代感強的媽祖文化傳播方式[38]。苗紅等(2014)分析了寧夏休閑農業景區的特征及產品開發情況[39]。商業化是旅游地形象中消極的一面,目前研究的很少,孫小龍等(2017)從游客識別和解讀入手對西江苗寨的商業化符號表征進行研究[40],開拓了旅游地形象研究的新視角。
3.其他旅游研究。除了對旅游者和旅游目的地進行研究,學者們也關注了旅游學領域的其他研究內容,可以細分為:旅游流、旅游酒店、旅游重大事件。
旅游流網絡文本研究是在“互聯網+”旅游的普及、游客旅游方式的升級以及自由行市場超過旅行團基礎上興起的[41]。但是該研究目前不具有普遍性,在2011年至2018年中僅有一篇核心期刊對此進行了深入研究。任飛(2014)以山東省自由行旅游流為研究對象,通過抓取網絡文本信息,從流量、流向、溢出性、客源分布、跨區域聯系幾個方面展開對比分析并提出建議[41]。
酒店作為旅游活動的重要元素,是學者們關注的研究對象之一。酒店的服務質量是主要的研究視角。肖軼楠(2016)認為對賓客網絡點評進行內容分析,更能客觀全面地反映目前我國高端度假酒店的服務質量,對于提升度假酒店服務品質和提升管理水平有重要意義[42]。另外,游客對酒店的感知會影響游客的滿意度和忠誠度,傅云新等(2014)構建了青年旅社游客感知價值概念模型,得出游客較為關注服務價值、功能價值、情感價值和社會價值[43]。
基于網絡文本分析的旅游研究有一篇是關于旅游重大事件的。重大事件對舉辦地的影響和評價研究已成為國際事件研究的重要內容之一,而利用互聯網資料開展事件旅游研究是重要的方法和手段。戴光全等(2012)從網友許愿的角度探討了西安世界園藝博覽會這一重大事件的意義結構,構建了一個兩維三結構的重大事件意義體系框架[44],具有一定的典型性。
隨著互聯網的普及和發展,旅游學領域的研究不再局限于通過問卷調查獲取數據?;诰W絡文本分析的旅游研究選取相關網站(官方網站、旅游企業網站、新浪微博、攜程網、同城網、藝龍網、去哪兒網和大眾點評網等)的“分享旅游體驗貼”或者是游客點評。網絡數據資料采集多使用網絡爬蟲工具操作,如八爪魚、火車頭等采集器。網絡文本是旅游研究中從網絡上最直接獲得的數據樣本,為了補充研究不足,有的學者將網絡文本數據與問卷調查數據相結合,更具有說服力,如肖星(2011)。而張珍珍(2014)通過對比問卷調查和網絡文本分析的結果研究西安市的旅游形象。使用內容分析法對采集到的文本進行分析是目前最普遍使用的,樣本期刊中有31 篇論文使用了ROST 軟件中高頻詞、語義分析、情感分析工具進行分析,ROST軟件使用率最高。少數學者使用UCINET 軟件、KHcoder 軟件進行社會網絡分析,如鐘櫟娜(2015),敬峰瑞(2017)。其他學者結合了層次分析法、ASEB、扎根理論等進行定性研究。研究方法強調定性與定量相結合。
通過分析發現,實證研究的區域尺度范圍大到自治區,直轄市、地級市,小到一個旅游景點。在43個樣本文獻中,除了以全國優秀旅游城市[22]、全國12個紅色旅游景區[14]和全國范圍內的的自行車騎行行為[6]、出境游[11]、[17]等為研究對象,79%的實證研究是針對某一特定的旅游目的地。樣本區域分布廣泛,涉及到15 個省,4 個自治區,2 個直轄市的34 個旅游目的地或研究對象(見表1)。總體來看,西部地區最多,東部沿海地區多于中部地區。中西部地區樣本研究對象是全國乃至全世界著名的旅游地,旅游資源豐富,知名度高,具有典型性和代表性,游客們在網絡平臺上發布了大量的游記和點評,為學者們在選取研究對象時提供了重要的參考。由此可見,隨著互聯網的普及和發展,人們對旅游地的趨之若鶩不再受限于當地的經濟發展水平,更多的是出于對其旅游價值的欣賞和熱衷,這也為學者在網絡上搜集研究資料提供了豐富的素材。

表1 樣本區域分布情況
在“互聯網+”時代,游客習慣于通過網絡平臺做出旅游決策,并分享旅游體驗。隨著“互聯網+旅游”的興起,基于網絡文本分析的旅游研究成為旅游學中新的研究領域,引起了學者們的關注,目前做出了一些研究成果。通過對學者們的文獻論文分析發現,目前的研究處于初級水平階段,偏向實證研究,理論研究欠缺。基于網絡文本分析的旅游研究在以下方面存在廣泛的研究空間。
從研究視角看,2011年至2018年期間,基于網絡文本分析的旅游研究或是集中于旅游者、旅游目的地,或是關于旅游流、旅游酒店、旅游重大事件,都從較廣泛的角度對提高旅游地形象、改善旅游服務質量建言獻策。但都屬于應用型研究,缺乏相關理論的探討。研究內容不夠深入,面臨過多實證脫離理論研究的尷尬境地。故理論研究也亟需深化,尤其是網絡文本分析對旅游企業發展的影響機制、文本數據選擇行為機制以及基于旅游組織戰略管理視角的旅游市場營銷等重大理論問題都是迫切需要探討的課題,未來可以嘗試構建我國的旅游網絡文本分析的理論框架。
樣本論文中研究數據來源于兩個方面:一種是根據研究主題在搜索引擎中獲取相應的博文,另一種是在一個點評類網站上抓取點評信息。但是兩種都是針對文字的分析,缺乏對發帖者在網站發布的圖片、視頻、音頻等內容以及跟帖信息的研究。這些既可以補充文字的不足,也可以成為新的研究方向和領域。另外,現有的研究在從OTA 平臺獲取點評信息的同時,很少關注各個網站平臺的影響力差異問題。由于游客發布的信息量大,網站平臺影響力會導致部分游客發布的信息落選,部分游客的留言被青睞。針對同一個主題,不同的網站發帖內容也會存在差異性,故第三方網絡平臺的知名度和受眾面對抽樣對象選取的影響也值得進一步探討。
網絡評價來自于游客旅游后的感受,這種感受真實與否,會受到眾多因素的影響,對于同一個旅游目的形象的評價分析會因不同的文化背景、年齡層次、居住環境、旅游經歷和游覽時的心情不同呈現出差異性。在對酒店住宿和餐飲進行點評時甚至會受到賣家的利益誘惑(如消費折扣、小禮品等)而給出偏離真實的評論和分數。故對網絡發帖者的“背景”研究應被納入到文本分析中用來矯正該旅游者網絡口碑影響。
目前較多學者利用ROST 軟件對獲取的網絡文本進行詞頻分析、語義分析、情感分析等。極少數學者使用其他軟件。分析工具呈現出單一性特征。另外,在分析時低頻詞被淘汰,無法進行系統的分析和討論,一定程度上降低了數據挖掘的信度和效度。旅游網絡文本分析與其他理論方法的結合也存在局限性,利用層次分析法、ASEB、扎根理論等進行定性研究時不夠深入。未來可以嘗試采用更多更優的數據挖掘軟件和分析方法進行研究。