劉聰 楊陽 鄧洋陽

摘要:旅游體驗正替代自然稟賦成為旅游出行選擇的主要考量因素。本文在分析傳統旅游體驗測量方法的基礎上,研究提出一種基于數字足跡,通過數據采集、分句、篩選、抓取、匯總等過程實現半結構化到結構化數據轉化的旅游體驗測量方法。本研究以九寨溝景區為例,通過對比實驗的方式,實證比較了該方法與傳統人工分析方法的準確度。實驗結果顯示基于數字足跡的方法能夠實現對游客旅游體驗的準確測量。
關鍵詞:數字足跡;旅游體驗;測量方法
中圖分類號:F59 文獻標識碼:A 文章編號:1008-4428(2019)09-0056-02
一、引言
改革開放以后,我國旅游業發展迅速,逐漸成為國民經濟的重要支柱。悠久的歷史文化和豐富的自然資源是當前旅游產業蓬勃發展的重要原因。初期依靠純粹自然稟賦吸引的游客數量趨于穩定,我國的旅游業正進入新的發展階段。旅游體驗正替代傳統的自然稟賦成為游客旅游出行選擇的重要依據。提高旅游體驗水平成為旅游產業進一步發展的核心內容。
旅游體驗一詞早在20世紀70年代就已經被提出。早期旅游體驗被認為是人們對現代生活困窘的一種積極回應。也有學者將旅游體驗定義為對旅游相關需求的滿足程度。隨著旅游體驗被越來越重視,對旅游體驗的量化成為當前的迫切需求。已有研究大多數是采用向游客發放調查問卷的方式,通過對調查結果的量化分析實現對游客旅游體驗水平的間接測量。這種方式的測量結果對問卷設計有較高要求。設計的調查問卷是否客觀和科學是保證測量結果準確性的關鍵。另外。問卷發放的規模也會影響測量結果的精確度。
數字足跡描述的是數字工具使用過程中直接或間接產生的反映主體生活信息的數字記錄。游客的數字足跡為旅游體驗的測量提供了新的數據來源。旅游體驗被界定為對旅游相關需求的滿足程度,而游客的數字足跡中存在反映需求滿足情況的數字記錄。網絡點評是游客數字足跡的組成部分,是游客表達旅途感受的一種方式,也是游客主動釋放出的關于旅游需求及滿足情況的信息。
相較于問卷調查,網絡點評這種游客主動表示出的需求信息更具有客觀性和科學性。基于此,本文在分析網絡點評特征的基礎上,依托于當前數據采集、文本分析和數據處理技術,設計出一種旅游體驗的測量方法,旨在為旅游體驗的定量研究提供數據基礎。
二、數據特征分析
(一)旅游點評重復率高,句式簡單,結構近似
點評源自游客在過去某個時間段在特定空間的經歷,而外部環境在短期的變化非常小,這就造成很多相同的點評內容。旅游點評的句子比較簡單,單個用戶的點評語句很多只有一條,并且單句的字數也比較少。點評語句大多是一些口語化的表達,簡單精練,意在讓瀏覽者直接理解所描述對象的狀態或特征。單句結構通常采用名詞在前,接形容詞,兩者中間可能存在副詞。
(二)旅游點評對象具體,且范圍有限
旅游點評意在直接讓瀏覽者了解點評者的感受,所以語句表達都較為具體,對象非常明確,例如景色、天氣。由于旅游點評還是依賴于現實世界,旅游空間的構成元素比較有限,并且游客的感官角度比較相似。所以點評的對象就非常具體和有限。
三、旅游體驗測量方法
根據網絡旅游點評的特征,研究設計出如下測量游客旅游體驗水平的方法。
基于游客旅游點評與游客的關系,以及網絡旅游點評的可得性,網絡旅游點評非常適合作為測量游客旅游體驗的數據來源。樣本的獲取可以采用兩種方式,一種是與旅游點評網站溝通獲得網站后臺的原始數據。另一種是通過第三方工具從旅游點評的內容頁面采集點評數據。該過程會形成一張包含所有旅游網絡點評的表,每一行均為一條點評記錄。
測量游客的旅游體驗質量需要建立旅游體驗質量評價指標體系。早期旅游體驗評價指標體系的建立主要通過發放調查問卷的方式,而隨著通信技術的發展,已有學者提出數據足跡作為游客旅游行為的信息載體,可以作為建立旅游體驗的評價指標體系的數據來源,并建立了相應的旅游體驗的評價指標體系。本研究沿用這一以網絡點評數據為基礎,采用扎根理論,通過多層編碼的方式建立旅游體驗的評價指標體系的方法。除此之外,研究還需要通過詞頻分析建立相應的數據字典,用于收集解釋反映評價指標的各類詞匯,包括名詞、形容詞和副詞,并且為其分配了相應的權重。該建模過程會形成兩張表,一個用于羅列不同評價指標所對應的名詞集合,另一個用于描述不同名詞、形容詞和副詞組合的分值。
網絡旅游點評數據量非常龐大,并且存在部分單個用戶多條點評短句,一條點評短句包括多個點評對象,長難句,詞匯拼寫錯誤、句法錯誤等情況。因此收集到的原始旅游網絡點評數據無法直接用于分析。需要一個預處理過程。該過程包括兩個步驟:第一步是分句,如果單個用戶一次點評內容-包含多條點評語句,那么將其拆分為多條點評記錄,并且如果拆解后的點評記錄是并列句,那么將其拆分為多條簡單句,直至所有點評記錄都為單個簡單句為止。第二步是篩選,依照數據字典,對分句后的短句逐條篩查,選出其中包含有數據字典中記載的明確評價對象的短句。游客的網絡點評內容依賴于現實世界,表述的基本是存在的共性問題或感受,并且網絡點評與寫文章不一樣,更多的是游客的口語化表述,重在簡單直觀的傳遞游客感受,因此具體的點評內容和句式結構都有非常高的重復率。相較于傳統的抽樣數據,已有的研究強調點評數據的全樣本特征,即能夠收集到全部的數據。但是,相對于全數據分析,篩選過程能夠在大幅度減小測算難度的同時,還能保證測算結果的準確率。畢竟全數據分析中的難點集中在對復雜句型的分析,以及對個別詞匯語義的識別,而這些只占極少的部分。該預處理過程會優化原始數據構成的表,形成只有一列,每行都只有一個簡單句的新表。
雖然經過預處理后的數據變得比較規整。但是對于這類半結構化文本的量化分析依舊需要一個向結構化轉變的過程。具體轉化過程采用的是分批次抓取的方法,依照詞頻分析建立的詞庫。依次抓取簡單句中的名詞、副詞和形容詞。該抓取過程會讓預處理后的表單,變更為表單包含四列數據的結構,第一列保留預處理后的簡單句,第二列為從前面保留的簡單句中抓取到的名詞,第三列為抓取的副詞,第四列為抓取的形容詞。
整個數據的處理到這里就基本完成,剩下的就是對照數據字典和分值表單,計算每一條簡單句對應的分值。該過程會在原有表單中開辟出新的一列,用于闡釋該簡單句的得分情況。最后。再對每個評價指標所對應的所有簡單句的分值進行匯總。得出相應評價指標的得分,進而實現對游客旅游體驗質量的測量。
四、實驗分析
根據已有構建的旅游體驗評價指標體系,本研究選擇利用上述基于數字足跡的分析方法測算旅游體驗的一級構成指標,即住宿體驗水平。實驗選取九寨溝景區作為游客旅游體驗的目的地,其附近的酒店旅館就成為制約游客住宿體驗的最主要因素。通過對九寨溝周邊酒店的網絡點評內容的分析能夠客觀的測算出游客的住宿體驗水平。
本研究通過數據采集工具從攜程網采集了九寨溝附近幾家酒店的用戶點評數據,選擇標準為點評記錄超過500條。通過詞頻分析歸納出5個反映住宿體驗的二級指標,分別是地理交通、外部環境、服務水平、酒店設施。并分別建立與這些二級指標相對應的詞庫,基本結構見表1。
采集到的原始點評數據無法直接用于分析,本研究對其進行了必要的分句和篩選處理。首先,將包含逗號、多個句號的點評記錄提取出來,根據符號位置將其拆分為多條短句。重復上述過程,直至每行記錄都是簡單句為止。然后,將每條簡單句與名詞詞庫進行比照,剔除掉不包含高頻名詞的簡單句。預處理過程見圖1。
經過預處理的數據無法直接用于量化分析,本研究還利用抓取的方式將其轉化為結構化數據。轉化后的數據結構見表2.對照權重表,依次為每一條簡單句打分,分值區間為0至5分,其中0分最差,5分最優。在此基礎上,將所有簡單句的分值加總,再平均。得到游客旅游體驗的一級指標住宿體驗的得分。最終,得到九寨溝游客旅游體驗的一級指標住宿體驗的得分為4.836分。
為了驗證該方法的有效性,本研究同時還做了一組對比試驗。利用隨機抽樣的方式,從樣本中抽取出300條點評記錄,采用人工分析的方式,對照權重表,依次計算出每條點評記錄的分值,最后再進行匯總求平均值。這種方法得到的九寨溝游客旅游體驗的一級指標住宿體驗的得分為4.815分,兩種方法的誤差只有0.4%。比照結果表明基于數字足跡的旅游體驗測量方法有很高的準確度。
五、研究結論
本研究在分析已有旅游體驗測量方法和數字足跡特點的基礎上。提出一種基于數字足跡的旅游體驗測量方法。經過數據采集、預處理、抓取和評分等過程,將半結構化數據轉化為結構化數據,實現對游客旅游體驗評價指標的測量。本研究還以九寨溝為例,實證檢驗了該方法的測量結果,并通過對比實驗的方式,比較了基于數字足跡的測量方法與傳統的人工逐條分析方法的效果。實驗結果顯示新方法與人工方法的測量準確度相差無幾,證明了基于數字足跡的旅游體驗測量方法的有效性和準確性。