陳天宇,張春燕,李,謝雙玉,2
(1.華中師范大學a.地理過程分析與模擬湖北省重點實驗室;b.城市與環(huán)境科學學院,湖北 武漢 430079;2.中國旅游研究院武漢分院,湖北 武漢 430079)
游客在目的地游覽后的體驗結果與其本身對旅游目的地期望對比產生出的心理狀態(tài)被解釋為游客滿意度[1]。旅游地發(fā)展需要從游客滿意的角度多考慮延伸,以此滿足市場競爭加劇下游客日益增長的期望需求[2]。通過游客滿意度來設定游客評價機制,測評旅游吸引力及相關服務水平競爭力的掌握認知,可以促進旅游經濟發(fā)展,提高景區(qū)競爭力,彰顯旅游業(yè)的可持續(xù)發(fā)展價值[3,4]。滿意度研究在旅游學科范疇內發(fā)展迅速,國外學者前期主要將研究視角 聚 焦 于 內 涵 測 度[5-7]、行 為 感 知[8,9],同 時 對 測評模型進行了一定程度的探討[10,11],美國顧客滿意度模型(ACSI)、歐洲顧客滿意度模型(ECSI)和瑞典晴雨表模型(SCSB)是現(xiàn)有較為成熟的模型。國內研究較國外而言,起步較晚,研究熱點多集中在內涵測度[12-17]、影響因子[18-26]及相關實證研究[27-31]中,研究尺度漸漸從宏觀區(qū)域轉為具體旅游地景區(qū),其中省域尺度下的滿意度研究亟需深入。研究方法上主要通過指標體系構建、網絡與實地調研,運用IPA分 析[32-34]、結 構 方 程 模 型[35-40]、模 糊 綜 合 評價[41-43]、回歸分析法[18,44]等常用分析方法對滿意度現(xiàn)狀及相關影響因素進行探究。
縱觀國內外現(xiàn)有的游客滿意度研究,其研究對象囊括到旅游目的地及相關行業(yè)中的旅游產品,在內容對內涵測度進行思考的同時,研究模型及測評系統(tǒng)也日益發(fā)展完善。整體方法由定性向定量轉變,但相比于滿意度研究中不斷被豐富完善的回歸分析方法,數(shù)據挖掘這類高質量聚類分析技術在當今旅游與多學科交融促進的研究背景下應用還相對缺失。關聯(lián)規(guī)則作為一項數(shù)據挖掘技術,在對空間數(shù)據進行挖掘后能夠分析不同事件及現(xiàn)象間各要素存在的關聯(lián)關系,其在土地覆蓋變化、氣象預報、醫(yī)療疾病研究等領域已被廣泛應用[45]。楊鴻雁、周芬芬、田英杰借助關聯(lián)規(guī)則,挖掘出食品安全滿意度中潛在的關聯(lián)信息,并向相關部門提供對策建議[46]。對比現(xiàn)有的研究方法,將關聯(lián)規(guī)則作為研究新視角,分析游客滿意度的優(yōu)勢體現(xiàn)于算法能夠從紛繁復雜的研究內容中尋找出暗含的、不明的、游客存在興趣點的、利于決策潛在價值挖掘的內容思路。通過關聯(lián)規(guī)則,重新排序聚類分析中現(xiàn)存的研究影響因素,廓清更多潛在的影響關系,并通過與現(xiàn)有的研究成果對比,思考深化游客滿意度相關研究[47,48]。
湖北省地處我國中部地區(qū),自然與文化旅游資源豐富。湖北省文化和旅游廳數(shù)據顯示,截至2019年底,全省共有A級景區(qū)412家,其中5A級景區(qū)11家。本文通過關聯(lián)規(guī)則這項數(shù)據挖掘技術,聚類分析了湖北省2019年5A級景區(qū)游客滿意度數(shù)據,探尋了不同5A級景區(qū)間游客滿意度影響因子之間的相互關系,同時為該省旅游景區(qū)的未來發(fā)展提出了對策建議。
數(shù)據來源于湖北省2019年游客滿意度調查工作。調研于2019年10月在湖北省各5A級景區(qū)中進行,數(shù)據獲取采用問卷調查的形式,調研方式為調研員隨機選擇游客進行面對面交談式問卷調查,并當場回收問卷。調查內容主要涵蓋兩方面:一是游客的人口學特征,包括游客性別、學歷、年齡、旅游方式、旅游目的等14個題項(表1);二是游客滿意度維度,包括景區(qū)旅游形象、旅游資源、價格合理性等11個維度,共52個題項的滿意度評價,每個題項提供很滿意、滿意、基本滿意、不太滿意、不滿意和不清楚6個選項供被調查者選擇,并根據李克特五級量表法描述游客滿意度評價的主觀心理感受。

表1 樣本人口學特征描述性統(tǒng)計表(N=2061)
調查共收集問卷2150份,其中有效問卷2061份。其中,武當山景區(qū)294份、黃鶴樓景區(qū)108份、東湖景區(qū)125份、木蘭生態(tài)文化旅游區(qū)175份、清江畫廊景區(qū)199份、三峽大壩景區(qū)260份,三峽人家—屈原故里景區(qū)221份、神農架景區(qū)286份、神農溪景區(qū)38份、恩施大峽谷景區(qū)146份、三國赤壁景區(qū)209份。問卷有效率為95.9%。
20世紀80年代末,國際人工智能大會提出了KDD概念,并在其基礎上衍生出數(shù)據挖掘這一技術。數(shù)據挖掘內涵旨在提煉大量數(shù)據集中具有潛在價值意義的知識,以便從中提取沒有顯露但對策略決定具有參考價值的信息。1993年,美國IBM Almaden Research Center的Rakesh Agrawal等在對KDD研究中提出了關聯(lián)規(guī)則這一重要課題[49]。
①項集:指項的集合,若項集中包含k個項,則稱該項集為k-項集。
②支持度計數(shù):指項集出項的頻率,也是項集中的事務數(shù)。
③支持度(Support):支持度是事務集中同時出現(xiàn)兩個項集的概率,記作P(A∪B)。表示如下:

式中,A、B分別表示兩個項集,D為事務集。
④置信度:置信度是事務集D中,在項集A的項集出現(xiàn)后,項集B也同時出現(xiàn)的概率,記作P(B|A)。表示如下:

⑤頻繁項集:最小支持度是指規(guī)則所必須達到的最小支持度閥值,最小置信度則是必須達到的最小置信度度閾值,規(guī)定將大于最小支持度要求的項集稱為頻繁項集[50,51]。
1994年,Agrawal提出關聯(lián)模型Apriori,該算法主要用于對歷史交易數(shù)據信息的挖掘,通過發(fā)現(xiàn)頻繁模式來提供決策支持。Apriori算法有兩條性質必須了解:一是頻繁項集的任何非空子集也是頻繁項集;二是非頻繁項集的所有超集也都是非頻繁項集[52]。Apriori算法的主要思想是:首先找出所有滿足支持度閾值的頻繁項集,然后遞歸找出所有的頻繁項集,最后通過比較最小置信度閾值,滿足條件的便是有價值的規(guī)則。Apriori算法一般通過采用連接和剪枝的方法來搜尋全部頻繁項集。其中,連接是產生候選項集的流程,剪枝則為去除非頻繁項集的流程[53]。
游客滿意度變量設計(圖1):本文將5A級景區(qū)游客滿意度作為因變量X,將游客的社會屬性特征和旅游目的與方式作為自變量A集,游客對景區(qū)的旅游形象評價作為自變量B集,游客對景區(qū)的旅游資源評價作為自變量C集,游客對景區(qū)價格合理性的評價作為自變量D集,游客對景區(qū)服務水平評價作為自變量E集,游客對景區(qū)管理水平評價作為自變量F集,游客對景區(qū)旅游配套設施評價作為自變量G集,游客對景區(qū)旅游交通評價作為自變量H集,游客對景區(qū)旅游餐飲評價作為自變量I,游客對景區(qū)旅游購物評價作為自變量J,游客對景區(qū)旅游娛樂評價作為自變量K,游客對景區(qū)的總體感受評價作為自變量L。結合調查問卷設計,通過將5A級景區(qū)游客滿意度作為因變量,采用游客對5A景區(qū)中各不同影響因素的滿意度來評價游客感知,將游客期望與游客感知質量作為研究的前提變量,將游客對景區(qū)的總體滿意度、重游意愿、推薦意愿來作為研究的結果變量,考察相關因素對因變量的影響程度。

圖1 游客滿意度變量設計
首先,檢查數(shù)據是否達到挖掘要求,在此基礎上,填補缺失數(shù)據,消除不合格數(shù)據并刪除重復記錄,將合格數(shù)據處理為布爾型,剔除無關指標,統(tǒng)一指標名稱。對數(shù)據進行關聯(lián)規(guī)則時使用Weka、R語言兩個數(shù)據挖掘軟件,旨在豐富數(shù)據挖掘的豐富性和完善性。同時,將兩個軟件得到的數(shù)據互相參考,確保關聯(lián)結果更加準確合理。Weka處理關聯(lián)規(guī)則的步驟為:運用Excel工具對原始數(shù)據進行預處理,采用Python將數(shù)據轉換為CSV格式,排寫為arff格式,運用Weka軟件,通過Apriori算法挖掘數(shù)據信息。R語言處理關聯(lián)規(guī)則的步驟為:運用Excel工具對原始數(shù)據進行預處理,另存為RStudio可以處理的CSV格式;通過RStudio將數(shù)據轉化為“transaction”格式,用于關聯(lián)規(guī)則分析;然后通過Apriori函數(shù),設定相應的Support和Confidence數(shù)值,得到對應的關聯(lián)規(guī)則。
借助Weka及R語言中的Apriori算法,本文將研究結果進行數(shù)據關聯(lián),校驗其關聯(lián)結果,著重分析相關變量間存在的對應關系。通過軟件間關聯(lián)結果比對,充分發(fā)揮Apriori算法的特性,頻繁項目的全部非空子集都必須是頻繁的,從而縮減候選項集,盡量避免生成和計算無法成為頻繁項集的候選項集,獲得對象更少、結果精度更高的候選項集的集合。因此,本文能夠獲取到正確可靠且符合條件的關聯(lián)規(guī)則。
將11個5A景區(qū)預處理后的數(shù)據導入Weka和R語言進行關聯(lián),通過分析不同景區(qū)間關聯(lián),結果發(fā)現(xiàn),湖北省5A景區(qū)中僅有木蘭生態(tài)文化旅游區(qū)和三峽人家兩個景區(qū)頻繁關聯(lián)了各不同影響變量,其他9個景區(qū)的關聯(lián)結果普遍反映出相關變量中游客感知質量重視度的缺失。具體劃分為以下兩類:一類是東湖、黃鶴樓、三國赤壁、神農溪景區(qū)游客對景區(qū)價格合理性相關變量缺乏重視度;另一類是恩施大峽谷、清江畫廊、三峽大壩—屈原故里、神農架、武當山景區(qū)游客對旅游娛樂相關變量間缺乏重視度。在關聯(lián)規(guī)則被不確定選項規(guī)則占據絕大篇幅的情況下,為了使研究更加全面,同時挖掘出更多景區(qū)潛在關聯(lián)信息,在不影響其他選項研究的前提下,本文將景區(qū)中不確定選項數(shù)據剔除處理,再次進行關聯(lián)規(guī)則數(shù)據挖掘。整理挖掘結果后,按照其關聯(lián)特性分為以下3類:以東湖、三峽人家、神農架、武當山景區(qū)為主,突出強調自身重游意愿及推薦親友旅游意愿關聯(lián)景區(qū)其他變量之間的一類(表2);突出強調旅游目的與景區(qū)其他變量關聯(lián)關系的恩施大峽谷、黃鶴樓、清江畫廊、三國赤壁、三峽大壩—屈原故里景區(qū)的一類(表3);景區(qū)其他變量關系頻繁關聯(lián)景區(qū)服務性、娛樂性的木蘭生態(tài)文化旅游區(qū)及神農溪景區(qū)一類(表4)。

表2 重游及推薦意愿與景區(qū)變量關聯(lián)結果構成(以武當山景區(qū)為例)

表3 旅游目的與景區(qū)變量關聯(lián)結果構成(以清江畫廊景區(qū)為例)

表4 景區(qū)服務娛樂性與景區(qū)變量關聯(lián)結果構成(以神農溪景區(qū)為例)
從武當山景區(qū)關聯(lián)結果發(fā)現(xiàn),相關景區(qū)變量中強調愿意重游與推薦親友旅游意愿的頻繁關聯(lián)項主要為宣傳力度、旅游市場秩序、景區(qū)可進入性和內部交通幾個變量,其他3個景區(qū)的頻繁關聯(lián)項各有不同,如東湖景區(qū)為景觀吸引力、景區(qū)可進入性、交通引導標識,三峽人家為餐飲價格、景區(qū)門票價格、景區(qū)客流管理、景區(qū)可進入性,神農架為景區(qū)可進入性、旅游市場秩序、交通引導標識。此類景區(qū)中,旅游市場秩序、景區(qū)可進入性、交通引導標識的出現(xiàn)頻率最高,關聯(lián)性也最強,說明現(xiàn)在越來越多的游客選擇自駕游作為出行方式,景區(qū)為了保證游客在計劃時間內抵達旅游目的地,需要具備良好的交通可進入性和清晰醒目的交通引導標識,同時良好的市場秩序和客流管理能夠方便游客提高自身有效游玩效率,這是影響游客滿意度、重游率和推薦意愿的主要因素。將此類景區(qū)按重游、推薦意愿與景區(qū)其他變量間的相關性為劃分依據將關聯(lián)變量關系列出(表5),發(fā)現(xiàn)愿意重游這項變量與景觀吸引力、景區(qū)可進入性、宣傳力度、餐飲價格、總體滿意度之間頻繁關聯(lián)。重游意愿高的游客普遍傾向于推薦親友來該地旅游,且受教育水平較高的游客能夠在將其他景區(qū)作為比較前提的基礎上給予該景區(qū)合理的評價。景區(qū)要想獲得較高的游客滿意度,需要將豐富的旅游資源與優(yōu)越的旅游交通條件、良好的旅游形象宣傳多關聯(lián),游客在被景區(qū)資源吸引的同時,更突出關注景區(qū)價格的合理性。

表5 以重游及推薦意愿劃分的不同景區(qū)間關聯(lián)變量關系表
分析強調旅游目的與景區(qū)相關性的5大景區(qū),發(fā)現(xiàn)其關聯(lián)結果也不盡相同。在游客同樣選擇旅游目的為觀光游覽的前提下,黃鶴樓景區(qū)內游客頻繁關聯(lián)景區(qū)自身吸引力、游覽價值和環(huán)境衛(wèi)生條件;清江畫廊景區(qū)游客則表達了對景區(qū)可進入性、內部交通和景區(qū)游覽標識的在意;三國赤壁景區(qū)中自駕游占比較高,游客著眼于對旅游停車場的評價;恩施大峽谷和三峽大壩—屈原故里中大部分游客對景區(qū)內部交通與景區(qū)可進入性表示出了較高重視,但恩施大峽谷的游客傾向于關注景區(qū)價格合理性,三峽大壩—屈原故里的游客則側重于選擇景區(qū)旅游娛樂。總結而言,絕大部分選擇觀光游覽的游客,其景區(qū)滿意度中仍將旅游交通這一變量視為旅游關注的重點。以旅游目的與景區(qū)其他變量之間相關性為劃分依據,將不同景區(qū)間關聯(lián)變量關系列出(表6),發(fā)現(xiàn)旅游目的為觀光游覽的游客大多選擇自駕游或親友游,對景區(qū)可進入性、游覽標識與指示牌等方面的關注度較大,愿意主動去了解景區(qū)內價格方面的合理性。

表6 以旅游目的劃分的不同景區(qū)間關聯(lián)變量關系表
最后分析頻繁關聯(lián)景區(qū)服務娛樂性關系的木蘭生態(tài)文化旅游區(qū)和神農溪景區(qū)。木蘭生態(tài)文化旅游區(qū)的關聯(lián)結果顯示,正面的工作人員服務態(tài)度(尤其在購物和餐飲方面)會對游客留下的就餐環(huán)境和食品衛(wèi)生評價產生較大的積極影響,傾斜游客的景區(qū)整體滿意度。三峽人家的關聯(lián)結果體現(xiàn)出重游、推薦意愿主要關聯(lián)交通引導標識、景區(qū)內部交通和旅游市場秩序幾個變量,側面反映出旅游者對旅游交通和市場秩序帶給游客整體旅游感受的感知程度占比。神農溪景區(qū)較為準確的旅游形象定位有利于景區(qū)旅游娛樂的整體提升。符合游客心中景區(qū)旅游娛樂期望,景區(qū)可收獲到更高的總體滿意度。以景區(qū)娛樂服務性和景區(qū)其他變量間的相關性作為劃分依據,將木蘭生態(tài)文化旅游區(qū)和神農溪景區(qū)的關聯(lián)變量關系列出(表7),發(fā)現(xiàn)工作人員服務態(tài)度與景區(qū)票務服務、市場秩序、游覽價值、餐飲服務態(tài)度之間頻繁關聯(lián),工作人員專業(yè)素質與景區(qū)形象定位、旅游市場秩序與相關人員服務態(tài)度、景區(qū)游覽價值也頻繁關聯(lián);景區(qū)娛樂項目的體驗性、娛樂設施的完善性、娛樂活動的趣味性將關聯(lián)性集中在景區(qū)形象定位、游客旅游目的和推薦意愿方面。這從側面反映出游客會根據自身的旅游目的來檢驗景區(qū)形象定位是否匹配,在綜合考量景區(qū)服務管理水平、旅游娛樂體驗的前提下,評估自己對該景區(qū)的總體滿意程度,分析景區(qū)的游覽價值,確定是否推薦該地給親朋好友旅游。

表7 以景區(qū)娛樂服務性劃分的不同景區(qū)間關聯(lián)變量關系表
本文運用關聯(lián)規(guī)則中的Apriori算法對湖北省2019年5A級景區(qū)的游客滿意度數(shù)據進行了研究分析,將游客期望和游客感知質量(住宿、餐飲、娛樂、交通、購物等)作為前提變量,將游客總滿意度、重游意愿和推薦意愿作為結果變量給予關聯(lián)規(guī)則,分析了游客滿意度影響因子之間的關聯(lián)關系。主要結論如下:①對于前提變量中的游客感知質量而言,游客對景區(qū)價格合理性、景區(qū)旅游娛樂兩大變量缺乏重視。②從前提變量與結果變量的關系視角切入發(fā)現(xiàn),前提變量內正面的景區(qū)旅游交通、價格合理性和旅游娛樂各因素評價與滿意的結果變量之間關聯(lián)最為頻繁,突出這幾個變量在游客滿意度中的影響力。游客對景區(qū)的重游和推薦意愿受宣傳力度、景觀吸引力、景區(qū)可進入性、餐飲價格、總體滿意度等因素影響較大。數(shù)據挖掘的結果顯示,游客文化程度越高,景區(qū)旅游宣傳越好、交通越便利,游客重游和推薦意愿越強,總體滿意度越高。近年來游客對旅游交通的重視程度愈發(fā)明顯,選擇自駕游來滿足自身觀光游覽的需要,因此旅游交通對游客滿意度的影響值得景區(qū)思考。③游客會根據自身期望有側重地對滿意度相關自變量做出評價,以此表達自身的滿意度偏好。精準的景區(qū)形象定位有利于旅游娛樂的提升,游客滿意度評價往往更高。同時,景區(qū)工作人員的服務態(tài)度、專業(yè)素質的評價好壞與景區(qū)其他滿意度自變量因子之間相互影響。
從研究方法來看,利用關聯(lián)規(guī)則可找出與傳統(tǒng)回歸方法不同的潛在信息知識,研究分析影響游客滿意度的旅游形象、旅游資源、景區(qū)價格合理性、景區(qū)服務水平、景區(qū)管理水平、旅游配套設施、旅游交通、旅游餐飲、旅游購物、旅游娛樂等不同變量之間的關聯(lián)關系;從研究結果來看,關聯(lián)規(guī)則算法將滿意度中的已知影響變量重新排序,通過關聯(lián)出新的變量組合,提取更多潛在的影響因素,研究滿意度嬗變中的新思路。但由于本文僅使用了2019年的調研數(shù)據,因此挖掘出的結果存在一定的局限性,希望在今后的研究中能夠梳理、挖掘、分析出基于不同年份、不同季節(jié)等信息綜合分析下的更具有效性的關聯(lián)規(guī)則。
一是政府應加強景區(qū)教育和基礎設施方面投入。旅游產業(yè)要素在相互緊密的交織中被不斷擴展,由做大到做強,從規(guī)模增長到高質量發(fā)展,成為當前我國旅游發(fā)展轉型時期的重要思路。旅游的高質量發(fā)展需要地方政府的積極投入。豐富的旅游資源是湖北省景區(qū)發(fā)展的物質基礎,但如何將其合理利用,滿足消費者的心理需求,需要人力資本教育水平程度的提高。游客在進行消費等決策行為時,難免需要專業(yè)人員的建議和解惑;同時,教育與資本環(huán)環(huán)相扣,政府若重視教育和基礎設施方面投入,會對景區(qū)健康發(fā)展產生積極影響。
二是優(yōu)化景區(qū)體驗設計,充分調動游客參與積極性。游客愈發(fā)突出的旅游體驗需求,成為衡量旅游目的地吸引力的重要指標,不僅游客滿意度的結果受游客體驗質量影響較大,游客未來的重游傾向也與之密切相關[54]。針對研究結果反映出的游客對于景區(qū)商品價格、住宿價格、娛樂體驗性和娛樂設施等相關變量缺乏重視這一問題,景區(qū)應從旅游體驗的視角出發(fā),梳理景區(qū)發(fā)展脈絡,優(yōu)化景區(qū)體驗設計,設計出兼具文化特色和創(chuàng)意精神的文創(chuàng)商品,打造出能夠提升游客娛樂體驗特色的景點,帶動商品經濟發(fā)展,調動游客購物和娛樂的積極性。
三是加大景區(qū)形象宣傳力度和旅游交通體系建設。旅游交通方式的發(fā)展會在很大程度上影響旅游目的地的演進[55]。從研究結論可知,在景區(qū)對游客具有吸引力的前提下,旅游交通體系越完善、可進入性越強,形象定位越準確、宣傳力度越大的景區(qū),其游客重游和推薦意愿越高。因此,相關部門應不斷加強景區(qū)形象宣傳力度,努力完善旅游交通體系建設及相關服務配套設施,滿足游客日益增長的需求,推動旅游方式向多樣化、有序化發(fā)展,為景區(qū)發(fā)展注入新活力,幫助游客“發(fā)現(xiàn)好景區(qū),體驗到景區(qū)”。
四是提高景區(qū)形象定位與景區(qū)服務管理關聯(lián)水平。在信息的傳播、獲取都十分便捷的今天,游客可通過各種不同的渠道來輔助自己做出旅游決策。因此,如何在日益競爭激烈的旅游市場中嶄露頭角,需要旅游景區(qū)廓清自己的形象定位。關聯(lián)結果中,游客在檢驗景區(qū)形象定位的同時也在對景區(qū)對服務管理水平做出評價,兩者相輔相成、互相促進。如果從根本的游客意愿出發(fā),在同一形象標準上,努力提高景區(qū)形象定位與景區(qū)服務管理的關聯(lián)水平,可用人情氣質來填補市場空隙和消費者心理空白,以此提高景區(qū)游客滿意度。