龍 睿, 吳旭云
(上海師范大學(xué) 旅游學(xué)院, 上海 200233)
旅游產(chǎn)業(yè)是近年來發(fā)展最為迅猛的產(chǎn)業(yè)之一,對旅游景點不同時段的游客數(shù)量進(jìn)行準(zhǔn)確預(yù)測,既可以整合分配景區(qū)各種資源,減少人力、物力資源的浪費,又能夠有效避免由于游客過多而導(dǎo)致景區(qū)的準(zhǔn)備工作不足,最終給游客帶來不良旅游體驗的風(fēng)險[1].為了將游客數(shù)量預(yù)測活動量化處理,引入了旅游景點人氣指數(shù)指標(biāo),通過對該指標(biāo)變化趨勢的準(zhǔn)確預(yù)測,而達(dá)到合理控制旅游景點人員流動的目的[2].旅游景點人氣指數(shù)是一個動態(tài)的量化指標(biāo),基于網(wǎng)絡(luò)大數(shù)據(jù)[3]和現(xiàn)代信息技術(shù)[4]采集旅游景區(qū)人數(shù)流通的相關(guān)指標(biāo),并采用特定的方法對這些指標(biāo)數(shù)據(jù)進(jìn)行綜合評定與分類識別,最后能夠相對準(zhǔn)確地預(yù)測出一段時期內(nèi)景點游客數(shù)量的變化情況,協(xié)助旅游景區(qū)管理人員事先做出計劃和安排,并協(xié)調(diào)好控制游客的出行活動.傳統(tǒng)旅游景點游客數(shù)量的預(yù)測方法,多以歷史數(shù)據(jù)和數(shù)據(jù)庫數(shù)據(jù)為預(yù)測基礎(chǔ),并未考慮到區(qū)域差異化程度與其他的影響因素,因此該種預(yù)測方法是一種靜態(tài)的預(yù)測方法,與真實的結(jié)果偏差較大.BP神經(jīng)網(wǎng)絡(luò)方法[5]在數(shù)據(jù)預(yù)測的準(zhǔn)確性上有所提升,但該方法預(yù)測的泛化能力較弱,有時會陷入局部最優(yōu),影響對旅游景點人氣指數(shù)預(yù)測的準(zhǔn)確性.而實際上不同旅游景區(qū)和臨近旅游景區(qū)的區(qū)域差異化程度,對于景點人氣指數(shù)會產(chǎn)生重要的影響,為此本文基于旅游區(qū)域差異化理論,對景點旅游人數(shù)的空間分布進(jìn)行聚類分析,將各個影響因素和空間聚類結(jié)果輸入極限學(xué)習(xí)方法模型,能夠準(zhǔn)確預(yù)測出未來一段時期內(nèi)被研究旅游景點的人氣指數(shù),實驗數(shù)據(jù)結(jié)果也驗證了基于區(qū)域差異化的人氣預(yù)測方法的準(zhǔn)確性和適用性.
旅游景點人氣指數(shù)是指利用最新的技術(shù)手段,在對旅游景區(qū)的各類指標(biāo)進(jìn)行采集之后,通過一定的模型算法計算對其進(jìn)行度量,并對其進(jìn)行綜合性和總結(jié)性的識別和評判,最終以一個較為通用的等級標(biāo)準(zhǔn)來衡量某個景區(qū)或景區(qū)中某個景點的客流量和旺盛程度,根據(jù)這一結(jié)果對旅游景區(qū)人氣趨勢等方面作出預(yù)測,以便給出因地制宜的發(fā)展建議.旅游景區(qū)人氣指數(shù)這一概念是在旅游信息化基礎(chǔ)之上構(gòu)建起來的,是對旅游景區(qū)管理、開發(fā)、治理、游客旅游活動給出宏觀指導(dǎo)和建議的重要指標(biāo)[6].
旅游景區(qū)人氣指數(shù)形成的過程:①從某個景區(qū)或景區(qū)中某個景點中選擇出一批具有代表性的、能體現(xiàn)當(dāng)?shù)靥厣幕穆糜尉包c;②根據(jù)影響人氣指數(shù)的各類因素指標(biāo)對這些旅游景點進(jìn)行信息的采集和整理;③根據(jù)已建立的旅游景區(qū)人氣指數(shù)預(yù)測模型,再通過一定的計算機(jī)算法對結(jié)果進(jìn)行測度,最終形成可發(fā)布的旅游景區(qū)人氣指數(shù)[7].
影響旅游景區(qū)人氣指數(shù)的因素主要有如下幾個方面:①氣象條件,如天氣、溫度、風(fēng)力、能見度、光照強(qiáng)度等;②季節(jié)、節(jié)氣;③節(jié)假日,如周末、法定假日、各類小長假等;④其他條件,旅游景區(qū)所在位置、旅游景區(qū)周邊交通環(huán)境、旅游景區(qū)類型、旅游景區(qū)的特色主題活動、當(dāng)前的影響力,等等.
對影響景區(qū)發(fā)展的因素信息進(jìn)行采集,是預(yù)測旅游景區(qū)人氣指數(shù)的重要工作之一.實現(xiàn)這一過程的前提是旅游產(chǎn)業(yè)的信息化和技術(shù)化,只有滿足了這一條件,才能更好地完成旅游景區(qū)人氣指數(shù)信息的采集和后期的預(yù)測.為了準(zhǔn)確地對旅游景區(qū)人氣指數(shù)進(jìn)行預(yù)測,首先要進(jìn)行旅游景點的區(qū)域差異化水平的測度[8].根據(jù)上文已經(jīng)探討過的影響旅游景區(qū)人氣指數(shù)的各項因素,進(jìn)行有關(guān)于旅游景點的區(qū)域差異化信息的采集.
主要考慮從以下幾個方面進(jìn)行信息采集.
① 旅游景區(qū)當(dāng)前的營業(yè)狀態(tài)信息采集.主要包括各旅游景區(qū)門票銷售情況采集、游客入園情況采集和門票減免信息的采集.這些信息能夠較為直觀地反映出各旅游景區(qū)的客流量和經(jīng)營情況.
② 交通狀況信息采集.主要包括旅游景區(qū)所在的地理位置采集、去往旅游景區(qū)的道路交通實時情況采集、旅游景區(qū)周邊交通便捷度信息采集.
③ 季節(jié)因素和天氣情況信息采集.主要包括季節(jié)因素信息采集、不同天氣狀況對景區(qū)的影響信息采集 (如,陰天、晴天、雨雪天氣、霧、霾等對景區(qū)人氣的影響)、能見度信息采集、旅游景區(qū)常年溫度變化信息采集、旅游景區(qū)常年風(fēng)力變化狀況信息采集、旅游景區(qū)常年空氣濕度變化狀況信息采集、旅游景區(qū)紫外線強(qiáng)度信息采集等.
④ 旅游景區(qū)優(yōu)惠活動信息采集.主要包括旅游景區(qū)固有的特色景色信息數(shù)據(jù)采集、某一特定時期旅游景區(qū)特色旅游活動信息采集、某一特定時期旅游景區(qū)優(yōu)惠活動信息采集等.
通常來說,對于上述各方面的信息采集方式選擇性較多.如:對旅游景區(qū)營業(yè)狀態(tài)信息的采集可通過匯總各個景點的售票終端的信息而得到.對旅游景區(qū)周邊交通便捷度信息的采集,可以通過多媒體呼叫中心實時傳播方式得到.季節(jié)因素和天氣變化情況的信息采集相對來說比較方便,由于目前氣象服務(wù)的范圍較廣、實時性較好,因此可以通過與氣象臺等單位取得聯(lián)系而得到[9].
為了使區(qū)域差異化分析結(jié)果更加清晰和直觀,本文先選用了多個指標(biāo)進(jìn)行測量和研究,這些指標(biāo)包括不同區(qū)域旅游景點樣本數(shù)據(jù)之間的極差x1、標(biāo)準(zhǔn)差x2、變異系數(shù)x3、集中指數(shù)x4、景點所在地區(qū)的經(jīng)濟(jì)發(fā)展水平x5、景點所在地經(jīng)濟(jì)發(fā)展速度x6.這些指標(biāo)構(gòu)成指標(biāo)集{xn},n=1,2,3,…,6.其中極差指標(biāo)為樣本數(shù)據(jù)最大值與最小值之間的差值;標(biāo)準(zhǔn)差為各變量值與均值之間的離散程度,離散程度越大表明各旅游景點之間區(qū)域差異化程度越大;變異系數(shù)為標(biāo)準(zhǔn)差與樣本均值之間的比值;地理集中指數(shù)揭示出旅游景點之間的空間集聚程度;旅游景點所在地的地區(qū)經(jīng)濟(jì)發(fā)展水平和經(jīng)濟(jì)發(fā)展速度也是影響區(qū)域差異化水平的重要因素.聚類分析方法是一種研究區(qū)域差異化程度的有效方法之一,按照樣本數(shù)據(jù)的特征,建立多元統(tǒng)計分析模型.將旅游景點相關(guān)的樣本指標(biāo)進(jìn)行整理,并通過歐式平方距離方法獲得相關(guān)的系數(shù)矩陣.

(1)
其中,ci和cj分別代表旅游景點所在地區(qū)與鄰近的地區(qū),Dij為i地區(qū)和j地區(qū)之間的歐式距離,也是區(qū)域差異化的空間聚類結(jié)果,D為平方歐式距離.以研究樣本指標(biāo)xn之間的空間距離作為極限學(xué)習(xí)方法模型的輸入項,就能夠?qū)崿F(xiàn)對旅游景點的區(qū)域差異化測度和人氣指數(shù)的預(yù)測.
由于旅游景點的人氣指數(shù)分布具有明顯的動態(tài)性特征,明確了旅游景點之間的區(qū)域差異化程度,有助于提高對旅游景點人氣指數(shù)的預(yù)測精度.旅游景點游客人數(shù)統(tǒng)計分布的相關(guān)歷史數(shù)據(jù)信息不完備,因此在研究區(qū)域差異理論的基礎(chǔ)上,本文構(gòu)建了一種極限學(xué)習(xí)方法模型,實現(xiàn)對無序性人氣指數(shù)分布數(shù)據(jù)的準(zhǔn)確預(yù)測.
文章通過旅游景點的差異度測量,能夠掌握臨近景點的區(qū)域差異度水平對當(dāng)?shù)芈糜尉包c差異度的影響,但當(dāng)?shù)鼐包c本身的一些影響因素也會制約人氣指數(shù)預(yù)測的準(zhǔn)確性.這些影響因素主要包括景點營業(yè)狀態(tài)y1、景點周圍的交通狀況y2、季節(jié)因素y3、天氣因素y4、促銷互動y5.將景點之間的差異度指標(biāo)集合xi和景點內(nèi)部的影響因素集合yi,進(jìn)行數(shù)據(jù)匯總和預(yù)處理并測量人氣指數(shù)的未知度.令zn為樣本景點的集合,λik表示k個影響景點人氣指數(shù)的監(jiān)測值,λik的值可以通過對xi和yi指標(biāo)值的綜合評價得出,用矩陣形式可以表示為

(2)
經(jīng)過預(yù)處理后的人氣指數(shù)監(jiān)測值集合λik,可以作為原始數(shù)據(jù)輸入極限學(xué)習(xí)模型,并準(zhǔn)確預(yù)測出不同的旅游景點未來一段時間的旅游人氣指數(shù)的變化趨勢.
極限學(xué)習(xí)方法是一種針對前饋神經(jīng)網(wǎng)絡(luò)的監(jiān)督型學(xué)習(xí)方法,與傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型不同,該方法將經(jīng)過預(yù)處理后的人氣指數(shù)監(jiān)測值輸入網(wǎng)絡(luò)輸入層之后,輸入層與中間隱含層的權(quán)值系數(shù)就不再變動,因此只要事先確定好隱含層的神經(jīng)元數(shù)目,就能夠獲取到一組唯一的最佳預(yù)測值.極限學(xué)習(xí)方法彌補(bǔ)了原有神經(jīng)網(wǎng)絡(luò)預(yù)測方法泛化能力弱的缺點,具有更快的學(xué)習(xí)速度和預(yù)測精度.極限學(xué)習(xí)方法也克服了傳統(tǒng)尋優(yōu)方法易陷入局部最優(yōu)的不足,能夠準(zhǔn)確地預(yù)測出旅游景點未來一段時間的人氣指數(shù)的變化趨勢.神經(jīng)元是極限預(yù)測方法模型的基本單位,其結(jié)構(gòu)示意圖如圖1所示.

圖1 極限學(xué)習(xí)方法神經(jīng)元的基本結(jié)構(gòu)圖
某個神經(jīng)元上的刺激量為其他臨近神經(jīng)元傳遞過來的刺激量的加權(quán)和,經(jīng)過預(yù)處理后的旅游景點的相關(guān)信息可以作為神經(jīng)元上的刺激量來考慮.極限神經(jīng)元模型是一種單隱層前饋的神經(jīng)網(wǎng)絡(luò)模型,其基本結(jié)構(gòu)相對于傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)模式更為簡潔,有輸入層、輸出層和單隱層組合而成,由于中間隱含層的神經(jīng)元數(shù)目是事先確定的,因此可以根據(jù)不同神經(jīng)元之間的權(quán)重比例指定刺激量的傳遞規(guī)則,輸出層接到單隱層的刺激指示之后輸出最終的旅游景點人氣指數(shù)預(yù)測結(jié)果[10].假定一共有j個樣本監(jiān)測值集合表示為(λj,tj),其中t為監(jiān)測時間變量.

(3)
如果設(shè)極限學(xué)習(xí)方法模型中一共有M個隱含節(jié)點,則此時輸出的神經(jīng)元Oj可以表示為

(4)
其中:g(x)為極限學(xué)習(xí)方法模型的激活函數(shù);wi為中間層的權(quán)重比例;γi為輸出層的權(quán)重比例;μi中間隱含層的神經(jīng)元偏差.極限學(xué)習(xí)模型的最終目的是使對旅游景點人氣指數(shù)預(yù)測值的輸出誤差最小,即滿足下列條件:

(5)
用矩陣的形式表示模型的期望輸出E=H·γ,其中E為期望輸出矩陣,H為中間隱層的節(jié)點輸出矩陣,γ為輸出層的權(quán)重集合,那么極限學(xué)習(xí)模式中間隱層節(jié)點輸出可以表示為

(7)
經(jīng)式(7)求出最優(yōu)的旅游景點人氣指數(shù)期望輸出值

(8)


(9)
其中,H+為極限學(xué)習(xí)模型中間隱含層節(jié)點輸出矩陣的廣義逆.中間隱層是極限學(xué)習(xí)模型中最重要的結(jié)構(gòu),也是實現(xiàn)對旅游景點人氣指數(shù)預(yù)測的關(guān)鍵環(huán)節(jié),由于隱層節(jié)點一旦確定后就不能夠更正,以保持模型在預(yù)測中的準(zhǔn)確度和泛化性能,因此在中間層節(jié)點數(shù)量的選定方面要格外慎重,如果中間隱層的節(jié)點數(shù)量選擇過少,可能會無法充分地顯示出全部景點樣本的特征規(guī)律;如果選擇的節(jié)點過多,不僅運算復(fù)雜,也很難在眾多的期望中識別出最優(yōu)解,影響模式的泛化處理能力.在確定最優(yōu)中間隱含層節(jié)點數(shù)量時,要經(jīng)過多次的嘗試和訓(xùn)練,首先設(shè)置一個數(shù)量較小的節(jié)點數(shù)量,之后在一定的范圍內(nèi)逐漸嘗試增加節(jié)點數(shù)量,使用相同的樣本數(shù)量進(jìn)行反復(fù)迭代循環(huán),在監(jiān)測過程中觀測誤差項的變化情況,在誤差最小的情況下得到的中間隱含層節(jié)點數(shù)量即為最優(yōu)的節(jié)點數(shù)量,節(jié)點數(shù)量k的確定過程如下:

(10)


圖2 基于區(qū)域差異化的模型最優(yōu)拓?fù)浣Y(jié)構(gòu)選擇
旅游景點的人氣指數(shù)預(yù)測過程較為復(fù)雜,會受到景點之間區(qū)域差異性因素的影響,也會受到單個景點交通情況、季節(jié)天氣等因素的影響.為此,本文先基于區(qū)域差異性理論確定出景點之間相互影響的指標(biāo)因素,在對景點內(nèi)部的各個影響因素展開系統(tǒng)分析,將不同旅游景點之間的區(qū)域差異性指標(biāo)因素和內(nèi)部的各個預(yù)處理后的影響因素進(jìn)行匯總分析,形成了監(jiān)測數(shù)據(jù)集合.在人氣指數(shù)預(yù)測方法上,本文選用了具有更強(qiáng)泛化能力和運算簡潔性的極限學(xué)習(xí)方法,該方法由于在初始階段就確定的中間隱層節(jié)點的數(shù)量,因此更適用于指標(biāo)較多的海量模糊數(shù)據(jù)處理.為提高極限學(xué)習(xí)方法的預(yù)測準(zhǔn)確性,對中間隱層的節(jié)點數(shù)量確定過程和模型的拓?fù)浣Y(jié)構(gòu)確定過程進(jìn)行了系統(tǒng)優(yōu)化,能夠降低方法的預(yù)測成本和代價.
旅游景區(qū)人氣指數(shù)的預(yù)測和發(fā)布應(yīng)該是一個連續(xù)、智能的信息采集、分析、預(yù)處理、預(yù)測和發(fā)布的過程,通常存在1~3 h的時間間隔.在旅游旺季,這個時間間隔可能會縮短一半來滿足對旅游市場分析的需求.對于上文旅游景區(qū)人氣指數(shù)預(yù)測模型已得到的數(shù)據(jù),其發(fā)布渠道通常有下面幾種:①利用廣播電視、報紙等傳統(tǒng)的媒體傳播手段,在一個特定的時間或者特定的頻道進(jìn)行發(fā)布;②利用新媒體技術(shù)進(jìn)行數(shù)據(jù)的實時廣播;③利用多媒體數(shù)字接收設(shè)備,如移動端,游客可以根據(jù)自己的需求和意向進(jìn)行查看,即時得到自己所需的旅游景區(qū)的相關(guān)信息.
為驗證基于區(qū)域差異化的旅游景點人氣指數(shù)預(yù)測方法的實際應(yīng)用效果,設(shè)計了1組數(shù)據(jù)對比試驗,參與對比預(yù)測的傳統(tǒng)方法包括基于歷史數(shù)據(jù)庫的預(yù)測方法和BP神經(jīng)網(wǎng)絡(luò)預(yù)測方法.用于試驗的樣本數(shù)據(jù)來源于A自然風(fēng)光旅游景區(qū),在該旅游景區(qū)的200 km半徑范圍內(nèi)還存在3個風(fēng)格不同的景區(qū),因此能夠形成一定程度的區(qū)域差異化影響.首先確定研究對象的實驗周期為2017年6月—2018年5月的12個月時間,每1個月選擇3組人氣指數(shù)預(yù)測值,并與真實采集的人氣指數(shù)預(yù)測值進(jìn)行對比,基于區(qū)域差異化的景點人氣指數(shù)預(yù)測方法的預(yù)測結(jié)果,如表1所示.
從基于區(qū)域差異法的景區(qū)人氣指數(shù)預(yù)測值與真實值的數(shù)據(jù)統(tǒng)計分布情況能夠分析出,3組預(yù)測值與真實統(tǒng)計值的差距較小,誤差能夠控制在2%之內(nèi),此外統(tǒng)計結(jié)果表明A景區(qū)在6—10月的旅游人氣指數(shù)較高,是旅游的黃金季節(jié),臨近景區(qū)影響指標(biāo)因素和景點內(nèi)部的各影響因素,也會對旅游人氣指數(shù)的預(yù)測產(chǎn)生重要的影響.由于基于區(qū)域差異法的旅游景點人氣指數(shù)預(yù)測方法考慮到了多種指標(biāo)的共同影響,同時極限學(xué)習(xí)法還具有較強(qiáng)的泛化能力,因此在預(yù)測準(zhǔn)確性方面能夠獲得較為滿意的預(yù)測結(jié)果.為了從橫向的角度對比不同的旅游景點人氣指數(shù)預(yù)測方法準(zhǔn)確性,對不同預(yù)測方法下,1 a時間內(nèi)各月的旅游人數(shù)進(jìn)行測度,測度結(jié)果分別如圖3~圖5所示.

表1 基于區(qū)域差異化的人氣指數(shù)預(yù)測值與真實值對比

圖3 傳統(tǒng)基于歷史數(shù)據(jù)的各月旅游人數(shù)預(yù)測結(jié)果分析

圖4 基于BP神經(jīng)網(wǎng)絡(luò)方法的各月旅游人數(shù)預(yù)測結(jié)果分析

圖5 基于區(qū)域差異化的各月旅游人數(shù)預(yù)測結(jié)果分析
從3組實驗數(shù)據(jù)的人氣指數(shù)預(yù)測浮點分布圖能夠分析出,基于區(qū)域差異化的景點旅游人數(shù)預(yù)測結(jié)果最為接近真實值走向,可以證明其對景點人氣指數(shù)的預(yù)測效果較好;而傳統(tǒng)基于原始數(shù)據(jù)的預(yù)測方法的偏差較大,因為旅游景區(qū)人氣指數(shù)的影響因素是一個動態(tài)的變化過程,歷史數(shù)據(jù)只能夠作為參考項,而不能夠作為預(yù)測人氣指數(shù)的決定性因素;而BP神經(jīng)網(wǎng)絡(luò)方面在預(yù)測效果上優(yōu)于傳統(tǒng)方法,但優(yōu)于該方法的數(shù)據(jù)泛化能力較弱,只有在個別月份的預(yù)測效果較好,長期預(yù)測不具備優(yōu)勢.
隨著人民生活水平的提高和旅游產(chǎn)業(yè)的發(fā)展,旅游景點的開發(fā)程度越來越高,觀光人數(shù)也呈現(xiàn)逐年攀升的態(tài)勢.但是由于受到景區(qū)之間區(qū)域差異化和旅游景點內(nèi)部各因素的影響,旅游景點的人氣指數(shù)會隨著季節(jié)和時間的變化而出現(xiàn)一定程度的波動,因此準(zhǔn)確預(yù)測旅游人氣的變化情況能夠?qū)崿F(xiàn)景點各種旅游資源的優(yōu)化配置,降低人力成本消耗,更有利于旅游產(chǎn)業(yè)的發(fā)展.針對傳統(tǒng)旅游景點人氣預(yù)測方法的缺點和不足,本文從區(qū)域差異化特征出發(fā),基于極限學(xué)習(xí)方法能夠準(zhǔn)確地預(yù)測出一段時間之內(nèi)旅游景區(qū)人氣指數(shù)的變化情況,預(yù)測的實際效果要優(yōu)于傳統(tǒng)預(yù)測方法.