特征分離編碼的景區短期客流量預測模型

2023-01-31 03:56:58鄒開欣佃松宜王茂寧

計算機工程與設計 2023年1期

鄒開欣，佃松宜，王茂寧,2+

(1.四川大學電氣工程學院，四川成都 610065；2.四川大學計算機學院，四川成都 610065)

0 引言

隨著經濟的快速發展，旅游人數的增加，準確預測景區客流量成為難題。景區管理者掌握到未來客流量，有利于對未來的工作、人員安排做出科學、合理的決策，解決景區交通擁堵、景點人員擁擠等問題，排除安全隱患。景區客流量隨著時間呈現出周期性規律的變化，是一種典型的時間序列，因此建立一個能夠準確預測景區未來客流量的時間序列模型具有重要意義。

預測時間序列的方法有基于經典的統計學方法。Aasim等[1]提出基于自回歸積分滑動平均(autoregressive integrated moving average，ARIMA)和小波變換的混合模型預測短時和超短時風速。Ilie等[2]使用ARIMA方法預測新型冠狀病毒肺炎流行趨勢并在多個國家得到驗證。Li等[3]提出先使用灰度模型計算再使用ARIMA殘差對模型進行修正和驗證的方式預測能源需求的增長。此類方法比較適合于處理平穩時間序列，但是對于處理景區客流量非平穩變化的時間序列有很大的局限性。

最近幾年，由于大量數據的出現和計算能力的提高，對時間序列的研究從傳統的分析方法轉向了機器學習和深度學習方法。機器學習方法能夠較好處理非線性變化的時間序列，得到了廣泛的應用。Sun等[4]將短時交通流時間序列進行相空間重構，使用支持向量機(support vector machine，SVM)對短時交通流量預測，并利用模擬退火算法對花授粉進行優化用以優化SVM的參數。Jia等[5]提出了多任務的最小二乘支持向量機，利用相鄰時間點之間的相關性，構造多個相鄰時間點的學習任務，并在多個時間序列數據集上驗證了方法的有效性。Deng等[6]采用模糊集理論將灌溉功率時序分解成信息粒表征原始數值點集，使用SVM預測信息粒并利用灰狼優化算法調整SVM參數。Hu等[7]整合極度隨機樹、隨機森林(random forest，RF)、極限梯度提升(extreme gradient boosting，XGBoost)、多元線性回歸方法預測船舶燃料消耗，采用貝葉斯超參數優化方法設置模型的超參數值。但是相比于傳統機器學習，循環神經網絡(recurrent neural network，RNN)能夠使用其內部狀態處理輸入序列，更好捕捉輸入序列中的時間依賴，特別是其變體長短期記憶(long short-term memory，LSTM)神經網絡，可以學習到輸入序列中的長時間依賴關系。Yan等[8]將CNN挖掘到的相鄰路口交通流量的空間相關性特征與LSTM挖掘到的交通流量時序特征相結合預測短時交通流量。Zheng等[9]根據交通系統中的時空關系選擇LSTM模型。Xu等[10]提出基于LSTM神經網絡的模型解決無站式共享單車的動態需求問題。Jia等[11]考慮到降雨對交通流量的影響，結合深度信念網絡和LSTM神經網絡學習各種降雨情況下的交通特征預測交通流量。

當使用LSTM做多步預測時，特別是使用單向LSTM，除最后一個LSTM單元以外，中間的LSTM單元并沒有學習到整個輸入序列的信息。此外，雖然LSTM能夠很好學習到輸入序列中的長時間依賴關系，但是當隨著輸入序列的增長，其性能表現也將不可避免的受到影響。近幾年出現的Seq2Seq結構以及注意力機制很好解決了上述問題，為序列建模的問題探索了新的方向。Han等[12]將變道車輛以及周圍車輛視作整體狀態單元，并為狀態單元內的所有車輛加入時空狀態特征來刻畫車輛間的動態行為，采用基于LSTM的編碼器-解碼器結構以及注意力機制預測車輛的變道軌跡。You等[13]對船舶的軌跡和位置特征進行優化，使用基于Seq2Seq結構的模型預測短期船舶軌跡。Zhang等[14]使用t-SNE算法將特征向量降維后再使用K-means算法聚類，采用為每個簇構建帶注意力機制的Seq2Seq模型對功率輸出進行預測。以上方法都取得了不錯的效果，然而很少研究者在景區客流量預測的領域中使用注意力機制和Seq2Seq結構的模型。

本文提出了一種基于特征分離編碼和注意力機制的景區短期客流量預測模型FSEANet，該模型為Seq2Seq結構，不同分布規律的特征擁有各自獨立的編碼器，這些獨立的編碼器對不同類型分布規律的特征信息編碼，然后融合成最終的編碼向量序列。注意力機制幫助解碼器在每一個解碼時刻關注到編碼向量序列中不同重要程度的信息，將編碼向量序列重新組合成一個上下文向量。最終解碼器對上下文向量進行解碼，得到未來的游客數量。

1 特征選擇

景區的客流量與眾多因素有關。節假日時有更多的游客出行游玩，并且游客會根據節假日的長短做出行計劃。此外，游客也會關注景區的天氣情況，選擇在比較適合游玩的天氣時出行。因此，本文選擇日期、天氣、假期信息和游客數量等作為特征并使用Spearman rank相關系數給出各個特征與客流量之間的相關性，見表1。Spearman rank相關系數公式如下[15]

表1 特征與客流量相關性

(1)

其中，ρ代表Spearman rank相關系數， cov(rgx,rgy) 為協方差，σrgx和σrgy為秩變量的標準差。若秩變量是不相同的整數，則可用式(2)

(2)

其中，di=rg(x(i))-rg(y(i))，m為元素個數。Spearman rank相關系數的取值范圍為[-1,1]，相關系數大于0代表客流量隨特征值單調增加，小于0代表隨特征值單調減少，絕對值越接近1代表越接近完全單調相關，越接近0代表相關度越低。從表中可知，年份特征的相關系數大于0，說明客流量呈現出逐年增加的趨勢。此外假期天數與氣溫的Spearman rank相關系數非常接近1，代表這些特征與客流量密切相關，客流量會隨著假期總天數的增加和氣溫的提升而增多，隨著剩余假期的減少而下降。

2 網絡模型與算法

2.1 網絡模型的整體架構

本文提出的FSEAMNet模型如圖1所示。本文網絡主體為Seq2Seq結構[16]。景區數據庫的原始數據進行歸一化處理

圖1 模型框架

(3)

其中，xr代表原始特征，xr min代表原始特征中的最小值，xr max代表原始特征中的最大值，xs代表歸一化后的特征。將具有相同分布規律的特征分離，根據特征的分布規律，采用均勻分布特征編碼器，泊松分布特征編碼器以及非均勻分布特征編碼器對特征編碼。3個編碼器相互獨立，減少了干擾分布規律的影響，提高了編碼器對相同分布特征的編碼能力。編碼器均采用LSTM神經網絡，由于不同特征在時間方向上具有不同的相關性，因此均勻分布特征編碼器與非均勻分布特征編碼器采用單向LSTM神經網絡，泊松分布特征編碼器采用雙向LSTM(Bi-LSTM)。注意力機制提升解碼器對編碼向量的聚焦能力，在不同的解碼時刻為每個編碼時刻的編碼向量分配權重，從而得到關鍵的包含各個分布規律特征的編碼向量表示——上下文向量。解碼器采用同樣的LSTM神經網絡將上下文向量中的信息解碼成游客數量信息。

2.2 特征編碼器

X′p=fc256(Xp)

(4)

X′u=fc256(Xu)

(5)

X′n=fc256(Xn)

(6)

2.3 解碼器與注意力機制

(7)

(8)

(9)

(10)

(11)

3 實驗結果與分析

3.1 景區游客數據及實驗建立

本文選取的數據集是從景區數據庫中獲取的真實數據。該數據集中包含了從陽歷2011-01-02～2017-07-05的數據，包括陽歷年、陽歷月、陽歷日、農歷年、農歷月、農歷日、假期第幾天、假期總天數、氣溫上限、氣溫下限、天氣和游客數量。陰歷考慮到有閏月的情況，本文把閏月定義為閏的月份加0.5，即如果是閏4月，用4.5表示。另外天氣是非數值型數據，因此需要將天氣數據編碼，按照天氣的惡劣程度將天氣編碼。1到6的整數分別代表雪、雨、霧、陰、多云和晴。小數代表天氣的轉變，如5.6代表多云轉晴。

以時間步長為1，滑動窗口為30提取樣本，同時將窗口后預測天數內的游客數量作為該樣本的預測真值，隨機選擇80%的樣本作為訓練集，20%的樣本作為測試集。使用Pytorch v1.6.0在NVIDIA GeForce GTX 1660Ti GPU上訓練模型，訓練的epoch設置為1000，并且在測試集上引入early-stopping機制，避免模型過擬合。使用均方誤差(mean squared error，MSE)為模型損失函數

(12)

此外，使用Adam優化器優化損失函數，學習率設置為0.0002，第一和第二矩估計的指數衰減率指數下降率和分別設置為0.5和0.999。

3.2 評價標準

本文的評價標準從兩個方面考慮，一是從模型的擬合能力方面，考慮均方根誤差(root mean squard error，RMSE)以及平均絕對誤差(mean absolute error，MAE)作為評價標準。二是從實際工程應用方面，使用平均絕對百分比誤差(mean absolute percentage error，MAPE)作為評價標準

(13)

(14)

(15)

3.3 模塊重要性分析

3.3.1 注意力機制的影響

圖2說明了注意力機制對FSEAMNet預測誤差的影響。本文模型在圖中集中于左下角，相比于特征分離編碼的網絡模型(feature separation encoding network，FSENet)各種層數的編碼器和解碼器組合中的預測誤差都有明顯的下降。尤其是在最簡單的編碼器和解碼器層數的組合中，即一層編碼器和一層解碼器，誤差最多下降了65.38%。誤差下降最少也有26.89%，當組合為3層編碼器，兩層解碼器時。圖3展示了不同輸入輸出對的注意力矩陣，行代表輸入時間步長，列代表輸出時間步長。可以看到，不同時間步的輸出對輸入序列的關注部分并不一樣，從圖中可以觀察到輸出序列隨時間步長向后的推移，對輸入序列的關注重點也在向后推移，使得不同時間步的輸出序列能夠捕捉到輸入序列中對當前時刻更有價值的信息。注意力機制的引入使得解碼器獲得了聚焦功能，增強了模型對具有長時間依賴的序列的學習能力。

圖2 注意力機制的影響

圖3 注意力矩陣的可視化

3.3.2 特征分離的影響

圖4說明了特征分離對FSEAMNet預測誤差的影響。與統一編碼的FSEAMNet(FSEAMNet in unified encoding，FUE)相比，所提模型在圖中位置更加靠近左下方，表明模型的預測誤差有了顯著的下降。其中在一層編碼器和一層解碼器的組合中減少最多，誤差最多減少了50.84%。當組合為3層編碼器和兩層解碼器時誤差最少減少有2.57%。結果驗證使用獨立的編碼器對具有不同分布規律的特征分別進行編碼，能夠使編碼器專注于學習和理解具有相似類型的分布特征規律，避免了信息雜亂，讓編碼效果更加出色，預測誤差有效減少。

圖4 特征分離的影響

3.4 景區客流量預測性能比較

本文將FSEAMNet與其它方法作了對比，如RF、XGBoost、LSTM、Bi-LSTM、FSENet以及FUE。表2展示了不同歷史時間窗口各個模型預測性能的細節對比，每個時間窗口最好的結果都加粗顯示。對于傳統方法RF和XGBoost，與更加適合時序問題建模的基于LSTM的模型比較，它們的預測誤差都排在靠前的位置。對于LSTM模型，Bi-LSTM的性能表現略好于單向的LSTM。對于擁有基于LSTM的Seq2Seq結構的FSEAMNet，本文對比了將特征分離編碼但無注意力機制的FSENet，以及不區分特征分布規律但擁有注意力機制的FUE。在所有的歷史時間窗口中，基于Seq2Seq結構的模型的預測結果更加準確，特別是本文提出的FSEAMNet模型，在所有歷史時間窗口中的表現都是最好的。從表中可知，在歷史時間窗口為30時，本文模型在各項性能指標中的表現均為最優，展現了所提模型對于長時間序列優秀的建模能力。在各指標中，最多比RF下降82.80%，比XGBoost下降80.50%，比LSTM下降75.34%，比Bi-LSTM下降73.14%，比FSENet下降65.38%，比FUE下降51.82%。

表2 各模型性能表現對比

3.5 景區客流量預測案例分析

在實際工程應用中，景區會利用所有的歷史數據作為模型的訓練數據，然后用訓練好的模型預測未來一周的客流量，根據預測的客流量做出相應的一系列管理措施。本節模擬了10次獨立的工程應用，即不是對同一周的客流量做重復預測。每一天預測客流量的MAPE如圖5所示。從結果上看，FSEAMNet對未來一周客流量預測的MAPE均小于10%，完全能夠滿足工程上的應用要求。

圖5 預測客流量的MAPE

此外預測時可以大致分為兩種情況，一種情況是未來一周沒有包含節日，另一種情況是未來一周包含了節日的特殊情況。因此，針對這種特殊情況下模型的表現，本文也對FSEAMNet性能表現進行了比較，如圖6所示。在圖6(a)的實驗中，所要預測客流量的日期中沒有包含節日，而在圖6(b)的實驗中，所要預測客流量的日期中第2天到第4天是勞動節。從圖6(c)中可以看到，兩種情況下所提模型的每日MAPE都保持在10%以下，說明模型具有一定的魯棒性，但在無節日的情況時MAPE波動較小，在有節日的情況時，MAPE在節日附近兩天有一定的波動。

圖6 特殊案例

4 結束語

本文提出了適用于真實景區客流量預測的模型FSEAMNet。該模型根據特征的分布規律將特征分離并獨立編碼，泊松分布規律特征采用Bi-LSTM特征編碼器編碼，均勻分布和非均勻分布規律特征采用單向LSTM特征編碼器編碼，解碼器基于單向LSTM，并在加入注意力機制后得到聚焦編碼信息的能力，最后在解碼器的解碼信息中提取到未來客流量信息。在真實的景區客流量數據中對FSEAMNet進行了驗證。所提模型最小RMSE、MAE和MAPE分別為765.77、348.98和4.23，與其它模型相比誤差下降最多達82.80%。在工程案例分析中，每日MAPE均小于10%。實驗結果表明，所提模型能夠較準確的預測景區未來短期客流量，為景區管理者掌握未來客流量變化提供了一種可行的方法。