李俊?胡婷



摘? 要:為了提高物流的配送效率,尋求合理的配送路徑,通過分析短期歷史交通流量,使用集合經驗模態(tài)分解去噪,以擬合優(yōu)度最大化為目標,運用麻雀搜索算法優(yōu)化懲罰參數和核函數參數的最小二乘支持向量機回歸預測短期交通流。結果表明集合經驗模態(tài)分解能有效去除短期交通流中的噪聲,構建的EEMD-SSA-LSSVR模型可以高效地預測短期交通流量。
關鍵詞:麻雀搜索算法;集合經驗模態(tài)分解;短時交通流預測;最小二乘支持向量機回歸
中圖分類號:TP18? ? ? ? ?文獻標識碼:A文章編號:2096-4706(2022)06-0093-04
Short Term Traffic Flow Prediction Based on EEMD-SSA-LSSVR
LI Jun, HU Ting
(School of Business Administration, Chongqing Technology and Business University, Chongqing? 400067, China)
Abstract: To improve the distribution efficiency of logistics and find the reasonable distribution route, the ensemble empirical mode is used to decompose noise signals by analyzing the short-term historical traffic flow. Aiming at maximizing the goodness of fit, the sparrow search algorithm is used to optimize the least squares support vector machine regression of penalty parameters and kernel function parameters to predict the short-term traffic flow. The results show that the ensemble empirical mode decomposition can effectively remove the noise in the short-term traffic flow, and the constructed EEMD-SSA-LSSVR model can effectively predict the short-term traffic flow.
Keywords: SSA; EEMD; short term traffic flow prediction; LSSVR
0? 引? 言
交通狀況直接影響著車輛的行駛速度,因而間接影響著物流的配送效率。本文在時變路網下冷鏈低碳物流路徑優(yōu)化研究和重慶市物流發(fā)展水平與農業(yè)現代化測度及其時空耦合協調研究這兩個課題中,發(fā)現道路交通流預測對路徑優(yōu)化和區(qū)域經濟發(fā)展至關重要。因此本文使用麻雀搜索算法優(yōu)化最小二乘支持向量機回歸的參數以提高交通流預測準確度。
1? 模型構建
1.1? 集合經驗模態(tài)分解
集合經驗模態(tài)分解(Ensemble Empirical Mode Decomposition, EEMD)是由Wu等[1]在2009年提出的一種噪聲輔助數據分析方法。EEMD首先將白噪聲wj(d)引入到初始數據I(d)中,如式(1)。其次對含噪數據Ij(d)進行分解得到第j個本征模函數(intrinsic mode function, IMF)集。在EEMD的第j輪分解過程中,帶噪的Ij(d)被分解為IMFsj,k(d)和殘差rj,k(d),如式(2)。當完成N輪分解后,求解N組IMF的平均值獲得最終IMF集,如式(3)所示:
Ij(d)=I(d)+wj(d)(1)
(2)
(3)
其中,j表示第j次分解,滿足0(4)
1.2? 最小二乘支持向量機回歸
對于一個給定的學習樣本集,,利用非線性映射φ把數據集從輸入空間映射一個高維特征空間,以使輸入空間中的非線性擬合問題變成高維特征空間中的線性擬合問題[2]。高維特征空間的線性回歸函數如式(5)所示。式中,w為權值矢量,b為偏置。
f (x)+wTφ (x)+b(5)
LSSVM選擇誤差ξi的二次項,優(yōu)化問題和約束條件為:
(6)
St.yi=wTφ(xi)+b+ξi,i=1,2,…,l (7)
式(6)中,ξi表示誤差,C為容錯懲罰因子,定義Lagrange函數:
i=1,2,…,l (8)
根據庫恩-塔克(KKT)條件可得:
,,αi=Cξi,(9)
消去變量w和ξ可得到如式(10)的線性系統(tǒng)。式中,lv=[1,…,1]T,Ωij=φT(xi)φ(xj)。
(10)
采用最小二乘法求解上面的線性方程組得到回歸函數為:
(11)
引入核函數K(x,xi)=φT(x)φ(xi),則LSSVR回歸模型見式(12):
(12)
本文K(x,xi)選取徑向基函數。
2? 算法設計
麻雀搜索算法(Sparrow Search Algorithm, SSA)由Xue等在2020年提出[3]。算法中麻雀分為發(fā)現者和加入者,發(fā)現者負責搜索食物和為加入者提供方向,加入者利用發(fā)現者提供的信息獲取食物。麻雀可以在這兩種身份之間相互轉換,但發(fā)現者和加入者的比例不變。
假設在d維空間中存在n只麻雀,第i只麻雀的位置為Xi=[xi1,xi2,…,xid],i=1,2,…,n,xid為第i只麻雀在第d維空間中的位置。f(Xi)=f([xi,1xi,2…xi,d])為麻雀i的適應度,其中f()為適應度函數。在算法迭代過程中,發(fā)現者的位置更新方式如式(13)所示。
(13)
t為當前迭代次數,維度j∈[1,2,…,d],為t次迭代中麻雀i在j維的位置,T為最大迭代次數,隨機數Q服從正態(tài)分布,L為1×d的矩陣,隨機數α∈(0,1),預警值R2∈[0,1],安全值ST∈[0.5,1]。R2ST表示一些麻雀已經發(fā)現了天敵,并發(fā)出了警報,此時所有麻雀需迅速向安全區(qū)域移動。
(14)
加入者的位置更新方式如式(14)所示。為在第t次迭代中全局最差位置,1×d的矩陣A中每個元素隨機賦值1或-1,A+=AT(AAT)-1。為t+1次迭代中發(fā)現者的最優(yōu)位置。當i>n/2時,適應度值較低的加入者i處于十分饑餓的狀態(tài),需要飛往其他地方覓食。
當麻雀發(fā)現天敵時會發(fā)出報警信號,這些麻雀的位置在種群中隨機產生,如式(15)所示:
(15)
為第t次迭代中全局最優(yōu)位置,步長控制參數β為服從正態(tài)分布的隨機數,隨機數K∈[-1,1]表示麻雀移動方向同時也是步長控制參數,fi為麻雀i的適應度,fw為當前全局最差適應度值,fg為當前全局最優(yōu)適應度值,ε為極小常數。fi>fg表示麻雀處于種群邊緣,易受天敵攻擊。fi=fg表明處于種群中間的麻雀意識到了危險,需要靠近其他麻雀以減少被捕食的風險。SSA-LSSVR短期交通流預測的適應度函數為擬合優(yōu)度,如式(16),其中yi為真實值,為預測值,為均值。算法流程圖如圖1所示。
(16)
3? 短期交通流預測
交通數據來自明尼蘇達州交通部數據研究實驗室(http://www.d.umn.edu/~tkwon/TDRL-Software/Download.html)。數據是位于I-35W上S64站點的341號、342號和343號探測器2016年1月1日至2016年1月15日(15天)的平均值,站點位置如圖2所示。數據每隔5分鐘測量一次。數據集分為訓練集和測試集,分別為14天和1天。實驗采用PyCharm IDE編程,在Windows11 X64操作系統(tǒng)、AMD Ryzen 75800H CPU、16 GB內存環(huán)境下運行。本文麻雀種群規(guī)模為30,迭代次數為50,發(fā)現者比例為20%,預警麻雀比例為10%,預警值為0.6。
3.1? 數據預處理
3.1.1? 時序相空間重構
設時間序列數據為[T1,T2,…,Tn],建立滑動窗口如式(17)所示,參考文獻[4],本文m=5。
,(17)
3.1.2? 數據標準化
由于LSSVR的假設建立在數據集是正態(tài)分布的基礎上,因此采用Z-score規(guī)范化,將原始交通流映射到均值為0,標準差為1的分布上,見式(18),其中μ為均值,δ為方差[5]。
z=(Xi-μ)/δ(18)
3.2? 集合經驗模態(tài)分解
采用EEMD分解得到的IMF函數如圖3所示。根據波動頻率和瞬時頻率,將IMF1和IMF2作為噪音去除,將IMF3-11求和重構為去噪交通流。以2016年1月15日的交通流為例,由圖4可知,去噪后的交通流曲線更加平滑。
3.3? 預測結果比較
四種模型的預測結果如表1所示,預測效果如圖5至圖8所示。使用默認參數的LSSVR預測原始交通流,擬合優(yōu)度R2為0.776 07。使用SSA優(yōu)化LSSVR的懲罰系數C和核函數參數gamma預測原始交通流,擬合優(yōu)度R2增加,均方誤差MSE減小,擬合效果提高。優(yōu)化后的懲罰系數C和核函數參數gamma分別為0.286 000 42和0.212 426 08。SSA-LSSVR的收斂曲線如圖9所示,發(fā)現收斂曲線呈階梯型,SSA在第12代收斂。
為降低噪聲對預測的影響,使用EEMD對原始交通流去噪,再使用LSSVR預測去噪后的交通流,擬合優(yōu)度R2為0.996 78。相比原始交通流預測,去噪后的預測效果明顯提升。最后,使用SSA優(yōu)化LSSVR的懲罰系數C和核函數參數gamma預測去噪后的交通流,擬合優(yōu)度R2增加,為0.996 93;均方誤差MSE減小,為0.034 47,進一步提高了LSSVR的預測效果,優(yōu)化后的懲罰系數C和核函數參數gamma分別為18.939 801 07和0.652 176 03。
SSA-EEMD-LSSVR的收斂曲線如圖10所示,發(fā)現SSA在第8代收斂,相比原始交通流預測,去噪后算法收斂速度更快,尋優(yōu)精度更高。
4? 結? 論
針對短期交通流非線性、含噪性的特點,本文使用集合經驗模態(tài)分解去除短期交通流中的噪音,提高了短期交通流預測的準確率;其次,本文使用麻雀搜索算法優(yōu)化最小二乘支持向量回歸的懲罰參數和核函數參數,可以減少試參的盲目性并提高模型預測的精度。
參考文獻:
[1] WU Z H, HUANG N E. ENSEMBLE EMPIRICAL MO DEDECOMPOSITION:ANOISE-ASSISTED DATA ANALYSIS METHOD [J].Advances in Adaptive Data Analysis,2009,1(1):1-44.
[2] SUYKENS J A,VANDEWALLE J,MOOR B D. Optimal control by least squares support vector machines [J].Neural Networks,2001,14(1):23-35.
[3] XUE J K,SHEN B. A novel swarm intelligence optimization approach:sparrow search algorithm [J].Systems Science & Control Engineering,2020,8(1):23-24.
[4] 曹成濤,徐建閩.基于PSO-SVM的短期交通流預測方法 [J].計算機工程與應用,2007(15):12-14.
[5] ZHANG Q Y,QIAN H,CHEN Y P, et al. A short-term traffic forecasting model based on echo state network optimized by improved fruit fly optimization algorithm [J].Neurocomputing,2020,416:117-124.
作者簡介:李俊(1998—),男,漢族,江西九江人,中級物流師,碩士研究生,研究方向:智能算法;胡婷(1996—),女,漢族,四川遂寧人,碩士研究生在讀,研究方向:智能算法。
收稿日期:2022-02-09
基金項目:重慶工商大學研究生創(chuàng)新型科研項目(yjscxx2021-112-14、yjscxx2021-112-15)