盧海鵬, 韓 瑩, 張 凱, 張齡允, 丁昱杰
(南京信息工程大學 自動化學院, 南京 210044)
目前, 交通流預測模型中最常見的模型就是統計模型和機器學習模型. 其中統計模型中典型的代表是差分自回歸移動平均(autoregressive integrated moving average, ARIMA)模型. 文獻[3]用ARIMA 模型在周期性交通流數據下進行短時交通流預測; 文獻[4]指出ARIMA 模型適合于線性的數據預測, 對于非線性強度較高的交通流預測有一定的局限性. 鑒于此情況,適合非線性的機器學習被廣泛地應用到交通流預測中.支持向量機(support vector machine, SVM)是傳統機器學習中最常見的模型. 文獻[5]利用SVM 模型預測異常狀態下的交通流, 證明了SVM 模型能夠提高預測精度. 但是, 研究表明機器學習難以捕捉交通流序列長期記憶的特點, 從而影響機器學習預測精度.
近些年, 隨著人工智能的發展, 深度學習已經成為當前研究的熱點, 被廣泛地應用于交通流預測領域. 文獻[6,7]將長短時記憶網絡(long-short term memory networks, LSTM)應用于交通流預測, 通過LSTM 對交通流數據中的特征進行提取, 從而更好地表示交通流數據的非線性, 達到更好的預測結果. 為了提高交通流預測模型的準確性和泛化性, 文獻[8]提出了基于模糊分析的LSTM 交通流預測. 文獻[9]利用卷積神經網絡(convolutional neural network, CNN)與LSTM 相結合的深度結構, 構建二者相結合的復合模型, 通過捕獲交通網絡的時空相關性進行有效的預測. 文獻[10]在CNN-LSTM 模型基礎上加入了注意力機制(attention mechanism), 利用注意力機制重新分配權重的特點, 進而提高了預測精度. 在交通流時間序列中, 考慮前向和后向數據的變化規律有助于提高模型的擬合精度, 文獻[11]利用雙向長短時記憶網絡(bi-directional longshort term memory, BiLSTM)模型對高速公路交通流進行預測, 結果表明BiLSTM 模型預測精度優于LSTM模型預測精度. 文獻[12]為了充分發揮CNN 對空間特征的選擇提取能力, 同時利用BiLSTM 提取時間特征,構建CNN-BiLSTM 復合模型, 通過實驗證明該模型的預測值與真實值更貼合, 證明了BiLSTM 挖掘數據特征能力比LSTM 更強, 對于復雜的回歸問題具有較好的擬合性能. 深度學習模型結構復雜, 層數較多, 容易陷入局部最優的情況, 從而影響預測精度, 很難滿足短時交通流預測.
為了解決上述問題, 2018 年寬度學習系統(broad learning system, BLS)的提出被廣泛應用于各類預測領域, 從理論上證明了BLS 在時間序列的預測上具有良好的函數逼近能力, 且通過實驗證明了BLS 在回歸性能上表現優異[13]. 文獻[14]利用KNN 篩選出時空相關性高的K個路段, 將選取的路段交通流輸入到BLS網絡中進行預測, 預測效果都顯著的提高.
ITS 中短時車流量的數據均會存在一定量的噪聲,為實現數據的準確預測, 可在數據處理時采用信號分解的方式. 文獻[15]通過多種分解算法對交通流數據進行分解, 以此降低數據中的噪聲對預測結果的影響,接著使用K 均值聚類將分量進行聚類, 之后通過BiLSTM對交通流進一步的預測. 結果表明, 經變分模態分解算法(variational mode decomposition, VMD)分解后的預測精度更高.
雖然上述方法都取得了較好的預測結果, 但都沒解決深度學習帶來局部最優的問題.本文的創新點是在交通領域首次引入BLS 與深度學習結合, 通過其得到全局最優解, 解決深度學習易陷入局部最優從而影響預測精度的缺點. 同時考慮到交通流數據的噪聲干擾, 引入了VMD 進行降噪處理. 基于此, 本文提出基于VMD-BiLSTM-BLS 模型的短時交通流預測. 為了證明本文模型預測的準確性和可應用性, 選取了美國加利福尼亞州交通局PeMS (performance measurement system)交通數據庫實測的交通流數據進行實驗. 通過對比基線模型、消融模型以及現有模型, 結果表明: 本文模型在預測精度方面顯著提升. 另外值得指出的是,本文提出的深度學習和寬度學習相結合的預測模型不但可以應用于交通領域, 其在金融、氣象、海洋等需要大量時間序列分析預測等領域也有廣泛的應用前景.
2014 年Dragomiretskiy 等[16]提出了變分模態分解, 解決了經驗模態分解中存在的端點效應和模態分量混疊的問題. 具體分解步驟如下:


LSTM 網絡在循環神經網的基礎上增加了輸入門、輸出門和遺忘門, 通過這3 個門, LSTM 模型解決了循環神經網絡中長序列依賴的問題. LSTM 數學原理運算公式如式(7)-式(11)所示.
在衛可S溶液中加入液態的單丙二醇(MPG)可將其結冰點降至-10℃,同時不會影響其功效,從而確保建筑物和場地入口處的屏障控制設備,例如腳踏消毒盆和車輛噴霧消毒在嚴冬季節仍可保持液態?!靶l可S和衛可LSP都為畜牧生產商和養殖戶提供了可靠的消毒性能和適用性,可以滿足現實中的農場條件需求,從而成為各個季節保障圈舍、各類表面、設備、車輛和鞋類物品生物安全的首選消毒劑?!盋ho補充道。

BiLSTM 是由前向LSTM 和后向LSTM 構成, 進行雙向訓練, 既保留了LSTM 能夠處理長時間序列的特點, 又考慮到了前后數據變換的影響, 提高了特征提取的全局性, 對于復雜的回歸問題具有較好的擬合性能. BiLSTM 的結構圖如圖1 所示.

圖1 BiLSTM 結構圖
在隨機向量函數鏈接神經網絡的基礎上提出BLS,消除了局部最優的缺點. 圖2 為BLS 結構系統圖. 流程步驟如下.


圖2 BLS 結構系統圖
通過上述分析, 本文集聚了深度學習和寬度學習系統的優勢, 并引入了VMD 模塊進行降噪處理, 提出了VMDBiLSTM-BLS 組合預測模型, 模型結構如圖3 所示.

圖3 VMD-BiLSTM-BLS 模型結構圖
由圖3 可以看出, 本文模型由車流量序列預處理、網絡訓練預測、預測輸出3 個模塊構成. 具體步驟如下:
步驟1. 車流量序列預處理. 由于每天會出現上下班高峰期, 車流量原始序列可能存在奇異值, 為了減少奇異值對數據造成不必要的影響及加快梯度下降, 本文首先將原始序列進行歸一化處理, 其歸一化公式如式(15)所示. 接著為了減少噪聲對該模型預測結果的影響, 將歸一化之后的序列進行VMD 分解, 得到多個不同頻率下的子序列.




圖4 BiLSTM-BLS 連接圖
本文車流量數據來源于美國加利福尼亞州交通局PeMS 交通數據庫實測的交通流數據, 本文選用的交通流數據是從2016 年1 月4 日至2016 年2 月16 日內工作日的1 車道點每5 分鐘統計一次的交通流, 共7 776組數據.
根據本文數據集的特點, 將27 天7 776 組數據,前90%作為訓練集, 后10%作為測試集. 為了提升數據的平穩性, 設置時間滑動窗口為6. 利用VMD 把原始序列分解為5 個子序列, 將子序列轉換為三維的張量輸入給BiLSTM 網絡, 為了防止過擬合在每層的BiLSTM 后加上Dropout 機制. 再通過全連接層, 將其輸出作為BLS 層的特征節點, 特征節點經過激活函數非線性變換生成增強節點, 更新權重及其偏置. 本實驗是基于深度學習框架Keras 實現的, 通過多次重復實驗, 選取了最優情況的數值. 具體的參數見表1. 其中Alpha 為懲罰因子,K為分解的模態數, Tol 為收斂準則容忍度, N1 為每個映射特征節點個數, N2 為映射特征個數, N3 為增強節點個數,C為正則化參數.

表1 VMD-BiLSTM-BLS 模型參數表


將原始序列進行VMD 分解, 得到5 組頻率尺度不同的子序列, 圖5 是交通流數據分解圖. IMF0 為趨勢分量, 反映了交通流序列的總體變化趨勢. IMF1-IMF4為波動分量, 反映了曲線的隨機波動細節. 分解的序列與原始序列相比, 平穩性和平滑性方面表現更好, 相似的細節信息更集中, 更加容易擬合.

圖5 交通流數據分解圖
(1)與基線模型對比分析
由于基線模型比較經典, 此外交通流數據存在一定的周期性, 基線模型在具有周期性的數據上預測效果還是有較好表現. 為了驗證本文所提模型的預測能力, 首先將本文模型分別與基線模型ARIMA[3]、SVM[5]進行對比, 評價指標結果如表2 所示. 各個模型的參數都是通過多次實驗采用擬合效果最好的數值.

表2 基線模型與本文模型評價指標對比表
從表2 可以看出, ARIMA、SVM 模型的RMSE都大于15,MAE都大于11, 而VMD-BiLSTM-BLS 模型的RMSE、MAE均沒超2, 且R2_score也達到了0.997 5. 證明了本文模型在預測精度上明顯要比基線模型預測精度高, 這是由于基線模型無法挖掘出復雜、非平穩時間序列的特征.
(2)與消融模型對比分析
其次, 將本文模型與消融模型BiLSTM-BLS、VMDBiLSTM[15]進行對比分析, 其中VMD-BiLSTM 也是最新的模型. 評價指標結果見表3.

表3 消融模型與本文模型評價指標對比表
通過表3 可以看出, 本文模型與BiLSTM-BLS、VMD-BiLSTM 相比,RMSE分別下降了8.287 7、4.050 4,MAE分別下降了5.999 9、3.618 6, 且R2_score分別提高了5.8%、2.13%, 預測效果顯著提升. 這是由于本文模型, 集聚了VMD 去除數據噪聲的作用, BiLSTM 充分考慮前后向數據的影響, BLS 解決局部最優的優勢.
(3)與現有模型對比分析
最后, 為了驗證本文模型本文模型預測精度有所提升, 分別與現有模型BiLSTM[11]、當前研究較熱的CNN-BiLSTM[12]模型以及最新模型, 含有注意力機制(attention mechanism)的CNN-LSTM[10]模型進行對比分析, 評價結果如表4 所示.
從表4 可以看出, 本文模型的3 個評價指標明顯優于現有模型BiLSTM, 其中CNN-BiLSTM 模型與BiLSTM 模型相比,RMSE下降了1.009 5,MAE下降了0.865 4, 這是由于CNN-LSTM 不僅提取了時間特征, 還挖掘了空間特征, 可以提升預測精度. 在此基礎上加上注意力機制的模型, 預測精度再次提升, 這是由于注意力機制進行權重新分配, 提高了預測精度. 本文模型與CNN-LSTM-Attention 相比,RMSE、MAE分別下降了5.784 6、4.991 1,R2_score提升了3.71%, 驗證了本文模型預測效果要優于最新模型.

表4 現有模型與本文模型評價指標對比表
(4)可視化對比分析
為了更加直觀地驗證本文模型的有效性, 選取測試集中最后一天的交通流原始序列進行擬合分析, 圖6-圖10分別給出了本文模型與其他模型的預測結果對比圖.

圖6 BiLSTM 模型預測值與真實值對比圖
從圖6、圖7 中可以直觀的看出VMD-BiLSTM模型相對于BiLSTM 模型擬合效果有所提高, 這是由于原始序列經過VMD 分解之后, 得到不同頻率的子序列, 降低了噪聲對原始數據造成不良的影響, 使得擬合程度增強. 從圖6 和圖8 可以看出, 在上班高峰期的時候BiLSTM 模型擬合效果不如BiLSTM-BLS 模型,從而驗證了BLS 解決了局部最優的問題, 提高了預測的準確性. 分析圖7 和圖8, 可以明顯地看到, 不管是VMD-BiLSTM 模型還是BiLSTM-BLS 模型在波峰和波谷的時候擬合效果并不是很理想, 但是從圖9 可以看出VMD-BiLSTM-BLS 模型明顯改善了波峰和波谷不準確性的問題. 通過對圖9 和圖10 進行對比, 可以看到在8 點到15 點的時候, VMD-BiLSTM-BLS 模型擬合效果要比現有模型中較火的CNN-BiLSTM 模型明顯提高.

圖7 VMD-BiLSTM 模型預測值與真實值對比圖

圖8 BiLSTM-BLS 模型預測值與真實值對比圖

圖9 VMD-BiLSTM-BLS 模型預測值與真實值對比圖

圖10 CNN-BiLSTM 模型預測值與真實值對比圖
通過以上實驗的對比結果來看, 本文所提出的VMD-BiLSTM-BLS 模型在評價指標RMSE、MAE、R2_score均達到比較好的結果, 對短時交通流的預測有著良好的預測結果, 改善了現有模型不準確性的問題.
準確的短時交通流預測會給人們的出行帶來極大的便利, 不僅提出合理的出行意見, 而且減少了事故率.準確的短時交通流預測是構建智慧交通的關鍵, 所以準確的掌握短時交通流的發展趨勢, 建立健全的預測系統, 有利于交通部門做出合理的疏導安排.
本文所提出的短時交通流預測模型, 是將深度學習與寬度學習進行結合, 改善了現有模型預測不準確的問題. 將本文提出的模型與基線模型、消融模型以及現有模型進行對比, 實驗結果表明本文所提出的短時交通流預測模型在RMSE、MAE、R2_score三個評價指標上均表現最佳. 實驗表明, 本文所提出的VMDBiLSTM-BLS 模型可以準確地預測短時車流量, 為交通部門提供了有利的參考價值.