楊國亮,溫鈞林,賴振東,張 碩
(江西理工大學 電氣工程與自動化學院,江西 贛州 341000)
交通流預測是智能交通系統中不可或缺的組成部分。準確的交通流預測能幫助交通管理部門提前預知交通擁堵等情況,事先做出相應的措施,提高路網的工作效率,降低事故發生的風險。
隨著深度學習的發展,人工智能在交通預測領域取得了一系列突破。LSTM[1],GRU[2]等循環神經網絡模型比HA,ARIMA[3]等傳統模型更有效地提取交通數據的時間相關性。為了考慮交通路網的非歐氏空間特征,DCRNN[4]利用有向圖對交通路網進行建模,以擴散圖卷積的方式捕獲交通數據的空間依賴性,并使用Seq2Seq結構來提取時間相關性。STGCN[5]則構建了一個全卷積的時空圖網絡模型,利用圖卷積和一維卷積分別對交通數據的空間和時間特征進行建模。而ASTGCN[6]進一步考慮交通數據的周期性,搭建了一個多組件時空圖卷積網絡,對近期、日周期和周周期的交通流數據進行建模,并利用注意力機制考慮時間和空間的動態特性。綜上,挖掘交通數據的時空相關性是交通預測的關鍵,但大多數現有的交通預測模型很少關注不同交通數據之間存在的聯系。
本文探索了交通流與交通速度數據之間的相關性,并提出一種速度門控時空圖卷積網絡(speed gated spatial temporal graph convolution network,SGSTGCN),嘗試以交通速度的角度輔助模型進行交通流預測。在真實高速公路交通數據集上進行實驗驗證,SGSTGCN的預測性能優于近期經典的時空圖網絡預測模型DCRNN,STGCN。
交通路網是典型的非歐氏結構數據,因此,本文將其定義成無向圖G(V,E,A),其中V為圖上|V|=N個節點的集合,E為連接節點的邊。鄰接矩陣A∈RN×N代表圖G中節點的連接情況,當節點i和j相連時,Aij=1;否則Aij=0。


圖1 小型交通路網示意
交通流預測問題可被定義為,尋找一個函數f,在給定歷史Tp時段交通數據X={X1,X2,…,XTp}∈RN×C×Tp的情況下,預測未來Tq時段的交通流數據Y={Y1,Y2,…,YTq}∈RN×C×Tq。函數的映射關系可以表示為
Y=f(X,G)
(1)
本文提出的SGSTGCN的總體框架如圖2所示。

圖2 速度門控時空圖卷積網絡的總體框架

TS_block的結構如圖3所示。其采用一維擴張卷積(dilated convolution,Dconv)捕獲路網上每個節點的時間相關性,并利用門控線性單元GLU控制時間卷積網絡層之間的信息流動,得到門控擴張卷積

圖3 時空卷積塊
=(θ1(r)*X)?σ(θ2(r)*X)
(2)
式中θ1(r),θ2(r)為兩個不同的擴張卷積核,通過調節擴張率r,往卷積核的元素間填充r-1個零值,進而擴大時間維度的感受野。為輸出的時間特征,σ,*分別為Sigmoid函數和卷積算子,?為哈達瑪積。
接著,利用K階切比雪夫近似圖卷積(GCN)[7]對每個t時刻路網的空間特征進行建模,且t時刻的輸出為
(3)
式中θ∈RK為切比雪夫系數向量,Tk(x)=2xTk-1(x)-Tk-2(x),T0(x)=1,T1(x)=x為切比雪夫多項式。而=2L/λmax-IN,λmax為圖拉普拉斯矩陣L的最大特征值,IN為單位陣。
經過圖卷積的處理后,每個節點將聚合K階相鄰節點的特征。而通過多個時空卷積塊的疊加,模型在時間和空間2個維度的感受野將得到逐步擴大。
除了對交通流數據的時空特征進行挖掘外,本文發現速度信息能有效地輔助模型對路網特征進行理解,從而實現更準確的交通流預測。假設圖1中路段1的交通流量很大,速度卻很慢,則該路段有可能發生突發事件造成了擁堵,短期內該路段的交通流變化趨勢不會很明顯。同時,路段1的突發狀況可能會影響相鄰路段的通行效率,從而導致其他路段的交通流量增大。
因此,本文提出了SG_module對上述常見且復雜的交通關系進行建模。如圖2所示,SG_module構建了2個時空卷積塊分支,分別提取交通流數據Xf與速度數據Xs的時空特征,得到Hf和Hs。接著,通過Sigmoid函數將速度特征Hs處理成(0,1)取值范圍的特征權重,最后利用哈達瑪積融合該權重與交通流特征,得到輸出
=Hf?σ(Hs)
(4)
本文選取ASTGCN[6]公布的真實高速公路數據集PeMSD4和PeMSD8對模型的有效性進行驗證。數據集中包含了交通流和交通速度數據,相關描述可見表1。該數據是由美國加利福尼亞州的PeMS(Caltrans Performance Measurement System)[8]基于30 s/次的頻率采樣實時采集的,并匯總成以5 min為時間間隔的樣本。本文以6︰2︰2的比例將數據劃分成訓練集、驗證集和測試集,并對其進行零均值化(zero-mean)處理。

表1 數據集描述
在Nvidia Tesla P100 GPU的環境下,本文采用網格搜索法對模型的超參數進行尋優。實驗表明SG_module個數M=8時,SGSTGCN在驗證集中表現最優。在這8個SG_module中,TS_block的門控擴張卷積的擴張率r分別為1,2,1,2,1,2,1,2,而卷積核大小均為3,個數為64。圖卷積的卷積核個數也為64。批大小(Batch Size)設置為64,且采用學習率為0.001的Adam優化器來優化Smooth L1損失函數。本文Tq和Tp均為1 h,即利用歷史1 h的交通流與速度數據預測未來1 h內的交通流數據。并利用平均絕對誤差(mean absolute error,MAE)、均方根誤差(root mean square error,RMSE)和平均絕對百分比誤差(mean absolute percen-tage error,MAPE)對模型未來1 h內的平均預測誤差進行評估。指標的值越小,則說明模型的預測效果越好。
表2展示了本文提出的SGSTGCN模型與基準方法SVR,LSTM,DCRNN,STGCN在PeMSD4和PeMSD8數據集上的預測效果。由表2可以觀察到,僅考慮交通流數據時間特征的SVR,LSTM預測結果并不理想。而引入圖神經網絡對交通路網空間特征進行建模的DCRNN,STGCN均取得較好的效果。

表2 不同交通流預測模型的性能比較
相比于前述模型,SGSTGCN在各個指標中均達到最佳性能。在PeMSD4上,SGSTGCN的MAE/RMSE/MAPE相比基準方法中表現最好的STGCN分別提升了4.11 %/5.57 %/1.71 %;在PeMSD8上,則提升了7.62 %/5.30 %/6.47 %。這得益于SG_module以交通速度的角度有效地輔助模型更全面地理解整個路網的動態變化,進而實現更準確的交通流預測。同時,層層疊加的SG_module利用門控擴張卷積非線性地擴大時間維度的感受野,使得模型有能力感知更長時間跨度的時序特征,從而對交通流長期的時序特征進行建模。
為了對各個模塊的有效性進行評估,在PeMSD8數據集上對SGSTGCN與如下變體模型進行比較。1)Basic模型:一個以一維卷積與圖卷積為基礎模塊,且只考慮交通流數據的時空圖卷積網絡模型;2)TGLU模型:將Basic模型中的一維卷積替換成門控擴張卷積;3)SGM模型:在Basic模型基礎上,加入速度門控注意力模塊。
圖4對比了各個模型未來1 h中每個時間節點(以5 min為間隔)的預測性能。從圖4(a),(b)可以發現,4種模型短期(5~15 min)的MAE和RMSE差距較小,但隨著預測時間的加長,這種差距逐漸擴大。而在圖4(c)中,雖然SGM模型從5 min到20 min的MAPE比TGLU大,但在25 min后的預測中,SGM的指標低于TGLU,并逐漸逼近預測效果最好的SGSTGCN。

圖4 變體模型在PeMSD8上各時間點的預測效果
上述實驗表明:1)門控擴張卷積能有效地通過控制時間維度的感受野,捕獲交通流長期的時間相關性;2)速度特征是交通流預測的有效輔助信息,并在長期交通流預測時,起到了較大的促進作用;3)結合了上述兩個模塊的SGSTGCN在長短期預測中均表現出優秀的效果。
本文提出了一種基于速度門控時空圖卷積網絡的交通流預測模型SGSTGCN,該模型結合門控擴張卷積和圖卷積來捕獲交通數據的時空特征,并引入速度門控模塊,利用交通速度特征輔助模型對交通流進行預測。實驗結果表明:本文提出的速度門控模塊能有效地輔助模型對交通流進行長期預測。并且,SGSTGCN在不同規模的數據集上均優于近期提出的時空圖網絡預測模型DCRNN,STGCN。