王志成,張玉一,巴天星,常燕燕
(沈陽市規(guī)劃設(shè)計(jì)研究院有限公司,遼寧沈陽 110004)
良好的交通狀況以及有效的交通管理方案,對城市功能的多樣化與良性協(xié)同發(fā)展具有重要意義。隨著理論技術(shù)的不斷發(fā)展,智慧交通系統(tǒng)可以識別出擁堵路段并指揮城市交通。優(yōu)異的交通指揮系統(tǒng)可以協(xié)助城市交通部門對道路進(jìn)行管控,避免擁堵,從而提升出行效率[1-4]。
實(shí)時(shí)性是交通流最典型的特征,通常可以使用預(yù)測手段對道路進(jìn)行指揮和疏導(dǎo)。目前最常用的方法就是利用安裝在路口的攝像頭采集圖像數(shù)據(jù),或在地面安裝壓力傳感器獲取交通流量、機(jī)動車輛駕駛速度以及道路占用率等信息,再通過計(jì)算推導(dǎo)對交通流量進(jìn)行準(zhǔn)確預(yù)測[5-6]。同時(shí),部分地區(qū)的交通數(shù)據(jù)還會被做成API 接口開放至第三方地圖軟件,以引導(dǎo)人們的出行。雖然現(xiàn)階段智能交通指揮系統(tǒng)的普及率較高,但由于交通流具有非線性、隨機(jī)性與實(shí)時(shí)性等特點(diǎn),傳統(tǒng)的交通指揮系統(tǒng)大多僅能對少量指標(biāo)進(jìn)行分析,因此實(shí)時(shí)預(yù)測的準(zhǔn)確性偏低。該文通過對多源數(shù)據(jù)進(jìn)行異構(gòu)與融合,做出準(zhǔn)確預(yù)測,從而緩解城市交通的運(yùn)行壓力。
長短時(shí)記憶時(shí)間循環(huán)神經(jīng)(Long Short-Term Memory,LSTM)網(wǎng)絡(luò)[7-9]是一種由循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)演化而來的網(wǎng)絡(luò)模型。該模型具備處理時(shí)間特征數(shù)據(jù)的能力,可以實(shí)現(xiàn)對帶有時(shí)序特征數(shù)據(jù)的分析。RNN 模型依據(jù)時(shí)間展開的結(jié)構(gòu)如圖1 所示。

圖1 RNN模型結(jié)構(gòu)
在圖1 中,RNN[10-12]可以展開為不同時(shí)間節(jié)點(diǎn)的輸入。隱藏層函數(shù)的表達(dá)式如下:
輸出層函數(shù)為:
其中,b和c為相應(yīng)的偏置,f(·)為核函數(shù)。
由于RNN 網(wǎng)絡(luò)在處理大規(guī)模數(shù)據(jù)序列時(shí),會存在梯度消失的問題。因此LSTM 在結(jié)構(gòu)層面對原模型進(jìn)行了改進(jìn),即在RNN 的神經(jīng)網(wǎng)絡(luò)中增加了三個(gè)門單元。該文所采用的LSTM 結(jié)構(gòu)如圖2 所示。

圖2 LSTM的網(wǎng)絡(luò)結(jié)構(gòu)
LSTM 的隱藏層由遺忘門、輸入門及輸出門組成。遺忘門能對內(nèi)部神經(jīng)元的狀態(tài)信息進(jìn)行傳遞,其輸入為t-1 時(shí)刻的節(jié)點(diǎn)狀態(tài)輸出與當(dāng)前時(shí)刻的數(shù)據(jù),輸出為:
其中,Wf和Uf為遺忘門輸入權(quán)重值,bf為激活函數(shù)的偏置值,σ為Sigmoid 函數(shù)。
輸入門則主要用來控制輸入信息的數(shù)量,其由Sigmoid 函數(shù)和tanh 函數(shù)兩部分組合而成。輸入門的函數(shù)表達(dá)式為:
而tanh 函數(shù)的表達(dá)式為:
單元狀態(tài)由遺忘門的輸出與輸入門的輸入組成,其可表征為:
其中,⊙為同或邏輯運(yùn)算。輸出門用來傳輸控制信息,其與輸入門具有相同的函數(shù)組成形式,如下所示:
因此在t時(shí)刻該文所采用LSTM 模型的輸出為:
在單向的LSTM 網(wǎng)絡(luò)中,模型數(shù)據(jù)僅應(yīng)用了正向的數(shù)據(jù)流,但并未考慮逆向數(shù)據(jù)流。然而在對實(shí)際的交通流數(shù)據(jù)進(jìn)行預(yù)測時(shí),通常需要使用整個(gè)時(shí)間序列數(shù)據(jù)。正向與逆向的LSTM 網(wǎng)絡(luò)分別可以訓(xùn)練t時(shí)刻前后的數(shù)據(jù),因此將二者的網(wǎng)絡(luò)相結(jié)合,進(jìn)而得到雙向LSTM(Bi-LSTM)網(wǎng)絡(luò),其結(jié)構(gòu)如圖3 所示。

圖3 Bi-LSTM網(wǎng)絡(luò)結(jié)構(gòu)
由于該文使用的CIM 系統(tǒng)可以采集到實(shí)時(shí)的交通圖像,而LSTM 算法為循環(huán)神經(jīng)網(wǎng)絡(luò),其處理圖像的能力較差。因此,使用深度卷積神經(jīng)網(wǎng)絡(luò)(Deep Convolutional Neural Networks,DCNN)對初始圖像進(jìn)行預(yù)訓(xùn)練,從而提取圖像的全局特征。
深度卷積神經(jīng)網(wǎng)絡(luò)[13-15]在圖像識別與特征提取領(lǐng)域具有較大優(yōu)勢,而DCNN 通過自主學(xué)習(xí),能夠?qū)D像特征進(jìn)行深層次的挖掘,網(wǎng)絡(luò)的主要架構(gòu)如圖4所示。

圖4 深度卷積神經(jīng)網(wǎng)絡(luò)的架構(gòu)
圖4 所示的深度卷積神經(jīng)網(wǎng)絡(luò)主要由輸入層、卷積層、池化層、全連接層以及輸出層組成。其中,輸入層為CIM 系統(tǒng)實(shí)時(shí)采集到的圖像數(shù)據(jù),該層可以對原始圖像進(jìn)行預(yù)處理,從而保障輸入圖像的歸一化。卷積層是深度卷積神經(jīng)網(wǎng)絡(luò)的核心計(jì)算單元,其包含有多種維度的卷積核,能夠?qū)D像特征進(jìn)行深層次的提取。池化層通過壓縮卷積層的輸出數(shù)據(jù),進(jìn)而去除特征數(shù)據(jù)的重疊信息,因此被保留下來的部分即可以代表圖像的本質(zhì)特征,并提升算法的計(jì)算性能。而全連接層則將已完成的工作進(jìn)行了整合,并將最終的特征數(shù)據(jù)映射至樣本空間。
單層DCNN 的結(jié)構(gòu)較為簡單,對數(shù)據(jù)特征的提取并不準(zhǔn)確,通常需要對DCNN 的卷積層進(jìn)行合理的設(shè)置與安排。因此,文中使用多尺度的深度卷積神經(jīng)網(wǎng)絡(luò)完成圖像的特征提取。多尺度的深度卷積神經(jīng)網(wǎng)絡(luò)由大尺寸及小尺寸的卷積核組成,大尺寸卷積核可以獲得更佳的全局視野,而小尺寸卷積核則能得到更好的局部特征。
由上文可知,多尺度DCNN 獲取圖像特征需要多層合理的設(shè)置,但網(wǎng)絡(luò)層數(shù)過多可能會導(dǎo)致計(jì)算資源消耗的急劇上升,網(wǎng)絡(luò)性能也會發(fā)生不同程度的退化。因此,該文在多尺度DCNN 結(jié)構(gòu)中加入了殘差網(wǎng)絡(luò)(Residual Network,ResNet)[16],將淺層及深層的卷積層相連接,進(jìn)而優(yōu)化網(wǎng)絡(luò)的整體性能。殘差網(wǎng)絡(luò)的結(jié)構(gòu)如圖5 所示。

圖5 殘差網(wǎng)絡(luò)的結(jié)構(gòu)
可以看到,通過殘差模塊的作用,輸出數(shù)據(jù)能夠綜合淺層的輸入與深層的輸出。同時(shí),與二維卷積層的互相融合還可以對時(shí)間維度特征進(jìn)行更好的把握。因此,該文所采用殘差模塊可以定義為:
其中,xl-1是第l-1 層殘差網(wǎng)絡(luò)的輸出,xl是第l層殘差單元的輸出,θl是第l層殘差單元參數(shù)集合,F(xiàn)為殘差函數(shù)的映射關(guān)系。傳統(tǒng)ResNet 網(wǎng)絡(luò)共有3 層,其結(jié)構(gòu)如圖6 所示。

圖6 傳統(tǒng)的ResNet網(wǎng)絡(luò)
該文利用多尺度深度卷積神經(jīng)網(wǎng)絡(luò)對ResNet 進(jìn)行改進(jìn),在原網(wǎng)絡(luò)的基礎(chǔ)上,在每層殘差單元中加入了更多級的殘差結(jié)構(gòu)。改進(jìn)后的ResNet 結(jié)構(gòu)如圖7所示。在經(jīng)過第一層卷積后,經(jīng)過第二子層時(shí)會有三個(gè)3×3 的卷積核,而這三個(gè)卷積核則可以感受到數(shù)據(jù)的所有特征信息,這樣每個(gè)殘差網(wǎng)絡(luò)都能夠得到不同尺度的數(shù)據(jù)特征。

圖7 改進(jìn)后的ResNet網(wǎng)絡(luò)
綜上所述,該文最終設(shè)計(jì)得到的殘差卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖8 所示。

圖8 殘差卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
該文設(shè)計(jì)的算法總體模型如圖9 所示。模型數(shù)據(jù)為多源數(shù)據(jù),其中,多尺度DCNN 模型為圖像特征的提取結(jié)構(gòu),模型的主要輸入部分則為CIM 交通系統(tǒng)提供的城市實(shí)時(shí)交通流三維模型。而Bi-LSTM 結(jié)構(gòu)為多源數(shù)據(jù)訓(xùn)練模型,多源數(shù)據(jù)包括時(shí)間、天氣與路況信息等。使用全連接層對訓(xùn)練后的數(shù)據(jù)集進(jìn)行分類,得到最終的數(shù)據(jù)標(biāo)簽,進(jìn)而對城市交通情況進(jìn)行綜合分析,為后續(xù)管理措施的制定提供數(shù)據(jù)支撐。

圖9 算法總體模型
為充分驗(yàn)證文中所提算法的有效性,實(shí)驗(yàn)使用某地區(qū)2015—2020 年的交通數(shù)據(jù)作為訓(xùn)練集,并將2021 年的數(shù)據(jù)作為驗(yàn)證集。多尺度DCNN 模型的輸入數(shù)據(jù)為CIM 三維圖像模型集,其可實(shí)時(shí)反映交通流的狀態(tài),并為LSTM 提供其他種類的多源數(shù)據(jù)。數(shù)據(jù)集的相關(guān)信息如表1 所示。實(shí)驗(yàn)使用Python3.6 對算法進(jìn)行編寫,相關(guān)軟硬件的配置環(huán)境如表2 所示。

表1 數(shù)據(jù)集相關(guān)信息

表2 軟硬件配置參數(shù)
為了驗(yàn)證該文算法的可行性,根據(jù)編寫的程序?qū)ζ浞诸愋阅苓M(jìn)行測試。實(shí)驗(yàn)測試指標(biāo)選擇了均方根誤差(RMSE)和平均絕對值誤差(MAE)進(jìn)行無單位的數(shù)值計(jì)算,而對比算法選擇了RNN、LSTM、CNN、SVM 和RF 算法。通過對訓(xùn)練集進(jìn)行模型訓(xùn)練,并使用驗(yàn)證集對結(jié)果加以驗(yàn)證,實(shí)驗(yàn)結(jié)果如表3所示。
由表3 可知,該文算法的RMSE 和MAE 誤差指標(biāo)值分別為7.896 及4.259,與LSTM 原始算法相比誤差降低了0.878 和0.955。同時(shí)也可以看到,CNN 處理及挖掘時(shí)間序列特征的能力較差,RMSE 和MAE的值較高;而傳統(tǒng)算法例如RF 算法,在處理時(shí)間序列數(shù)據(jù)時(shí)則容易忽略時(shí)間特征。
除了使用LSTM 進(jìn)行多源數(shù)據(jù)分析外,還使用多尺度DCNN 算法對CIM 三維圖像進(jìn)行處理。多尺度DCNN 可以從三維圖像中獲得車流的詳細(xì)特征,因此還需要對該文所提出的多尺度DCNN 模型進(jìn)行評價(jià)。評價(jià)指標(biāo)為準(zhǔn)確率、召回率以及F1 值,對比算法則為CNN、DCNN、ResNet、AlexNet 和ZFNet 算法。狀態(tài)識別結(jié)果如表4 所示。

表4 交通狀態(tài)識別結(jié)果
從表4 可以看出,該文算法對交通狀態(tài)的識別準(zhǔn)確率能夠達(dá)到87%,證明其可以實(shí)現(xiàn)對交通三維圖像的精準(zhǔn)識別及處理。此外,相較于其他對比算法,該文算法的評價(jià)指標(biāo)均為最優(yōu)。
良好的交通指揮系統(tǒng),對提升城市的出行效率,減少交通擁堵有著重要的意義。該文基于CIM 系統(tǒng)與多源數(shù)據(jù)提出了一種動態(tài)交通信息分析算法。該算法由多尺度DCNN 模型和Bi-LSTM 模型組成,通過對CIM 三維數(shù)據(jù)進(jìn)行訓(xùn)練,進(jìn)而獲取實(shí)時(shí)的交通情況并獲得相應(yīng)的時(shí)序特征。實(shí)驗(yàn)測試證明,所提方法的圖像識別性能與多源數(shù)據(jù)分類性能較為理想,具備可供工程應(yīng)用的實(shí)時(shí)交通狀態(tài)識別能力。