張 弛,付相君,周先穎,陳 堅
(1.重慶交通大學 交通運輸學院, 重慶 400074; 2.重慶市交通規劃和技術發展中心, 重慶 400060)
作為交通現代化建設的關鍵組成部分,智能交通系統(intelligent transport system,ITS)在提升交通管理水平、道路通行效率方面發揮了重要作用。從智能交通系統基于數據驅動的內核來看,完善的交通數據采集系統不可或缺。但受制于財政預算與建設計劃,目前流量檢測器主要布設于城市快速路、主次干路等重點區域,無法達到路網全覆蓋[1]。這導致部分道路無法受到有效監控,成為了交通數據采集系統的“盲區”。因此,通過有限數量的流量檢測器實現全路網交通狀態的實時準確感知,是現階段快速推廣智能交通系統、實施城市交通精細化管理的必要保障。
交通流量預測研究按不同預測時間跨度可分為:實時預測、短期預測(5~30 min)、中長期預測(30 min以上)。其中,實時流量預測以具有相關性的路段流量為研究對象,通過已知路段(有流量檢測器)流量來預測其他具有相關性的未知路段(無流量檢測器)流量,實際應用于指導路網流量檢測器的布設優化。Bianco等[2]使用OD矩陣分析路段流量相關性,得到路網所需流量檢測器的最少數量。姜桂艷等[3]根據聚類譜系圖按流量相關性強弱對路段進行劃分,將相關性強的路段定義為“相關路段”,然后根據逐步回歸法構建了相關路段流量間的線形回歸方程。張航等[4]通過模糊聚類對路段流量相關性進行分析,并同樣使用逐步回歸法構建了流量預測模型。Castillo等[5]考慮OD對的變異性,提出了基于貝葉斯網絡的相關路段流量預測模型。王殿海等[6]基于路段流量相關性篩選路網中的關鍵路段,通過線性組合的方法由關鍵路段流量推算出了其他路段流量。鄭長江等[7]采用模糊聚類劃分相關路段,再根據分組結果對流量檢測器布局進行優化。已有研究主要通過聚類分析來探索路段流量間的相關性,然后在相關性較強的路段流量間分別建立兩兩對應的數學關系,其建模過程較為繁復,難以實際應用。在使用多維標度法劃分相關路段的基礎上,針對每組相關路段基于多層感知機建立了實時流量預測模型,實現了由關鍵路段已知流量至同組其他所有未知路段流量的整合建模,建模過程更為簡捷。在區域路網流量檢測器的實際布設中,僅需在少數關鍵路段布設流量檢測器,即可由模型預測得到全部路段的流量數據。
在空間層面,城市路網中的路段通過節點(交叉口)相互連接,節點處交通流量總流入等于總流出,并呈現一定程度的連續流狀態,故區域路網內的某些路段流量數據呈現空間相關性(即路段流量相關性),這是構建和訓練相關路段流量預測模型的基本依據[8]。
城市路網由基本路段(交通量保持不變的一段單向道路)組成。根據路段流量相關性,區域路網中所有基本路段可被劃分為多組具有流量相關性的路段(即相關路段),每組相關路段的流量在同一時刻存在多元線性相關或多元非線性相關的關系。流量檢測器的布設原理是在每組相關路段中選取一條關鍵路段布設流量檢測器,實時獲取該關鍵路段某一時刻的流量數據,再根據流量相關性使用適當的方法來實時預測同組其他基本路段在同一時刻的流量。因此,區域路網中相關路段的分組數量即是所需布設流量檢測器的最少數量。
相關分析是一種研究不同變量之間關系的統計分析手段,常用的方法包含相關系數法、聚類分析及多維標度法等。其中,相關系數法僅能分析樣本兩兩之間的相關關系,無法直接確定所有樣本間的相對相關程度,對于相關路段劃分這類大樣本問題的適用性不高。聚類分析由于直接把高維樣本納入一維譜系分類中,可能導致樣本間關系簡化甚至失真。而多維標度法(multi dimensional scaling,MDS)依據樣本之間的原始距離,將樣本從高維空間轉化到低維空間,實現了低維空間中樣本坐標點間歐幾里得距離與其實際相關性的匹配,相較于聚類分析更能完善地保存樣本間的原始關系[9]。因此,本文采用Kruskal的非度量古典MDS分析路網中所有路段流量間的關系,根據流量相對相關程度來劃分相關路段,步驟如下[10]:


步驟3假設X(n×r)是r維擬合構造圖,相應的距離矩陣為D=(dij);假設r維空間中的n個點表示為X1,X2,…,Xn,則Xi的坐標記為Xi=(Xi1,Xi2,…,Xir)T,i=1,2,…,n。則對象i與j在r維空間中的歐幾里得距離為:

(1)

(2)
式中:Stress取值范圍為[0,1],數值越小表示擬合度越好。擬合構圖壓力系數的值所對應的擬合程度如表1所示。

表1 壓力系數值擬合程度
步驟4在確定維數r時,從r=1開始迭代,當Stress的值首次小于5%時的維數r即為最小維數。對于每一個r,都可以找到使Stress值最小的擬合構圖。
步驟5根據各路段流量樣本在r維擬合圖中的分布,得到相關路段分組。
多層感知機(multi-layer perceptron,MLP)由單層感知機拓展而來,網絡結構包含輸入層、隱層、輸出層,是一種常用的深度學習模型。由于結構中存在一層或多層隱層,MLP具有很強的自適應、自學習及容錯能力,能解決單層感知機不適用的非線性可分問題,目前已被廣泛應用于區域物流需求預測、區域公路網規模預測等領域。根據城市道路交通流理論,路段流量與其影響因素之間存在復雜的非線性關系,簡單模型難以對其進行建模和計算。因此,本文使用MLP模型來建立相關路段流量間的映射關系。
相關路段流量是城市形態、路網布局特征、區域交通流時空特征等多維因素相互耦合的結果,并在空間上呈現出路段流量相關的現象。因此,在每組相關路段中關鍵路段流量已知的前提下,預測同組其余路段流量的要點在于如何描述該關鍵路段與被預測路段流量間的相關性,并以此構建相關路段流量間的映射關系。路段流量相關性的本質是依附于路網的車流存在連續流狀態,故路網拓撲結構是影響路段流量相關性的最主要因素。在微觀路段層面,被預測路段的車道數[11]反映了其物理特性,最短路徑長度反映了其與關鍵路段間的距離關系;在宏觀路網層面,被預測路段的度[12]、介數[13]、緊密中心度[14]分別從相連路段的數量、出現在路網中各個最短路徑的概率、至其他路段的可達性3個方面反映了其在路網中的重要程度。這5個拓撲結構指標均通過直接影響路網流量分配結果間接影響關鍵路段與被預測路段流量間的相關性,如圖1所示。

圖1 路網拓撲結構對路段流量相關性的影響過程框圖
因此,針對每組相關路段,選取關鍵路段已知流量及被預測路段的車道數、最短路徑長度、度、介數、緊密中心度5個拓撲結構指標作為流量預測模型的輸入層變量,如表2所示。

表2 輸入層變量定義
雙隱層MLP模型相較于單隱層MLP模型更適宜學習不連續函數(如鋸齒波),如圖2、3所示。同時,如在第1個隱層設置較多的隱節點,而第2個隱層設置較少的隱節點,更有利于改善多層前饋網的性能。因此,構建結構為(6,p,q,1)的雙隱層MLP模型及(6,p,1)單隱層MLP對比模型,分析隱層數量對流量預測效果的影響。各模型均采用相同的樣本數據進行訓練,通過試湊法(對比網絡的迭代次數和誤差精度等指標)確定隱層神經元數量。

圖2 單隱層模型結構示意圖

圖3 雙隱層模型結構示意圖
對樣本數據進行歸一化處理后,采用BP算法進行MLP模型訓練。BP神經網絡的學習過程包括信息正向傳播和誤差反向傳播兩部分,核心思想是通過反向傳播將所得誤差分攤給各層所有單元。
1) 信息正向傳播過程

(3)

2) 誤差反向傳播過程
(4)
式中:yi為樣本數據輸出層i節點流量真實值;ai為樣本數據輸出層i節點流量輸出值。
優化目標為確定W(權值)和b(偏置)使得損失函數C(W,b)最小,模型輸出的流量預測值將越來越趨近于真實值。W和b的迭代公式如下:

(5)
式中:α為學習速率,取值范圍(0,1]。
3) 效果評價
為驗證預測模型精度,使用平均相對誤差(MRE)、均等系數(EC)對模型預測效果進行綜合評價。其中,MRE反映了模型預測值偏離實際值的程度;EC反映了模型預測值與實際值的擬合度,數值大于0.85表明擬合度較好[15]。
(6)
式中:yi為第i個測試樣本實測值;為第i個測試樣本預測值;n為測試樣本數量。
以重慶市渝中區兩路口環道及周邊道路路網為實例分析對象。該區域路網主要承擔南北向出入境車流及區內東西向轉換車流,交通地位突出。路網共包含12條道路,按單向路段流量不變(無流入流出)的原則可被劃分為33條基本路段,如圖4所示。通過區域路網已布設并投入使用的微波檢測器獲取全部基本路段2019年7月15日至8月15日(共32 d)每天6∶00—24∶00(間隔5 min,一天217條數據)的流量數據。

圖4 區域路網
以33個基本路段為變量(變量名分別為L1~L33),使用IBM SPSS Statistics 22軟件基于MDS進行相關路段劃分。將各路段32 d中每天間隔5 min 的流量數據取32 d的平均值,整合得到各路段一天的平均流量數據,以此計算各路段的流量數據相關系數矩陣,然后將其轉化為廣義距離矩陣。分別計算1、2、3維空間下的壓力系數值,結果顯示二維空間下匹配程度最高,如表3所示。根據二維空間擬合構圖,33個基本路段可分為4組相關路段。第1組:L13、L26、L30,第2組:L3、L4、L5、L6、L7、L8、L9、L17、L18、L27、L28、L29,第3組:L1、L2、L10、L11、L12、L14、L15、L20、L21、L22、L23、L24、L25、L31,第4組:L16、L19、L32、L33,如圖5所示。MDS線性擬合散點分布基本呈線性,如圖6所示,表明采用歐幾里得距離對原始距離矩陣的擬合程度較好。

表3 各維數壓力系數值

圖5 二維擬合分組示意圖

圖6 線性擬合散點分布示意圖
以第3組相關路段為例,建立基于MLP的流量預測模型。使用Pajek軟件處理路網拓撲結構,結合實地調查,得到第3組各相關路段的車道數、最短距離、度、介數、緊密中心度數據。經相關分析,5個拓撲結構指標之間呈弱相關性(相關系數均小于0.3)。根據介數最大原則,確定路段L20為第3組的關鍵路段。按照神經網絡訓練數據量大,測試數據量小的原則,選取各基本路段前31 d(7月15日—8月14日)的流量及5個拓撲結構指標數據作為訓練樣本數據,最后1 d(8月15日)的流量及5個拓撲結構指標數據作為測試樣本數據。對數據進行缺失值和異常值處理后再歸一化。采用Matlab編程進行訓練,將模型訓練誤差指標設置為MRE,訓練目標設置為0.1,傳遞函數采用sigmoid,學習率為0.001,最大迭代次數為1 000次。經過訓練并形成穩定的預測模型后,單、雙隱層模型各層神經元節點數分別為(6,13,1)、(6,10,3,1),誤差評價指標如表4所示,模型輸出結果反歸一化得到的各路段流量預測值與實際值擬合如圖7、8所示。結果顯示:單、雙隱層模型的平均相對誤差(MRE)均在0.1以內且均等系數(EC)均大于0.85,表明流量預測值與實際值擬合度較高,MPL模型在實時流量預測中具有較高適用性。其次,雙隱層模型的誤差指標均優于單隱層模型,表明雙隱層MLP模型較單隱層MLP模型在相關路段流量實時預測領域具有更高的預測精度,即隱層數量在一定程度上會影響模型預測精度。

表4 模型誤差評價指標

圖7 單隱層模型流量擬合曲線

圖8 雙隱層模型流量擬合曲線
1) MDS、MLP在城市區域路網相關路段流量預測領域具有較高適用性,可實現由關鍵路段已知流量至同組其他所有未知相關路段流量的整合建模,建模過程較傳統實時流量預測更為簡單。
2) 雙隱層MLP模型較單隱層MLP模型在相關路段流量預測領域具有更高的預測精度,達到87.4%。
3) 區域路網流量檢測器的布設可根據相關路段MDS劃分結果,僅需在每組相關路段中的關鍵路段布設流量檢測器,再由雙隱層MLP模型預測得到同組其余未布設流量檢測器路段的流量,通過有限數量的流量檢測器實現對區域路網流量的全面檢測。