龐星宇、成洪博、陳凌鋒、胡鄭雨、黃軍
(1.深圳高速公路股份有限公司,廣東 深圳 518038;2.北京北大千方科技有限公司,北京 100085)
在高速公路交通狀況監測工作中,高速公路管理部門能夠采集到的信息通常為車輛通行數據,無法直接得到車輛的實時行駛速度信息。為了更好地開展高速公路交通狀況監測工作,需要相關部門不斷優化基于車輛通行數據的交通狀況監測技術,做到實時、直觀地監控下轄高速公路的交通運行狀況。目前,根據我國相關建設規范可知,高速公路匝道收費站之間的距離一般為15km,城市周邊的高速公路,收費站之間的距離不小于3km,因此從收費站的收費數據中提取相關交通參數進行計算,得到的交通狀況空間粒度至少為3km,無法細致地反應高速公路較小路段內的交通狀況及變化情況。同時,由于大部分收費站為匝道收費站,以收費站劃分道路節點,會將車輛通行匝道的時間與通行高速公路主線的時間混合,無法準確地描述高速公路主線的路況。
由于高速公路一般里程較長,對道路交通情況進行描述時需要對道路整體進行劃分,便于對路況進行細致描述,同時可以對擁堵等異常事件進行精確定位,這樣能夠更好地滿足高速公路管理需求。
在該研究中,以ETC 龍門架的里程樁號為節點,將高速公路劃分為若干個基本路段,然后根據視頻攝像頭的樁號與方向,將細化后的更小的路段融入基本路段。
首先采用ETC 龍門架的里程樁號作為節點將高速公路劃分為基本路段。單方向上,N 個龍門架可以將道路劃分為N+1 個基本路段,雙向則為N+2 個基本路段,如圖1所示:

圖1 基本路段劃分示意圖
由于高速公路交通具有很明顯的方向性、連續性以及有限的封閉性,結合前述的基本路段劃分示意圖圖1可以發現,高速公路上不同設備采集到的多源異構數據在空間上具有明顯的前后銜接關系。參考鏈式存儲結構,提出構建交通數據鏈模型,對不同來源、不同結構的數據進行融合,便于進一步計算交通狀況。
該研究中所指的高速公路交通數據為:通過ETC龍門架以及攝像頭等數據檢測點采集到的、可以對交通流現狀進行描述且能夠用于計算交通狀況的數據,具體包括宏觀層面的車輛行駛速度、空間占有率、檢測設備編號以及微觀層面的車輛編號、車輛通行時間、檢測設備編號等數據。
其中宏觀信息主要源于視頻攝像頭AI 分析結果數據,微觀信息主要源于ETC 龍門架統計的車輛通行數據,通過多源異構數據融合技術對這些數據進行處理,能夠實現對數據的有效存儲與調用,對計算高速公路交通狀況有較大的現實意義。
參考鏈式存儲結構原理,通過構建交通數據鏈模型的方式,對高速公路多源異構交通數據進行融合。模型的構建包含以下幾個步驟:
2.2.1 數據鏈接
參考鏈式存儲結構,根據檢測點的空間位置和先后銜接關系形成檢測點數據鏈條,數據鏈條中包含代表高速公路起止位置的頭尾結點,同時每個數據結點表示該位置存在一個數據檢測設備。
2.2.2 數據填充
鏈條中的頭結點代表高速公路的起始點,不包含數據域,在指針域填入該方向上第一個數據檢測點的空間信息;在鏈條中數據節點的數據域,填入對應數據檢測點采集到的屬性信息,在鏈條中數據節點的指針域,填入下一個數據檢測點的空間信息;鏈條中的尾結點代表高速公路的終止點,不包含數據域,且指針域為空值。數據填充模式見圖2。

圖2 檢測點數據鏈條示意圖
其中設備類型為E 的數據結點表示,該位置為通過ETC 龍門架檢測的交通數據,設備類型為C 的數據結點則表示,該位置為通過視頻攝像頭檢測的交通數據。考慮到視頻攝像頭采集到的數據為車輛通過當前道路斷面的瞬時數據,從數據中提取出的交通狀況信息只能說明附近較短距離內的道路交通狀況,因此應在對應的數據結點上游補充一個虛擬結點,明確視頻攝像頭檢測數據的覆蓋范圍,完整數據鏈條示意圖如圖3所示。

圖3 完整檢測點數據鏈條示意圖
2.2.3 數據處理
不同來源的交通數據形成完整的交通數據之后,還需要進一步將各個數據結點中不同結構、不同量綱的交通數據轉換成統一量綱,完成真正的數據融合。考慮到實時判別高速公路運行狀況的目標,模型選取車輛行駛速度這一指標作為融合方向。
第一,針對通過視頻攝像頭采集數據的檢測點A,通過對視頻畫面進行AI 分析可以直接得到車輛行駛速度,而對應的虛擬結點A′位于點A 上游100m處,根據前文所述的路段劃分過程,兩者之間為細化路段A′-A,可以通過下式計算車輛通過細化路段A′-A 的平均時間t。

l
'為細化路段的長度,為固定值100m;v
為車輛的平均通行速度。從數據鏈條的起始點依次向后檢索數據結點中設備類型的值,當找到設備類型為C 的數據結點后,利用上式計算車輛平均通過時間t,并存入該數據結點的數據域,同時將細化路段長度l
'存入該數據結點的數據域,并繼續向后檢索。第二,針對通過ETC 龍門架采集數據的檢測點C,可以采集到通過車輛的編號和通過時間,結合上游ETC 龍門架B 的統計數據,可以利用同一車輛通過的時間差得到車輛通行時間,根據前文所述的路段劃分方法,兩者之間為基本路段B-C。考慮到單一車輛可能出現臨時停車等異常情況,導致通行時間過長等,所以可以采用單位時間內的平均通行速度作為指標,描述基本路段內的整體路況。平均通行速度vˉ通過下式計算。

S
為ETC 龍門架B 的里程樁號;S
為ETC龍門架C 的里程樁號;t
為車輛通過ETC 龍門架B 的時間;t
為車輛通過ETC 龍門架C 的時間。考慮到車輛通過基本路段的同時,必定通過了基本路段內包含的細化路段。為了避免重復計算,需要按照以下計算方式,將細化路段的長度和對應的車輛通過時間從基本路段數據中去除。

x
為該基本路段內包含的細化路段個數。式(4)中:t
為第i 個細化路段的通過時間。則基本路段的平均通行速度計算公式變形如下。

從數據鏈條的起始點依次向后檢索數據結點中設備類型的值,當找到第一個設備類型為E 的數據結點A 時,將該數據結點標記為上游結點并繼續向后檢索,當找到第二個設備類型為E 的數據結點B 時,將該數據結點標記為下游結點,最近的上游結點與下游結點之間組成一個基本路段。按照上面的步驟,計算出基本路段A-B 的車輛平均通行速度vˉ,并將車輛平均通行速度vˉ存入該數據結點以及基本路段A-B 上所有虛擬結點的數據域。完成后將數據結點B 的下游結點標記改為上游結點并繼續向后檢索。
2.2.4 刪除無效數據
數據處理完成后除頭結點與尾結點外,所有節點數據域內均存有結點里程樁號數據以及上游對應路段的車輛通行速度數據,保留這些數據,刪除其他無效數據,便于后續計算。
經過多源異構數據融合過程后,數據鏈條中的所有數據結點的數據域都存有該結點對應的數據檢測點的里程樁號數據,以及對應路段的平均通行速度數據。根據里程樁號數據可以顯著區分各個不同的路段,而根據平均通行速度數據可以直觀地判別路段的通行狀態。
平均通行速度對應的路段通行狀態為:>75 表示暢通,>55 表示一般,>35 表示緩行,<35 表示擁擠。
通過上述步驟可以得到研究范圍內高速公路各路段的實時路況信息,篩選車輛通行狀況為擁堵的路段,認為該路段可能發生影響交通暢通性的事件,與對應時間段的交通事件數據進行對比,如果該路段沒有上報交通事件,則上報預警信息,提醒管理人員注意。
該實例驗證過程采用的數據為2021年8月11日全日深圳某高速公路主線上的ETC 龍門架以及視頻攝像頭采集到的數據總數據集,同時通過互聯網公開數據采集方法,采集高德地圖路況信息數據,用于數據對比。總數據集中共有數據條目2124624 條,其中ETC 龍門架數據條目共計2115984 條,視頻攝像頭AI分析數據統計頻率為5min,數據條目共計8640 條。結合數據檢測點分布圖,將路段通行狀態表與互聯網路況數據進行對比,發現細化路段10016′-10016,10015′-10015,10012′-10012,10011′-10011 處于緩行或擁擠的狀態,其他基本路段均保持暢通狀態,與互聯網路況數據基本一致。其中存在部分誤差,是由于前端檢測設備的布設位置及密度引起的。對比結果表明,基于鏈式數據融合的路況計算模型可以正確反映道路的通行狀況,有一定的實際意義。
綜上所述,根據高速公路通行數據的空間特征,采用數據鏈模型對多源異構的數據進行融合,并在融合的基礎上進一步計算道路通行狀態,經過與實際情況的對比,發現模型具有良好的適用性。同時,模型具有以下應用價值:
第一,在以往技術的基礎上,提出用ETC 龍門架與攝像頭代替收費站對高速公路路段進行劃分,提高了道路交通狀況的空間粒度,能夠更好地滿足管理人員對細節路段路況的管理需求。
第二,通過路況計算結果可以發現可能存在的交通事件,能有效彌補交通事件發現機制的不足,避免部分發生在監控盲區的交通事件難以被發現。