宋 濤 楊云飛 邵 京 戴 杰 杜世貝
(1.浙江杭紹甬高速公路有限公司,浙江 杭州 311215;2.浙江高信技術股份有限公司,浙江 杭州 310005)
數據融合方法是從不同的數據源重建數據,以找到新的相關性和組合,從而生成新的數據,并產生更好的決策和行動。制定數據方法或算法包括4個基本過程:預處理、過濾、決策和評估。從數據融合模型中獲得高質量的結果取決于執行這些過程的算法組合選擇、輸入的質量和輸出的類型。這些步驟試圖結合數據來揭示有意義的特征,從而獲得更高的精度值,并幫助改進決策過程。
高速公路車輛感知體系下,高速公路交通事件采集方式多樣,通常采用視頻、雷達及交通運行特征變化監測交通事件,每種監測方式單一監測交通事件存在信息上報重復和誤報等情況。交通事件對高速公路的運營安全與效率具有重要影響,及時、準確地發現高速上的交通事件一直是交通狀態監測研究的難點。然而,受檢測數據獲取與處理方法的限制,交通事件自動監測在效率、效果以及經濟性方面還存在較大的提升空間。為了進一步改善交通事件自動監測的效率與效果,該文對視頻交通事件數據、雷達交通事件數據和交通運行特征變化判斷的交通事件數據進行分析研究,提出多監測方式交通事件自動監測融合算法,以提高交通事件自動監測的效率與準確性。
數據融合方法是通過采用特定的算法和/或數學模型來得到解決特定領域的問題的數據融合技術、算法或方法。常用方法包括卡爾曼濾波、神經網絡、D-S理論、模糊邏輯、聯合概率數據關聯、貝葉斯、k-最近鄰、軟件定義智能體以及混合算法。不同算法適用情況不同。
研究結果需要特定的測量工具來定量或定性地定義數據融合模型的有效性。文獻[1-2]等人強調了在融合后進行評估的必要性,以衡量績效效率水平。所選數據融合方法的線性或非線性過程取決于數據屬性、提出的模型和正在建模的領域問題。常用方法是均方根誤差(RMSE)、均方根百分比誤差(RMPSE)、平均絕對誤差(MAE)和平均絕對百分比誤差(MAPE)。
在高速公路車輛感知體系下,高速公路交通事件采集方式多樣,通常采用視頻、雷達及交通運行特征變化監測交通事件,每種監測方式單一監測交通事件會存在信息上報重復和誤報等情況。對視頻、雷達和交通流運行特征變化檢測到的交通事件數據,如何構建數據融合算法模型,減少重復上報事件、降低事件誤報率、提高事件準確率。
對視頻、雷達、交通流運行特征變化檢測到的交通事件數據,采用基于D-S的融合算法進行數據融合。數據融合又稱為信息融合或多傳感器數據融合,是利用計算機技術對傳感器數據進行處理,進而便于分析和決策的一種技術。數據融合技術包括3個層次,分別為像素級融合、特征級融合和決策級融合。
該文是對不同傳感器或方法得到的結果進行融合,根據一定的準則和決策的可信度做出最優決策,使在某些方法失效時仍能做出正確判斷,進而提高決策準確度,所以屬于決策級融合技術。
首先分析3種檢測方式在雨天、白天和夜間條件下,以及不同交通流狀態下的事件檢測可信度,制定不同條件組合情況下的融合規則,以可信度高的檢測方式為主,其余方式為輔,生成完備交通事件表(事件庫)。
該文使用D-S證據理論對雷達和視頻檢測的交通事件數據及通過利用加州算法對交通運行特征進行推算得到的交通事件數據進行融合決策。其中D-S推理的主要思想為引起一個事件發生有許多原因,結合不同的結果對不同的假設進行獨立的判斷,利用尋找事件主要原因的思想,得出不同假設的概率分配,稱為mass函數。
基于以上方法,傳統方法得出的mass函數主要基于主觀判斷,是一個經驗函數,為了提高函數的準確性,也可以與一些量化方法相結合,從而得到一個較為客觀的函數,從而計算融合概率。當某個事件發生的概率最大時,該對應的事件即為判決結果。在D-S證據理論中,由互不相容的基本命題組成的完備集合稱為識別框架,表示對某一問題的所有可能答案,但其中只有一個答案是正確的。該框架的子集稱為命題,首先分配給各命題基本可信度,利用D-S融合規則將多個信號源的基本信任函數進行融合得到反映融合信息的新的基本信任分配函數,并據此進行決策。構建算法模型步驟如下。
對視頻、雷達和交通流運行特征變化檢測到的交通事件數據,采用基于D-S證據理論的融合算法進行數據融合得到交通事件集。
通過D-S證據理論進行算法融合,其命題為告訴公路是否發生事件,表示有事件發生,表示無事件發生,使用加州算法事件表A、雷達事件表B和視頻事件表C數據作為證據。
在證據理論中,一個樣本空間稱為一個辨識框架,用Θ表示。Θ中所有子集構成的冪集記為2,當Θ中元素為時,冪集的個數為2。該算法中,冪集的表示如公式(1)所示。

當加州算法事件表、雷達事件表和視頻事件表的數據進行融合時,需要對某一事件的以下幾種情況進行判斷。A有此事件,B有此事件,C有此事件。2) A有此事件,B有此事件,C無此事件。3) A有此事件,B無此事件,C有此事件。4) A有此事件,B無此事件,C無此事件。5) A無此事件,B有此事件,C有此事件。6) A無此事件,B有此事件,C無此事件。7) A無此事件,B無此事件,C有此事件。8)A無此事件,B無此事件,C無此事件。
在進行融合前對這3種證據進行基本可信度分配,得到信任函數,然后利用Dempater合成法則得到新的信任函數,再根據決策規則進行決策判斷是否有交通事件發生,得出最后決策。
融合算法進行之前要先為加州算法、雷達和視頻,這3個信源對命題和的基本可信度進行賦值。常用的基本可信度賦值方法如下。1) 根據目標類型數和環境加權系數確定信任函數。2) 利用統計證據獲得基本可信度賦值。3)利用目標速度和加速度獲得基本可信度賦值。4) 利用目標身份獲得基本可信度賦值。
結合該文實際數據以及事件檢測的特點,采用第2個方法,即利用統計數據獲得基本可信度賦值的方法對、的基本可信度分別進行賦值。具體方法見表1。

表1 基本可信度賦值方法表
將視頻結構化數據事件數據、毫米波雷達事件數據和加州算法得出的事件數據與真實事件表相匹配,對基本可信度進行賦值得到基本可信度分配表。
由于視頻檢測時會受到白天和黑夜的影響,因此設置早上6點至晚上19點間為白天,其余為黑夜。根據白天、黑夜分別設定不同的mass函數,見表2~表4。

表2 視頻白天mass函數

表3 雷達mass函數

表4 加州算法mass函數
根據基本可信度分配表計算組合的信任函數。對事件信息進行融合時,由于數據量大,證據數量的增加可能會導致計算量非常龐大,因此對多個證據進行融合時采用兩兩融合的方法,然后再依照此方法遞推完成多證據的融合。
使用D-S合成規則對其中2個算法的概率分配函數進行融合,規則如公式2所示。

其中,K=∑A。計算過程見表5。

表5 D-S組合規則
根據表5的計算方法對3種信源數據進行信任函數的融合,得到融合后新的信任函數()、()和(Θ)。
多個決策合成得到新的信任函數后,選擇一個最終的決策規則進行決策得到事件集。基于D-S證據理論的常用決策方法包括:基于信任函數的決策、基于基本可信度賦值的決策和基于最小風險的決策。該文使用基于信任函數的決策方法具體如下。
設 ?,∈Θ,滿足公式(3)、公式(4)。

如果滿足公式(5),此時,為決策結果,、為預先設定的閾值。

采用該決策方法時需要針對實際應用問題確定和的值,不同的閾值組合有可能得到不同的決策結果,進而對決策結果產生影響。
將規則融合部分得出的()、()和(Θ)帶入公式(5),得到如表6所示的決策表,根據決策表每種組合結果對照雷達事件數據、視頻事件數據和加州算法計算到的事件數據,判斷該事件數據所屬的組合,根據該組合的結果做出決策,輸出事件集。

表6 D-S決策表
當有新的加州算法事件、雷達事件和視頻事件時,根據表6(在該文中只需使用前7條結果)便可做出決策是否輸出事件。
以視頻檢測事件作為真實事件表,將3種方法檢測的結果帶入融合后的組合表,可統計計算準確率。
該算法調用D-S類的成員函數precision_Recall可實現計算某一天或某小時中融合算法精確率和召回率。根據算法的檢測結果和真實事件數據有如表7所示的混淆矩陣,其中0表示無交通事件,1表示有交通事件。

表7 混淆矩陣

該次測試路段選擇滬杭甬高速柯橋至紹興段,全長10 km為測試路段,對選擇測試段進行數據集準備。
在數據庫中導入此路段雙幅同一時間段毫米波雷達原始數據、視頻結構化事件表和毫米波雷達事件表。加載2020年10月份數據,采用頻率為80 ms。
將mass函數經Dempster合成規則組合后,結果見表8。

表8 D-S多檢測方式交通事件融合決策表
篩選并融合后的數據如下。白天(1代表檢測出事件發生,0代表未檢測出事件發生)融合結果見表9。

表9 D-S多檢測方式交通事件融合表
以視頻檢測事件作為真實事件表,將3種方法檢測的結果帶入融合后的組合表,準確率為91.3%。
該文提出基于D-S的多檢測方式交通事件融合算法,對視頻檢測、雷達檢測和基于交通流特征變化的加州算法判斷交通事件數據進行融合,以視頻檢測到的事件作為真實事件表,通過融合算法融合后,輸出融合事件表,與真實事件對比,準確率達到91.3%。通過算法研究和開發,可以將算法封裝為服務,通過算法平臺進行調度執行,并基于高精度地圖進行事件可視化和聯動,并應用于實際高速公路運營管理,減少重復上報事件、降低事件誤報率,并提高事件準確率。