王彥平 王端陽 李 洋 林 赟 邱葉林
(1. 北方工業大學信息學院數據科學與大數據技術, 北京 100144; 2. 北京市市政工程設計研究總院有限公司, 北京 100082)
在實際的路面交通場景中的多目標跟蹤受到很多不確定因素的限制,例如,實際交通場景中雜波密集、背景復雜、運動目標個數未知,不同目標的運動過程由于是隨機的、難以確定的而導致很難用一個準確的、統一的模型來描述目標的真實運動過程。在目前已經發展出的多目標跟蹤技術中,多假設跟蹤(Multiple Hypothesis Tracking,MHT)[1]和聯合概率數據關聯濾波(Joint Probabilistic Data Association Filter,JPDAF)[2]這兩種算法的核心是數據關聯,利用單目標貝葉斯濾波算法完成對單個目標的狀態估計,本質上是把多目標跟蹤問題轉化成多個獨立的單目標跟蹤問題來處理,適用于空中等目標個數較少、目標運動狀態較為單一的簡單場景,但缺點是隨著目標數目和傳感器獲得量測數目的增長,其關聯組合會呈指數形式增長,即當處理場景相對復雜的多目標跟蹤問題時,容易出現關聯錯誤而導致 JPDAF 和 MHT 的跟蹤性能下降,雖然也有學者提出了一些針對此問題的改進算法,但大多都犧牲了算法性能,不能從根本上解決問題。
實際交通場景面臨著目標個數未知、目標運動模型未知、雜波密集、高信噪比等問題,基于JPDAF 和 MHT的算法由于受限于數據關聯性能而已不再適用。目前,基于隨機有限集(Random Finite Set,RFS)的多目標跟蹤算法已經成為了熱門研究方向[3- 4],它可以對多目標運動模型和觀測模型進行建模,不需要進行復雜的數據關聯就可以對雜波條件下目標個數時變的多個目標進行聯合檢測與跟蹤。基于RFS的濾波算法也在不斷被提出和完善,在多目標濾波算法性能上,提出了基于一階統計矩近似的概率假設密度(Probability Hypothesis Density,PHD)濾波[5]等算法。但是這些濾波器并未提供目標軌跡,多目標仍然不可區分。為了解決多目標跟蹤過程中的軌跡保持問題,Ba-T,Vo和Ba-T,Vo提出了帶標簽的隨機有限集及其貝葉斯濾波過程,同時給出了delta泛化的帶標簽多伯努利濾波(δ-Generalized Labeled Multi-Bernoulli filter,簡稱δ-GLMB)[6],已受到廣泛關注和拓展[7-9]。但是MHT、JPDAF和RFS框架下的標準多目標跟蹤算法通常是基于點目標模型,即假定目標是一個點,在一個采樣周期內每個目標至多產生一個量測,每個量測至多由一個目標產生。在實際交通場景中,由于一些復雜目標可能會有多個散射中心并且隨著傳感器精度的不斷提高或由于傳感器的多路徑效應,在毫米波雷達的一個采樣周期內某些目標會有多個測量點,此外,在距毫米波雷達較遠處,當目標之間相對距離太近時也容易出現多量測情況,此時標準多目標跟蹤算法會將同一個目標的多個量測點劃分為新生目標的軌跡點從而導致跟蹤結果中出現目標有多條軌跡的問題。文獻[10]結合脈沖擴展和假設分解策略,提出了一種基于隨機有限集的擴展算法,另外,也已經有發展出的多傳感器協同方法進行多目標跟蹤,有利于提升多目標跟蹤準確度,文獻[11]提出了一種基于算數均值融合的分布式伯努利濾波器,在處理漏檢問題上有明顯優勢。本文基于實際工程應用中的成本、多傳感器融合難度等因素,選擇使用單個77 GHz毫米波雷達對某段交通道路中的多目標進行了跟蹤。
本文基于δ-GLMB算法在復雜場景下的優異性能和能夠根據目標關聯的標簽信息快速形成軌跡的特點,首先選擇了δ-GLMB算法對大量的77 GHz毫米波雷達觀測實際交通場景的數據進行跟蹤實驗,發現在實際復雜交通場景中單個目標有多量測的現象較為普遍,但其多量測數目有限,且通過更嚴格條件的原始數據清洗和對δ-GLMB濾波器的調參也只能改善而不能完全解決單目標的多軌跡問題。因此,本文提出了一種在δ-GLMB跟蹤結果的基礎上加入自適應門限判定的改進算法,利用自適應門限判定方法彌補δ-GLMB假定目標在一個采樣周期內至多產生一個量測的缺陷,實現多余軌跡的刪除和屬于同一個目標的軌跡的標簽統一。
本文結構安排為:第1部分介紹了標簽隨機有限集框架下的多目標跟蹤算法,第2部分介紹了實際交通場景中δ-GLMB濾波算法的局限性,第3部分介紹了在δ-GLMB跟蹤結果的基礎上加入自適應門限判定的改進算法,第4部分是實驗和結果分析,第5部分是結論。
隨機有限集框架下的多目標跟蹤,是對多目標的狀態和量測進行建模,標簽隨機有限集則是將集合中多目標狀態都相應的添加了標簽。基于隨機有限集的δ-GLMB濾波算法分為預測和更新兩步,在貝葉斯遞推下封閉,目標狀態(x,l),目標被檢測概率為pD(x,l),目標未被檢測到的概率為qD(x,l)=1-pD(x,l),算法定義如下:
(1)

當目標的先驗概率密度形式如(1)時,δ-GLMB的預測步如下:
(2)
(3)

如果多目標的預測概率密度如式(1)所示,則更新步如下所示:

(4)
δ-GLMB濾波算法的詳細定義與推導過程見文獻[6]。在更新步中,Θ為關聯映射θ集合,θ:L→{0,1,2,…,|Z|}是目標到量測之間的關聯映射,確保θ(i)=θ(i′),且i=i′表示一個軌跡最多能生成一個量測結果,也就是一個量測結果至多匹配一個目標軌跡。因此,當一個目標在同時刻有不止一個量測時,δ-GLMB濾波算法會將屬于同一個目標的所有量測判斷為新生目標的軌跡。
通過δ-GLMB濾波算法對77 GHz毫米波雷達觀測實際交通場景的數據進行多目標跟蹤實驗時出現單目標有多條軌跡的情形有以下三種,分別是:①由雷達分辨率不足導致的多軌跡問題:觀測區域有多個目標同時出現但彼此間距離太近,由于雷達分辨率不足導致目標運動至距雷達較遠處時多個目標的量測逐漸合并,不同目標的軌跡也逐漸合并為一條軌跡,如圖1所示,在距傳感器距離較遠時,三個目標的軌跡逐漸變得混亂、相交、難以區分;②由多量測導致的多軌跡問題:部分目標在毫米波雷達的一個采樣周期內存在多個量測點,δ-GLMB濾波器把同一目標的量測點判定為新生目標的軌跡,如圖2中實際只有3個目標,但有6條軌跡;③由目標軌跡間斷導致的多軌跡問題:恢復軌跡被判定為新生目標軌跡(間斷前后航跡標簽不一致),如圖3所示,該目標的恢復軌跡被與間斷前軌跡的標簽不同,正確跟蹤結果應如圖4所示(間斷前后航跡標簽一致)。

圖1 多目標軌跡合并Fig.1 Trajectory merging of multiple targets

圖2 同一目標有不止一條軌跡Fig.2 A target has more than one track

圖3 軌跡恢復后標簽與間斷前標簽不同Fig.3 The label after the track recovery is different from the label before discontinuity

圖4 軌跡恢復后標簽與間斷前標簽相同Fig.4 The label after the track recovery is the same as the label before discontinuity
情形①的出現主要是由傳感器精度導致的,如果有多個彼此間相對距離很近的目標逐漸向遠離毫米波雷達的方向運動時,隨著雷達分辨率降低,這些目標的量測逐漸合并會導致每個目標獨立的跟蹤軌跡越來越難保持而最終軌跡合并。對此,可以通過對δ-GLMB濾波算法中的目標出生概率PD的適當調節進行改善。通過δ-GLMB算法對大量的77 GHz毫米波雷達觀測實際交通場景的數據進行跟蹤實驗可以得到:目標出生概率PD>0.85時利于新生目標的軌跡起始,但不利于后期的軌跡保持;目標出生概率PD在0.7~0.85之間時雖然有助于軌跡保持,改善量測間斷后軌跡被劃分為新目標的問題,但目標的起始軌跡難以形成。在目標向遠離傳感器方向運動時,為了軌跡保持,當目標從觀測區域的近距端向遠距端運動時分辨率逐漸變差時,目標的出生概率也該逐漸降低。因此,在目標的整個運動過程中,為了兼顧目標運動軌跡的起始和保持,目標的出生概率PD不應該設為定值而應該能夠自適應調節。這樣的變化考慮一個取值范圍為[0,1]的函數作為出生概率的系數來實現,sigmoid函數能夠達到要求,同樣的tanh函數的正半部分也可以。通過多次實驗發現,當目標距離傳感器90 m左右,多個目標的軌跡開始難以清晰區分。設雷達分辨率為L(x)。
(5)
第②、③種情形的出現是因為δ-GLMB濾波算法假設單個目標至多產生一個量測點,但實際交通場景中的單個目標很可能產生多個量測也可能因為漏檢而沒有量測,這增加了目標狀態與量測集之間的關聯不確定性,δ-GLMB濾波算法可能會將屬于同一個目標的多量測和量測間斷后的恢復軌跡判定為新生目標的軌跡,因此,針對情形②、③的多余軌跡刪除是本文的研究重點。
本文已經通過嚴格的數據清洗篩除虛警點和對δ-GLMB算法中參數的合理調節明顯改善了δ-GLMB算法的跟蹤結果中出現的單目標有多軌跡的現象,但由于實際交通場景中目標各自的運動狀態的不同和周圍環境變化等復雜因素,僅使用以上兩種手段并不能完美兼顧到每個目標的跟蹤而徹底避免多軌跡問題,這仍然給場景中目標數目的正確估計和軌跡的正確輸出帶來很大影響。因此,本文提出了一種在δ-GLMB算法的跟蹤結果基礎上加入自適應門限判定的改進算法,通過充分利用場景中每個目標的歷史軌跡信息來完成多余軌跡刪除。
在77 GHz毫米波雷達觀測的實際交通場景中由δ-GLMB濾波算法得到的目標跟蹤結果會出現單目標的多軌跡問題,除去傳感器自身精度因素外,成因有兩個:①由多量測導致的多軌跡問題:δ-GLMB濾波器判定多余量測點均屬于新生目標而給每個多余量測點均劃分新的軌跡標簽;②由目標軌跡間斷導致的多軌跡問題:δ-GLMB濾波器判定恢復軌跡屬于新生目標而劃分新的軌跡標簽。為了正確判斷新生標簽軌跡點是新生目標還是由①、②兩種因素導致的單目標的多軌跡問題,并對多軌跡進行處理,本文提出了一種在δ-GLMB算法的跟蹤結果基礎上加入自適應門限判定的改進算法。目前也有多種閾值設計方法,文獻[12]利用了Sigma-gating方法得到了更高的估計精度和跟蹤效率。本文則是利用目標的歷史運動信息推測下一時刻的理想運動狀態作為閾值篩選出下一時刻最有可能屬于該目標的航跡點并刪除其它多余航跡點來實現多余航跡刪除。
在實際交通場景中目標運動模型是未知的,目標運動的速度變化和位置變化都是非線性的,在預測目標下一時刻運動狀態時Kalman濾波等需要先對目標運動模型有準確了解的方法就已不再適用。本文提出的自適應門限判定方法的依據是目標在未來短期內的運動狀態只與當前時刻和此前一段歷史運動狀態有關而與更遠的軌跡沒有直接關系[13],當目標運動狀態沒有發生明顯變化如加減速時,目標每個時刻的運動狀態仍然與相鄰的前一時刻運動狀態有密切關系;當目標運動狀態發生明顯變化或由傳感器得到的目標運動量測數據存在較大誤差時,可以充分考慮目標在此前一段時間內的歷史運動狀態變化來估計后一時刻的運動狀態。

(6)
這也就是目標歷史運動狀態的變化情況。然后根據目標歷史狀態改變情況進一步推算目標在k+1時刻運動狀態。當目標本身沒有明顯加減速等運動狀態的改變時,由于實際場景中目標均為非線性運動,在每個時間間隔內仍然會有微小的改變,根據目標運動的連續性可知:越接近k+1時刻的運動狀態對k+1時刻運動狀態估計的參考價值越大,反之越小,基于這一特點,本文將賦予歷史運動狀態變化量不同的影響權重來估計目標在k+1時刻的運動狀態,下表計算了5個不同目標分別選取前2、3、4、5個運動狀態變化量并賦予相應權重后,估計10個時刻的軌跡點與原軌跡點之間距離的均方根誤差見表1,圖5畫出了其中目標1和目標2的軌跡估計圖。
可以看出,只利用前2個時刻間的運動狀態變化量估計之后時刻的目標運動狀態時誤差最高,利用前3個就已經能夠較好的估計出之后時刻的軌跡點,若之前一段時間內目標運動狀態較為平穩,利用過長的歷史狀態進行估計是沒有必要的,若之前一段時間內目標運動狀態不平穩,利用過長歷史狀

圖5 對同一個目標利用不同時長的歷史運動狀態變化量得到的10幀軌跡估計Fig.5 A 10-frame trajectory estimate obtained by using historical motion state changes of different durations for the same target

表1 5個不同目標依次選取前2、3、4、5個運動狀態變化量估計10個時刻的軌跡點與原軌跡點之間距離差的均方根誤差(單位:m)
態進行估計反而會增大誤差,因此本文將選擇前3個時刻間的運動狀態變化量進行估計。由此可以得到目標在k至k+1時刻間的估計狀態改變量為:

(7)
其中ω1>ω2>ω3>ω4,ω1+ω2+ω3+ω4=1,最終可以得到目標在k+1時刻的運動狀態估計:
(8)

(9)

自適應門限推導過程如圖6所示。

圖6 自適應門限判定算法推導流程圖Fig.6 Flow chart of adaptive threshold determination algorithm
δ-GLMB算法得到的跟蹤結果中,在k+1時刻共有M個目標,每個目標都有獨一無二的標簽,計算這M個目標在k時刻至k+1時刻間的估計狀態改變量:ΔX1(k,k+1),ΔX2(k,k+1),…,ΔXM(k,k+1)和運動狀態估計X1,k+1,X2,k+1,…,XM,k+1。通過M個目標在k時刻與k+1時刻的軌跡標簽對比,將M個已存在目標在k時刻分為軌跡正常延續目標和軌跡間斷目標。此外,還可通過前后時刻標簽對比,得到k+1時刻出現R個新生標簽軌跡點Xnew1,Xnew2,…,XnewR。
每個新生標簽軌跡點有3種可能情況:①新生標簽軌跡點是新生目標軌跡點;②新生標簽軌跡點是已存在目標的多余軌跡點;③新生標簽軌跡點是已存在目標軌跡間斷后的恢復軌跡點,但恢復軌跡點并未沿用間斷前的軌跡標簽而是被賦予新的軌跡標簽。由每個已存在目標的自適應門限表達來判斷k時刻所有R個新生標簽軌跡點分別屬于以上哪種情況:首先,判斷新生標簽軌跡點是否屬于情況③:當新生標簽軌跡點Xnewr與某軌跡間斷目標的運動狀態改變量ΔXnewr,間斷滿足
|Xnewr-Xm,k|≤|ΔXm(k,k+1)|+ε
(10)
其中ε是任意小的正數,認為該新生標簽軌跡點是軌跡間斷目標的恢復軌跡點,否則不是;然后判斷所有不屬于情況③的新生標簽軌跡點分別屬于情況①還是情況②:當新生標簽軌跡點與軌跡正常延續目標的運動狀態改變量ΔXnewr,正常滿足公式(10)的點時,認為該新生標簽軌跡點屬于情況②,否則屬于情況①。
每種情況對應不同的處理方式:對屬于情況①的新生標簽軌跡點,保留該軌跡點及標簽;對屬于情況②的新生標簽軌跡點,需要與其它也屬于同一目標m的D個軌跡點一起被評價,保留最優軌跡點min|Xd,m|,其中
|Xd,m|=|Xd,k+1-Xm,k+1|,d=1,2, …,D
(11)
然后刪除其它多余軌跡點;對屬于情況③的新生標簽軌跡點,需要向間斷前的軌跡標簽統一。最后,若k時刻仍存在軌跡間斷目標,判斷該目標具體是軌跡間斷還是已經軌跡結束,若軌跡未結束,以該目標在k時刻的運動狀態估計作為軌跡外推點。自適應門限實現軌跡間斷處外推和多余軌跡刪除的步驟如圖7所示。

圖7 自適應門限判定算法實現軌跡間斷處外推和多余軌跡刪除的步驟Fig.7 Steps of adaptive threshold determination algorithm to extrapolate and delete the redundant trajectories
本文選取77 GHz毫米波雷達對一條馬路的某個時間段的3個觀測數據來進行實驗,77 GHz毫米波雷達數據率范圍是11 Hz~14 Hz。該馬路為直線且不存在岔路,即運動目標僅能在觀測區域中道路的兩端出現或消失,且不會在道路中間掉頭,不存在超車、并道或在馬路中間停車等特殊情況,即目標的運動模型近似滿足直線運動,傳感器觀測示意圖如圖8所示。

圖8 77 GHz毫米波雷達觀測示意圖Fig.8 Observation diagram of 77 GHz millimeter wave radar
首先,δ-GLMB濾波算法對三個觀測數據中的目標運動進行跟蹤。在觀測區域中,雜波均勻分布,雜波強度λ=5、雜波區域S=[-1000,1000]×[-1000,1000]m2。設定每個目標的幸存概率PS=0.99,傳感器檢測到目標概率PD=0.80,對3個數據均觀測100幀。
圖9、圖11、圖13分別為三段觀測數據對應的實際觀測場景,圖10、圖12、圖14所示分別為3段觀測數據經過δ-GLMB濾波后得到的運動目標的跟蹤結果,第一個圖表示在x軸方向的跟蹤軌跡,第二個圖表示在y方向上的跟蹤軌跡,不同顏色的軌跡代表不同目標的運動軌跡估計,“x”代表目標量測點跡,黑色點為濾波器估計值。可以看到,濾波器估計值與真實軌跡大致上吻合,證明δ-GLMB算法能夠對多目標進行有效跟蹤。

圖9 觀測數據1對應的場景1Fig.9 Scene 1 corresponding to observation data 1

圖10 δ-GLMB濾波器對觀測數據1的狀態估計Fig.10 The state estimation of observation data 1 by δ-GLMB filter

圖11 觀測數據2對應的實際場景Fig.11 Scene 2 corresponding to observation data 2

圖12 δ-GLMB濾波器對觀測數據2的狀態估計Fig.12 The state estimation of observation data 1 by δ-GLMB filter

圖13 觀測數據3對應的實際場景Fig.13 Scene 3 corresponding to observation data 3

圖14 δ-GLMB濾波器對觀測數據3的狀態估計Fig.14 The state estimation of observation data 3 by δ-GLMB filter
在觀測數據1中共出生3個運動目標,目標2小汽車的軌跡由兩條軌跡共同組成。在觀測數據2中共出生6個目標,目標3的行人更易受到路邊障礙的遮擋而間斷,目標2和目標5分別存在不止一條航跡。在觀測數據3中共出生5個目標,在目標1由于被遮擋導致軌跡點混亂,目標5在距傳感器遠處由于傳感器分辨率和其它相距很近目標的因素影響而軌跡間斷,在由遠及近的運動過程中逐漸發展出多軌跡。
通過3段數據的δ-GLMB算法的跟蹤結果和實際場景的對比分析可以看到:在3個運動場景中,δ-GLMB濾波器得到的目標個數估計和運動狀態估計是不準確的,由于目標自身尺寸、傳感器分辨率及觀測角度、周圍目標或障礙物的遮擋等原因造成了單目標的多軌跡問題。通過本文提出的自適應門限判定方法對以上δ-GLMB算法的跟蹤結果的缺陷進行改進,對3個數據的改進結果如圖15、圖16和圖17所示,其中每個場景的實驗參數設置見表2。

表2 自適應門限判定算法實驗參數設置
n、α、ε和ω的取值與場景有關。目標航跡越接近直線,說明該目標運動狀態越趨于勻速,則n和α越趨近于1、ε越趨近于0,反之越大,其取值上限由多次測試達到最好結果時得到,原則上n和α不應超過2,ε不應超過1;ω的取值與目標本身運動狀態變化有關,當目標運動狀態較為平穩時,ω1的取值可以合理增大。

圖15 對觀測數據1加入自適應門限判定的狀態估計Fig.15 The state estimation of observation data 1 by adaptive threshold determination algorithm

圖16 對觀測數據2加入自適應門限判定的狀態估計Fig.16 The state estimation of observation data 2 by adaptive threshold determination algorithm

表3 改進前后算法性能對比

圖17 對觀測數據3加入自適應門限判定的狀態估計Fig.17 The state estimation of observation data 3 by adaptive threshold determination algorithm
圖15、圖16、圖17分別為3段觀測數據為在自適應門限判定后得到的跟蹤結果,與圖10、圖12、圖14和3段觀測數據對應的實際場景對比可以看出:目標的多余航跡已被刪除,航跡間斷前后的標簽已經統一,并且新目標的出生與運動均未受到影響。觀測場數據1中的小汽車僅保留了一條完整的有效軌跡,證明自適應門限判定算法能正確判斷出屬于同一個目標的多條軌跡并進行刪除;觀測場景2中的行人目標實現了軌跡外推和間斷前后的標簽統一,證明了自適應門限判定算法能解決由軌跡間斷造成的多軌跡問題;觀測場景3中的第20幀出生的目標也進行了間斷前后軌跡標簽的統一和多余軌跡的刪除,證明了自適應門限判定算法能夠解決軌跡間斷和多量測這兩種因素同時存在下的多軌跡問題。表3給出了在本文的實際交通場景下,δ-GLMB算法和在δ-GLMB算法的跟蹤結果基礎上加入自適應門限判定算法后的性能對比,改進后對場景中目標個數估計的準確率顯著提高,證明了本文提出的自適應門限判定方法能夠正確判斷新生標簽航跡點是新生目標的航跡點還是已存在目標的航跡點并分別做出相應的處理,很好的彌補了δ-GLMB濾波器對實際場景中目標跟蹤存在的不足,實現了對目標的正確跟蹤。
針對實際復雜交通場景中毫米波雷達能從單目標上獲得多個量測從而導致 δ-GLMB算法的多目標跟蹤結果中出現單目標有多軌跡等問題,本文提出在δ-GLMB跟蹤結果的基礎上加入自適應門限判定的改進算法,彌補了δ-GLMB濾波算法假定一個目標至多有一個量測導致把同一目標的多條軌跡判定為新生目標軌跡的這一缺陷。自適應門限判別算法能夠正確區分新生標簽軌跡點是屬于新生目標還是已存在目標,對判定為真正的新生目標軌跡點進行保留,對判定為屬于已存在目標的多余軌跡點進行刪除,對判定為屬于軌跡間斷目標的的恢復軌跡點進行間斷前后軌跡標簽的統一。實驗結果表明本文提出的改進算法能夠很好地實現對實際復雜交通場景中的多目標跟蹤。但本文提出的算法僅考慮目標近似做直線運動的情況,當目標進行拐彎、掉頭等非直線運動的情況還有待研究。