楊金龍,程小雪,繆佳妮,張光南
1.江南大學物聯網工程學院,江蘇無錫 214122
2.長安大學信息工程學院,西安 710064
多目標跟蹤[1]是目標跟蹤方向的一個重要分支,作為經典的計算機視覺問題,多目標跟蹤在智能視頻監控、智能交通管制及無人駕駛等領域有著廣泛的應用。復雜環境下視頻多目標跟蹤應用中,除了光照變化、目標形變和目標遮擋等問題,目標數目未知、新生目標不確定、圖像模糊及雜波干擾等復雜問題,也一直是多目標跟蹤領域中研究的難點。
早期的多假設跟蹤(multiple hypothesis tracking,MHT)[2]和聯合概率數據關聯濾波(joint probabilistic data association filter,JDAF)[3]等方法,通過將目標與量測建立明確的關聯實現多目標跟蹤。這些方法在視頻多目標跟蹤中取得了一定的效果,但是復雜的數據關聯過程,使得算法效率大幅度下降。此外,對數目未知且變化的多目標跟蹤,存在目標數目及狀態估計不準確的問題。近年來,Mahler提出的隨機有限集(random finite set,RFS)[4]理論,分別對目標狀態和觀測進行隨機集建模,提供了一種自頂向下的多目標跟蹤處理方法,可避免復雜的數據關聯運算,尤其在對數目未知且變化的多目標跟蹤中取得了一定的優勢。基于RFS的算法,如概率假設密度(probability hypothesis density,PHD)[5]、勢概率假設密度(cardinalized PHD,CPHD)[6-7]、多伯努利濾波(multi-Bernoulli filter,MBF)[8-9]、勢均衡多伯努利濾波(cardinality balanced MBF,CBMBF)[10]等算法在視頻多目標跟蹤中得到進一步應用。文獻[11]提出序貫蒙特卡羅(sequential Monte Carlo,SMC)的多伯努利濾波算法,如粒子多伯努利濾波(particle multi-Bernoulli filter,PMBF)[10],借助多目標貝葉斯估計理論遞推近似多目標狀態集的后驗概率密度分布,提高對數目變化多目標的跟蹤精度。
得益于近幾年檢測算法[12]的突破性發展,基于檢測的跟蹤算法[13-14]逐步成為目前廣泛使用的視頻目標跟蹤框架,基于RFS的濾波方法中,目標的新生依賴于先驗的新生強度函數,但在真實跟蹤場景中,通常難以準確地給出目標的新生強度函數。傳統的MBF、PHD算法[15-17]根據先驗知識設置目標的新生強度和新生區域,通常需要預先了解場景信息。文獻[18]給定目標新生概率,使用量測值作為高斯分布的均值,提出量測驅動的目標新生模型。同時,利用外觀特征信息來學習目標的外觀模型,并構造增強似然函數,提高跟蹤性能。文獻[19]基于量測似然較高的新生粒子建立自適應目標新生模型,借助空間關系,采用現有的數據驅動門限方法選擇目標量測,降低跟蹤過程中更新步驟的時間復雜度。文獻[20]預先設定置信度閾值,自適應地生成目標新生強度。以上方法,對于目標新生問題作出了很大貢獻,但是難以有效去除檢測結果中的干擾雜波,由新生目標的量測確定新生強度也會導致跟蹤結果誤差較大。此外,目標檢測作為檢測跟蹤算法的底層步驟,檢測器性能直接影響跟蹤算法的精度,復雜環境下誤檢與漏檢問題,是檢測跟蹤算法的一個典型挑戰。文獻[21]提出YOLOv3算法,該算法是對文獻[22-24]的一系列改進,采用Darknet-53作為特征提取的網絡,在不同尺度上預測邊界框,具有較好的檢測效果與檢測速度,但對復雜環境的視頻多目標檢測,同樣會出現誤檢和漏檢等問題。
針對上述視頻多目標跟蹤過程中,目標數目變化、目標遮擋和檢測器漏檢、誤檢等問題,本文基于MBF跟蹤框架,采用YOLOv3檢測算法對視頻幀進行預檢測,并采用卷積特征[25]描述目標,計算相鄰幀目標相似度矩陣,實現檢測框初步匹配,然后融合目標模板、目標軌跡和匹配框,進一步提出目標識別策略,結合目標標簽,有效進行雜波剔除,實時對新生目標判別和漏跟目標重識別。重識別的目的是避免漏跟的目標被重新跟上時,不至于被當作新生目標,可以和之前的軌跡關聯,減少軌跡碎片。最后,通過建立目標遮擋處理機制,融合高置信度檢測框,優化目標運動模型,提出目標模板自適應更新方法,去除跟蹤過程中的累積誤差,以實現視頻多目標連續軌跡的優化跟蹤。
本文的主要貢獻概括如下:
(1)由于傳統的PMBF需要事先給定目標的新生位置,但在真實場景中,目標的新生位置不確定,為此,本文在PMBF框架下,融入YOLOv3算法對視頻目標進行預檢測,并設計新生目標及存活目標判斷策略,以及漏跟目標重識別策略,實現對預檢測目標類別判決。YOLOv3檢測框置信度表示檢測框包含目標的概率和檢測框與目標匹配程度的得分,本文將低置信度檢測框判斷為誤檢或檢測不準確,通過后續的PMBF濾波,實現對誤檢或檢測不準確的多目標進行正確跟蹤,提高對目標的跟蹤精度。
(2)基于對預檢測目標類別判定,提出融合高置信度檢測框構造目標運動模型,優化目標狀態預測,為后續狀態更新及提取奠定基礎。
(3)提出融合檢測結果的自適應模板更新策略,并根據交并比和目標運動速度及方向對被遮擋目標進行判決處理,可有效提高算法對被遮擋目標的估計精度。
(4)通過目標身份識別標記及漏跟目標的重識別,實現對多目標運動航跡的關聯。
在空間χ上,將多目標狀態RFS表示為X={X(1),X(2),…,X(M)},X(i)={(r(i),p(i))}為第i個目標分量,通過伯努利參數(r(i),p(i))來參數化目標后驗概率分布,其中r(i)和p(i)分別表示第i個目標的存在概率和概率分布。MBF采用貝葉斯理論對多目標的后驗概率分布進行迭代更新,以達到對多目標的狀態估計。
假設第k-1幀多目標的后驗概率分布為:
其中,Mk-1表示第k-1幀存活目標的個數。則預測的多目標概率分布可表示為:


pD,k(x)為目標檢測概率,gk(z|x)表示量測似然函數,Zk、κk(z)分別表示量測集和雜波密度函數,第k幀目標數目估計為Mk=Mk|k-1+|Zk|。
為了減少背景干擾,提取具有高區分性的目標特征,本文采用文獻[25]中提出的卷積特征,提取每個目標的表觀特征,特征提取主要分為三部分:構造卷積核、提取卷積特征和相似度計算。
(1)構造卷積核
在目標框周圍,以目標框大小的矩形框隨機采樣m個背景樣本框,背景樣本框與目標框中心位置的距離,要求在水平方向距離大于1/4目標框寬度或者在豎直方向距離大于1/4目標框高度,然后將目標框與背景樣本框尺寸規范化為n×n,并灰度化圖像,得到樣本集{I,B1,B2,…,Bm},其中I表示目標框圖像,Bi為第i個背景樣本圖像。使用大小為w×w的滑動窗口,以步長Δ分別對樣本集圖像進行卷積操作,得到目標圖像塊集合y={Y1,Y2,…,Yl}和背景圖像塊集合,為保留梯度信息,弱化亮度影響,將所有圖像塊減去自身均值并二范數歸一化處理,最終使用K-means算法[26],從目標圖像塊集合中選出d個圖像塊作為目標卷積核:

從m個背景樣本對應的背景圖像塊集合中,選出m×d個背景圖像塊,對這些圖像塊平均池化得到背景卷積核:

(2)提取卷積特征
利用式(12)中的目標卷積核,在目標圖像I上,以步長Δ進行卷積操作,提取目標特征圖。同時采用式(13)中的背景卷積核,同樣以步長Δ在圖像I上卷積=,得到相應的背景特征圖
在目標特征圖上進行背景信息減除:

(3)相似度計算
為了更準確地評價兩個框的相似程度,本文在目標跟蹤過程中,通過式(15),計算出相似度,用于目標模板、檢測框、跟蹤框等之間的相似性度量。

其中,fh、f分別為兩個框的卷積特征,表示f的二范數。
本文在MBF框架下,引入YOLOv3檢測算法對視頻幀進行預檢測,通過計算相鄰幀檢測框的相似度矩陣,并進行檢測框的初步匹配,加入目標標簽信息識別身份,融合高置信度檢測框、目標軌跡和目標模板,以剔除干擾雜波,提出目標新生識別和漏跟目標重識別策略以實現對目標軌跡的連續估計。此外,設計目標遮擋處理機制,提出目標模板自適應更新策略,進一步實現多目標的優化跟蹤。本文算法基本框架如圖1所示,主要步驟如下。
(1)相鄰幀目標檢測

Fig.1 Flow graph of proposed algorithm圖1 提出算法的流程框圖
采用YOLOv3算法檢測第k和k+1幀視頻序列,記第k幀檢測框個數為n,檢測框狀態集為S?k=,第k+1幀檢測框個數為m,其檢測框狀態集為表示第i個檢測框狀態向量,參數分別表示第k幀第i個檢測框左上角的橫坐標、縱坐標,以及檢測框的寬、高和標簽。
(2)相似度矩陣計算
采用第3章中的卷積特征表示第k幀和第k+1幀的檢測框,分別記為表示第k幀中第i個檢測框的卷積特征向量,計算檢測框特征對應的相似度矩陣Λ:

從檢測框相似度矩陣Λ的每一行選擇值最大且大于相似度閾值Tl的兩個檢測框作為匹配結果,由于視頻幀中目標連續變化,假定同一個目標在相鄰兩幀不會出現特別大的位移變化,因此本文在相似度匹配的基礎上,加入目標框的交并比(intersection over union,IOU)作為限制,對于多個相似度較高的目標框,利用IOU作為限制條件,可有效剔除相似目標框對匹配結果的影響,若兩個檢測框的IOU大于IOU閾值Tu,則可判定兩個檢測框匹配,假設第k幀中的第i個檢測框與第k+1幀中的第j個檢測框匹配,則為第k+1幀中匹配的檢測框賦值標簽,即
根據相鄰幀的檢測框、目標模板和存活目標軌跡來進行目標識別。將第k幀檢測框與第k+1幀檢測框進行匹配,對于第k幀中第i個檢測框,若為空,則表示該檢測框包含的目標在第k-1幀中未被檢測到,采用與相鄰幀檢測框匹配相同的計算方法,將該檢測框與存活目標軌跡、目標模板進行匹配,提出如下目標識別過程:
(1)新生目標識別

(2)漏跟目標重識別

(3)存活目標識別
(4)干擾雜波識別
目標識別過程中,為每個檢測框目標進行標簽賦值,實現對新生目標賦值新標簽,實現對存活目標和重識別目標與之前軌跡進行匹配關聯,并在后續PMBF濾波時,通過標簽將對應的檢測框進行優化濾波,以提高對目標跟蹤的準確率。尤其是在目標重識別環節,通過對目標的重識別,可以避免把重識別的目標當作新生目標,有效減少被重新起始的軌跡數量。
假設目標運動模型為隨機游走模型,根據目標識別后的檢測信息,若目標被檢測到,且檢測框置信度大于置信度閾值TB時,采用檢測框調整目標狀態,即:



(1)目標狀態更新
假設第k-1幀多目標預測概率分布為:

(2)目標狀態提取
本文算法采用文獻[16]中提出的粒子重采樣和伯努利分量刪減方式,來避免粒子退化,剔除存在概率過小的伯努利分量。根據更新后的多目標后驗概率分布,采用與文獻[16-17]相同的閾值τ(τ=0.5),提取存在概率大于閾值τ的伯努利分量對應的目標狀態,通過選擇權重大于0.2且與目標框的IOU值最大的粒子作為目標狀態估計,既考慮了目標的IOU值,同時又保證采樣粒子的權值不至于過小。如果粒子的權值比較大,但IOU值很小,說明粒子與目標離得較遠,可能不是目標的最佳狀態;如果IOU比較大,但粒子權值比較小,說明粒子與目標相似性較低,也可能不是目標的最佳估計,因此在限定的粒子權值范圍內,如果粒子權值和IOU都比較大,則最有可能是目標的最佳估計。本文采用經驗值0.2作為粒子權重的閾值提取目標狀態,即:

目標運動過程中,周圍環境及自身狀態會不斷發生變化,如背景變化、自身扭曲、旋轉及尺度變化等,因此需要對目標模板進行實時更新,本文算法綜合考慮采用存活目標軌跡、目標模板和目標檢測結果進行融合更新目標模板,即:


當相鄰兩個目標框的IOU大于IOU閾值Tu時,可判定這兩個目標出現遮擋情況,此時YOLOv3檢測器可能出現三種情況:(1)當檢測器能檢測出這兩個目標,表示目標輕度遮擋,對目標模板進行自適應更新;(2)當只有一個目標能被檢測器檢測出來時,可判定另一個目標為被遮擋目標,對被遮擋目標,停止模板更新,采用該目標前兩幀的位移差,估計目標實時速度v與運動方向θ,對目標進行預測估計,目標框的大小保持不變;(3)當兩個目標都無法通過檢測器檢測出來時,依據式(15)計算兩個目標框與對應目標模板的相似度,相似度小的目標框,判定為被遮擋目標,與第(2)種情況中采用同樣的方式處理被遮擋的目標。若目標在跟蹤過程中消失或者跟丟,在目標分離或者重新出現時,可通過目標識別策略對目標進行重識別。
為了驗證本文算法的有效性,實驗在處理器為Intel Core i7-8700、3.2 GHz,12核,內存為16 GB,顯卡為NVIDIA Geforce GTX 1080 Ti的工作站上運行,采用Matlab2016a對本文算法進行測試。實驗采用公共數據集中5組典型的視頻序列,包括Visual Tracker Benchmark[27]TB50中的序列Huamn4,TB100中的序列Jogging、Subway、Suv和CAVUAR[28]中的序列Crossing(EnterExitCrossingPaths1cor)。表1為對應視頻序列存在的主要問題,這5組典型視頻序列分別來源于不同場景,且包含相機移動、目標遮擋、目標形變、圖片模糊、光照變化等干擾情況。將本文算法與PMBF算法[12]、HIST(histogram feature filter)算法[8]、CNT(convolution network feature tracker)算法[29]和IOU-T(IOU tracker)算法[30]進行性能比較與分析。其中,CNT、PMBF算法使用與本文算法相同的抗干擾卷積特征,HIST算法使用直方圖特征。在實驗中,PMBF算法也利用YOLOv3的檢測結果,將判定為新生目標的檢測結果作為PMBF算法的新生目標,為了公平地比較,IOU-T算法同樣使用YOLOv3檢測結果。

Table 1 Tested video sequence表1 測試視頻序列
算法中參數設置如下:目標存活概率Ps=0.9,存活目標的最大、最小采樣粒子數目為100,新生目標的最大、最小采樣粒子數目為=350、=100 。卷積特征提取時,目標框尺寸規范化為32×32 (n=32),滑動窗口大小為6×6 (w=6),步長Δ=1,子塊的個數為d=100 。遮擋判斷時,目標之間IOU閾值設為Tu=0.15。目標匹配時,相似度閾值設為Tl=0.2。檢測框置信度閾值設為TB=0.9。
實驗中采用的性能評價指標主要為OSPA(optimal sub-patten assignment)距離統計[31]、目標數目估計和多目標跟蹤正確度(multiple object tracking accuracy,MOTA)[32]、多目標跟蹤精度(multiple object tracking precision,MOTP)、軌跡完整目標數目(mostly tracked,MT)、標簽跳變數(identity switch,IDs),其中MOTA、MOTP、MT、IDs分別定義如下:
(1)多目標跟蹤正確度(MOTA)

其中,mk為第k幀中被跟丟的目標數量,fpk為第k幀誤檢的目標數,mmek為第k幀中跟蹤軌跡中目標標簽發生跳變的個數,gk表示第k幀中目標的實際數目。
(2)多目標跟蹤精度(MOTP)

(3)軌跡完整目標數目(MT),表示目標跟蹤軌跡占真實軌跡長度80%以上的目標軌跡數目,刻畫了軌跡的完整程度。
(4)標簽跳變數(IDs),表示跟蹤過程中目標標簽發生變化的次數,即漏跟目標重新被跟蹤后,如果不能與之前軌跡關聯,則標簽發生跳變。
5.2.1 目標重識別
視頻序列Crossing包含5個運動目標,存在目標緊鄰和較長時間的目標遮擋問題,同時伴隨目標逐漸出現導致形變較大的情況等。目標被長時間遮擋,當目標重新出現時,如圖2所示,檢測器檢測到重新出現的目標,PMBF算法將重新出現的目標判定為新生目標,不能與之前該目標的軌跡關聯,同時在跟蹤過程中,受目標緊鄰和遮擋的干擾出現誤跟和跟蹤框偏移的現象;HIST算法則出現跟蹤框嚴重偏移;CNT算法中較為相似的目標,在遮擋發生后,跟蹤框錯位;IOU-T算法完全拋棄使用圖像信息,只利用目標檢測結果進行跟蹤處理,無法繼續跟蹤漏檢目標,當目標再次被檢測到時,同時被定義為新目標,難以與歷史目標關聯;而本文算法,較長時間被遮擋的目標,由于存在概率逐漸降低導致目標消失,如圖2(f)所示,當目標再次出現時,通過計算重新出現的目標框與目標模板的相似度,可有效地對目標進行重識別,將目標重新加入到目標跟蹤軌跡中,與之前軌跡關聯,減少軌跡碎片和標簽跳變情況。

Fig.2 Tracking results of sequence Crossing圖2 Crossing序列跟蹤結果
5.2.2 目標緊鄰與遮擋
視頻序列Jogging和Subway都存在目標緊鄰與遮擋情況,其中視頻序列Jogging為相機移動的路口場景,包含3個運動目標,存在目標被部分和完全遮擋的情況,視頻序列Subway包含8個運動目標,存在多個目標緊鄰和頻繁被遮擋等問題。如圖3,目標脫離遮擋狀態時,IOU-T算法將重新檢測到的目標定義為新生目標,PMBF、HIST算法即使沒有丟失目標,但是跟蹤框的偏離程度卻增大,CNT算法則是出現跟蹤框跟丟的現象,而本文算法能很好地融合目標的檢測結果和跟蹤結果,實現對跟蹤框進行調整,可以獲得比較準確的跟蹤結果。
對于多個目標存在頻繁的緊鄰與遮擋,如圖4所示,YOLOv3難以檢測到被遮擋目標或者檢測結果偏差較大,導致IOU-T算法頻繁丟失目標,且跟蹤框不準確,PMBF、HIST、CNT算法處理遮擋、緊鄰問題時,也會出現較大的偏差,甚至跟丟,本文算法引入遮擋處理機制,融合濾波和檢測結果,提取目標運動信息,能夠較好地對被遮擋目標進行跟蹤。

Fig.3 Tracking results of sequence Jogging圖3 Jogging序列跟蹤結果
5.2.3 圖像模糊與目標形變
視頻序列Human4為相機移動紅綠燈路口場景,包括3種類型17個目標,視頻中存在由于相機運動或目標快速運動等造成的目標模糊情況,且存在許多目標頻繁發生形變問題。圖片模糊可能導致檢測器性能下降,部分目標被漏檢,目標形變對檢測器的性能影響較小,但可能出現檢測框不準確的情況。如圖5所示,PMBF算法能跟上目標,但部分目標的跟蹤框會出現偏離,HIST算法出現跟蹤框嚴重偏離,CNT算法無法重新跟蹤漏跟的目標,導致跟蹤精度下降,IOU-T算法則依賴于檢測器結果,無法處理漏檢和誤檢目標,而本文算法有效地在濾波過程中融合檢測結果,能夠較好地處理這兩種情況,具有較高的跟蹤精度。

Fig.4 Tracking results of sequence Subway圖4 Subway序列跟蹤結果

Fig.5 Tracking results of sequence Human4圖5 Human4序列跟蹤結果
5.2.4 目標大位移
視頻序列Suv為相機移動動態背景的公路場景,包含6個運動目標,存在快速運動導致的大位移情況,同時也包含了目標形變、目標緊鄰與遮擋等問題。如圖6所示,目標的大位移對檢測器沒有影響,IOU-T算法表現良好,而PMBF、HIST、CNT算法會出現目標跟丟的情況,本文算法由于利用檢測器的結果去調整跟蹤過程,對于較大位移的目標也具有很好的跟蹤效果。
MOTA、MOTP、ML、IDs這4個指標的定量實驗結果如表2所示,本文算法利用相似度矩陣對檢測框進行關聯,且包含目標重識別過程,有效減少了目標標簽的跳變。與對比方法相比,本文算法在IDs和MT指標上具有明顯優勢,即本文算法通過目標重識別有效關聯了目標軌跡,減少了軌跡碎片,提高了目標軌跡完整性。

Fig.6 Tracking results of sequence Suv圖6 Suv序列跟蹤結果
YOLOv3檢測器在視頻序列Crossing、Suv上,檢測效果良好,因此對于MOTP指標,IOU-T算法與本文算法表現相似,但是遮擋、緊鄰和大位移等問題的存在,使得HIST、CNT、PMBF算法在跟蹤過程中出現跟蹤框偏移、目標漏跟等現象,跟蹤精度減少。視頻序列Jogging是比較簡單的視頻場景,本文算法的MOTA指標與PMBF算法相差不大,但是MOTP指標優于對比算法,由于在實驗中PMBF算法與本文算法采用了同樣的卷積特征和目標新生方式,說明本文算法提出的自適應更新策略能有效減少跟蹤過程中的累積誤差,更準確地對目標進行跟蹤。對于存在目標形變、目標遮擋、圖像模糊等復雜的視頻序列,如視頻序列Subway和Human4,本文算法的MOTA指標和MOTP指標都具有明顯優勢。
為了進一步進行對比分析,本文采用當前圖片幀中跟蹤框的個數作為目標數目估計值。圖7~圖11所示為目標數目估計與OSPA距離估計對比圖,實驗中PMBF、IOU-T算法和本文算法都是基于檢測結果判斷目標新生,因此當新生目標部分出現,而檢測器無法檢測出時,目標數目估計不準確,OSPA值上升,而HIST、CNT算法固定目標新生位置,若將部分出現的目標作為跟蹤框會導致后續跟蹤精度下降,若對完整出現目標進行跟蹤,則對前面幀部分出現的目標出現漏跟,目標數目估計值減少,OSPA距離增大。目標逐漸消失過程中,PMBF、CNT算法對目標消失不敏感,可能導致目標數目估計值增加,IOU-T算法由于檢測器的漏檢,會出現目標數目估計值減少,導致OSPA突增。如圖8~圖11中左圖所示,當新生目標出現時,本文算法能很快將新生目標檢測出并加入到目標軌跡中,同時本文算法融合濾波器與檢測結果,提高了目標消失過程中的跟蹤性能。PMBF、HIST、CNT算法在出現圖片模糊、目標形變、目標大位移、目標緊鄰與遮擋等情況時,容易出現誤跟和漏跟,導致跟蹤框偏離較大,OSPA值上升。復雜環境下,檢測器性能下降,出現漏檢、誤檢,IOU-T算法受檢測器性能影響,導致目標數目減少,跟蹤框不準確,OSPA值急劇上升。本文算法包含目標緊鄰與遮擋處理機制,同時利用檢測結果優化濾波過程,整體跟蹤性能明顯優于對比算法。

Table 2 Comparison of quantitative results表2 定量結果比較
本文提出了一種基于YOLOv3檢測的多伯努利視頻多目標跟蹤算法,首先采用抗干擾的卷積特征描述目標,弱化背景信息,通過計算相鄰幀檢測框的相似度矩陣,實現對檢測框的幀間匹配,利用檢測框與目標模板、目標軌跡的相似度匹配,剔除干擾雜波,實時進行目標新生判斷和漏檢目標重識別,使得軌跡碎片減少,提高了軌跡完整性。同時,提取目標運動信息,建立目標遮擋處理機制,實現遮擋情況下,對目標的準確跟蹤。在跟蹤過程中,利用高置信度檢測框優化目標運動模型,提出目標模板的自適應更新策略,可有效去除跟蹤框累積誤差,提高對目標和背景變化的自適應性。實驗結果表明,本文算法具有良好的跟蹤性能。

Fig.7 Comparison between object number estimation and OSPA distance estimation of sequence Crossing圖7 Crossing序列目標數目估計與OSPA距離估計對比

Fig.8 Comparison between object number estimation and OSPA distance estimation of sequence Jogging圖8 Jogging序列目標數目估計與OSPA距離估計對比

Fig.11 Comparison between object number estimation and OSPA distance estimation of sequence Suv圖11 Suv序列目標數目估計與OSPA距離估計對比