李月武,劉長江,胡建旺,吉 兵
( 1.陸軍工程大學石家莊校區,河北 石家莊 050000; 2.解放軍31697部隊,遼寧 大連 116104)
數據融合技術越來越多地應用于包括C4ISR系統和各種武器平臺在內的軍事領域和許多民事領域[1]。但是對融合算法和系統性能的研究成果和應用效果的評估國內外研究都比較欠缺,主要原因是多傳感器信息融合的處理過程是多層次多級別的,融合系統所匯集和處理的信息種類繁多,信息源之間關系復雜,使得客觀、公正地評估融合系統成為該領域研究的重點和難點[2]。
目前針對分布式航跡融合系統的性能評估,雖然已有一些理論、方法研究及成果,但是針對不同的融合系統提出了不同的指標體系以及不同的評估系統,即使同一級別或層次,也有不同的評估度量指標,尚未形成一套標準的分布式航跡融合系統性能評價指標體系[3]。并且在目標跟蹤與數據融合時可能出現虛警、丟點等情況,使得融合數據與真值數據無法一一對應[4],常用的精度指標位置均方根誤差(position root mean square error, PRMSE)、速度誤差、航向誤差[5]等無法正確評價融合精度,需要提出新的精度指標對系統進行評估。
針對目前分布式航跡融合系統尚未形成一套標準的性能評價指標體系,以及常用精度指標存在的問題,對分布式航跡融合系統評價指標體系進行優化。
粗糙集理論是一種處理不精確、不確定和模糊知識的軟計算工具[6-7]。本文采用粗糙集理論對初步構建的指標體系其進行約簡優化,剔除冗余指標,并確定指標權重。下面簡單介紹一下粗糙集理論、基于粗糙集等價關系的指標篩選模型以及屬性重要性計算。
知識約簡(knowledge reduction)是粗糙集理論的核心問題之一。所謂知識約簡,就是在保持知識庫分類能力不變的條件下,刪除其中不相關或不重要的信息,包括屬性約簡和對象約簡(或規則約簡),以使知識表示簡化,下面介紹一下屬性約簡的基本概念。
1) 近似域
定義1 粗糙集就是論域U上的一個等價關系R,?A?U,A的上、下近似集分別為:
(1)
(2)

2) 知識表達系統
定義2 知識表達系統,可以被看為一個關系數據表,它的形式化定義為:S=〈U,C,D,V,f〉,其中U為論域,C為條件屬性,D為決策屬性,C∪D=R是屬性集合(等價關系集合),V=∪a∈AVa是全體屬性集的集合,Va表示了屬性a∈A的值域,f:U×A→V是一個映射,它指定U中的每個對象x的屬性值,則這種數據表為稱為知識表達系統。
3) 不可分辨關系
定義3 設S=〈U,A〉為一信息表,B?A,定義B在U上的不可分辨關系(等價關系)IND(B)為:

(3)
4) 知識約簡
定義4 知識約簡:對于給定的信息系統S和S中的一個等價關系族P?S,?R∈P,若IND(P)=IND(P-{R})成立,則稱R為P中不必要的,否則就是必要的。
根據指標體系的每一個指標,可以對評價對象進行一種劃分,將評價對象劃分為多個等價類,或根據多個指標所構成的指標集,得到一個等價關系。如式(3)所示,IND(R)即代表對應著指標集R的等價關系,對于

即等價關系IND(R)為所有其子集的等價關系的交集。
假定R是一個等價關系族,r∈R,若IND(R)=IND(R-{r}),則稱r在指標集R中可被約去,為冗余指標,否則r為指標集R中絕對必要的,不可約去。若對于?r∈R都是不可約去的,則稱R是獨立的等價關系族。若P=R-{r}是獨立的,則P是R的一個約簡,記為RED(R)。
基于粗糙集等價關系的指標篩選模型如下所示:
步驟1 記指標體系為C={ai},i=1,2,…,m,求IND(C);
步驟2 對i=1,2,…,m,依次求IND(C-{ai});
步驟3 若IND(C-{ai})=IND(C),則ai為指標體系C中可以約簡的冗余指標;否則ai為不可約去的必要指標;
步驟4 得到篩選后的指標體系為RED(C)={ak|ak∈C,IND(C-{ak})≠INC(C)}。
粗糙集中屬性重要性是指去掉某個指標后對系統分類情況的影響大小,反映了各個指標對整個指標體系的重要性,因此根據屬性重要性可以得到指標權重。若去掉該屬性相應的分類變化比較大,則說明該屬性的重要性高,即指標權重大;反之,說明屬性的重要性低,即指標權重小[7]。
假定一個信息系統為S=(U,A,V,f),P?A,U/IND(P)={x1,x2,…,xn},知識P的信息量為:
(4)
式(4)中,|Xi|為Xi元素個數。指標體系中不同指標所反映的信息量的大小不同,則指標r∈R在指標體系R中的重要性為:
SigR-{r}(r)=I(R)-I(R-{r})
(5)
由式(5)可以看出,由R刪除r之后所引起的信息量變化的大小來表示指標r在指標體系R中的重要性。由此可得,若R={r1,r2,…,rn},則指標r∈R的權重為:
(6)
通過粗糙集屬性重要性得出的指標權重是以實驗數據為依據,對數據本身進行挖掘,從而找出事物間的內在規律,與層次分析法或專家憑經驗得出的權重相比,粗糙集屬性重要性得出的權重更具有客觀性,提高了評價結果的真實性。
融合系統評估整體狀況的客觀反映構成了指標體系,在進行融合系統性能評估時,依據不同的評估對象和評估目的,建立評價指標體系,體系是否科學合理,決定了評估工作成功與否[8]。
目前構建的指標體系基本是基于專家咨詢或歷史經驗等方法,從不同研究角度建立相應的指標體系,并沒有理論方法去指導設計指標體系,但大都依據全面性、客觀性、獨立性、層次性等原則。構建指標體系的步驟如圖1所示。
本文通過分析評估對象,發現常用評價指標存在的問題,對指標進行優化,提出新的指標,并根據已有文獻中指標體系整理總結初步構建指標體系,然后基于粗糙集屬性約簡理論對指標體系進行篩選優化,最終構建一套較為完整、合理的分布式航跡融合指標體系。

圖1 構建指標體系流程Fig.1 Build an indicator system process
2.1.1問題描述
常用的航跡融合精度指標基本包括位置誤差、速度誤差、航向誤差等,計算方法基本是通過融合估計狀態與真值狀態進行比較,求得均方根誤差。當目標狀態一一對應時,PRMSE指標可以精確地反映融合系統的位置精度誤差,但是在目標跟蹤和數據融合時,由于環境變化、噪聲干擾等問題容易出現虛警、漏警、丟點和野值的情況,并且由于跟蹤中斷和雷達重新編批的情況,此時融合估計狀態與真值狀態很難一一對應,無法使用傳統的計算方法計算精度問題,常用的精度指標便不能正常評價融合系統的性能,需要對精度指標進行改進,使得新精度指標可以在任何情況下正確評價融合系統的精度問題。
當目標跟蹤估計位置和真實位置不能一一對應時,將融合估計結果和真實目標狀態看成兩個集合進行測量,通過測量兩個集合之間的差異來反映融合結果與真值之間的精度誤差,不僅考慮距離誤差,還考慮集合之間的勢誤差。測量集合距離的Hausdorff距離和Wasserstein距離[9]雖然可以度量兩個集合之間的差異,但是前者對集合勢誤差不敏感,后者對集合勢誤差過于敏感。文獻[10]提出的最優子模型分配距離(optimal subpattern assignment, OSPA)有效地彌補了兩者缺點,但是經過實踐研究發現OSPA距離也存在一定的局限性:若一個集合為空集時,另一個集合為非空集時,OSPA計算距離無法區分不同非空集合之間的不同;若兩個集合距離誤差為0,但集合勢不同,當max(m,n)→時,OSPA距離為0,不能正確評價結果;對于虛警和漏警OSPA距離懲罰是不一樣的。
針對OSPA距離存在的局限性,文獻[11—12]提出了最佳基數線性分配(cardinalized optimal linear assignment,COLA)度量標準,有效解決了OSPA度量標準的局限性,并證明了其有效性。但將COLA度量標準作為精度指標還面臨一個問題,由于截止距離的存在,COLA指標中的距離誤差總小于或等于1,無法正常評價距離誤差,本文對其做一定的改進,將改進后的度量標準作為精度指標評價,可以有效評價融合系統的精度問題。
2.1.2精度指標改進
假設真實狀態估計和融合狀態估計兩個集合分別為X={x1,x2,…,xm}和Y={y1,y2,…,yn},則這兩個集合之間的COLA距離定義為[11-12]:
若n≥m,則:
(7)
若n≤m,則:
(8)
COLA度量標準有效彌補了OSPA距離作為評價指標的不足之處:
1) 若一個集合為空集時,另一個集合為非空集,元素個數為n時,COLA計算距離為n1/p,可以有效測量不同非空集合的勢誤差;
2) 若兩個集合距離誤差為0,但集合勢不同,當
max(m,n)→時,COLA計算距離為(n-m),可以有效評價兩個集合之間的誤差;

相比OSPA度量標準,COLA距離可以更加合理、準確地計算兩個集合之間的差異,但是根據式(7)可以得:
(9)
由式(9)可以看出,其中距離誤差始終小于或等于1,無法正常評價距離誤差,因此本文將COLA距離改成如式(10)所示:

(10)
將改進后的COLA指標作為精度指標,若要評價位置誤差,X,Y分別為兩個狀態的位置向量;若要評價速度誤差,X,Y便為速度向量。融合COLA精度指標不僅考慮狀態之間的距離誤差,還考慮之間的勢誤差,可以更加合理有效地評價系統的精度問題。
本文首先通過分析評估對象,發現已有指標體系中精度指標存在的問題,提出了新的精度指標,即融合COLA精度指標,然后根據已有文獻[5,8,13-17]所提出的指標體系進行經驗總結,并根據分布式航跡融合系統的特點和指標構建原則,初步構建指標體系如圖2所示。

圖2 初步構建指標體系Fig.2 Preliminary construction of the index system
初建的指標體系由兩級指標構成,5個一級指標,22個二級指標,分別從系統處理能力、融合COLA精度、目標識別能力、航跡質量以及航跡相關度五個方面對系統進行性能評估,每個指標的具體定義以及計算方法現有文獻已經給出,這里便不再詳細介紹,重點研究指標體系約簡。
由于指標體系中指標數量過多,使得評估計算過于繁瑣,因此本節通過對分布式航跡融合系統進行仿真實驗,獲得實驗數據,根據粗糙集約簡理論對初步構建的評價指標體系進行約簡,剔除冗余指標,完成指標體系的構建。
2.3.1實驗條件
根據粗糙集屬性約簡理論,通過設計相同的劇情對7種不同分布式航跡融合系統進行Monte Carlo實驗,獲得實驗數據,使用基于粗糙集等價關系的指標篩選模型,對初步構建的指標體系進行篩選優化。實驗數據如表1所示。
2.3.2實驗結果
現以一級指標航跡質量為例進行指標約簡。此評估指標體系中,各屬性均為條件屬性,不包含決策屬性,因此是一個非決策系統,指標體系中各個指標屬性值都是連續性屬性,因此需要對指標數值進行離散化處理,以各屬性的中間值為閾值對指標進行離散化,然后根據基于粗糙集等價關系的指標篩選模型進行指標約簡,步驟如下:
1) 記指標體系C4={C41,C42,C43,C44,C45},論域U={U1,U2,U3,U4,U5,U6,U7},求得IND(C4)={{U1,U6},U2,U3,U4,U5,U7};
2) 依次求得:
IND(C4-C41)={{U1,U6},{U2,U4},U3,U5,U7},
IND(C4-C42)={{U1,U6},U2,U3,U4,U5,U7},
IND(C4-C43)={{U1,U6},U2,U3,{U4,U5},U7},
IND(C4-C44)={{U1,U3,U6},U2,{U4,U7},U5},IND(C4-C45)={{U1,U6},U2,U3,U4,U5,U7};
3) 由步驟2)求得的結果可知,IND(C4-C42)=IND(C4-C45)=IND(C4),則C42和C45為指標體系C中可以約簡的冗余指標;
同理使用此模型對其他一級指標進行約簡,可得其他一級指標的約簡結果為:
則約簡后的指標體系由5個一級指標和15個二級指標構成,指標體系如圖3所示。

圖3 融合系統性能評估指標體系Fig.3 Fusion system performance evaluation index system
由于粗糙集屬性重要性得出的權重更具有客觀性,因此使用指標屬性重要性對指標權重進行賦值,實現系統的綜合評估。
以約簡前的一級指標為例,對其二級指標進行權重計算。假定信息系統為S=(U,C4,V,f),步驟如下:
1) 首先計算指標的不可分辨關系,則
U/IND(C4)={{U1,U6},U2,U3,U4,U5,U7},
U/IND(C4-C41)={{U1,U6},{U2,U4},{U3,U5},U7},
U/IND(C4-C42)={{U1,U6},U2,U3,U4,U5,U7},
U/IND(C4-C43)={{U1,U6},{U2,U3},{U4,U5},U7},
U/IND(C4-C44)={{U1,U3,U6},{U4,U7},U2,U5},
U/IND(C4-C45)={{U1,U6},U2,U3,U4,U5,U7}。
2) 由式(4)計算指標體系中各個指標的信息量,I(C4)=40/49,I(C4-C41)=36/49,I(C4-C42)=40/49,I(C4-C43)=36/49,I(C4-C44)=34/49,I(C4-C45)=40/49;
3) 由式(5)計算各二級指標在一級指標航跡質量中的重要性,則sigC4-C41(C41)=4/49,sigC4-C42(C42)=0,sigC4-C43(C43)=4/49,sigC4-C44(C44)=6/49,sigC4-C45(C45)=0;
4) 由式(6)計算航跡質量指標中各二級指標的權重,為:w41=0.285 7,w42=0,w43=0.285 7,w44=0.428 6,w45=0 。
則約簡前的航跡質量指標中二級指標的權重分別為w4=[0.285 7,0,0.285 7,0.428 6,0],同理,根據粗糙集屬性重要性得其他一級指標中二級指標的權重分別為w1=[0.263 1,0.315 8,0,0.421 1],w2=[0.2,0.2,0.4,0.2],w3=[0.25,0.25,0.25,0.25],w5=[0.5,0.5,0,0,0]。
本實驗通過設計劇情,使用本文構建的指標體系對甲乙兩個分布式航跡融合系統進行Monte Carlo測試求得指標均值,并采用本文根據屬性重要性計算的權重對兩個系統進行綜合評估,驗證指標體系的有效性,其中甲融合系統最多處理100批目標,乙融合系統最多處理60批目標。
假設有10批目標勻速直線運動,目標均以vx=100 m/s,vy=0 m/s的速度平行勻速直線運動,初值狀態橫坐標均為1 000 m,縱坐標分別為[1 000,2 000,3 000,4 000,5 000,6 000,7 000,8 000,9 000,1 000] m,目標軌跡如圖4所示。
經對甲乙兩個系統進行Monte Carlo測試后,得到的實驗數據如表2所示。

圖4 目標軌跡Fig.4 The target tracks

表2 實驗數據2
本節根據上小節由屬性重要性得出較為客觀的指標權重系統進行綜合評價。
1) 計算各融合系統的指標歸一化得分。根據指標越小越優型與越大越優型計算方法計算各指標得分S,計算方法參考文獻[18],結果為:
S1=[1,0.2,0.76,0.51,0.37,0.14,0.5,0.31,0.24,0.49,0.58,0.1,0.24,0.1,0.38,0.45];
S2=[0,0.3,0.7,0.78,0.53,0.5,0.4,0.57,0.58,0.45,0.54,0.55,0.46,0.45,0.41,0.46]。
2) 計算指標權重。為簡便起見視一級指標同等重要,即w=[0.2,0.2,0.2,0.2,0.2],則每個二級指標對分布式航跡融合系統的權重為[0.052 6,0.063 2,0.084 2,0.04,0.04,0.08,0.04,0.05,0.05,0.05,0.05,0.057 1,0.057 1,0.085 7,0.1,0.1]。
3) 綜合評估。根據步驟1)和步驟2)計算的指標歸一化得分和指標權重,綜合評估得分E分別為:E1=0.387 6,E2=0.476 5,則根據評估值得出優劣次序為甲小于乙,則乙分布式航跡融合系統得分最高,綜合性能最好。
通過仿真實驗與評估計算表明,約簡的評價指標體系可以客觀、全面、有效地對分布式航跡融合系統進行評價,具有較強的適用性。
本文對分布式航跡融合系統指標體系進行優化,使用最佳基數線性分配度量標準代替原有的精度指標,對精度指標進行優化,提出了融合COLA精度指標,并通過分析評估對象,依據構建原則初步構建評價指標體系,然后通過仿真實驗獲得的實驗數據和粗糙集屬性約簡的性質對指標體系進行篩選,最終構建了一套較為完整、客觀公正的評價指標體系。仿真實驗結果表明,優化后的指標體系可以有效以及更加適用地評價分布式航跡融合系統性能。