吳 鵬,諸德放,劉子易
(1.空軍勤務學院,江蘇 徐州 221000;2.解放軍94865部隊,杭州 310000)
目標價值是指戰場目標打擊價值,用來描述和衡量在一定戰斗條件下,對戰場目標實施打擊必要性的一個綜合性指標[1],目標價值評估即量化分析目標價值。空地制導彈藥作為高價值、大威力武器,合理安排其打擊目標具有重要意義。目前,我軍對炮兵打擊目標價值的研究較多,很少涉及空地制導彈藥打擊目標,且多采用層次分析法、多屬性決策法或模糊分析法進行分析,此類方法處理特征信息的方式粗糙,誤差較大。BP神經網絡具有儲存和應用經驗知識的自然特性,自學習能力強,善于聯想、概括、類比和推廣,將BP神經網絡應用于目標價值評估具有良好的前景。同時,BP神經網絡的缺點也很明顯,網絡的泛化能力差、容易陷入局部最小值,因此,需要對網絡進行改進才能保證評估效果。
本文提出了一種改進BP神經網絡,使用貝葉斯正則化方法和遺傳算法優化BP神經網絡。結論表明,該方法有效改善了網絡的性能,保證了預測精度。
目標價值評估指標的選取直接影響著評估結論的準確性和客觀性。選取指標時,要充分考慮空地制導彈藥性能特點、作戰任務規劃和目標屬性。
空地制導彈藥打擊目標的過程可描述為3個階段:突防階段、制導階段和末端打擊階段。突防階段,彈藥突破敵方電磁干擾、地導高炮反擊等手段的封鎖,受目標的反擊能力的影響;制導階段,彈藥通過制導系統導引抵達目標上空并鎖定目標,受目標偽裝程度、信息可靠程度等因素影響;末端打擊階段,彈藥抵達目標并通過戰斗部毀傷目標,受彈藥毀傷特性、目標易毀性等因素影響。只有順利完成3個階段的任務,制導彈藥才能充分發揮自身的毀傷特性。綜合考慮打擊的3個階段和作戰任務規劃,并結合相關文獻,選取如下目標價值評估指標:
1)任務一致性:指目標對主要作戰行動的影響程度[2],體現在對我方戰術目標的影響和對敵方企圖的影響兩方面。與主要作戰任務方向越一致,目標價值越大。
2)打擊緊迫性:指對目標進行打擊的時限要求。體現在目標對我方部隊產生危害所需時間和不對目標進行射擊目標逃匿的可能性兩個方面,由目標所處狀態和機動性兩個因素決定[3]。對目標進行打擊的緊迫程度越高,目標價值越大。
3)信息可靠性:指目標信息的可靠程度。體現在情報信息的準確性和目標的偽裝程度兩個方面,情報越準確、偽裝程度越低,目標信息越可靠。信息可靠性越高,目標價值越大。
4)目標威脅性:指目標火力強弱和作戰企圖對我方載機、指揮機構乃至整個作戰意圖構成威脅的大小。威脅程度越大,目標價值越高。
5)目標反擊能力:指目標對彈藥打擊的抗擊強度以及可能對我造成的火力損傷程度[4]。主要體現在目標對彈藥進行封鎖和干擾的能力。目標反擊能力越高,價值越高。
6)目標易毀性:指受到相同程度的打擊后目標的毀傷程度。體現在目標被摧毀的難易程度和快速恢復能力兩個方面[5-6]。易毀性越高,目標價值越大。
這6個指標構成了目標價值的特征集,通過對6個指標賦分,可完成對目標價值的基本描述。
BP神經網絡是指基于誤差反向傳播算法的多層前向神經網絡,由輸入層、輸出層和若干個隱含層組成,一個3輸入2輸出的三層BP網絡結構如圖1所示。

圖1 3輸入2輸出的三層BP網絡結構
其學習過程可以描述為兩個過程:1)工作信號的正向傳播:輸入信號從輸入層經隱單元,傳向輸出層,在輸出端輸出產生輸出信號。2)誤差信號反向傳播:網絡的實際輸出與期望輸出之間的差值即為誤差信號,誤差信號由輸入端開始逐層向前傳播。當誤差小于設定值、權值的變化很小或達到最大迭代次數時,學習停止,神經網絡訓練完成。
由于選取了6個評價指標,故本模型采用6輸入1輸出的BP網絡結構。
傳統的BP神經網絡一般采用LM算法,將網絡的訓練誤差平方和作為性能函數,該算法的泛化能力較差。故采用貝葉斯正則化方法對BP網絡進行改進,將神經網絡權值和閾值的均方差引入性能函數,通過正則化系數的調整使小作用的連接權趨于零,在保證網絡精度的前提下,剪除冗余的連接權和神經元,從而提高網絡的泛化能力[7]。
改進后的性能函數如下:

網絡中的權值修正如下:

式中:E為修正后的性能函數,EW為權衰減項,ED為誤差函數,α,β為正則化系數,n為樣本數量,m為權值和閾值的數量,yi為第i個樣本的實際輸出,ti為第i個樣本的期望輸出,ωj為第j個權值(包含閾值),η為學習步長,vi為前一層的輸出。
貝葉斯正則化方法中,正則化系數決定著神經網絡的訓練目標,α<<β時,重點訓練誤差函數,可能出現過擬合現象;α>>β時,重點訓練權衰減項,可能出現誤差較大的問題[8]。因此,正則化系數的確定十分關鍵。該方法將系數設為隨機變量,系數的概率密度最大時即為最優正則化系數,最優解為:

式中:WP為E取最小值時所對應的權值(包含閾值)矩陣,γ為有效參數個數,為E在WP處的海森矩陣。
遺傳算法是一種借鑒生物界自然選擇和基因分離組合定律的全局優化搜索算法。遺傳算法對參數的編碼從多點進行操作,可以有效防止搜索過程陷于局部最優解。BP網絡沿著誤差減小的最大梯度方向調整網絡權值,容易陷入局部最小值,采用遺傳算法優化BP網絡的初始權值,可以有效改善此問題,優化步驟如下[9]:
1)對BP神經網絡的初始權值和閾值進行隨機種群初始化實數編碼;
2)計算種群適應度,尋找最優個體;將誤差函數絕對值作為適應度函數F:

其中y為樣本的預測值,t為樣本的實際值。
3)進行遺傳算子操作(選擇、交叉、變異),產生新一代個體。
選擇操作選用基于適應度比例的輪盤賭法,個體i的選擇概率為pi:

交叉操作采用實數交叉法,第k個染色體ak和第l個染色體al在j位的交叉操作方法如下:

第i個染色體的第j個基因的變異操作方法如下:


其中 N 為種群數,b、r為[0,1]間的隨機數,amax為基因aij的上界,amin為基因aij的上界,r2為一個隨機數,g為當前迭代次數,Gmax為最大進化次數[10]。
4)判斷進化是否結束,若是,則輸出最優解,若否,則返回2)繼續操作。
5)對最優個體解碼,確定BP網絡的最優權值和閾值。
使用貝葉斯正則化方法和遺傳算法優化BP神經網絡具體流程如圖2所示:

圖2 貝葉斯正則化方法和遺傳算法優化BP神經網絡流程
根據Kolmogorow定理,一個三層的BP神經網絡能夠逼近任意復雜的非線性映射,故采用三層BP神經網絡。BP神經網絡隱層數的確定沒有具體的理論依據,可按公式來確定,n為輸入單元數,m為輸出神經元數,k為[1,10]之間的常數。經過多次測試,當k取6時,取得最佳預測精度,故隱含層取9個節點。BP神經網絡的參數設置如下頁表1所示。
遺傳算法的參數設置如下頁表2所示。
訓練樣本的質量直接決定著網絡評估結果的準確性,選擇樣本數據時應當注意樣本的代表性和數據的準確性。假定我方遂行登島作戰任務,計劃使用空地制導彈藥對敵進行打擊,天氣狀況良好,彈藥性能正常。在此背景下,將專家評定的12類典型目標的經驗數據作為樣本,標準化處理后,數據如表3所示,其中X1~X6為前述6個指標得分,Y為目標經驗價值。

表1 BP神經網絡參數設置

表2 遺傳算法參數設置

表3 典型目標的指標經驗數據
利用MATLAB軟件建立上文所述的改進BP神經網絡模型,將前9組數據用于訓練,達到設定的精度要求后,利用后3組數據對網絡進行測試,測試結果與主成分分析法[11]和傳統BP網絡模型計算結果進行對比。4種模型的仿真結果如表4所示。

表4 4種模型測試結果
兩種BP網絡評估結果與實際值的擬合曲線如圖3所示。
3種模型評估結果的誤差曲線如圖4所示。

圖3 兩種BP網絡評估結果與實際值擬合曲線

圖4 3種模型評估結果誤差曲線
由圖3、圖4可見,經過貝葉斯正則化方法和遺傳算法優化的BP神經網絡預測值與實際值誤差最小,較改進之前泛化能力更佳,建模精度優越。
空地制導彈藥作為我空軍實施空中精確打擊的重要手段,研究其打擊目標價值,對于提高其作戰效能,具有重要的現實意義和軍事價值。本文結合空地制導彈藥性能特點、作戰任務規劃和目標屬性,選取了6個目標價值評估指標。此外,利用貝葉斯正則化方法和遺傳算法優化BP神經網絡,建立了目標價值評估模型,測試結果表明,優化后模型性能優異,在空地彈藥打擊目標價值評估中具有實用意義,能夠為指揮機關決策提供依據或參考。