袁斐然, 劉春生, 陳必露
(南京航空航天大學,南京 211000)
受益于軍事領域的廣泛運用,追逃博弈理論自被ISAACS提出后就受到了各國學者的青睞[1]。近年來,伴隨著戰區通訊指揮系統和新式武器裝備的入列,戰爭逐漸向著集團化、智能化方向發展。傳統一對一追逃博弈結構已無法滿足協同作戰的需求,多對一追逃博弈理論應運而生。文獻[2]提出了多對一追逃條件下成功追擊(逃逸)的必要條件,為后續研究提供了理論基礎;文獻[3]研究了目標速度更快時的多對一追擊方式;文獻[4]進一步研究了高機動性目標與快速追擊者間的追逃博弈過程;KUMKOV等[5]總結了多方追逃零和博弈問題的研究近況,指出目前關于多對一博弈問題的研究依然局限于簡單的線性動態博弈。
當前,多對一追逃問題的一個重要應用是導彈協同攻防問題。隨著高超音速導彈等一批高性能導彈投入使用,傳統線性模型與先進導彈協同攻防過程匹配度不佳,會造成制導精度顯著下降。而在非線性模型中研究微分博弈制導律則不可避免地需要計算非線性偏微分HJI方程[6]。近年來,自適應動態規劃(ADP)算法的發展為處理該問題提供了新思路,即通過構造神經網絡,在線迭代逼近最優解。文獻[7]研究了“領導-跟隨”模式下基于ADP的非線性多智能體系統控制問題;文獻[8]結合容錯控制技術和ADP算法,提出了非線性最優容錯控制律設計方案;文獻[9]將ADP技術應用于一對一導彈非線性追逃模型,證明該方法相較于傳統比例導引和最優制導方法具有更好的追擊性能;……