王輝,李濤,唐道光,吳駿雄,張意,黎海青
1.北京理工大學 宇航學院,北京 100081 2.北京理工大學 無人機自主控制技術北京市重點實驗室,北京 100081 3.北京信息科技大學 高動態導航技術北京市重點實驗室,北京 100085 4.中北大學 電氣與控制工程學院,太原 030051 5.中國北方工業公司,北京 100053 6.中國兵器工業第203研究所,西安 710065
現代戰爭中,雖然大規模壓制武器依然扮演著重要角色,但圖像精確制導彈藥以其成像清晰、精度高、附帶損傷小等特點在世界范圍內受到了高度重視,并在歷次戰爭和局部沖突中大量使用且戰績顯著[1-5]。作為圖像精確制導彈藥的核心技術,圖像制導技術主要完成對目標的探測、識別和跟蹤,并提供準確的導引信息。隨著圖像處理、高分辨率傳感器技術、芯片技術和人工智能的迅速發展,圖像制導技術發展迅猛且越來越受關注,能夠多波段、高靈敏度、高分辨率地獲取豐富的戰場成像信息,有利于在復雜背景中發現和識別目標,提高反隱身和抗干擾能力,是當前各國精確制導技術的研究熱點[6-9]。
未來戰場環境日趨復雜,在目標偽裝、距離較遠或出現相似干擾的情況下,自動目標識別技術的應用尚有很多技術難點需要突破[10-11]。利用射手的識別能力,人在回路識別技術適用于復雜環境干擾和目標偽裝下的目標識別,攻擊靈活性較高,因而有較大研究價值。射手通過導彈傳回的實時圖像信息快速識別并靈活鎖定目標,通過圖像跟蹤器自動跟蹤或控制手柄手動跟蹤直到擊中目標,此方式即為人在回路制導[12-13]。各國現役的光纖圖像制導彈藥射程一般在15 km以內,質量、搭載空間的限制等原因導致其無法在更遠的作戰距離上采用光纖傳輸圖像信息[14]。相比之下,采用無線電的數據鏈通信具有傳輸距離更遠的優勢[15-16],但無線電通信帶寬較低,圖像數據的發送和接收需要經過壓縮和解壓,此過程必然會造成圖像信號延時[17-18],導致射手難以快速準確地識別和捕獲目標,甚至出現人機耦合誘發振蕩現象[19-21]。
射手模型描述了射手控制導引頭光軸跟蹤目標的過程,手動跟蹤時射手-導引頭是人工控制系統。含有射手動力學的圖像導引頭控制回路會對目標在視場中的誤差角進行跟蹤補償,從而提升圖像制導彈藥的控制性能和制導精度。因此,明晰射手在不同圖像信號延時下對于圖像導引頭跟蹤誤差的響應,對設計制導控制系統和提升制導精度十分重要。20世紀中葉,研究者開始對射手進行建模,McRuer等提出的精確擴展交叉模型最具代表且應用廣泛[22-23],在更廣的頻率范圍內描述了射手的動態特性。然而在實際控制任務中,射手為了更好地適應控制對象動力學與圖像信號延時,其操作行為多分布在較高頻段且表現出超前特性。之后很多射手模型參數辨識的研究都采用了McRuer等提出的模型,且包含不同類型的激勵信號[24],辨識方法包括最大似然估計法、遺傳算法和區間分析法[25-27]。1970年之后,現代控制理論發展迅速,Kleinman等提出了最優控制模型[28],Hess建立了Hess 結構模型[19],可以準確表征射手的信號處理過程。近年來,射手建模逐漸頻繁應用神經網絡技術和模糊控制[29]。
射手模型參數反映了射手響應的詳細特征,可以利用實驗數據進行參數辨識獲得。參數辨識方法包括兩種:一種是射手對時不變控制對象的響應,如傅里葉系數法和最大似然估計法[24,30];另一種是射手對時變控制對象的響應,如小波變換法[13,31]和Kalman濾波法[32]。趙軍民等利用輔助變量法辨識射手模型參數,但固定了射手模型的神經延遲環節,只跟蹤直線運動的坦克目標,無法充分激勵射手響應[33]。唐道光等研究了自動跟蹤、無延時手動跟蹤和有延時手動跟蹤3種模式下導引頭回路與制導回路的性能,但是所考慮的射手模型在不同控制環境下的模型參數保持不變,忽略了射手對控制環境的適應性[34]。Potter和Singhose研究了在存在時間延遲的手動控制系統中,輸入整形(Input Shaping)能否提高射手對柔性系統的跟蹤性能,但控制對象僅限于低頻、輕微阻尼的振動模式[35]。文獻[36]研究了多軸控制任務中射手適應時變控制動力學的建模過程,但射手模型參數沒有從實驗數據中獲得。
本文基于真實的圖像導引頭模型及參數,引入兩類射手模型,第2類射手模型為McRuer等提出的精確擴展交叉模型,針對其難以準確描述射手對圖像信號延時的超前補償特征和操作行為的高頻分布問題,優化了射手模型結構;針對上述參數辨識實驗存在的激勵信號單一和參數未從實驗獲得的問題,設計寬頻率的隨機激勵信號,通過辨識實驗得到動力學參數。此外,基于相同射手識別同一目標和射手對不同圖像信號延時的適應性,對比研究了兩類射手模型與不同圖像信號延時對人在回路式圖像制導彈藥導引頭特性和制導性能的影響。本文的主要貢獻為優化射手模型結構,實驗辨識動力學參數,以及通過仿真實驗研究兩類射手模型對制導系統的影響。
圖像導引頭控制系統保證了導引頭光軸在空間的穩定性,完成對目標的搜索、捕獲與跟蹤。圖像導引頭通常采用角速率陀螺式平臺導引頭,其俯仰框與偏航框的控制系統相互獨立且結構相似。表征實際圖像導引頭系統單通道控制回路的模型如圖1所示,包含穩定回路和跟蹤回路。穩定回路作為跟蹤回路的內回路,作用是隔離彈體角擾動、穩定導引頭光軸指向以及改善跟蹤系統的速度特性與加速度特性。跟蹤回路的作用是在手動或自動跟蹤模式下,依據射手或圖像跟蹤器給出的目標位置誤差信息,控制導引頭光軸運動,以實現對目標的實時跟蹤。

圖1 圖像導引頭控制回路

在導引頭跟蹤目標時,圖像傳感器實時敏感導引頭視線誤差角Δq,控制電路綜合Δq與角速率陀螺輸出的反饋信號,生成控制電流驅動力矩電機,力矩電機帶動平臺轉動以消除Δq,從而使導引頭光軸實時跟蹤彈目視線,所以平臺導引頭控制系統實質是一種角跟蹤系統。某型平臺導引頭參數如表1所示[37]。

表1 平臺導引頭參數
因為軸承間存在摩擦力矩等干擾,彈體姿態變化會影響導引頭在慣性空間的指向和輸出。為了消除彈體運動耦合,穩定回路的設計通常使其具有較高的開環增益和較寬的帶寬。根據去耦能力指標可以確定穩定回路開環增益和設計合適的校正網絡,以滿足系統穩定性需求。依據已建立的圖像導引頭控制回路,穩定回路如圖2所示。

圖2 圖像導引頭穩定回路
基于上述導引頭參數,設計的滯后校正為[38]
(1)
校正前和校正后的穩定回路開環頻率響應如圖3所示,響應參數對比如表2所示??芍葱U到y穩定性較低,而滯后校正的加入使系統高頻段的幅值衰減,從而降低了系統的幅值穿越頻率;滯后校正參數的恰當選取較大程度地提升了校正后系統的穩定性,從而保證了校正后的系統可以同時滿足穩定裕度和去耦能力指標的要求。

圖3 穩定回路開環頻率特性

表2 穩定回路開環頻率響應參數
文獻[33]基于射手固有動態特性,研究分析射手操作行為,理論上建立的射手擬線性模型為
(2)
式中:射手手動跟蹤目標時的適應參數kp、T1、T2與被控對象——空地導彈/反坦克導彈的運動規律有關,而視覺感知反應延時τ′和神經肌肉延遲時間τn是射手的固有屬性。
文獻[33]利用輔助變量法辨識動力學參數,變化范圍如表3所示。對于訓練有素的射手,神經肌肉延遲時間τn接近于0.1 s,視覺感知反應延時τ′通常取0.15 s。

表3 動力學參數
針對式(2)所示的射手模型1,本文采用文獻[39]中的辨識方法獲取其動力學參數,即先用最大似然估計法得到參數估計值,再用混合梯度優化算法尋找全局最優解,并且保證兩類射手模型選用同一批參試人員進行動力學參數辨識,最終得到射手模型1的仿真參數見表4。

表4 射手模型1的仿真參數
McRuer等描述射手行為時采用精確的擴展交叉模型——PEC 模型(Precise-Extended Cross Model)。相比于頻率適用范圍僅局限于幅值穿越頻率附近的射手交叉模型,PEC模型的頻率覆蓋范圍擴展到了高頻處和低頻處[22]。其響應包含兩個部分,分別為線性傳遞函數的響應和殘差信號。通常認為殘差信號為高斯信號,表示射手模型的非線性部分,因為難以定量衡量其大小,導致無法定量研究控制系統指標,因而在分析和設計時不考慮殘差信號對控制系統的影響[39]。PEC 模型射手對圖像顯示做出響應的線性傳遞函數為
(3)
式中:Kp為視覺感知增益;τL為視覺感知超前時間常數;τl為視覺感知滯后時間常數;ξnm為神經肌肉系統阻尼;ωnm為神經肌肉系統自然頻率;τd為視覺感知反應延時。

如圖4所示,PEC模型由配平項和物理約束兩部分組成。McRuer等提出的交叉定理[22]顯示,為了更好地適應控制對象動力學,射手會調整其配平項動力學,從而使系統開環傳遞函數在交叉頻率處的頻率特性接近于單積分器系統。實際控制任務中,射手控制對象動力學的形式一般類似于1/s(0.01s+1),即射手的實際控制對象多分布在較高頻段,射手會在更高的頻率附近進行配平[39-40];此外,在射手對視場中的誤差角進行跟蹤補償時,射手對不同圖像信號延時具有適應性,圖像信號延時越長,射手常表現出超前補償的特征。由于以上兩點原因,PEC模型中表示低頻特性的滯后時間常數τl難以準確地描述射手的真實操作行為,同時文獻[37]表明τl難以通過辨識實驗獲得,因此式(3)表示的PEC模型結構優化為

圖4 PEC模型

(4)

針對該辨識參數向量,文獻[37]進行了數次人在回路實驗,運用最大似然估計法獲得射手模型的參數估計值,運用混合梯度優化算法尋找全局最優解。人在回路制導方式中射手控制的是導引頭內回路,其動力學特性在飛行過程中變化不大。在射手模型2的參數辨識實驗中,射手對目標在視場中的誤差角進行跟蹤補償,為使激勵信號具有較寬頻率范圍且表現出一定隨機性,激勵信號設計為一些正弦信號疊加而成,表示為
(5)
式中:Aj為正弦信號的幅值;ωj為正弦信號的頻率;φj為正弦信號的相位,j=1,2,…,N,N為正弦信號的個數。
為了充分激勵射手響應,激勵信號的頻譜應該在高頻與低頻之間折中分布,因此正弦信號頻率設計在ωj=0.1~20 rad/s的范圍里按對數尺度均勻分布,幅值分布類似于一階低通濾波器,此外,相位對實驗結果影響很小因而隨機選擇。正弦信號個數N=10時,激勵信號如圖5所示。

圖5 激勵信號
人在回路實驗在圖6所示的半實物仿真系統上進行。動力學仿真模塊用來采集手柄的輸出信號,同時仿真圖1所示的圖像導引頭動力學并通過UDP通訊協議將視線誤差角呈現在顯示模塊上,參試人員依據該誤差信號,操縱手柄使導引頭光軸指向目標以減小跟蹤誤差。選取6位參試人員采集數據,參試人員A為未經過培訓的“新手”,參試人員B~F為受過前期培訓的“老手”。辨識結果如表5所示,由于參試人員個體差異性和控制策略不同,實驗結果略有不同。

表5 參試人員的辨識結果

圖6 半實物仿真系統簡圖
圖7為所有參試人員辨識模型的伯德圖,可知參試人員A的幅頻特性明顯低于其他參試人員。為了更真實普遍地反映射手的動態特性,研究射手模型2對導引頭控制系統影響時,選取參試人員B~F的辨識結果并取平均值,得到射手模型2的動力學參數向量θ。

圖7 參試人員辨識模型的伯德圖
圖8為導引頭跟蹤回路的開環頻率響應,包含圖像信號延時、射手環節與穩定回路。圖8驗證了McRuer等提出的交叉定理,幅頻特性曲線在幅值穿越頻率處的斜率約為-20 dB/dec,然而因為參試人員面對圖像信號延時會產生適應性超前調節行為,導致了高頻輸入區的幅頻特性曲線的斜率小于-20 dB/dec。

圖8 所有人機系統開環頻率特性
根據圖1所示的圖像導引頭控制回路,分別研究引入射手模型1和射手模型2后導引頭控制系統的穩定性。導引頭穩定回路閉環傳遞函數為
(6)
結合式(1)所示的滯后校正網絡和表1所示的平臺導引頭參數,由于主導極點對系統的瞬態響應發揮主導作用,則式(6)近似等效為
(7)
導引頭跟蹤回路開環傳遞函數為
(8)
式中:K1為跟蹤回路放大器增益;τ為圖像信號延時;Gp(s)為射手模型1或2;Φ1(s)為穩定回路閉環傳遞函數。
研究相同射手識別同一目標的情況,因而射手動力學近似不變同時反應延時恒定,不同射手模型的參數選取如表4所示。穩定裕度表示控制系統的相對穩定性,包含幅值裕度和相位裕度。相位裕度γ表述為
γ=π+Φ(ωc)
(9)
式中:ωc為幅值穿越頻率;γ的物理意義是,當Φ(ωc)再滯后γ角度時,系統處于臨界穩定狀態,一般經驗上取γ=30°~60°。
引入射手模型1,相位裕度γ=45°時,由奈奎斯特穩定性判據,圖像信號延時τ與導引頭跟蹤回路開環增益K的關系如式(10)所示,其推導過程見附錄A。
(10)
同理,引入射手模型2,相位裕度為γ=45°時,圖像信號延時τ與導引頭跟蹤回路開環增益K′的關系如式(11)所示,其推導過程見附錄B。
(11)
引入射手模型1和射手模型2后,不同相位裕度和圖像信號延時下的導引頭穩定域如圖9所示。由穩定域與相位裕度、圖像信號延時、導引頭跟蹤回路開環增益的關系圖可知:① 相位裕度越大,導引頭穩定域越小,則在固定圖像信號延時條件下設計的開環增益就越小,從而降低了導引頭跟蹤目標的快速性;② 圖像信號延時越長,導引頭穩定域越小,則在固定相位裕度條件下設計的開環增益就越??;③ 引入射手模型2后的穩定域小于引入射手模型1后的穩定域,則在固定圖像信號延時和固定相位裕度條件下設計的開環增益就越小。

圖9 引入不同射手模型的導引頭穩定域
根據圖1所示的圖像導引頭控制回路,結合式(1)所示的滯后校正網絡和表1所示的平臺導引頭參數,分別研究引入射手模型1和射手模型2后,即手動跟蹤模式下導引頭的快速性。在實際控制任務中射手對被控對象動力學具有一定的適應能力,例如圖像信號延時越長,射手可能會表現出較低阻尼的神經肌肉動力學特征,同時提供較大的超前相位,以保證系統的穩定。自尋的制導模式是由彈上計算機識別和鎖定目標,無數據鏈傳輸圖像信號和射手環節。
圖10所示為手動跟蹤模式下射手模型對導引頭快速性的影響,考慮射手對圖像信號延時的適應性,可知:① 手動跟蹤模式下,延時環節存在時,導引頭系統保持了一定的穩定性,這是因為射手的適應性控制行為補償了延時帶來的相位滯后;② 圖像信號延時越長,導引頭跟蹤速度越低,跟蹤誤差角越大,容易致使目標逃出探測器的視場范圍;③ 相同延時情況下,相比射手模型1,引入射手模型2后的導引頭系統跟蹤誤差角較小,跟蹤精度高。此外,相比于自尋的制導模式,手動跟蹤模式下導引頭系統的跟蹤速度較低,精度與穩定性較差,從而導致手動跟蹤模式下的制導系統性能降低。

圖10 手動跟蹤模式下射手模型對導引頭快速性影響
為了研究手動跟蹤模式下不同射手模型與圖像信號延時對比例導引制導精度的影響,結合上文圖像導引頭模型,基于小角度假設建立了人在回路比例導引制導系統單通道線性模型,引入導彈初始速度指向誤差、目標常值機動與目標隨機機動3類誤差源后的制導系統如圖11所示。

(12)
式中:u(·)是單位階躍函數,起始時間ts是隨機變量,且在制導時間[0,T]上呈現均勻分布。
由文獻[41]可知,目標隨機機動等效的成形濾波器為一個積分器,表示為
(13)


伴隨法常用于分析制導系統性能,它可以高效快速地分析出不同誤差源對脫靶量的影響,其基本思想是把脫靶量的平均值與方差表示成不同誤差源的貢獻的加權和,而伴隨模型的脈沖響應表示每個誤差源的加權系數。圖11所示的線性制導系統經過變換后的伴隨模型如圖12所示,其中yf為目標常值機動輸入所引起的脫靶量;yε為導彈初始速度指向誤差所引起的脫靶量;yr為目標隨機機動輸入所引起的脫靶量。

圖11 手動跟蹤模式下的制導系統

圖12 手動跟蹤模式下制導系統的伴隨模型
依次分析導彈初始速度指向誤差、目標常值機動和目標隨機機動3類誤差源輸入下,手動跟蹤模式下射手模型與圖像信號延時對制導系統脫靶量的影響,仿真參數設置如表6。

表6 射手模型2的仿真參數

圖13 導彈初始速度指向誤差輸入下脫靶量變化

圖14 目標常值機動輸入下脫靶量變化

圖15 目標隨機機動輸入下脫靶量變化
由于訓練有素的射手對不同控制對象與控制場景具有適應性,而射手對復雜背景下目標的反應延時是影響射手模型的主要因素,因此人在回路制導模式末制導彈道的設計應該便于圖像導引頭成像。結構優化后的射手模型2更準確地表述了射手對圖像信號延時的超前補償特性和操作行為的高頻分布現象,寬頻率隨機激勵信號的設計充分激勵了射手響應,通過辨識實驗得到了動力學參數。基于相同射手識別同一目標的仿真實驗表明:人在回路手動跟蹤模式下,圖像信號延時越長,導引頭的穩定域越小,即在固定相位裕度條件下所設計的開環增益就越小,導致導引頭跟蹤速度越低,且穩定跟蹤時的誤差角越大,容易致使目標逃出探測器的視場范圍;射手的適應性控制行為一定程度上補償了延時環節帶來的相位滯后;相同延時情況下,相比射手模型1,引入射手模型2后的導引頭系統穩定跟蹤時的誤差角較小,跟蹤精度較高。
射手模型與圖像信號延時會影響導引頭的穩定性與快速性,從而影響手動跟蹤模式下比例導引制導系統的脫靶量和收斂時間。相比自尋的模式,手動跟蹤模式下制導系統的收斂時間隨圖像信號延時的增加而增加,不僅對導引頭的探測距離要求更高而且增加了射手的工作負荷。射手動力學增加了制導系統的收斂時間,相比射手模型1,引入射手模型2的制導系統的收斂時間更短。由于射手的適應性,手動跟蹤模式只能滿足目標過載常值與導彈初始速度指向誤差輸入下制導系統的性能要求。
附錄A
引入射手模型1,導引頭跟蹤回路開環傳遞函數為
(A1)
式中:開環增益K=2.56K1。
將式(A1)改寫成復數形式:

(A2)
式中:Φω=(τ+0.15)ω+arctan(0.11ω)+arctan(1.35ω)-arctan(0.37ω)。
由奈奎斯特穩定性判據[42],可知相位裕度γ=45°時的穩定條件為
(A3)
解得
(A4)
假設本文研究的空地導彈、反坦克導彈彈道變化較小,認為導引頭輸入信號的頻率較低,即ωx較小,則
(A5)
可得相位裕度γ=45°時,圖像信號延時τ與導引頭跟蹤回路開環增益K的關系如式(10)所示。
附錄B
引入射手模型2后,導引頭跟蹤回路開環傳遞函數為
(B1)
式中:開環增益K′=0.3K1。
將式(B1)改寫成復數形式:
jcos(Φ″ω+γ)]
(B2)

相位裕度為γ=45°時,由奈奎斯特穩定性判據,可得圖像信號延時τ與導引頭跟蹤回路開環增益K′的關系如式(11)所示。