李 娟,張建新,楊莉娟,嚴浙平
(1.哈爾濱工程大學 自動化學院,黑龍江 哈爾濱,150001;2.哈爾濱工程大學 水下機器人技術重點實驗室,黑龍江 哈爾濱,150001;3.江南造船(集團)有限責任公司,上海,201913)
目標跟蹤作為無人水下航行器(unmanned undersea vehicle,UUV)實現海底管道檢修、港口防御、情報搜集、對接回收及時敏打擊等作業任務的關鍵技術,具有廣泛的應用前景[1-3]。在UUV對運動目標的跟蹤過程中,往往要求保持尾隨監控的狀態,需要在保證 UUV安全的前提下不丟失目標,因此有別于一般意義下的路徑或軌跡跟蹤問題[4]。另外,實際的海洋環境中噪聲復雜,存在一些 UUV不能穿越的風險區域和運動障礙物,如果不針對此種情況進行在線行為決策,就難以保證UUV自身的安全。
從目前研究現狀來看,UUV的自主運動能力并不強,還沒有實現真正的智能化[5]。環境感知能力[6-7]、全局和局部規劃決策能力和運動控制是UUV的必備技能,UUV根據探測獲取的環境信息自主地規劃推理,從而避開風險區和動障礙物,完成從起始位置到目標點的移動任務或達到監控敵方目標的目的。因此,UUV對運動目標的跟蹤須具備一定自動導引策略,否則將不具備工程意義。
導引方法是載體在接近目標的過程中設計的其速度和轉向矢量的變化規律,通過時變策略改變載體的運動行為實現期望目標[8-9]。經典的導引方法有比例導引法、尾追法、固定提前角法和平行接近法等[10-11]。但是這些方法多是針對終點攔截設計的,在航空航天、導彈制導方面應用較多,一般載體發射擊中目標是雙方盡毀一次性使用,不需要考慮之后的控制約束問題,這與 UUV跟蹤動目標,監視巡航或發射魚雷的控制目標并不完全一樣。針對水下動目標的定位跟蹤和精確制導研究尚不成熟,文中試圖對此問題做簡化討論研究,并且將帶有飽和約束的目標跟蹤和障礙物避碰問題結合起來,嘗試解決在未知環境下的UUV目標跟蹤導引問題。
文中針對存在未知障礙物的風險環境,在考慮到運動目標視線點的不固定以及運動目標運動隨機性的影響因素[12],對 UUV對運動目標的跟蹤策略問題[13-14]進行研究。依據運動控制的導引律,創新性地提出了跟蹤誤差系統與視線法相結合的方法,實現了UUV自主安全跟蹤動目標的目的。同時在極坐標系下建立了UUV與目標、障礙物的相對運動模型,克服了傳統視線導引法中無法考慮UUV運動飽和約束的局限性。通常把UUV通過所提方法跟蹤動態目標分為 2種情況:當UUV距離目標較遠時視線跟蹤起主要作用;當UUV與目標距離位于一定范圍內時,保持最佳跟蹤距離對目標進行跟蹤。文中所提方法解決了在未知水下環境存在動態目標以及動態與靜態障礙物情況下的動態目標跟蹤問題,克服了傳統導引控制中目標導引點不固定的局限,在UUV控制中航速和航向角速度受約束的情況下,實現了視線導引切換的目標跟蹤與對障礙物的有效規避。
為了便于問題分析和跟蹤控制策略設計,文中僅考慮 UUV平面運動跟蹤策略設計問題。在推力和方向舵組成的欠驅動 UUV系統中,橫向速度為微小的耦合量,對運動軌跡影響較小,因此運動學模型可簡化為如下形式[15]

UUV目標跟蹤和避碰控制問題示意見圖1。

圖1 無人水下航行器目標跟蹤和避碰控制問題示意圖Fig.1 Schematic diagram of target tracking and obstacle avoidance control of unmanned undersea vehicle(UUV)
圖中,ηEξ為慣性參考坐標系,可得到UUV與目標相對運動模型

式中:ρvg為UUV與目標間的距離;φvg為視線角。
對上式取微分得

將式(1)代入式(3),可得極坐標系下的UUV與目標相對運動模型(即跟蹤誤差模型)

同理,假設障礙物與 UUV具有相同的運動形式,可以推導出兩者的相對運動模型

為簡化多目標控制問題,文中做如下假設。
1)將 UUV、目標和障礙物的運動形式都看作是具有一定半徑的類質點運動,采用平面上的圓形表示,分別用下標v,g,o來區別 UUV、目標和障礙物的狀態變量。UUV物理結構簡化為半徑為Rv,中心位置為(xv(t),yv(t))的圓。同理,可以得到目標和障礙物的物理結構簡化表示形式。
2)在設計導引決策時考慮到UUV動力驅動能量有限,存在速度和航向上的飽和約束,設最大航速為、最大轉向變化率為,另外為保證UUV 潛伏在水下,其速度不能減速到零(否則會浮出水面),設最小航速為,則有

3)假設目標、各障礙物與UUV具有相同的運動學模型,只考慮水平面運動控制情況,且目標和障礙物以UUV可跟蹤的速度運動,即

根據上述假設以及建立的模型,UUV對目標的跟蹤控制可以通過對式(4)和式(5)設計相應的控制器來實現。然而在實際中,由于運動物體慣性以及控制指令、執行機構等的延時,需要在UUV和目標之間保留一定的安全距離,在安全距離內保持對目標的監視,一旦目標加速遠離跟蹤圈就切換到最大速度去追蹤目標。
在包含未知障礙物的環境下,UUV對動目標的跟蹤實際上是在2個相互對立的指標間進行綜合的問題,即在實現 UUV對運動目標以一定精度跟蹤的同時盡量減小 UUV的航行路程,減少能耗。因此,UUV跟蹤策略設計任務可描述為以下3個優先級由高到低的設計指標:
1)務必保證 UUV 自身的安全性,即禁止UUV進入高風險區,為便于表述,高風險區表示為以障礙物中心為圓心,D2為半徑的危險圓域;
2)保證UUV對運動目標有一定的跟蹤精度,即確保其在運動目標的接近圓面內滿足為最佳跟蹤距離,用以控制跟蹤精度;
3)在滿足前面 2個指標的前提下,盡量使UUV的航行路程最短。
水下環境中存在很多未知因素。針對隨機出現的障礙物與目標的未知參數信息,可通過建立UUV與目標、UUV與障礙物之間的運動模型進行避障與跟蹤導引的控制切換。此外,在避碰與跟蹤導引設計中引入的障礙物與 UUV的距離、在跟蹤導引律設計中引入的速度增益、轉艏增益、控制律切換等參數都是針對當前環境進行設定的未知參數。在現實中出現的障礙物也是在仿真環境中無法完全預料的未知因素。文中所研究的未知因素主要體現在:障礙物類型與狀態、障礙物的大小和數量、障礙物是靜態的還是動態的以及動態障礙物的運動方式等。
為實現二維動態環境中 UUV對動目標跟蹤控制任務,文中把式(4)和式(5)控制器的設計任務分為目標跟蹤和被動避碰問題[15-16]。
在控制律設計之前,首先給出定理證明過程中需要用到的2個定義[17-19]。
在最大轉艏角速度的限制下,控制UUV航向盡快向跟蹤視線方向轉動,并且當目標接近圓內時,UUV調整與目標速度相同的航速進行目標監視;當目標機動逃到跟蹤圈以外時,UUV采用最大航速追蹤。并選用恒定線速度的方式以減少控制量,以轉艏控制來增加航速控制的靈活性,即

式中,k0>0為速度增益,為保證跟蹤的平滑性,使 UUV在落后目標較遠時以與距離成正比的速度跟蹤;sat(u,)為飽和函數,取視線控制和飽和角速度的最小值,函數表示為

設k1為轉艏控制增益,Φ()α將轉角限制在區間[-π,π),定義

定理 1:令對于式(4),在控制律式(8)的作用下,存在參數k0,k1> 0使得
證明:為了證明跟蹤誤差可以收斂到D1內,首先假設當ρvg(t)>D1,由式(4)可得

為了避免轉艏角速率的飽和,可取

將式(11)和式(12)代入式(8),則可避免飽和出現,故


選擇類李雅普諾夫候選函數為

將V沿著系統(4)相對時間求導可得



當目標進入半徑為D2的障礙物危險圓以內,設計在最大轉艏角速度的限制下,控制 UUV以最大線速度盡快轉向遠離障礙物的視線方向,則避碰導引策略可表示為

式中:k為轉速控制增益,0<k≤1;k2設計為正常數的轉艏控制增益,其他部分說明同跟蹤導引函數。
定理2:對于式(5),在控制律式(19)的作用下,若則有
證明:由式(14)可得



因此,由式(19)和式(21)可知,避障導引策略設計可以轉化為尋找 (D2,k2) 使滿足不等式

為了避免rv飽和,由式(5)和式(19)可得
通過簡單計算,得式(23)和式(24)的1個可行解

選擇類李雅普諾夫候選函數如下

將E沿著式(5)相對時間求導可得

由式(5)和式(19),并考慮式(14)得E˙≤0,證畢。
基于上述 2種情況設計的導引策略,證明了存在 (k1,D1)使得UUV對目標的跟蹤誤差一致收斂于D1,存在 (k2,D2)使得在初始條件ρoiv(t0)≥D2+Rio+Rv下系統能夠保證成功避開障礙物。于是,在動態環境中UUV跟蹤目標的同時,被動避碰的策略可以設計為:在全局跟蹤過程中,如若出現ρoiv(t)≤D2+Rio+Rv的時刻,則立刻激活避碰導引律式(19),將視線切換到障礙物規避方面,一旦確認 UUV運動到安全區域之后,則按照式(8)立馬刻恢復跟蹤過程。
針對所設計的導引控制策略,仿真參數和初始化取值為:在300 m×300 m的仿真環境下,UUV和障礙物都被抽象成質點,但為了刻畫 UUV的存在與仿真圖中UUV的形狀,假設UUV長度5 m,將UUV 中心作為質點中心,取半徑為UUV占據有效區域大小,從而刻畫 UUV自身的安全范圍。航速飽和約束轉艏角速度飽和約束轉艏控制增益常系數k=0.1,跟蹤精度即接近圓半徑D1=10m ;初始時刻UUV速度航向角速度rv(t0)=0。目標運動軌跡設定為如式(28),滿足的約束。

仿真如圖2~圖4所示,對存在一個靜止障礙物的情況做具體分析,文中均認為障礙物對于目標不具有威脅。
在圖2中,障礙物設置在目標軌跡上(160 m,150 m)的位置,靜止障礙物半徑設為Ro=10m,避碰啟動即危險圓半徑D2=10m,UUV從初始位置D2+Ro=20m 開始,始終保持尾隨目標的跟蹤狀態,其中紅色Tg和藍色Tv分別表示目標和UUV的運動時間。

圖2 靜止障礙物下UUV跟蹤目標軌跡Fig.2 Trajectory of UUV tracking target in static obstacle environment
從圖 3中與目標視線角θ的關系可以看出,直到230 s左右UUV進入障礙物的危險區域(距離障礙物中心D2+Ro=20m 的位置)開始轉艏避碰,到280 s避開障礙物后立刻恢復跟蹤狀態。結合圖4可看出,UUV與目標的跟蹤誤差保持收斂于 10 m的位置,這與仿真設定的接近圓半徑D1=10m一致,從而驗證了設計策略的正確性以及對于靜態環境中動目標跟蹤問題的適用性。圖中,l為UUV和目標之間的間距。
仿真中,假設有 1個運動的障礙物,其半徑Roi=5m,UUV初始位置D2=15m,避障危險半徑分別設為D2=15m和D2=25m,得到跟蹤軌跡如圖5和圖6。

圖3 靜止障礙物下UUV跟蹤目標視線角曲線圖Fig.3 Line-of-sight angle curve of UUV tracking target in static obstacle environment

圖4 靜止障礙物下UUV與目標間距曲線圖Fig.4 Curve of distance between UUV and target in static obstacle environment

圖5 動態環境下避碰危險半徑為15 m時UUV跟蹤軌跡Fig.5 Tracking trajectory of UUV with 15 m danger radius of obstacle avoidance in dynamic environment
可以看出,對于障礙物設置越大的安全區,UUV與之碰撞的危險系數越小,但隨之帶來的是跟蹤誤差的增加,應權衡兩者的相互制約關系,選擇合適大小的目標接近圓和障礙物安全區。
此外,跟蹤過程中 UUV與目標間距如圖 7所示,可以看出,UUV對目標的跟蹤距離始終保持收斂于設定的最佳跟蹤距離D1=10 m。

圖6 動態環境下避碰危險半徑為25 m時 UUV跟蹤軌跡Fig.6 Tracking trajectory of UUV with 25 m danger radius of obstacle avoidance in dynamic environment

圖7 動態環境下UUV與目標間距曲線圖Fig.7 Curves of distance between UUV and target in dynamic environment
最佳跟蹤距離D1的大小決定了動目標跟蹤中,跟蹤精度和航行路程最小化之間的衡量程度;避碰半徑D2的大小決定了動目標跟蹤精度和躲避風險之間的對立程度。D1越大,UUV就有越大的范圍去搜尋最短的航程;但隨著D1的增大,跟蹤精度也隨之下降。D2越大,UUV進入風險區的可能性就越小,航行安全性越高;但隨之會導致跟蹤精度下降甚至丟失目標。因此,需要對參數進行調整以滿足不同的控制精度和動態性能要求。
文中針對 UUV跟蹤運動目標的導引策略進行了研究,提出了障礙物環境中的局部規劃方法。在 UUV運動控制中航速和航向角速度的飽和約束條件下,通過改變控制參數適應不同的跟蹤精度和風險系數,實現在運動目標跟蹤和障礙物規避兩者間自主靈活切換。在保證 UUV安全性和動態目標跟蹤精度的前提下,通過仿真試驗分別驗證了在靜態、動態障礙物情況下的動態目標跟蹤的有效性。同時,文中利用李雅普諾夫定理對導引跟蹤與避碰的切換控制律進行了合理性與收斂性的證明。但是,文中沒有考慮實際情況下動態目標存在機動的情形。下一步工作將結合實際情況,健全目標模型,來優化導引跟蹤與避碰切換控制律方法。