姚緒梁, 楊光儀, 彭 宇
(1.哈爾濱工程大學 自動化學院,哈爾濱 150001; 2.北京航天自動控制研究所, 北京 100854)
水下自主航行器垂直面運動的預測控制
姚緒梁1, 楊光儀1, 彭 宇2
(1.哈爾濱工程大學 自動化學院,哈爾濱 150001; 2.北京航天自動控制研究所, 北京 100854)
針對近水面海浪干擾下水下自主航行器(AUV)的深度跟蹤及姿態控制問題,提出一種基于非線性降維狀態觀測器(ROSO)的預測控制. 通過非奇異坐標變換實現AUV垂直面運動非線性模型的狀態估計,并將狀態估計結果用于預測控制及其預測模型的在線線性化過程中,在仿真實驗中對ROSO與全維狀態觀測器(FOSO)的狀態估計結果進行對比,同時也對比了所提出的基于在線線性化的預測控制(PC-NMOL)與現有的非線性預測控制(NPC)的控制效果. 仿真結果證明了所提出的方法可以得到精確的狀態估計,且具有動態響應快,對外部擾動魯棒性強的特點.
水下自主航行器;降維狀態觀測器;線性矩陣不等式;預測控制;在線線性化
本文針對近水面海浪干擾下的AUV垂直面運動非線性模型,設計了一種降維狀態觀測器來進行AUV的狀態估計,并將估計狀態用于所設計的預測控制器及其預測模型在線線性化的過程當中,有效地實現了AUV深度跟蹤和俯仰姿態控制.
首先假設AUV以恒定速度uc航行于近水面,重力與浮力近似相等,且重心與浮心在同一縱向軸線上,并忽略橫搖,橫蕩和艏搖的影響,并假設小縱搖角θ[7],且二階以上的水動力系數可以忽略.
由于數字控制器是通過零階保持器來實現,因此可以通過對現有AUV連續狀態方程進行歐拉變換[9],來得到所需的AUV非線性模型的離散形式為

(1)
式中:x(k)=[ω,q,z,θ]T∈Rn,ω為垂蕩速度,q為縱搖角速度,z為航行深度,θ為縱搖角,A=(TsAc+I),B=TsBc,D=TsDc,Ts為采樣周期,w(k)為海浪擾動,u(k)∈Rm為輸入,y(k)∈Rp為輸出,g(k,x(k))=Tsgc(t,x(t))為非線性項.Ac,Bc,Dc,gc(t,x(t))均來自AUV連續狀態方程,由AUV動力學與運動學方程[10]轉化得出.
本文中為便于理論的推導,可設m=2,p=2,n=4,d=2,C為行滿秩,且rank(C)=2,并假設(A,C)可觀測,g(k,x(k))滿足Lipschitz條件[11].
本文所提出的基于降維觀測器的預測控制方法,其中ROSO部分獨立于預測控制器,并可以保證預測控制器所需狀態估計精度,其總體結構如圖1所示.

圖1 系統結構框圖
首先,為保證系統在未知擾動下的能觀性,需要假設rank(CD)=rank(D),即ROSO存在的必要性條件. 由文獻[12]可知,(A,C)可觀測是全維狀態觀測器(FOSO)存在的必要性條件. 在文獻[13]中,ROSO設計所用到的非奇異坐標變換不會改變系統的能觀性,因此不難證明,上述兩種觀測器的存在性條件是等價的,也就是說ROSO與FOSO的應用范圍是相同的.

令μ(k)=A12y(k)+B1u(k),ρ(k)=y(k+1)-A22y(k)-B2u(k). 可得到ROSO結構為


(2)

(3)



(GD2-D1)w(k).
(4)

通過狀態估計誤差(4)可以看出,ROSO的維數(n-p)小于FOSO[14]的維數(n),也就是說,干擾w(k)到狀態誤差e(k)之間的傳遞函數通過降低觀測器的維數得以簡化,與FOSO相比,ROSO的系統結構更為簡單.
下面用一個定理來給出具有約束條件的ROSO設計,其中ROSO的狀態估計性能可以通過一個H性能指標來指定.

(5)

證明選擇如下李雅普諾夫函數
(6)
那么
ΔV(k)=V(k+1)-V(k) .
(7)
定義一個H性能指標為
在零初始條件下
(8)
由g(k,x(k))滿足Lipschitz條件,且
(9)
可得
等式兩邊同時乘以λmin(TTT)得到如下不等式

(10)
式中λmin(·)為最小特征矩陣.
那么將式(7)、(10)代入式(8), 可得
式中:


通過應用Schur補充引理可得Ω<0的等價條件為
(11)
將式(11)表示為
并再次應用Schur補充引理,最后可證明定理中式(5)成立,保證了‖e(k)‖2≤γ1‖w(k)‖2,進而證明狀態誤差(4)呈指數收斂. 與FOSO相比,本文通過引入約束條件(5)來對干擾w(k)進行抑制,減小了w(k)對狀態誤差(4)的影響.

(In-pA12-GA22))y(k)+(In-pB1-GB2)u(k).
最后,狀態估計可以表示
(12)
本節首先簡要的介紹了非線性預測控制(NPC)的原理,然后提出了一種將非線性模型在線線性化的方法,與NPC相比,模型在線線性化可以將非線性優化問題轉化成為二次規劃(QP)問題.
首先,在不加入擾動的情況下,將式(1)轉化為具有線性輸出的非線性狀態空間模型的一般形式:

式中非線性函數f:Rn+m→Rn.
那么NPC所用Np步的預測模型可表示為

將參考輸出軌跡和預測輸出向量表示為
那么NPC的性能指標可表示為
式中:R和Q為權重系數陣,u為控制增量向量.

在第K次迭代中,求解QP問題

且服從關于WK的線性化等式及不等式約束,式中BK為拉格朗日算子的Hessian矩陣. 由此得到dK來進行下一次迭代WK+1=WK+dK.
由上述SQP過程可以看出,在采樣時刻k所包含的多次迭代中,每一次迭代都要處理一個QP過程,然而在線性化預測控制中,每個采樣時刻僅需要進行一次QP過程. 因此本文針對上述問題提出了一種將非線性模型在線線性化的方法.
當前采樣時刻的線性化模型為

(13)

(14)
式(14)結合了上一節中的狀態估計信息,其中g(k,x(k))具體表示為如下形式
(15)
式中的非線性項系數可由前文提到的AUV動力學與運動學方程中的相應水動力系數計算得出.
將式(15)代入式(14)可得
其中:


(16)
其中:
對約束的處理能力是預測控制的優勢之一,在AUV實際應用中,約束條件可以簡要表示為
δmin≤δ≤δmax,
(17)
Δδmin≤Δδ≤Δδmax,
(18)
ymin≤y≤ymax.
(19)
式中Δδ為AUV控制增量,即AUV升降舵的偏轉角度,與式(16)中的u等價,式(17)~(19)可轉化為如下矩陣不等式表達形式
MΔδ≤γ.
(20)
接下來將約束條件(20)加入到預測控制的性能指標當中,并簡要表示為

(21)
式中:
通過求J關于u和λ的一階偏導數,使其結果為零求得使J為最小值的u和λ的表達式為
λ=-(ME-1MT)-1(γ+ME-1F),
(22)
u=-E-1(MTλ+F)=η-E-1MTλ,
(23)
式中η=-E-1F為不考慮約束的最優解.
然而不等式約束中往往含有無效約束,Kuhn-Tucker條件[15]也被用來定義關于λ的有效和無效約束條件. 現有方法中,有效集法[16]是很常見的搜索有效約束的方法,其中把u作為決策變量. 然而當一個多輸入多輸出系統含有非常多的約束條件時,計算量會變得非常大. 這時,選擇u的對偶變量λ作為決策變量可以簡化QP的計算量,將式(23)代入到式(21)中得到新的預測控制性能指標為

(24)
式中:H=ME-1MT,Kp=γ+ME-1F,且服從新的約束條件λ≥0.
此時選用Hildreth QP方法[17]來解式(24)最小化的問題,這種QP方法屬于逐個元素搜索,因而無需計算矩陣的逆,當有效集的個數大于u中元素的個數,或有效約束線性相關,那么迭代會在計數器最大值時終止,但是算法不會出錯,只是結果會得到一個關于所違背的約束條件的近優解. 最終得到收斂的λ*作為結果,計算出最優解為
u=η-E-1MTλ*.
(25)
根據預測控制滾動優化的特點,每個采樣周期優化計算的最后,將u中前m個元素Δu(k)用來更新預測控制的控制律u(k)=u(k-1)+Δu(k).
在驗證ROSO和預測控制器有效性的仿真實驗中,本文采用DOLPHIN MARK II型AUV,其具體的物理參數可見文獻[10],其中非線性模型參數為



由rank(CD)=rank(D)=2,(A,C)可觀,可以很容易驗證ROSO的存在性.
通過施密特正交化可以得到非奇異矩陣T,其具體形式為一個四階單位矩陣.

最后得到
如圖2所示,圖2(a)為通過ROSO得到的狀態估計與實際狀態的對比,圖2(b)為FOSO得到的狀態估計與實際狀態的對比. 盡管兩種狀態觀測器都可以使狀態誤差漸進收斂,但是從圖中可以看出,ROSO的狀態估計性能要優于FOSO.

(a) ROSO狀態估計與實際狀態對比

(b) FOSO狀態估計與實際狀態對比
本文中預測控制器參數選擇為:Np=30,Nu=2,Q=INp×Np,R=10. 狀態變量的初值全部為零. AUV直航速度為uc=1.832 m/s,參考深度軌跡為3.5 m,參考俯仰角為0°,輸入輸出約束條件為
δbmax=-δbmin=30°,
δsmax=-δsmin=25°,
Δδb,smax=-Δδb,smin=5°/s,
-5°≤θ≤5°,
0 m 其中:δ為前后升降舵舵角,Δδ為舵角變化量. 本文所使用的AUV海浪擾動模型[18]的參數為北太平洋的3級海況,有義波高Hs在0.5~1.25 m之間,并取值Hs=0.88 m,波浪周期為7.5 s,取值概率為16.9%,遭遇角β=45°,拖拽系數Cd=0.65,附加質量系數Cm=1.95,海浪波譜被分為N=271等份. 圖3為波浪力和力矩的曲線,在這里可以將海浪擾動視為狀態擾動,并將其看作零均值白噪聲序列,波浪力和力矩由文獻[18]中的方法計算得出,其表達式分別為 (26) (27) 圖3 波浪力和力矩曲線 式中:L0為AUV長度,ρ為流體密度,D0為AUV的直徑,ωω為波譜頻率的疊加. 可見兩者具有相同的形式但是不同的幅值和單位,此外,仿真時主要選取P-M譜主頻率附近的多種影響較大的頻率進行不規則波的疊加,使仿真結果更真實. 接下來用非線性預測控制(NPC)與本文提出的基于在線線性化的預測控制(PC-NMOL)進行對比,并假設所用的兩種方法的全部狀態量都可測. 圖4(a)為NPC與PC-NMOL的深度輸出曲線對比,圖4(b)為NPC與PC-NMOL的俯仰角輸出曲線對比. 圖5(a)、圖5(b)分別為NPC與PC-NMOL的前、后升降舵偏轉角度對比. (a) 深度輸出對比 (b)俯仰角輸出對比 AUV在低航速、近水面航行時,后升降舵對于縱搖控制比較有效,而前升降舵對于深度控制比較有效[19],結合圖4、5也可以看出,在深度達到3.5 m且趨于穩定后,AUV還需要繼續保持縱搖姿態穩定,因此后升降舵在零值上下的偏轉幅度要明顯大于前升降舵,由此驗證了前面提到的實際操舵特性. 由于本文所用預測控制(PC-NMOL和NPC),屬于多變量控制技術,控制對象主要針對多輸入多輸出(MIMO)系統,因此不用對俯仰角和深度分別設計獨立的控制器,僅通過設計一個預測控制器即可完成對MIMO系統的控制. 由于受到波浪的干擾,系統輸出和輸入曲線存在一定幅度的波動,盡管PC-NMOL的輸出跟蹤速度與NPC相比稍慢,但是PC-NMOL的深度和俯仰角跟蹤效果顯然更好一些,同時,與PC-NMOL相比,NPC的升降舵角變化幅度更大,頻率更高,即控制量波動更為顯著. 由此可以看出,針對近水面海浪干擾,本文所提出的PC-NMOL較傳統NPC可以更有效的補償輸出和輸入上的海浪干擾影響,且魯棒性更強. (a) NPC的升降舵偏轉角 (b) PC-NMOL的升降舵偏轉角 提出一種基于非線性降維觀測器的預測控制來對AUV垂直面運動的深度和俯仰角進行控制. 在預測控制器的設計過程中,使用了前級的ROSO對狀態量進行了精確的估計,并考慮是實際應用中,升降舵偏轉角的物理約束以及AUV姿態的約束,并通過Hildreth二次規劃方法進行約束處理. 通過仿真驗證可以得出,當AUV在垂直面航行時,所提出的控制器能夠將AUV控制在理想的深度和俯仰角,同時具有快速的動態響應,并能保證AUV在近水面對于海浪干擾的魯棒性. [1] XIANG X, LAPIERRE L, JOUVENCEL B. Smooth transition of AUV motion control: from fully-actuated to under-actuated configuration[J]. Robotics and Autonomous Systems, 2015, 67: 14-22. [2] YAN Z, YU H, HOU S. Diving control of underactuated unmanned undersea vehicle using integral-fast terminal sliding mode control[J]. Journal of Central South University, 2016,23:1085-1094. [3] LAKHEKAR G V, WAGHMARE L M, LONDHE P S. Enhanced dynamic fuzzy sliding mode controller for autonomous underwater vehicles[C]//Underwater Technology (UT). Chennai:IEEE, 2015: 1-7. [4] MAI B L, CHOI H S, YOU S S, et al. Time optimal trajectory design for unmanned underwater vehicle[J]. Ocean Engineering, 2014, 89: 69-81. [5] ADHAMIMIRHOSSEINI A, YAZDANPANAH M J, AGUIAR A P. Automatic bottom-following for underwater robotic vehicles[J]. Automatica, 2014, 50(8):2155-2162. [6] TSENG Y H, CHEN C C, LIN C H, et al. Tracking controller design for diving behavior of an unmanned underwater vehicle[J]. Mathematical Problems in Engineering, 2013, 2013. [7] HSU S P, LIU T S. Modifications of control loop to improve the depth response of autonomous underwater vehicles[J]. Mathematical Problems in Engineering, 2014, 2014:1-12. DOI: 10.1155/2014/324813. [8] SUBUDHI B, MUKHERJEE K, GHOSH S. A static output feedback control design for path following of autonomous underwater vehicle in vertical plane[J]. Ocean Engineering, 2013, 63: 72-76. [9] MAO Z, JIANG B, SHI P. Fault-tolerant control for a class of nonlinear sampled-data systems via a Euler approximate observer[J]. Automatica, 2010, 46(11): 1852-1859. [10]FIELD A I. Simulation, modelling, and control of a near-surface underwater vehicle[D]. Vancouver: University of British Columbia, 2000. [12]KRATZ W. Characterization of strong observability and construction of an observer[J]. Linear Algebra and its Applications, 1995, 221: 31-40. [13]SUNDARAPANDIAN V. Reduced order observer design for discrete-time nonlinear systems[J]. Applied Mathematics Letters, 2006, 19(10): 1013-1018. [14]SUNDARAPANDIAN V. Observer design for discrete-time nonlinear systems[J]. Mathematical and Computer Modelling, 2002, 35(1/2): 37-44. [15]BERTSEKAS D P. Nonlinear programming[M]. Belmont: Athena Scientific, 1999. [16]CAMACHO E F, ALBA C B. Model predictive control[M]. Dordrech: Springer Science & Business Media, 2013. [17]WANG L. Model predictive control system design and implementation using MATLAB?[M]. Dordrech: Springer Science & Business Media, 2009. [18]OSTAFICHUK P M. AUV hydrodynamics and modelling for improved control[D]. Vancouver: University of British Columbia, 2004. [19] 金鴻章,船舶控制原理[M]. 哈爾濱: 哈爾濱工程大學出版社, 2013. JIN Hongzhang. Ship control principle[M]. Harbin: Harbin Engineering University Press,2013. Predictivecontrolfordivingofanautonomousunderwatervehicle YAO Xuliang1, YANG Guangyi1, PENG Yu2 (1. College of Automation, Harbin Engineering University, Harbin 150001,China; 2.Beijing Aerospace Automatic Control Institute, Beijing 100854,China) To address the problem of depth tracking and attitude control of autonomous underwater vehicle (AUV) near the surface, a novel nonlinear reduced-order state observer (ROSO) and a predictive controller based on nonlinear model online linearization (PC-NMOL) are presented. By using a nonsingular coordinate transformation, the ROSO is achieved to accurately estimate the state variables of AUV. And the state estimation is applied to the predictive controller to enhance the attitude control and depth tracking performance of AUV. In simulation of AUV longitudinal motion control, the comparison has been presented between ROSO and full-order state observer (FOSO), also between PC-NMOL and traditional nonlinear predictive control (NPC). Simulation results show the fast dynamical response and strong robustness of proposed methods. autonomous underwater vehicle; reduced-order state observer; linear matrix inequality; predictive control; online linearization 10.11918/j.issn.0367-6234.201610106 TP242.6 A 0367-6234(2017)09-0166-08 2016-10-26 國家自然科學基金 (51279039) 姚緒梁(1969—)男,教授,博士生導師 楊光儀,hahaygy@hrbeu.edu.cn 水下自主航行器(AUV)是一種非常重要的海洋開發工具. 由于其強大的自主能力,AUV可以完成人類所安排的各種任務,并被廣泛的應用到軍事以及科研當中[1]. 當AUV在近水面航行時,垂直面的運動控制是其主要的研究方向之一,然而AUV系統的非線性特點以及近水面劇烈的海浪干擾,使研究的難度大大提升. 目前國內外已經有了很深入的研究成果,文獻[2]提出了Backstepping技術以及快速積分終端滑模控制器來分別對航速和深度進行控制,然而其中并沒有考慮兩種控制器之間的耦合作用. 文獻[3]設計了改進的動態滑模控制器,較好地提高了深度跟蹤控制的性能;文獻[4]基于解析滑模控制器的方法獲得了時間最優的軌跡跟蹤;文獻[5]提出了一種基于傅里葉系數展開及偽波普的非線性動態控制器,以實現深度跟蹤的目的;文獻[6]研究了模糊反饋線性化方法,在去掉了兩種一般假設條件的情況下對深度運動的非線性動態進行控制,然而文中并沒有考慮離散時間模型,且缺少足夠的仿真驗證;文獻[7]考慮了重力和浮力變化對深度跟蹤穩態誤差的影響,通過在外環增加了開關PI控制器消除了穩態誤差;文獻[8]通過靜態輸出反饋控制器來完成下潛任務,然而所用的仍然是線性模型. (編輯魏希柱)







4 結 論