杜 度
(海軍研究院,北京,100161)
自主無(wú)人航行器(autonomous undersea vehicle,AUV)作為一種海洋探索的重要工具,在現(xiàn)代和未來(lái)的海洋資源勘探中有著不可替代的地位,因此受到國(guó)內(nèi)外重視[1-3]。在深海探測(cè)中保持固定深度航行的能力是確保AUV探測(cè)水下資源的基礎(chǔ),因此研究 AUV的深度控制就顯得尤為重要。
AUV深度控制方法有反步法、模糊控制法和自適應(yīng)滑模控制法等[4-8]。Khodayari等[9]設(shè)計(jì)了一種新型的自適應(yīng)模糊PID控制器,通過(guò)組合自適應(yīng)方法和雙比例-積分-微分(proportional-integral-derivative PID)控制器改善PID參數(shù)和AUV建模不確定性。Wei等[10]基于非線性觀測(cè)器設(shè)計(jì)了針對(duì)深度控制的反步法控制器,使其對(duì)外界干擾具有較強(qiáng)的魯棒性。賈鶴鳴等[11]利用反步法設(shè)計(jì)了一種滑模控制器,但未考慮外界環(huán)境存在干擾的問(wèn)題。郭小溪等[12]給出參數(shù)最優(yōu)指標(biāo),利用遺傳算法實(shí)現(xiàn)了PID參數(shù)的自整定。王宏建等[13]提出具有PID增益調(diào)節(jié)的AUV深度控制方法,基于反饋增益的反步法設(shè)計(jì)控制器,避免了采用傳統(tǒng)反步法導(dǎo)致控制器中存在虛擬控制量的高階導(dǎo)數(shù)問(wèn)題,但在控制器設(shè)計(jì)中未考慮外界干擾問(wèn)題。Li等[14]提出了一種基于神經(jīng)網(wǎng)絡(luò)的自適應(yīng)控制方法,但由于反步法設(shè)計(jì)中存在虛擬控制量的導(dǎo)數(shù)高階過(guò)高,導(dǎo)致了控制器的計(jì)算較為復(fù)雜。汪偉等[15]基于滑模變結(jié)構(gòu)設(shè)計(jì)了一種 AUV深度控制器,利用模糊神經(jīng)網(wǎng)絡(luò)對(duì)滑模控制律的控制增益進(jìn)行在線調(diào)整,但是收斂速度較慢,且控制任務(wù)單一,不能快速跟蹤復(fù)雜期望軌跡。梅新華等[16]利用反向傳播(back propagation,BP)神經(jīng)算法自主優(yōu)化艏艉舵進(jìn)行定深航行,但同樣存在收斂速度較慢的問(wèn)題。
為解決控制器參數(shù)設(shè)定過(guò)程中存在反復(fù)調(diào)整的問(wèn)題以及可能存在參數(shù)非最優(yōu)的情況,文中利用徑向基函數(shù)(radial basis function,RBF)神經(jīng)網(wǎng)絡(luò)可以快速地逼近任意非線性函數(shù)的性質(zhì),設(shè)計(jì)了神經(jīng)網(wǎng)絡(luò)的識(shí)別函數(shù),使神經(jīng)網(wǎng)絡(luò)輸出能夠逼近期望軌跡。利用梯度下降法對(duì)PID參數(shù)進(jìn)行自整定,有效地減少了調(diào)整參數(shù)的時(shí)間同時(shí)保證控制器的控制效果最優(yōu)及其參數(shù)值的最優(yōu)性,使AUV可以在較短時(shí)間內(nèi)到達(dá)指定深度。
文中首先對(duì)六自由度的 AUV運(yùn)動(dòng)學(xué)和動(dòng)力學(xué)模型進(jìn)行簡(jiǎn)化,得出深度控制模型;然后簡(jiǎn)述了RBF神經(jīng)網(wǎng)絡(luò)的基本原理,并給出其逼近網(wǎng)絡(luò)的具體公式;為方便進(jìn)行數(shù)字仿真,設(shè)計(jì)出離散條件下的PID控制器和RBF網(wǎng)絡(luò)自整定PID參數(shù)的性能目標(biāo)函數(shù)和迭代公式;最后通過(guò)MATLAB仿真試驗(yàn)得出自整定 PID參數(shù)以及AUV深度控制的實(shí)際曲線和誤差值。試驗(yàn)證明RBF神經(jīng)網(wǎng)絡(luò)可以在較短時(shí)間內(nèi)確定最優(yōu)參數(shù),并保證AUV達(dá)到指定深度。
AUV的空間運(yùn)動(dòng)具有六自由度,通常可以在地球固定坐標(biāo)和船體移動(dòng)坐標(biāo)下描述其運(yùn)動(dòng)狀態(tài),AUV在2個(gè)坐標(biāo)系中的示意圖如圖1所示。

圖1 自主水下航行器坐標(biāo)系示意圖Fig.1 Coordinate systems of autonomous undersea vehicle(AUV)
在深度控制中,從實(shí)際考慮出發(fā),只考慮 AUV在垂平面的運(yùn)動(dòng)狀態(tài),并忽略垂向速度、橫向速度以及橫搖和首搖運(yùn)動(dòng)。因此可以得到簡(jiǎn)化后的AUV深度控制的運(yùn)動(dòng)學(xué)與動(dòng)力學(xué)模型[17]。
運(yùn)動(dòng)學(xué)模型

動(dòng)力學(xué)模型

式中:z,θ,u,w,q是系統(tǒng)狀態(tài)量,分別表示 AUV的垂蕩量、縱搖量、縱蕩速度、垂蕩速度和縱搖速度;其中m為 AUV 質(zhì)量,和為附加質(zhì)量,Iy為繞y軸的轉(zhuǎn)動(dòng)慣量,Zw和Mq為一次水動(dòng)力系數(shù),為二次水動(dòng)力系數(shù);ρ,g,分別代表水密度、重力加速度、AUV的排水體積和縱向穩(wěn)心高;ω1,ω2為海浪干擾;τq為控制輸入。
RBF神經(jīng)網(wǎng)絡(luò)早在1988年由Broomhead等[18]提出,是基于生物學(xué)理論的一種神經(jīng)元網(wǎng)絡(luò)結(jié)構(gòu),模擬了人類大腦皮層區(qū)域中局部調(diào)節(jié)和交疊感受野(receptive field)的人腦反應(yīng)機(jī)制。RBF神經(jīng)網(wǎng)絡(luò)是能在緊湊集和任意精度下逼近任意非線性函數(shù)的向前網(wǎng)絡(luò),相比于早期 BP網(wǎng)絡(luò)具有很好的泛化能力,因此廣泛應(yīng)用在模式識(shí)別和非線性控制領(lǐng)域中。RBF的網(wǎng)絡(luò)結(jié)構(gòu)為3層向前網(wǎng)絡(luò)(見(jiàn)圖 2)。

圖2 徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.2 Structure of radial basis function(RBF)neural network
RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)模型的第 1層為輸入層,其輸入向量表示為其中,n為輸入量個(gè)數(shù)。第2層為隱含層,隱含層為神經(jīng)元激活函數(shù),由徑向基函數(shù)構(gòu)成,其徑向基向量表示為其中,m為節(jié)點(diǎn)數(shù),sj,j∈m為高斯基函數(shù)

式中:bj為高斯基函數(shù)的寬度;cj為第j個(gè)節(jié)點(diǎn)的中心矢量,第3層為輸出層,輸出為加權(quán)函數(shù),表示為
從上節(jié)可知,RBF 神經(jīng)網(wǎng)絡(luò)是一種具有3層結(jié)構(gòu)的靜態(tài)前饋型網(wǎng)絡(luò)。因?yàn)殡[含層中的轉(zhuǎn)移函數(shù)是高斯函數(shù),所以與BP神經(jīng)網(wǎng)絡(luò)相比RBF神經(jīng)網(wǎng)絡(luò)具有更多的神經(jīng)元。并且 RBF 神經(jīng)網(wǎng)絡(luò)的另一個(gè)優(yōu)勢(shì)就是可以根據(jù)具體情況在訓(xùn)練階段調(diào)整隱含層單元數(shù),并且其輸出值也和初始權(quán)值設(shè)置沒(méi)有關(guān)聯(lián),因此RBF神經(jīng)網(wǎng)絡(luò)可以很好地避免復(fù)雜系統(tǒng)中可能存在的初始值參數(shù)設(shè)置問(wèn)題。
從訓(xùn)練速度上看,RBF 神經(jīng)網(wǎng)絡(luò)的收斂速度要好于 BP 神經(jīng)網(wǎng)絡(luò),這是因?yàn)?RBF 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的層數(shù)較少,BP 神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)較前者更為復(fù)雜。其次,RBF 神經(jīng)網(wǎng)絡(luò)中的輸入和高斯函數(shù)中心點(diǎn)的距離決定了隱含層的權(quán)值,特定的任務(wù)中,可以有效利用其網(wǎng)絡(luò)結(jié)構(gòu),根據(jù)訓(xùn)練樣本的布局和隱層單元的寬度,優(yōu)化和選擇訓(xùn)練權(quán)值。因此,RBF神經(jīng)網(wǎng)絡(luò)的3層網(wǎng)絡(luò)結(jié)構(gòu)使其更廣泛應(yīng)用于非線性函數(shù)逼近。
網(wǎng)絡(luò)逼近性能指標(biāo)函數(shù)為

為使 RBF進(jìn)行有效學(xué)習(xí),利用梯度下降法迭代輸出權(quán)值、節(jié)點(diǎn)中心值和節(jié)點(diǎn)基寬參數(shù),分別為

式中:α為學(xué)習(xí)效率;β為動(dòng)量因子。
為利用 RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行參數(shù)自整定,首先要定義整定目標(biāo),即選定整定函數(shù)。AUV深度控制的目標(biāo)是使其跟蹤期望軌跡,使深度跟蹤誤差在有限時(shí)間內(nèi)收斂。文中采用的控制系統(tǒng)結(jié)構(gòu)圖如圖3所示。

圖3 控制系統(tǒng)結(jié)構(gòu)圖Fig.3 Structure of control system
圖3中右端輸出為實(shí)際深度值;左端輸入為實(shí)際深度與期望深度的差值,將差值代入比例項(xiàng)kP,積分項(xiàng)kI,微分項(xiàng)kD表達(dá)式中,并輸入至RBF神經(jīng)網(wǎng)絡(luò);同時(shí)將PID控制器τq代入AUV模型中;之后將實(shí)際輸出深度,辨識(shí)網(wǎng)絡(luò)的輸出與實(shí)際輸出深度的差值代入 RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行整合。
令A(yù)UV進(jìn)行深度控制的期望路徑設(shè)為zd(t),因此根據(jù)其實(shí)際深度z(t)構(gòu)成路徑誤差

為保證 AUV按期望路徑航行,要使誤差為零,選取神經(jīng)網(wǎng)絡(luò)整定目標(biāo)

采取離散式PID控制器

式中,t=kT,kP,kI,kD采用梯度下降方法,表達(dá)式為

利用 MATLAB進(jìn)行試驗(yàn)仿真,驗(yàn)證文中所設(shè)計(jì)控制器的有效性。設(shè)AUV航行速度為2 m/s,深度初值z(mì)′=0,期望深度zd=10。首先任意給出PID參數(shù)初值傳統(tǒng)PID控制參數(shù)對(duì)控制輸入進(jìn)行限制,即采樣周期T=0.01s。海浪干擾10·si n(0.01t)。學(xué)習(xí)效率為α=0.5,動(dòng)量因子為β=0.05;輸入權(quán)、節(jié)點(diǎn)中心和節(jié)點(diǎn)基寬的初值都設(shè)為零。

圖4 AUV深度控制曲線Fig.4 Curves of AUV depth control
通過(guò)圖4可以看出AUV實(shí)際的深度控制能夠較快達(dá)到指定深度,與傳統(tǒng)控制方法相比可以在較短時(shí)間內(nèi)跟蹤誤差。通過(guò)圖5可以看出,AUV的深度控制的誤差很快趨于零,與傳統(tǒng)PID相比誤差相對(duì)較小,從圖 4局部放大圖可以看出,在RBF自整定PID控制下可以在更短時(shí)間內(nèi)收斂。控制輸入曲線如圖6所示。圖7可以看出PID參數(shù)只需設(shè)定初始值,就可以在很短時(shí)間內(nèi)完成自整定,保證其控制效果最優(yōu)及其參數(shù)值的最優(yōu)性,使AUV在較短時(shí)間能到達(dá)指定深度。

圖6 AUV控制輸入曲線Fig.6 Curves of AUV control input

圖7 PID參數(shù)自整定曲線Fig.7 Curves of PID parameter self-tuning
文中針對(duì)傳統(tǒng)PID控制器參數(shù)整定問(wèn)題,提出了一種基于RBF神經(jīng)網(wǎng)絡(luò)的參數(shù)自整定 PID深度控制器。首先根據(jù) AUV運(yùn)動(dòng)規(guī)律給出其垂平面的運(yùn)動(dòng)學(xué)和動(dòng)力學(xué)方程;其次設(shè)計(jì)了 AUV深度控制系統(tǒng)的控制結(jié)構(gòu),給出了RBF網(wǎng)絡(luò)整定目標(biāo)函數(shù)和PID控制器中各個(gè)參數(shù)項(xiàng)的離散形式;最后對(duì)AUV深度控制進(jìn)行仿真研究,與傳統(tǒng)PID控制器進(jìn)行對(duì)比,結(jié)果表明文中提出的基于RBF神經(jīng)網(wǎng)絡(luò)參數(shù)自整定控制方法優(yōu)于傳統(tǒng)PID控制方法,并且驗(yàn)證了該方法對(duì)PID參數(shù)自整定的有效性。
在實(shí)際的 AUV執(zhí)行機(jī)構(gòu)中,控制輸入可能會(huì)存在時(shí)滯問(wèn)題,未來(lái)將考慮在控制輸入時(shí)滯情況下的AUV深度控制,以提高控制器的適用性。
相關(guān)文章導(dǎo)航
1.王小陽(yáng),鄭思遠(yuǎn),李斌,等.基于AD變采樣抑制多普勒的移動(dòng)水聲通信系統(tǒng)[J].水下無(wú)人系統(tǒng)學(xué)報(bào),2018,26(5).
2.齊貝貝,嚴(yán)衛(wèi)生,高劍.基于偶極勢(shì)場(chǎng)的移動(dòng)回收站空間回塢導(dǎo)引算法[J].水下無(wú)人系統(tǒng)學(xué)報(bào),2018,26(3).
3.嚴(yán)浙平,何靚文,李娟.多域限界內(nèi)多AUV巡邏航路規(guī)劃方法[J].水下無(wú)人系統(tǒng)學(xué)報(bào),2017,25(4).
4.張廣潔,嚴(yán)衛(wèi)生,高劍.基于模型預(yù)測(cè)控制的欠驅(qū)動(dòng) AUV 直線路徑跟蹤[J].水下無(wú)人系統(tǒng)學(xué)報(bào),2017,25(2).
5.趙朝聞,張淞,李輝.基于超短基線的AUV自主對(duì)接流程及算法[J].魚(yú)雷技術(shù),2016,24(3).
6.趙寧寧,徐德民,高劍,等.基于Serret-Frenet坐標(biāo)系的多AUV編隊(duì)路徑跟蹤控制[J].魚(yú)雷技術(shù),2015,23(1).
7.楊智棟,潘光,杜曉旭.變纜長(zhǎng)拖纜AUV縱向運(yùn)動(dòng)建模與仿真[J].魚(yú)雷技術(shù),2014,22(1).
8.陳偉,嚴(yán)衛(wèi)生,崔榮鑫.障礙物環(huán)境下的多AUV主從式編隊(duì)控制[J].魚(yú)雷技術(shù),2013,21(6).
9.王茜,嚴(yán)衛(wèi)生,馮凱.自主式水下航行器舵機(jī)控制系統(tǒng)采樣校正[J].魚(yú)雷技術(shù),2013,21(3).
10.張靜,楊惠珍,郝莉莉,等.基于Jacobi幾何向量的多AUV編隊(duì)控制方法[J].魚(yú)雷技術(shù),2012,20(2).
11.沈建森,周徐昌,高璇.遠(yuǎn)程AUV近水面運(yùn)動(dòng)縱向模糊滑模控制[J].魚(yú)雷技術(shù),2011,19(5).
12.夏梁盛,嚴(yán)衛(wèi)生.海流干擾作用下欠驅(qū)動(dòng)AUV航路點(diǎn)跟蹤控制[J].魚(yú)雷技術(shù),2011,19(4).
13.柳其亮,徐德民.AUV舵面故障的直接自修復(fù)控制[J].魚(yú)雷技術(shù),2010,18(2).
14.雷江濤,聶衛(wèi)東,曲大偉,等.基于EASY5的AUV熱動(dòng)力系統(tǒng)建模與仿真[J].魚(yú)雷技術(shù),2010,18(1).
15.程雪梅.水下滑翔機(jī)研究進(jìn)展及關(guān)鍵技術(shù)[J].魚(yú)雷技術(shù),2009,17(6).
16.劉利,黃文玲.多AUV編隊(duì)協(xié)調(diào)模糊控制策略[J].魚(yú)雷技術(shù),2009,17(1).
17.潘光,黃明明,宋保維,等.AUV回收技術(shù)現(xiàn)狀及發(fā)展趨勢(shì)[J].魚(yú)雷技術(shù),2008,16(6).
18.桂志輝,嚴(yán)衛(wèi)生,高劍,等.虛擬現(xiàn)實(shí)在AUV地形跟蹤控制研究中的應(yīng)用[J].魚(yú)雷技術(shù),2008,16(4).