稅 懿,楊永峰,向國菲,佃松宜*
(1. 四川大學電氣工程學院,四川 成都 610065;2. 國網浙江電力有限公司衢州供電公司,浙江 衢州324000)
隨著現代控制技術和計算機技術的發展,移動機器人開始在越來越多的領域發揮重要作用,如物流、化工、商場購物等領域。與車式移動機器人、差速移動機器人相比,四個麥克納姆輪全向移動機器人(four mecanum omnidirectional mobile robot,FMOMR)具有較高的移動性,在有限空間中移動方便,因此在足球機器人、倉庫搬運機器人、移動機械手等領域得到了廣泛應用[1,2]。然而,在實際應用中,FMOMR必然會收到自身輪子磨損,非線性摩擦和外部干擾的影響,導致FMOMR無法實現精確跟蹤。因此,基于FMOMR設計的軌跡跟蹤控制器,必須要滿足較強的抗干擾能力。
近幾年,許多研究人員針對存在未知干擾的全向移動機器人設計滑模控制器,其研究結果表明滑模控制器能有效抑制外部擾動[3]。為了減少滑模控制中到達滑動面時間、降低抖振,將模糊控制與滑模控制相結合,使設計的軌跡跟蹤控制器不依賴系統的模型且對干擾具有完全魯棒性[4],但是模糊滑模控制需要調試大量參數。另一方面,可以利用模糊能夠處理不確信息的能力設計模糊神經網絡控制實現軌跡跟蹤[5],但是模糊神經網絡控制器需要大量學習,計算量大,不便于具體實現。
文獻[6]、[7]將模型預測控制與自適應控制相結合,設計出廣義預測控制(generalized predictive control,GPC)算法,具有預測模型、滾動優化和反饋校正等特點,對開環不穩定、非最小相位以及大時滯系統有很好控制效果[6,7]。但值得注意的是廣義預測控制只能有效抑制確定性的干擾,當系統存在模型嚴重失配或未知干擾,如參數擾動、未建模動態等,控制精度會顯著降低。
為了解決這個問題,本文針對FMOMR提出基于擴張狀態觀測器(extended state observer,ESO)的廣義預測控制算法,相較于文獻[6]、[7],所提出的方法能有效抑制未知干擾和參數攝動。
本文的貢獻主要有:1)設計基于ESO的廣義預測控制器,分別實現FMOMR在混合線性干擾和非線性干擾等未知干擾下的軌跡跟蹤控制。2)設計的軌跡跟蹤控制器與基于Kalman的廣義預測控制算法[8]比較,收斂速度更快,跟蹤效果更好。
利用TS模糊神經網絡辨識得到一組TS模糊模型,然后通過加權求和的方式得到受控差分整合滑動平均自回歸(controlled autoregressive integrated moving average,CARIMA)模型[9]
A(z-1)y(k)=B(z-1)u(k-1)
(1)
其中y(k)、u(k-1)分別表示被控對象輸出輸入量,ξ(k)是均值為白噪聲,A(z-1)和B(z-1)是后移算子z-1的多項式,它們分別可以表示如下:

(2)
針對得到的多輸入多輸出系統的CARIMA模型(1),可以將其目標函數表示為
(3)
其中N為預測時域,Nu為控制時域,λ為控制增量加權系數,w(k+j)為參考軌跡。然后從當前時刻尋找Nu步控制變量Δu(k+j-1),使系統在未來N步的預測輸出與給定參考軌跡的誤差最小。
為了使系統的輸出平滑的到達設定值,以減少過量的控制作用而引起振蕩,使當前時刻的輸出可以平穩收斂,通常選用如下一階滯后模型
w(k+j)=δy(k)+(1-δ)yr
(4)
其中0≤δ<1為柔化因子。
引入Diophantine矩陣的多項式方程得
I=Ej(z-1)A(z-1)Δ(z-1)+z-jFj(z-1)
(5)
Ej(z-1)B(z-1)=Gj(z-1)+z-jHj(z-1)
(6)
其中j=1,…,N,
式(1)兩邊同時乘以Ej(z-1),求解上式可得

(7)
將其寫成向量形式

(8)
其中

uT=[Δu(k)T,…,Δu(k+Nu-1)T]


然后,利用內點法對目標函數(3)求最優解。
首先假定函數滿足
limτ→0+h(τ)=+∞
h(τ)>0,?τ>0
h(τ1)≥h(τ2),?τ1≤τ2
其中τi(u)≥0,i=1,…,m,τi(u)是目標函數J(u)的不等式約束函數。
將h(τ)作為懲罰項,取懲罰項函數為h(τ1)=ln[τi(u)],構造內點罰函數如下

(9)
則求解目標函數(3)的問題變為求解如下目標函數

(10)

假設J(u),ln[τi(u)]和Pζk(u)為凸函數,則問題(10)的牛頓步長如下
dk=-[?2Pζk(uk)]-1?Pζk(uk)
(11)
如果uk+dk在可行域內,那么令uk+1=uk+dk,否則存在αk>0使得uk+αkdk正好處在可行域邊界上,這時令uk+1=uk+0.9αkdk,這樣uk+1總是內點。
具體算法步驟如下:
1) 給定u1滿足τi(u)≥0,i=1,…,m;



使用內點法求解后可以得到

(12)
其中f=HΔu(k-1)+Fy,令?P/?u=0,求得控制量u
u=(GTG+Iλ)-1(D+wGT-fGT)
(13)

取(GTG+Iλ)-1的第一行,并且將其第一行表示為PT=[P1,…,PN]。根據滾動優化和反饋校正原理,廣義預測控制律可以寫成
Δu(k)=PT(D+wGT-fGT)
(14)
u(k+1)=u(k)+Δu(k)
(15)

圖1 控制系統框圖
提高FMOMR軌跡跟蹤控制抗擾性能的關鍵是增強廣義預測控制的魯棒性,由此采用擴張狀態觀測器估計擾動[10]。基本思路是將系統中的未建模動態和外部擾動統一看作一個狀態量g(k),結合原有的狀態變量,將系統(1)擴張成新的1階控制系統。對這個擴張的系統構造2階擴張狀態觀測器(20),實時估計狀態量g(k),補償系統模型,從而提高系統的抗干擾性能。具體的設計過程如下:
考慮FMOMR參數攝動和外部擾動,FMOMR的CARIMA模型可以表示為
(A(z-1)+ΔA(z-1))y(k)
=(B(z-1)+ΔB(z-1))u(k-1)+xi(k)
(16)
式中,ΔA和ΔB表示FMOMR的參數攝動量,xi是外部擾動。令
g(k)=-ΔA(z-1)y(k)+ΔB(z-1)u(k-1)+xi(k)
(17)
其中g(k)代表總擾動向量,繼而式(16)可以表示為
A(z-1)y(k)=B(z-1)u(k-1)+g(k)
(18)
令x2=g(k)為擴張的狀態量,g′(k)為擾動向量g(k)的變化率,則式(18)可以擴張為

(19)
由此構建擴張狀態觀測器如下

(20)
其中β01、β02和h為ESO的設計參數,z1為位姿坐標y的估計值,z2為擾動向量g(k)的估計值。選擇適合的ESO參數,可使z2≈g(k)。


(21)

將由擴張狀態觀測器估計的擾動向量作為前饋補償控制,因此得到控制量為

(22)
顯而易見,新控制器與常規廣義預測控制器[6,7]式(15)相比,新增了擾動補償項z2/b0。該擾動補償項只需要原對象實時的輸入-輸出信息就可以通過構建擴張狀態觀測器得到,從而有效抑制參數攝動和外部未知擾動對系統的影響。
新控制器增強了傳統廣義預測控制器[6,7]的抗干擾性能,彌補了傳統廣義預測控制器缺乏抑制未知干擾能力的不足,又保留了GPC具有的預測模型、滾動優化和反饋校正等優點,具體控制系統結構框圖如圖1所示。
廣義預測控制和擴張狀態觀測器的具體參數設計如表1所示:

表1 廣義預測控制和擴張觀測器具體參數
為了更好的驗證本文設計的GPC-ESO軌跡跟蹤控制器的跟蹤性能和抗擾性能,將其與GPC-Kalman[8]相比較,FMOMR參考軌跡是8字形軌跡。
圖2,圖3和圖4是GPC-ESO和GPC-Kalman在混合干擾下的軌跡跟蹤效果,混合干擾如下式

(23)

圖2 混合干擾情況下的跟蹤效果

圖3 混合干擾情況下的跟蹤效果

圖4 混合干擾情況下的誤差
可以看到,在混合干擾的情況下,GPC-ESO較GPC-Kalman都有比較好的跟蹤效果,在干擾類型轉換的節點,GPC-ESO較GPC-Kalman抑制干擾的效果更好,收斂速度更快。
圖5,圖6和圖7是GPC-ESO和GPC-Kalman在非線性干擾xi=5*sin(t/150)*cos(t/300)情況下的軌跡跟蹤控制效果。

圖5 非線性干擾情況下的跟蹤效果

圖6 非線性干擾情況下的跟蹤效果

圖7 非線性干擾情況下的誤差
可以看到在非線性干擾情況下,GPC-ESO較GPC-Kalman算法的抑制干擾的效果更好,且收斂速度更快。
表2顯示了在不同干擾情況下兩種控制方法的軌跡跟蹤結果。可以看到無論是RMSE,SMPAE,還是NRMSE的誤差評價指標下,本文提出的GPC-ESO的軌跡跟蹤誤差都小于GPC-Kalman的軌跡跟蹤誤差,所以GPC-ESO的抗干擾性能更好。

表2 GPC-ESO和GPC-Kalman分別在混合干擾和非線性干情況下跟蹤8字形曲線的RMSE、SMAPE、NRMSE
本文針對FMOMR在參數攝動和外部未知干擾情況下的軌跡跟蹤問題,提出基于擴張狀態觀測器的廣義預測控制策略,通過仿真研究分析,主要有以下結論:
1)設計的擴張狀態觀測器,能實時補償各種未知干擾,包括混合線性干擾和非線性干擾。
2)設計的GPC-ESO控制律,能有效抑制參數攝動和外部干擾,當軌跡跟蹤過程中擾動發生突變時,該控制律能使系統快速收斂,實現軌跡跟蹤。
3)在對比仿真研究中,通過誤差性能指標定量分析2種不同控制策略的跟蹤控制性能,可以得出,所提出的控制策略具有更好的抗干擾能力。