于樹友 馮陽陽 KIM Jung-Su 陳 虹 4
預測控制是對工業控制工程具有重大影響的先進控制算法[1],大量應用于化工、冶金制造等過程控制領域[2].預測控制要求在每一個采樣時刻,根據系統當前時刻的狀態采樣值,最小化系統的目標函數(性能指標),獲得有限時域的開環控制序列或者無限時域的閉環反饋控制律.但只把控制序列或者反饋控制律的第一個片段作用于系統,在下一個采樣時刻根據新的測量值重新求解優化問題.由于采用了開環滾動優化、閉環反饋矯正的形式,預測控制可以解決非線性、約束系統的最優控制問題[3?6];也由于在每一個采樣時刻重新求解優化問題,在線修正預測軌跡,因而具有很強的抗干擾能力[7?8].
Grüne 在假設系統可控和優化問題具有滾動可行性的基礎上,提出了保證非線性預測控制穩定性的策略[9].為了保證預測控制的穩定性,另一種方法是在優化問題中加入終端約束集和終端懲罰函數[10?11].Grüne 的方法被稱為無(終端)約束預測控制;與之相對應,Chen 等[10]和Mayne 等[11]的方法被稱為具有終端約束條件的預測控制.通過合理地選擇終端懲罰函數和終端約束集,在假設優化問題在初始時刻具有可行解的條件下,具有終端約束條件的預測控制能夠保證優化問題具有滾動可行性和受控系統的漸近穩定性.文獻[12]深入分析了在優化問題中引入終端約束集和終端懲罰函數的優點和缺點.
終端懲罰函數、終端約束集和終端控制律構成了保證穩定性的非線性預測控制方法中優化問題的基本要素,三者需要離線求解,共同決定了在線計算負擔和閉環系統的性能.如果系統是局部Lipschitz 連續的,文獻[10]給出了連續時間約束非線性系統終端約束集存在的充分條件.Mayne 等在總結預測控制已有成果的基礎上,給出保證受控系統漸近穩定的終端要素需要滿足的“公理性”條件[11].文獻[13?14]將文獻[10]給出的終端約束集存在的充分條件推廣至離散時間非線性系統.由于預測控制中終端約束集的大小決定了預測時域的選擇,而后者又決定了系統的在線計算負擔,因而很多工作著眼于如何求得更大的終端約束集.利用非線性系統的局部線性微分包含,文獻[15?16]分別給出了橢球體和多面體型的終端約束集的求解方法.考慮線性時不變系統,文獻[17]提出了時變的終端懲罰函數和時變的終端約束集的求取方法,其中終端約束集是一族終端約束集的凸包,并且凸包的加權系數是時變的.在文獻[17]工作的基礎上,文獻[18]進一步研究了終端約束集族的構造方法.文獻[19]討論了有限步終端懲罰函數和有限步終端約束集的構造方法,可以得到更大的可行域(吸引域);當步數選為1 時,該方法就還原為經典的終端懲罰函數和終端約束集的構造方法.文獻[20]給出了非線性系統時變終端約束集和時變終端懲罰函數的計算方法,其中終端控制律可以是線性的,也可以是非線性的.通過估計非線性系統的高階非線性項,文獻[21?22]給出了兩種求解非線性預測控制終端約束集的方法,可以用來求解高維非線性系統的終端懲罰函數和終端約束集.上述方法都將終端約束集選擇為終端懲罰函數的水平截集.
本文提出了一種非線性預測控制終端約束集、終端懲罰函數和終端控制律的優化方法.與已有的方法相比,終端約束集不再是終端懲罰函數的水平截集.終端控制律將終端約束集和終端懲罰函數聯系起來:當系統狀態位于終端約束集時,在終端控制律的作用下,系統狀態保持在終端約束集中(正不變性);系統的終端懲罰函數是系統無窮維階段代價的上界.終端懲罰項和終端約束集的“解耦”通過在優化問題中引入新的優化變量實現,因而提供了新的自由度,降低了求解的保守性.
符號說明.記 R 為實數域,Rn為n維歐幾里得空間,Z 為非負的整數,Z+為正整數,Z[1,N]是指區間[1,N] 內的整數.符號k+i|k代表在k時刻預測一個(無限或者有限維) 序列時,該序列在k+i時刻的預測值.記M為n×n維的實數矩陣,M ?0和M ?0 分別表示矩陣M是正定對稱的、半正定對稱的,M ?0 和M ?0 分別表示矩陣M是負定對稱的、半負定對稱的.對于向量v ∈Rn,∥v∥Q=其中矩陣Q ∈Rn×n,Q ?0.矩陣I代表具有適當維數的單位矩陣;對稱矩陣中的?代表對稱矩陣中按照對角線對稱的對應元素;det(X)是指方陣X的行列式.
考慮離散時間非線性系統

考慮系統的輸入和狀態約束

其中,X和U為包含原點的有界閉集.
本文中假設系統的狀態xk是實時可測量的,并且不考慮外部擾動、模型不確定性和測量噪聲對系統動態的影響.
假設f:是二次連續的,(0,0)是系統的唯一平衡點.
定義k時刻的控制輸入序列

則k時刻預測控制的有限時域優化問題可以描述為:
問題 1.

其中,N為預測時域;N∈Z+;xk+i|k是在控制uk+i|k的作用下系統起始于xk|k的預測狀態軌跡;l(·,·) 是階段代價(Cost stage)函數,目標函數

階段代價l(x,u):X ×U →U關于自變量x和u均是連續的,并且滿足l(0,0)=0 和對所有的 (x,u)∈X ×U {0,0},l(x,u)>0.
終端約束集Xf是平衡點的一個鄰域;終端懲罰函數E(x) 是半正定的,并且當且僅當x=0 時,E(x)=0.記κf(x) 為終端控制律,通常終端控制僅用來求解終端約束集Xf和終端懲罰函數E(x),不會直接作用于系統.
下面的引理給出了為保證受控系統漸近穩定,終端控制律、終端約束集和終端懲罰函數需要滿足的條件.在文獻[11]中Mayne 等將上述條件稱為保證預測控制系統漸近穩定的“公理(Axioms)”.
引理 1[11].如果優化問題1 在初始時刻k=0 有可行解,并且終端約束集Xf、終端控制律κf(x) 和終端懲罰函數E(x) 滿足如下的條件:
1)Xf ?X,Xf是一個閉集,0∈Xf;
2)κf(x)∈U,?x ∈Xf;
3)f(x,κf(x))∈Xf,?x ∈Xf;
4)E(xk+i+1|k)?E(xk+i|k) +l(xk+i|k,κ(xk+i|k))≤0,?x ∈Xf.
其中,終端懲罰函數E(·) 是非線性系統 (1)的一個局部的Lyapunov 函數.則
1)優化問題1 在任意時刻k ≥0 均有可行解;
2)在預測控制的作用下,系統漸近穩定.
條件1)和2)表明在終端約束集中狀態約束和控制約束均得到滿足;條件3)表明在終端控制律的作用下,終端約束集是一個控制的不變集(即在終端控制律的作用下,如果當前時刻系統的狀態在終端約束集中,則下一時刻系統的狀態仍然在終端約束集中);條件4) 表明在終端約束集內,在終端控制律的作用下,代價函數沿著系統軌跡單調遞減.
記系統(1)在平衡點 (0,0) 的局部Lipschitz 線性化系統為

假設系統 (6)是可鎮定的,即存在一個線性反饋控制律Fx使得A+BF的特征根在單位圓內.選擇終端懲罰函數為系統局部的Lyapunov 函數,終端約束集為終端代價函數的水平截集.針對連續時間非線性系統和離散時間非線性系統,文獻[10,13]分別給出了終端約束集、終端控制律和終端懲罰函數存在的充分條件.
如果選取終端約束集為終端代價函數的水平截集

則條件4)就內在地包含了條件3).此時,終端懲罰函數、終端約束集和終端控制律需要滿足的4個條件就相應地簡化為3 個條件:

針對離散時間非線性系統,本文討論非線性預測控制終端約束集、終端控制律和終端懲罰項的優化方法.本文的結果中,終端懲罰函數和終端約束集內的局部Lyapunov 函數是不同的,終端約束集也可以不再是終端懲罰函數的水平截集.
為簡化,考慮如下多面體形式的狀態約束和控制輸入約束

本節首先介紹非線性系統 (1)的多胞體線性微分包含[23?24],在此基礎上討論非線性預測控制終端約束集和終端代價函數的求解方法.非線性系統的線性微分包含本質上是一個由系統構成的集合,非線性系統只是集合內的一個“元素”.如果集合(非線性系統的線性微分包含) 具有某種屬性,則作為集合中的一個特定元素的非線性系統也具有這一屬性.
假設

其中,

Co代表元素的凸組合,即存在L個非負的標量 使得λi,i=1,2,···,L,

注 1.終端約束集是系統平衡點的某一個鄰域,因而在求取終端約束集時可以只關心平衡點某一鄰域的微分包含.具體地,可以尋找C0?C使得

其中,?0是平衡點鄰域C0的線性微分包含.當然,在求取了終端約束集Xf后還需要檢查是否滿足Xf ??0.
下面的定理給出了求取非線性系統 (1) 終端約束集、終端懲罰函數和終端控制律的方法.
定理 1.對非線性系統 (1),假設系統的一個多胞體線性微分包含為式 (8).如果存在矩陣G,Y和對稱正定矩陣X1,X2,使得

則:
1)線性反饋控制律u=Fx,F=Y G?1可以選作系統的終端控制律;
2)橢圓域Xf:=可以選作系統的終端約束集;
證明.下面將逐一證明按照這種方式選擇的終端控制律、終端懲罰函數和終端約束集滿足引理1列舉的4 個條件.
1) 考慮線性反饋控制律u=Fx和二次終端懲罰函數條件

成立等價于

上式成立的充分條件[25?26]是對于任意的i=1,2,···,L,有

式(10)中{2,2}項表明X1?0;{1,1}項表明G+GT?X1.由于X1?0 和G+GT?X1,矩陣G是非奇異的.進一步地,由于X1?0 和(G ?X1)T×?0,所以

考慮到F=Y G?1和式 (10) 表明

對式 (15) 兩端分別左乘 diag{X1G?T,I,I,I}和右乘 diag{G?1X1,I,I,I},可以得到式 (13) 成立.即在終端控制律的作用下,沿著系統的狀態軌跡優化問題的代價函數是最優的.
2) 采用與上述相似的推理,可以得到

考慮到F=Y G?1和,式 (11) 表明

對式 (17) 兩端分別左乘 diag{X2G?T,I}和右乘 diag{G?1X2,I},可以得到

利用Schur 補定理[23],有


如果在某一時刻h0,∈Xf,則對于任意的k ≥h0,xk ∈Xf.即在狀態反饋控制律u=Fx的作用下,橢圓域Xf是非線性系統 (1) 的不變集.
3) 考慮到F=Y G?1和0?G+GT?X2?GT×G,式 (12) 表明

對式 (20) 兩端分別左乘 diag{X2G?T,I}和右乘 可以得到diag{G?1X2,I},

利用Schur 補定理,上式等價于

注 2.從形式上看,定理 1 中終端約束集Xf:={x ∈≤1}不再是終端懲罰函數的水平截集.
注 3.終端控制律沒有真正作用于系統;終端控制律使得系統在終端約束集中是正不變的(系統狀態進入終端約束集后將不再離開終端約束集);在終端控制律的作用下,在終端約束集中系統滿足輸出約束 (7);終端控制律使得系統的動態軌跡具有某種最優性(最優代價).
橢圓域Xf:=的容量(橢圓域包含點的個數)與 det(X2) 成正比[23].目標函數 det(·) 不是變量的凸函數,但是可以通過對數變換[27]或者求取特征值的幾何均值[28]將求取對稱矩陣最大行列式的非凸優化問題轉變為凸優化問題.本文采用文獻[28]介紹的求取特征值的幾何均值方法.
考慮如下的優化問題:
問題 2.

問題 2 是一個凸優化問題[28].通過求解凸優化問題 2 可以得到參數矩陣X1,X2,Y和G.在此基礎上,利用F=Y G?1得到終端控制律u=Fx;相應系統的終端懲罰項為系統的終端約束集為Xf:=
離散系統終端約束集也可以通過求解下面的優化問題得到[29?30].
問題 3.

在問題 2 中,如果選擇X1=X2=G,則問題2和問題 3 等價,從而由于在優化問題中引入了新的自由變量X2和G,因而可以從理論上保證求取問題 2 得到的終端約束集更大.求取問題2和問題 3 得到的終端約束集均為橢圓集,區別在于求取問題 3 得到的終端約束集是終端懲罰函數的水平截集,求取問題 2 得到的終端約束集與增加的一個自由變量X2相關,是正定函數xTX2x的水平截集.進一步地,由于均采用線性矩陣不等式求解優化問題,并且求取過程是離線進行,設計過程復雜性的有限提高仍然在可接受范圍內.
需要強調的是,終端約束集變大有可能導致系統動態性能變差.
考慮離散時間非線性系統

非線性系統(25)在平衡點 (0,0) 處Jacobi 線性化得到的線性系統是開環不穩定的,但是可控的.
考慮控制約束

階段代價函數l(x,u)=xTQx+uTRu中的權矩陣Q和R分別為

將系統(25)寫成如下形式

其中,μ=uk可以視為一個時變參數.考慮到uk ∈[?1,1],則系統的一個多面體線性微分包含為

其中,

分別采用文獻[30]和本文介紹的方法求取系統的終端不變域,相應的系統終端約束集如圖1,其中虛線對應的橢圓是采用文獻[30]中介紹的方法(求解問題 3) 得到的,實線對應的橢圓是采用本文介紹的方法得到的.從圖中可以看出,采用本文介紹的方法擴大了系統的終端約束集.

圖1 終端約束集Fig.1 Terminal constraint set


圖2~ 圖4 給出了初始狀態為x0=[?1.5 1.5]T時系統的動態響應,實線為采用本文方法求取的終端約束條件對應的系統動態,虛線為采用文獻[30]中介紹的方法求取的終端約束條件對應的系統動態.從圖中可以看出,在滿足控制輸入約束的情況下系統動態軌跡漸近趨于平衡點;并且采用本文介紹的方法并沒有使得系統的動態性能變差.上述仿真中,預測時域和控制時域相等,均為5.

圖2 系統的動態響應:x1Fig.2 Dynamic response of the system:x1

圖3 系統的動態響應:x2Fig.3 Dynamic response of the system:x2

圖4 系統的動態響應:uFig.4 Dynamic response of the system:u
需要指出的是,在狀態空間的某些點處,在相同的預測時域和控制時域下,本文介紹的方法有可行解,而采用文獻[30]中介紹的方法沒有可行解.
針對離散時間非線性系統,本文提出了一種非線性預測控制終端約束集的優化方法.從內容上看,本文提出的優化方法比文獻[29?30]中的經典優化算法多了自由變量,因而可以從理論上保證所求得的終端約束集比該經典優化方法更大,進而可以通過選擇更短的預測時域來降低預測控制在線計算負擔;從形式上看,本文提出的方法可以實現終端懲罰函數和終端約束集的某種解耦,即終端約束集不再是終端懲罰函數的水平截集.但終端約束集和終端懲罰函數仍然通過終端控制律聯系起來:終端約束集是受控系統在終端控制律作用下的不變集;當系統狀態在終端約束集時,在終端控制律的作用下,終端懲罰函數是系統的無窮時域階段代價的上界.最后通過仿真算例驗證了所提方法的有效性.