于樹友,褚建新,王銀敏
(1. 吉林大學 汽車仿真與控制國家重點實驗室,吉林 長春 130022;2. 吉林大學 控制科學與工程系,吉林 長春 130012)
倒立擺系統具有多變量、強耦合、非線性且不穩定等特性[1],所有重心在上支點在下的問題都可以用倒立擺問題來概括。科研人員通過對倒立擺的控制檢驗自己的控制算法,直觀地表現穩定性、可控性等關鍵問題。倒立擺有著深刻的工程背景,相關理論成果已經在直升飛機、火箭發射、人造衛星、機器人等方面得到了廣泛應用[2-3]。
按運動方式分類,倒立擺主要有兩類控制問題,一是使擺桿保持在豎直倒立位置的平衡控制,二是擺桿從靜止下垂狀態到豎直倒立方位所進行的起擺控制[4]。在進行平衡控制時,采用了基于觀測器的輸出反饋控制策略,分別采用極點配置法和最優控制策略設計平衡控制器。在本文中,針對擺桿及旋轉臂角速度不可測量問題,研究了一階旋轉倒立擺在不穩定平衡點處的狀態觀測器設計問題,分別設計了降維觀測器和高通濾波器對不可測狀態進行觀測。在進行起擺控制時,采用了能量控制策略。用Matlab/Simulink 工具完成了仿真環節,并在實驗環節成功完成了對倒立擺的平衡控制和起擺控制,驗證了控制器的有效性。該方法應用于自動控制相關課程的實驗教學,強化了學生對控制系統建模、控制器設計等理論知識的理解。
一階旋轉倒立擺的旋轉臂和擺桿可以簡化成兩個均勻的質量桿,其模型結構與相應的實物如圖1 所示,一階旋轉倒立擺的參數及物理意義見表1。

圖1 旋轉倒立擺系統示意圖

表1 系統物理參數表
由圖1 可知,系統的動能包括:旋轉臂轉動的動能,擺桿擺動的動能,擺桿質心在水平方向和豎直方向的動能。定義零勢能面為旋轉臂轉動的平面,則系統的動能和勢能可分別記為T和V,則:

動能與勢能的差記為H[5],則:

其中τ代表直流伺服電機輸出組轉矩,且有:

計算式(4)中的各個分量[6],并在平衡位置附近(α≤ 0.1745 rad )進行線性化,得到如下線性方程組

其中,JT=+J1mL2+J2mr2,G=+。將相關參數值代入式(7),得到一階旋轉倒立擺系統的線性化模型:

系統是以旋轉臂角位移、擺桿角位移、旋轉臂角速度和擺桿角速度為狀態變量,以直流電機輸入電壓為輸入的4 階線性系統。系統滿足可控性的充分必要條件rank[B AB A2B A3B] =4,系統滿足可觀性的充分必要條件rank[C CA CA2CA3]T=4,所以系統是可控、可觀的。其中,A為狀態矩陣,表示系統內部變量之間的聯系;B為輸入矩陣,表示各個輸入變量如何控制狀態變量;C為輸出矩陣,表示輸出如何反應狀態變量。
由于倒立擺的擺桿和旋轉臂的角速度(θ˙和α˙)無法直接測得,需要利用狀態觀測器對系統狀態進行觀測[7]。本節討論狀態觀測器的設計方法,并對其觀測效果進行對比和分析。

圖2 高通濾波器狀態觀測結構圖

圖3 高通濾波器幅相曲線特性
在設計降維函數觀測器時,首先給出了觀測器的結構如下:

其中,z為待觀測的狀態,F、G、H是構成降維狀態觀測器的待求矩陣。F陣的選取與觀測器的期望極點有關,G陣是一個任選的非奇異矩陣,H陣的值則需要求解一個Sylvester 方程。從觀測器綜合原則出發,取觀測器的特征值負實部為A-KB特征值的負實部的2~3 倍[8]。以平衡控制器中的極點配置法為例,并經過多次實驗,最終選取觀測器極點為 -10.5±10.5j。列出期望的特征方程(λ為特征根):

任取一個常矩陣G,使得 [F,G] 滿足完全可控條件。
求解Sylvester 方程TA-FT=GC,得:

記P=[CT]T,rank(P) = 4表明P為非奇異陣。若P為奇異陣,則需重新選取R及G陣。
計算矩陣H:

則函數觀測器的實現為Q=[Q1,Q2]:

一階倒立擺系統中兩個不能直接測得的狀態變量θ˙和α˙分別是可測變量θ和α的一階微分。由于微分環節不穩定,故采用一階高通濾波器來近似一階微分環節。選取如下形式的一階高通濾波器:

圖2 為高通濾波器狀態觀測結構圖,圖3 為高通濾波器幅相曲線特性。從圖3 可以看出,在頻率ω=0附近一階高通濾波器H(s) 可以很好地近似一階微分環節。
為了對觀測效果進行比較,現假設旋轉臂角速度、擺桿角速度都可測,通過Simulink 仿真輸出兩個狀態變量的大小,再使加入觀測器觀測到的狀態變量與之比較。為了使仿真結果更具有說明性,采用平衡控制的仿真過程來產生一個動態環境,取極點配置法設計的狀態反饋矩陣,仿真結果如圖4、圖5 所示。

圖4 觀測結果圖

圖5 觀測結果圖
從仿真結果可以看出,降維狀態觀測器的觀測效果很好。考慮到針對極點配置法以及LQR 法設計狀態反饋控制器時,觀測器的形式是不同的,同時由于實驗要反復多次進行,狀態反饋矩陣K經常會發生變化,所以采用降維狀態觀測器顯然會大大增加實驗負擔。采用高通濾波器進行狀態觀測時,觀測曲線比較平滑,且高通濾波器的結構不會隨閉環系統極點的變化而變化,因此在接下來的仿真及實驗過程中,都將采用高通濾波器來進行狀態觀測。
研究一階旋轉倒立擺的平衡控制問題。采用了基于觀測器的輸出反饋控制策略,考慮到線性系統的分離原理,狀態觀測器和狀態反饋控制器可以獨立設計。本節分別用極點配置和LQR 兩種控制方法實現倒立擺的平衡控制。
由于系統參數矩陣(A,B)可控,可以尋找合適的狀態反饋矩陣K,使系統閉環極點達到期望值。我們期望閉環系統的超調量和調節時間為:

假設該閉環系統極點由一對共軛閉環主導極點和兩個非主導極點構成。系統的動態特性主要由共軛閉環主導極點決定,與二階欠阻尼系統具有相似的動態特性,則二階欠阻尼系統中超調量和調節時間為:

其中,ζ為欠阻尼二階系統的阻尼系數,nω為自然角頻率。
根據式(18)和式(19)可以得到系統的一對閉環主導極點:

另外兩個非主導極點應滿足[9]:

由式(20)和式(21)可以確定系統期望的特征方程為:

相應得到狀態反饋矩陣為:

采用LQR 法設計的閉環控制系統,其控制性能主要由加權矩陣Q和R決定,加權矩陣Q和R的選擇反映能耗和誤差的折中。本文取R陣為1。Q陣的對角陣qi,i= 1,2,3,4表示設計者對狀態變量xi的關注程度,越重視某個狀態變量,越希望其誤差分量盡可能小,Q的對角元素相應的qi就要取得越大[10]。在一階旋轉倒立擺的控制過程中,主要目標就是使擺桿倒置穩定,也就是說對狀態變量α的重視程度最高,其對應的值也應該最大。在本文中取:

計算得出最優反饋矩陣為:

極點配置和LQR 兩種控制算法作用下的旋轉臂角位移θ、擺桿角位移α以及直流電機輸出電壓mV的仿真結果分別如圖6、圖7 和圖8 所示。

圖6 θ 的仿真結果圖

圖7 α 的仿真結果圖

圖8 Vm 的仿真結果圖
由圖6 可以看出,LQR 法設計的控制器控制系統,在θ值突變時其旋轉臂旋轉的幅度較極點配置法小,但是擾動影響持續的時間更長一些。從圖7 和圖8 可見,將LQR 法設計的控制器運用到倒立擺的控制時,其擺桿角位移波動的幅度和直流電機輸出電壓波動的幅度更小,即損耗的能量更少。
為了驗證兩個平衡控制器的實用性,必須進行具體的平衡控制實驗。本文的實驗借助QuaRC 軟件,在Matlab/Simulink 中搭建了控制模型來實現實時控制。在旋轉臂上加入幅值為20、周期為10 的方波信號進行擾動測試,可以驗證控制算法的抗干擾能力,實驗結果如圖9、圖10、圖11 所示。

圖9 θ 對比圖

圖10 α 對比圖

圖11 Vm 對比圖
從圖9 可以看出,當旋轉臂受到方波信號干擾時,采用LQR 法控制的倒立擺的旋轉臂不會出現轉動特別劇烈的情況。從圖10 和圖11 可以看出,在受到干擾時,采用LQR 法設計的控制器使倒立擺的擺桿擺動幅度更小,電機輸出能量也更少,LQR 法的優越性非常明顯,這樣的實驗結果與上述仿真結果一致。
起擺控制是指擺桿從常見的下垂狀態運動到豎直向上狀態的過程,本節采用能量控制策略討論擺桿的起擺控制問題[11]。以擺桿處于自然下垂狀態時質心所在的位置為零勢能點。
記E為擺桿的機械能,則:

其中Er為擺桿在豎直向上位置的勢能。
為使系統漸近穩定,則取軸加速度:

在實際的倒立擺系統中,一切動作的實現都依賴電機的輸出,軸加速度a的改變也不例外。在旋轉倒立擺系統中有:

由電機輸出轉矩與電壓的關系,可以得出:

實驗結果及分析如圖12、圖13、圖14 所示。其中,θ和α分別為旋轉臂角位移和擺桿角位移。

圖12 θ 變化圖
由實驗結果可以看出,系統在7 s 左右即可達到穩定狀態,控制效果較好,實驗成功。

圖13 α 變化圖

圖14 Vm 變化圖
一階旋轉倒立擺要通過對旋轉臂的控制來實現對擺桿的控制,使擺桿最終能夠處于倒置穩定狀態。分別用極點配置法以及LQR 法設計倒立擺的平衡控制器。仿真及實驗對比結果表明,用LQR 法設計的控制器控制效果更好。由于旋轉臂角速度和擺桿角速度不可測量,采用高通濾波器觀測不可測量的狀態。采用能量控制策略設計倒立擺的起擺控制器,并通過實驗驗證了控制器的有效性。通過實驗還驗證了一階旋轉倒立擺系統模型及所設計的控制器的有效性,也進一步證明了該教學平臺操作簡單、穩定可靠。將該實驗應用于本科教學,達到了以下教學目的:
(1)建立系統數學模型,掌握控制器的設計過程,為學生今后分析類似的控制系統、設計算法提供思路;
(2)熟悉Matlab 編程環境,掌握Matlab 仿真實驗設計與分析;
(3)掌握一階旋轉倒立擺的工作原理和應用,通過實驗直觀展示了系統工作過程。
該一階旋轉倒立擺實驗教學在自動控制相關課程中的應用,將大大提高教學質量和效果。以往的實驗內容多是在計算機上完成的,需要學生自己親自動手的該實驗將大大提高學生的熱情與積極性。該實驗形式是值得肯定的,應多提供類似機會,發揮學生的主觀能動性,使學生變被動學習為主動學習,增大科研興趣,提升實踐能力,培養團隊精神,為進入工作崗位打下堅實基礎。