摘 要:倒立擺系統被廣泛應用于檢驗各種控制理論和控制策略的有效性中。分析了兩種簡單而有效的控制策略:極點配置法和線性二次最優控制策略的LQR法,并通過Matlab仿真對單極倒立擺系統進行了控制效果的對比,從理論和仿真結果上討論了這兩種控制策略的優缺點。
關鍵詞:倒立擺;極點配置法;LQR;Matlab
中圖分類號:TP273 文獻標識碼:A
文章編號:1004373X(2008)0112902
Study of the Two Control Strategies Based on the Inverted Pendulum
PAN Jian,WANG Jun,TANG Caigang
(School of Electrical Electronic Engineering,Hubei University of Technology,Wuhan,430068,China)
Abstract:Inverted pendulums are widely used to verify some qualities and effect of certain control theory or method.The paper analyses the two single and effective control strategies:the pole-placement method and the optimization strategies of LQR method.We compare the control results of the single inverted pendulum system with the two control strategies by the Matlab experiment.The paper points out the advantage and disadvantage between the two different methods through theories and the results of the Matlab experiment.
Keywords:inverted pendulum;pole-placement method;LQR;Matlab
1 引 言
倒立擺系統是一種絕對不穩定、高階次、多變量、強耦合的非線性系統,是控制理論研究中理想的實驗對象,他為控制理論的教學、實驗和科研構建了一個良好的實驗平臺,促進了控制新理論和新思想的發展。倒立擺系統可以采用很多種控制策略,例如PID、自適應、狀態反饋、智能控制等。近年來,隨著對倒立擺系統研究的深入,涌現出大量優秀的控制策略和控制方法。因為對倒立擺系統的控制可以比較真實地模擬火箭的飛行控制和步進機器人的穩定控制等問題,所以對倒立擺系統進行深入研究具有很重要的理論和實際意義。
Matlab是MathWorks公司于1982年推出的一套高性能的數值計算和可視化軟件,他集數值分析、矩陣計算、信號處理和圖形顯示于一體,構成了一個方便的、界面友好的用戶環境,是常用的控制系統分析與設計工具。Matlab仿真程序的編寫不需要掌握很深的編程知識,只需要很少的代碼就能完成控制系統的仿真實驗。同時其具有很多專用的工具箱,使得編程變得很容易,這樣研究人員就能很直觀、方便地進行分析、計算及設計工作,從而大大節省了時間,提高了效率。
本文以一級直線倒立擺為研究對象,給出兩種在實際應用中廣泛使用的控制策略:狀態反饋的極點配置法和線性二次最優控制策略的LQR法,同時分別進行Matlab的仿真實驗,并對所得到的仿真結果進行對比研究,不僅從理論上分析這兩種控制策略各自的特點,而且從仿真輸出的曲線進行詳細的對比分析,使讀者能夠很直觀地分辨出兩種控制策略的優點與缺點,給出其各自的應用場合,為人們合理利用這兩種控制策略給出一定的理論指導。
2 倒立擺系統的建模
控制方法的研究離不開被控對象精確的線性模型,為了能夠系統地分析上述兩種控制策略,首先必須對被控對象進行建模。本文以深圳固高公司的GIP-100-L倒立擺實驗系統為研究對象,根據牛頓運動定律,并經過相關的整理和代入相關的參數可以得到如下的狀態方程:
則可以得出狀態矩陣:
3 極點配置法
極點配置法通過設計狀態反饋控制器將多變量系統的閉環系統極點配置在期望的位置上,從而使系統滿足瞬態和穩態性能指標。
(1) 首先構造被控系統的能控性矩陣[WTHX]M[WTBX]C=[[WTHX]B[WTBX] [WTHX]AB[WTBX] [WTHX]A[WTBX]2[WTHX]B[WTBX] [WTHX]A[WTBX]3[WTHX]B[WTBX]],通過計算可以得到rank([WTHX]M[WTBX]C)=4,即系統是可控的。
(2) 計算特征值
根據要求,并留有一定的裕量(設調整時間為2 s),選取期望的閉環極點s=μi(i=1,2,3,4),其中:
根據期望的特征方程:
因此可得:
4 利用愛克曼公式計算狀態反饋增益矩陣[WTHX]K的值[WTBZ]
根據愛克曼方程可以確定反饋增益矩陣為:
根據以上的思路,利用Matlab編寫如下的程序:
5 線性二次最優控制策略的LQR法
LQR方法針對狀態方程=[WTHX]A[WTBX]x+[WTHX]B[WTBX]u,通過確定最佳的控制量u(t)=-[WTHX]K[WTBX]x(t)的矩陣[WTHX]K[WTBX],使得控制性能指標J=∫∞0(xT[WTHX]Q[WTBX]x+uT[WTHX]R[WTBX]u)dt達到最小,其中[WTHX]Q[WTBX]為正定(或半正定)厄米特或實對稱矩陣,[WTHX]R[WTBX]為正定厄米特或實對稱矩陣,[WTHX]Q[WTBX]和[WTHX]R[WTBX]分別表示了誤差和能量損耗的相對重要性,[WTHX]Q[WTBX]中對角矩陣的各個元素分別代表各項指標誤差的相對重要性。
根據期望性能指標選取[WTHX]Q[WTBX]和[WTHX]R[WTBX],利用Matlab命令LQR就可以得到反饋矩陣[WTHX]K[WTBX]的值。LQR函數允許選擇兩個參數-[WTHX]R[WTBX]和[WTHX]Q[WTBX],這兩個參數用來平衡輸入量和狀態量的權重。在本實例中,我們選取[WTHX]R[WTBX]=1。
6 兩種控制策略的Matlab仿真結果的比較
為了觀測方便,我們只選取小車的位置曲線進行一對一的比較。根據計算出來的反饋矩陣[WTHX]K[WTBZ]值,利用Matlab能夠很方便地進行相應的仿真。在仿真中,通過比較兩種控制策略的輸出曲線來得出相關的結論。
極點配置法中,得到的仿真結果見圖1。
從仿真結果可以看出極點配置法和LQR法對小車的位置都有良好的控制效果,經過較短的過渡過程,小車能夠保持穩定。將圖1和圖2進行比較,很容易看出,圖2中[CM(23*2]的曲線比圖1中的曲線要平滑得多,LQR法比極點配置
法有較小的超調量,振蕩也較小。但是LQR法的反應較遲緩,過渡過程較長,沒有極點配置法來得迅速。
從兩種控制策略的仿真控制效果來看,極點配置法具有較優的魯棒性及瞬態特性,LQR法的魯棒性及瞬態性較差,但是LQR法具有較優的穩態特性,則極點配置法較差。這是因為LQR綜合考慮了各個狀態量在輸入控制量下的變化規律,從而保證了良好的穩態效果,但是犧牲了系統的魯棒性和瞬態性。極點配置法雖然能夠通過選擇合適的期望閉環極點達到良好的控制效果,但是這樣主要是依靠工程師的經驗來選擇期望的極點,因此極點配置法就沒有LQR法方便和簡單。
7 結 語
本文通過Matlab仿真驗證了極點配置法和線性二次最優控制策略的LQR法的有效性。同時對這兩種控制策
略進行了深入的比較,給出極點配置法更適合應用到要求快速響應的控制系統中,而LQR法更適合應用到對穩態性能要求較高的控制系統中。綜合各項性能指標來比較兩種控制策略,LQR法在總體上還是優于極點配置法。以后的研究工作可以通過改進LQR法來提高其魯棒性和瞬態性,使其具有更好的控制效果。
參 考 文 獻
[1]叢爽,李澤湘.實用運動控制技術[M].北京:電子工業出版社,2006.
[2]固高公司.固高教學產品Matlab實時軟件用戶手冊控制[Z].2004.
[3]胡壽松.自動控制原理[M].北京:國防工業出版社,1990.
[4]王孝武.現代控制理論基礎[M].北京:機械工業出版社,1998.
[5]王正林,王勝開,陳國順.Matlab/Simulink與控制系統仿真[M].北京:電子工業出版社,2005.
作者簡介 潘 健 男,1961年出生,上海人,湖北工業大學副教授。主要研究方向為控制理論。
注:“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。”