摘要:針對小車一級倒立擺的起擺控制,利用徑向基函數神經網絡的自適應能力,微調系統的控制參數,構造一個具有自調整能力的控制器來增大倒立擺擺起角度范圍。結果表明,基于RBF網絡的PID控制器較常規PID控制器具有更強的自適應能力、更高控制精度和更好的魯棒性,能滿足控制系統的實時性要求。
關鍵詞:倒立擺;RBF神經網絡;PID控制;擺起
中圖分類號:TP273文獻標識碼:A文章編號:1009-3044(2010)01-176-03
Control for Swing-up of Inverted Pendulum of Angel Based on RBF
LIU Ming, YANG Hai-rong, CUI Bao-ji
(Department of Electronic Information, Xi'an Polytechnic University, Xi'an 710048, China)
Abstract: The swing-up control of an inverted pendulum, a Radial Basis Function neural network (RBF) is built to identify the system and self-tuning the PD gains. The simulation results showed that the system, compare with conventional PD controller, the presented the control system has great anti-jamming ,adaptability and robustness.
Key words: inverted pendulum; diagonal recurrent neural network; PID control; swing-up
倒立擺系統是一個高階次、非線性、強耦合、多變量和自然不穩定的系統,是進行控制理論研究的理想實驗平臺。在控制過程中,它能有效地反映諸如可穩定性、魯棒性、隨動性和跟蹤等許多控制中的關鍵問題,是檢驗各種控制理論的理想模型。許多現代控制理論的研究人員一直將它視為典型的研究對象,不斷從中發掘新的控制策略和控制方法。
常規PD控制器不具有在線整定參數kp,kd的功能,致使其不能滿足在不同的偏差e及偏差變化率ec下系統對PD參數的自整定要求,從而影響其控制效果的進一步提高。為了滿足在不同的偏差e和偏差變化率ec對PD參數自整定的要求,本文在常規PD控制器的基礎上,利用神經網絡的自適應能力,微調系統的控制參數,構造一個具有自調整能力的,穩定的PD控制器,利用這種智能的PD控制器,增大倒立擺擺起角度范圍,使小車到達指定位置,擺桿最終保持豎直向上的狀態。
1 倒立擺數學模型
對于小車一級倒立擺系統,倒立擺示意圖如圖1所示,M為小車質量, m為擺桿的質量, b為小車的摩擦系數。l為擺桿轉動中心到桿質心的距離,I為擺桿慣量,F為加在小車上的力,x為小車的位置,θ為擺桿與垂直向上方向的夾角,g為重力加速度。 倒立擺的數學模型的建立方法在文獻[3]中已有介紹,本文直接給出倒立擺的狀態方程。 取狀態變量如下:x1=θ,x2=, x3=x,x4=。
可得到系統的狀態空間方程如下:X=Ax+Bu,Y=Cx+Du,式中,
2 控制原理
2.1 控制器的參數設計
對擺角的控制范圍是檢驗倒立擺控制系統性能的重要指標. 本文中,給出擺桿一個角度θ,利用控制算法在較短的時間內使擺桿從狀態迅速擺起到平衡位置附近,成功實現倒立擺的擺起控制。
控制器如圖2所示,在常規 PD 性能的基礎上,利用神經網絡的自適應能力,微調系統的控制參數,構造一個具有自調整能力的,穩定的PD控制器,利用這種智能的PD控制器,增大倒立擺擺起角度范圍。rk為系統的輸入指令,yk為系統的輸入值,k=1,2,3,4分別代表倒立擺的?準,,x,的狀態。由于電機控制方向必須與擺的倒動角度方向相反,故控制器參數選負數。
控制算法如下:
其中,
神經網絡整定指標為:
采用梯度下降法: (1)
(2)
速率式中, 為對象的Jacobian信息,該信息可以由神經網絡進行辨識。
2.2 RBF神經網絡辯識器
徑向基函數(RBF,Radial Basis Function)神經網絡是由J.Moody和C.Darken與20世紀80年代末提出的一種神經網絡,它是具有單隱層的3層前饋神經網絡,模擬了人腦中局部調整,相互覆蓋接受域的神經網絡結構,能以任意精度逼近非線性函數。RBF神經網絡是一種三層前向網絡,輸入層由信號源結點組成,輸入到輸出的映射是非線性的,第二層為隱含層,而隱層空間到輸出空間的映射使線性的,第三層為輸出層,從輸入層到隱含層的變換函數是徑向基函數,從隱含層到輸出層的變換是線性變換。采用RBF網絡可大大加快學習速度并避免局部極小問題,適合于實時控制的要求。采用RBF網絡構成神經網絡控制方案,可有效提高系統的精度,魯棒性和自適應性。
RBF 神經網絡辯識系統結構圖的結構 如圖3所示,RBF 神經網絡結構取5-6-4。 在RBF網絡結構中,X=[x1,x2,…,x5]T為網絡的輸入向量。其中x1=Δu。u表示控制量,x2=θ為擺角,x3=為擺角,x4=x為小車的位置,x5= 為小車速率。網絡隱層層有6個神經元,wjk為網絡輸出層的權值向量。ymk(k=1,2,3,4)為網絡的輸出,分別表示下一時刻倒立擺系統的擺角θ,擺角速率,小車的位置x,小車速率。
徑向基向量H=[h1,h2,…,h6]T,其中hj為高斯基函數:
網絡的第j個結點的中心矢量為Cj=[Cj1,Cj2,…,Cj5]T
設網絡的基寬向量為:B=[b1 b2 … b6]T
辨識網絡的輸出為:ymi=wi1h1+ wi2h2+…+ wi6h7
辨識器的性能指標函數為:
根據梯度下降法,輸出權,節點中心及節點基寬參數的迭代算法如下:
式中,η為學習速率,α為動量因子[4]。
其算法為:
式中,為被控對象的Jacobian信息(即為對象的輸出對控制輸入變化的靈敏度信息),通過RBF神經網絡的辨識而得。
3 仿真研究
控制算法應用于小車倒立擺擺起控制。下面進行對擺角控制范圍的仿真實驗,將位移初始值x保持為0.2m,擺角初始值θ從-40°逐漸增大到38°,系統都能較快地恢復到平衡點,但超調量也都隨之逐漸增大。 由文獻[1]可知,PD控制倒立擺擺起的角度范圍θ=-39°到θ=37°。
小車倒立擺系統參數如下[1]:取采樣周期t=0.01s,M=1.0kg=,m=0.1kg,L=0.5m,小車相對導軌的摩擦系數μc=0.0005,桿相對于小車的摩擦系數μp=0.000002,g=9.8m/s2。原始條件為:θ(0)=0, x(0)=0.2,(0)=0。期望狀態為:θ(t)=0,θ(t)=0,x(t)=0,(0)=0。由文獻[1]可知,PID控制擺角的范圍是 采用RBF整定的PD進行仿真,仿真結果如圖4.
圖4表示θ=-40°時候的仿真結果,圖5表示θ=38°時候的仿真結果。
可見,基于RBF整定的PID控制器比傳統PID控制器控制倒立擺擺角范圍增大了2°,表明RBF整定的PID控制器自適應能力快,系統魯棒性強。
4結論
本文針對倒立擺擺起角度控制問題,利用神經網絡的自適應能力,微調系統的控制參數,構造一個具有自調整能力的,穩定的PD控制器,利用這種智能的PD控制器,增大倒立擺擺起角度范圍。實驗結果表明,基于RBF網絡的PID控制器較常規PID控制器具有很強的自適應能力、更高控制精度和更好的魯棒性,能滿足控制系統的實時性要求。
參考文獻:
[1] 湛力,孫鵬,陳雯柏.倒立擺系統的自擺起和穩定控制[J].計算機仿真,2006,23(8):289-292.
[2] 張濤,吳漢生.基于神經網絡的強化學習算法實現倒立擺控制[J].計算機仿真,2006;23(4):298-300.
[3] 劉金琨.先進PID控制及其MATLAB仿真[M].2版.北京:電子工業出版社,2003:284-290.
[4] 牛建軍,吳偉,陳國定.基于神經網絡自整定PID控制策略及其仿真[J].系統仿真學報,2005,17(6):1425-1427.
[5] 徐國林,楊世勇.單級倒立擺系統的仿真研究[J].四川大學學報:自然科學版,2007,44(5):1013-1016.