摘 要:本文應(yīng)用Matlab 的Simulink工具箱中Model Reference Controller模塊的plant identification 模塊來(lái)控制辨識(shí)帶有反饋的倒立擺系統(tǒng)。在研究過(guò)程中,利用狀態(tài)反饋穩(wěn)定了倒立擺系統(tǒng),并將穩(wěn)定的倒立擺系統(tǒng)看作一個(gè)整體進(jìn)行神經(jīng)網(wǎng)絡(luò)辨識(shí)和控制。此方法簡(jiǎn)單易行,容易實(shí)現(xiàn)。
關(guān)鍵詞:倒立擺;神經(jīng)網(wǎng)絡(luò);自適應(yīng)控制
中圖分類號(hào):TP183;TP202+.7 文獻(xiàn)標(biāo)志碼:A文章編號(hào):1671-7953(2009)01-0075-08
RsearchforModelReferenceAdaptiveControl ofInvertedPendulumBasedonNeuralNetwork
SONG Xi-tao,WANG Zhi-gong
(Department of Mechanical and Electrical Engineering,Shandong Silk Textile Vocational College,Zibo Shandong 255300,China)
Abstract: This paper adopted the plant identification module of Module Reference Controller module in the Matlab's Simulink toolbox to control and identify the inverted pendulum system with feedback. In the process of research,state feedback was used to stabilize the inverted pendulum,and the stable inverted pendulum system was identified and controlled by the method of neural network as a whole. This method is simple and easy to be achieved.
Key words: pendulum;neural network;adaptive control
倒立擺是一種典型的快速、多變量、非線性、絕對(duì)不穩(wěn)定系統(tǒng),它已經(jīng)成為驗(yàn)證控制方法是否可靠的重要工具。人們?cè)噲D尋找不同的控制方法以實(shí)現(xiàn)對(duì)倒立擺的控制,以便檢驗(yàn)或說(shuō)明該方法對(duì)嚴(yán)重非線性和絕對(duì)不穩(wěn)定系統(tǒng)的控制能力。本文就是通過(guò)利用神經(jīng)網(wǎng)絡(luò)對(duì)倒立擺的辨識(shí)和控制了解基于神經(jīng)網(wǎng)絡(luò)離線辨識(shí)和實(shí)時(shí)控制的特性,并希望通過(guò)仿真過(guò)程中遇到的問(wèn)題的分析對(duì)控制系統(tǒng)加強(qiáng)理解。
1 單級(jí)倒立擺系統(tǒng)數(shù)學(xué)模型
倒立擺的模型為:
=mg sinθ-cosθ(f+mplθ #8226;2 sinθ)43ml-mplcos2θ(1)
其中:θ -夾角,f-作用力,mp-桿質(zhì)量取0.1kg,m-擺桿和小車(chē)總質(zhì)量1.1kg,l-半擺桿長(zhǎng)取0.5m,g-重力加速度取9.8m/s2
參考模型為:R(s)=1s2+2ξωns+ωn2,其中ξ=0.9,ωn=2.5rad/s。
2 控制方法的選取
神經(jīng)網(wǎng)絡(luò)控制自20世紀(jì)80年代以來(lái),與控制理論相接合,而發(fā)展成為自動(dòng)控制領(lǐng)域的前沿學(xué)科之一。它已成為智能控制的一個(gè)新的分支,為解決復(fù)雜的非線性、不確定、不確知系統(tǒng)的控制問(wèn)題開(kāi)辟了新途徑。應(yīng)用神經(jīng)網(wǎng)絡(luò)控制系統(tǒng)的方法也層出不窮,如神經(jīng)網(wǎng)絡(luò)直接逆控制,神經(jīng)網(wǎng)絡(luò)最優(yōu)控制,神經(jīng)網(wǎng)絡(luò)非線性預(yù)測(cè)控制等。因此在選擇控制方案時(shí)要依據(jù)系統(tǒng)的特性和控制的目的進(jìn)行。依據(jù)本文的目的(了解神經(jīng)網(wǎng)絡(luò)對(duì)未知系統(tǒng)的辨識(shí)和控制),本文選用神經(jīng)網(wǎng)絡(luò)直接逆控制的方案對(duì)倒立擺進(jìn)行控制,控制目標(biāo)是期望倒立擺的角度能夠跟蹤
參考模型的輸出。
3 神經(jīng)網(wǎng)絡(luò)直接逆控制概述
神經(jīng)網(wǎng)絡(luò)直接逆控制有兩種結(jié)構(gòu):直接型與間接型。直接型的原理是:構(gòu)造一個(gè)參考模型,使其輸出為期望輸出ym,控制的目的是使y跟蹤ym。若對(duì)象特性不確定、不確知,需采用間接型的結(jié)構(gòu),其原理是:給定一個(gè)由輸入/輸出對(duì){u(k),y(k)}表征的被控對(duì)象p,由輸入/輸出對(duì){r(k),ym(k)}表征的穩(wěn)定的參考模型M,r是有界的,ym是對(duì)象的期望輸出,控制的目的是確定控制序列u(k)使
E(k)=lim‖ym(k)-y(k)‖ε,ε >0(1)
即當(dāng)kk0時(shí),系統(tǒng)的輸出y(k)能跟蹤參考模型M的輸出ym,即y(k)跟隨ym。本文假設(shè)倒立擺的模型在神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)過(guò)程中是未知的,因此選用間接型直接逆控制的方案。圖1是神經(jīng)網(wǎng)絡(luò)直接模型參考自適應(yīng)和間接模型參考自適應(yīng)的結(jié)構(gòu)框圖。
使用神經(jīng)網(wǎng)絡(luò)進(jìn)行控制時(shí),通常需要兩個(gè)步驟:系統(tǒng)辨識(shí)和控制設(shè)計(jì)。在系統(tǒng)辨識(shí)階段,主要任務(wù)是建立控制系統(tǒng)的神經(jīng)網(wǎng)絡(luò)模型;在控制設(shè)計(jì)階段,使用神經(jīng)網(wǎng)絡(luò)模型來(lái)設(shè)計(jì)或者訓(xùn)練控制器網(wǎng)絡(luò)。Matlab的Simulink工具箱中提供了有關(guān)神經(jīng)網(wǎng)絡(luò)控制的工具,我們利用其中的Model Reference Controller模塊來(lái)控制倒立擺。
圖1 神經(jīng)直接模型參考控制和間接模型參考控制結(jié)構(gòu)
4 倒立擺的神經(jīng)網(wǎng)絡(luò)控制研究
4.1 倒立擺的神經(jīng)網(wǎng)絡(luò)模型辨識(shí)
4.1.1 設(shè)計(jì)實(shí)驗(yàn)采集系統(tǒng)的輸入輸出數(shù)據(jù)
注意事項(xiàng):
1)當(dāng)系統(tǒng)不穩(wěn)定時(shí),要在系統(tǒng)閉環(huán)狀態(tài)下采集數(shù)據(jù)
當(dāng)系統(tǒng)不穩(wěn)定時(shí),也許給系統(tǒng)一個(gè)微小輸入,就會(huì)使系統(tǒng)震蕩或使系統(tǒng)輸出發(fā)散,在實(shí)際系統(tǒng)中,在這種狀態(tài)下采集數(shù)據(jù)顯然會(huì)對(duì)系統(tǒng)造成很大的傷害,而且我們辨識(shí)一個(gè)不穩(wěn)定的系統(tǒng)也是沒(méi)有意義的,所以我們采集的數(shù)據(jù)要在使系統(tǒng)穩(wěn)定的范圍內(nèi)采集,當(dāng)系統(tǒng)是一個(gè)不穩(wěn)定的系統(tǒng)時(shí),首先要設(shè)計(jì)一個(gè)穩(wěn)定控制器使系統(tǒng)穩(wěn)定。
由于倒立擺是一個(gè)本質(zhì)非線性,絕對(duì)不穩(wěn)定的系統(tǒng),因此先要給系統(tǒng)設(shè)計(jì)穩(wěn)定的控制器,這里我們采用狀態(tài)反饋來(lái)使系統(tǒng)穩(wěn)定。
我們構(gòu)建狀態(tài)空間表達(dá)式,取x1=θ, x2=θ #8226;,x #8226;1=x2(2)
x #8226;2=mg sinx1-cos x1(f+mplx #8226;21sinx1)43ml-mplcos2x1=
mg sinx1-mplsinx1cos x1x2243ml-mplcos2x1-
cos x143ml-mplcos2x1f
(3)
當(dāng) x1= x2=0是系統(tǒng)是穩(wěn)定的平衡點(diǎn),在平衡點(diǎn)附近對(duì)系統(tǒng)進(jìn)行線性化,得到近似系統(tǒng)的表達(dá)式。
x #8226;1x #8226;2= 0 115.7756 0x1x2+0-1.4634
f(4)
由可控性矩陣[B AB]的秩為2可知,系統(tǒng)在平衡點(diǎn)附近是可控的。可以為線性化的系統(tǒng)設(shè)計(jì)穩(wěn)定的控制率。
設(shè)計(jì)的穩(wěn)定控制率為:
u=-kx+v(5)
其中v是參考輸入,k是狀態(tài)反饋系數(shù),根據(jù)狀態(tài)空間極點(diǎn)配置的原理,選取k1=20,k2=-0.5。
在設(shè)計(jì)完倒立擺穩(wěn)定的控制率后,將帶有反饋控制率的倒立擺看作是一個(gè)系統(tǒng),下面的辨識(shí)和控制都是針對(duì)這個(gè)系統(tǒng)進(jìn)行的。
2)對(duì)系統(tǒng)線性程度的測(cè)試
由于本文將帶有反饋的倒立擺看作一個(gè)系統(tǒng),辨識(shí)和控制都是針對(duì)這個(gè)系統(tǒng)進(jìn)行,因此要對(duì)系統(tǒng)進(jìn)行線性程度的測(cè)試。
首先給系統(tǒng)加入三個(gè)不同幅值的方波信號(hào),對(duì)比系統(tǒng)的輸出,再給系統(tǒng)加入三個(gè)不同幅值的正弦信號(hào),對(duì)比系統(tǒng)輸出,正弦信號(hào)的頻率為1Hz。
對(duì)比這六幅圖,可以看到系統(tǒng)顯然不滿足疊加定理,因此加入反饋的系統(tǒng)仍然是非線性的系統(tǒng)。
3)系統(tǒng)輸入的選擇
由于系統(tǒng)是非線性系統(tǒng),采集數(shù)據(jù)時(shí)輸入要滿足充分激勵(lì)系統(tǒng)的要求。這里選擇比較常用的信號(hào)“N-samples-constant”。信號(hào)的表達(dá)式如式(6),其中e(t)代表白噪聲信號(hào)。
u(t)=e(int[t-1N]+1) t=1,2,…(6)
信號(hào)示于圖3中。
圖3 采集系統(tǒng)I-O數(shù)據(jù)時(shí)的系統(tǒng)輸入
4)采樣頻率的選擇
通常認(rèn)為采樣頻率選取得越高越好,但是太高的采樣頻率會(huì)使得在辨識(shí)過(guò)程中產(chǎn)生數(shù)值問(wèn)題。這里選擇0.02s作為采樣頻率。
4.1.2 選擇模型結(jié)構(gòu)
對(duì)于神經(jīng)網(wǎng)絡(luò),其結(jié)構(gòu)主要包括神經(jīng)網(wǎng)絡(luò)的輸入,輸出,層數(shù),隱層節(jié)點(diǎn)數(shù)。這里選取單隱層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),隱層的節(jié)點(diǎn)數(shù)選為15個(gè)。由于待辨識(shí)的系統(tǒng)是二階系統(tǒng),當(dāng)前時(shí)刻的輸出和前兩個(gè)時(shí)刻的系統(tǒng)輸出和前兩個(gè)時(shí)刻的系統(tǒng)輸入決定,因此,神經(jīng)網(wǎng)絡(luò)的輸入有四個(gè),分別為y(k-1),y(k-2),u(k-1),u(k-2)。神經(jīng)網(wǎng)絡(luò)的輸出只有一個(gè),即y(k)。
圖4 神經(jīng)網(wǎng)絡(luò)辨識(shí)器參數(shù)選擇
4.1.3 帶有反饋的倒立擺系統(tǒng)辨識(shí)
本文采用Simulink工具箱中Model Reference Controller模塊的plant identification 模塊來(lái)控制辨識(shí)帶有反饋的倒立擺系統(tǒng)。神經(jīng)網(wǎng)絡(luò)辨識(shí)器的參數(shù)選擇如圖4所示。
辨識(shí)的結(jié)果如圖5所示。
圖5 對(duì)帶有反饋倒立擺系統(tǒng)的辨識(shí)結(jié)果
從圖5中可以看到神經(jīng)網(wǎng)絡(luò)的輸出與實(shí)際系統(tǒng)的輸出誤差在10-3量級(jí),可以接受。
4.2 應(yīng)用Simulink工具箱中Model Reference Controller模塊對(duì)系統(tǒng)進(jìn)行控制
應(yīng)用Simulink工具箱中Model Reference Controller模塊對(duì)帶有反饋的倒立擺系統(tǒng)進(jìn)行控制。在simulink中的控制系統(tǒng)的框圖如圖6所示。
圖6中的subsystem為帶有反饋的倒立擺系統(tǒng)。其中model reference controller模塊中既包括神經(jīng)網(wǎng)絡(luò)辨識(shí)模塊也包括神經(jīng)網(wǎng)絡(luò)控制器模塊,nn control signal為神經(jīng)網(wǎng)絡(luò)控制器的輸出,nn plant output為神經(jīng)網(wǎng)絡(luò)辨識(shí)器的輸出。Identification error展示神經(jīng)網(wǎng)絡(luò)辨識(shí)器的輸出與倒立擺輸出的差,control error展示倒立擺系統(tǒng)與參考模型之間的差,這個(gè)差值表征了倒立擺系統(tǒng)的跟蹤性能。為了說(shuō)明訓(xùn)練控制器時(shí)的注意事項(xiàng),我們分三個(gè)實(shí)驗(yàn)進(jìn)行說(shuō)明,這也正是我們?cè)趯?shí)驗(yàn)過(guò)程中遇到問(wèn)題,分析問(wèn)題,解決問(wèn)題的過(guò)程。
圖6 倒立擺神經(jīng)網(wǎng)絡(luò)控制系統(tǒng)框圖
4.2.1 實(shí)驗(yàn)一
1)神經(jīng)網(wǎng)絡(luò)控制器的訓(xùn)練
神經(jīng)網(wǎng)絡(luò)控制器的參數(shù)選擇如圖7所示。
圖7 神經(jīng)網(wǎng)絡(luò)控制器參數(shù)選擇
圖7為神經(jīng)網(wǎng)絡(luò)模型參考控制器輸入輸出接口,其中的training data是用來(lái)根據(jù)參考模型產(chǎn)生神經(jīng)網(wǎng)絡(luò)控制器在線訓(xùn)練時(shí)的數(shù)據(jù)對(duì)的。其中nn_ref為系統(tǒng)的參考模型。
神經(jīng)網(wǎng)絡(luò)控制器根據(jù)參考模型產(chǎn)生的輸入輸出數(shù)據(jù)進(jìn)行在線訓(xùn)練時(shí)的目標(biāo)是在給定系統(tǒng)和參考模型相同的輸入的情況下,系統(tǒng)的輸出與參考模型的輸出誤差越小越好。圖8展示了神經(jīng)網(wǎng)絡(luò)控制器在訓(xùn)練過(guò)程中,系統(tǒng)的參考輸入,參考模型的輸出和應(yīng)用神經(jīng)網(wǎng)絡(luò)控制的系統(tǒng)的倒立擺系統(tǒng)的輸出。從圖中可以看到神經(jīng)網(wǎng)絡(luò)控制的倒立擺系統(tǒng)能夠跟蹤參考模型的輸出,然而網(wǎng)絡(luò)控制器對(duì)前半段數(shù)據(jù)跟蹤控制效果較差,而對(duì)后半段的數(shù)據(jù)跟蹤控制效果較好。產(chǎn)生這種現(xiàn)象的原因會(huì)在實(shí)驗(yàn)2中給出。
圖8 神經(jīng)網(wǎng)絡(luò)控制器訓(xùn)練結(jié)果
2)驗(yàn)證神經(jīng)網(wǎng)絡(luò)控制器的控制效果
在神經(jīng)網(wǎng)絡(luò)控制結(jié)構(gòu)框圖(圖6)中,給定系統(tǒng)輸入信號(hào),觀察倒立擺系統(tǒng)的輸出和參考模型的輸出,來(lái)驗(yàn)證神經(jīng)網(wǎng)絡(luò)控制器的有效性。還要觀察神經(jīng)網(wǎng)絡(luò)控制器的輸出是否在可以接受的范圍內(nèi)。圖9中綠色曲線為參考模型的輸出,藍(lán)色曲線為倒立擺的輸出。圖10為驗(yàn)證神經(jīng)網(wǎng)絡(luò)控制器時(shí),神經(jīng)網(wǎng)絡(luò)辨識(shí)器與倒立擺輸出的差值,可以看出神經(jīng)網(wǎng)絡(luò)辨識(shí)器對(duì)不同的輸入信號(hào)精度都較高,說(shuō)明辨識(shí)較為成功。圖11為神經(jīng)網(wǎng)絡(luò)控制器的輸出,可以看到輸出較為平滑,可以接受。
3)小結(jié)
從辨識(shí)和控制的結(jié)果中,可以看到,辨識(shí)的精度較高,這不僅體現(xiàn)在辨識(shí)的過(guò)程中(圖5中辨識(shí)誤差在10-3量級(jí)),而且驗(yàn)證神經(jīng)網(wǎng)絡(luò)控制器時(shí)模型誤差也保持在量級(jí)。從圖11中可以看到神經(jīng)網(wǎng)絡(luò)控制器輸出較為平滑,控制系統(tǒng)雖然能夠跟蹤參考模型的輸出,但是總有些差強(qiáng)人意,控制過(guò)程中對(duì)訓(xùn)練數(shù)據(jù)也較為敏感,同樣是隨機(jī)產(chǎn)生的參考模型的訓(xùn)練數(shù)據(jù),在數(shù)據(jù)范圍,采樣時(shí)間的最大最小值相同的情況下,對(duì)控制器的訓(xùn)練結(jié)果影響很大,圖8給出的是眾多次仿真實(shí)驗(yàn)結(jié)果中最好的一個(gè)結(jié)果,在跟蹤模型參考的輸出時(shí)有時(shí),誤差仍然較大。在驗(yàn)證控制器的控制效果時(shí),控制器對(duì)給定的跟蹤信號(hào)也較為敏感,同樣,圖9中給出的仍然是較好的結(jié)果。所以本次實(shí)驗(yàn)結(jié)果算不上令人滿意,在若干次仿真實(shí)驗(yàn)后,原因找到了。這是由于在訓(xùn)練控制器時(shí),對(duì)訓(xùn)練數(shù)據(jù)的一次參數(shù)設(shè)置不當(dāng)所引起的。下面通過(guò)實(shí)驗(yàn)2給以說(shuō)明。實(shí)驗(yàn)步驟分別用A2,B2,C2標(biāo)識(shí)。
4.2.2實(shí)驗(yàn)二
1)神經(jīng)網(wǎng)絡(luò)控制器的訓(xùn)練
圖12實(shí)驗(yàn)二訓(xùn)練神經(jīng)網(wǎng)絡(luò)控制器時(shí)參數(shù)的選擇
圖12為實(shí)驗(yàn)二訓(xùn)練神經(jīng)網(wǎng)絡(luò)控制器參數(shù)的選擇,對(duì)比圖7,可以看到訓(xùn)練數(shù)據(jù)增多,數(shù)據(jù)分組也增多。給定輸入信號(hào)的最小采樣間隔增大,這是由于倒立擺在實(shí)際工作過(guò)程中要跟蹤較為低頻的信號(hào)。實(shí)際上訓(xùn)練數(shù)據(jù)的增加和訓(xùn)練方式的改變?cè)诒敬螌?shí)驗(yàn)中起到了關(guān)鍵的作用,這里訓(xùn)練方式選為一次增加數(shù)據(jù)段的訓(xùn)練方式,這樣訓(xùn)練出來(lái)的網(wǎng)絡(luò)控制器對(duì)所有的訓(xùn)練數(shù)據(jù)都會(huì)比較穩(wěn)定,不會(huì)如圖8中所示,網(wǎng)絡(luò)控制器對(duì)前半段數(shù)據(jù)跟蹤控制效果較差,而對(duì)后半段的數(shù)據(jù)跟蹤控制效果較好。這在圖13中可以看到,本次訓(xùn)練的網(wǎng)絡(luò)控制器對(duì)所有的訓(xùn)練數(shù)據(jù)跟蹤控制效果較為平均化。
圖13實(shí)驗(yàn)二神經(jīng)網(wǎng)絡(luò)控制器訓(xùn)練結(jié)果
2)實(shí)驗(yàn)二神經(jīng)網(wǎng)絡(luò)控制器的驗(yàn)證
圖14中給出用不同采樣時(shí)間的隨機(jī)信號(hào)驗(yàn)證神經(jīng)網(wǎng)絡(luò)控制器的效果圖,可以看到倒立擺基本能夠跟蹤給定參考信號(hào),但對(duì)比圖13訓(xùn)練時(shí)的控制效果,結(jié)果并不令人滿意。當(dāng)我們將參考輸入的信號(hào)換成變化較慢的chirp信號(hào)時(shí),控制器已經(jīng)不能保證跟蹤效果了(圖15)。3)實(shí)驗(yàn)二小結(jié)與分析
在實(shí)驗(yàn)二中我們大大增加了訓(xùn)練數(shù)據(jù)對(duì),也增加了訓(xùn)練數(shù)據(jù)段,并且在訓(xùn)練過(guò)程中采用了增加訓(xùn)練數(shù)據(jù)段的方式訓(xùn)練控制器。這樣解決了實(shí)驗(yàn)一中訓(xùn)練結(jié)果對(duì)不同的訓(xùn)練數(shù)據(jù)敏感的問(wèn)題,但是卻出現(xiàn)了訓(xùn)練好的網(wǎng)絡(luò)控制器對(duì)一種驗(yàn)證信號(hào)跟蹤控制效果比較好,而對(duì)另一種驗(yàn)證信號(hào)效果很差的現(xiàn)象。為什么會(huì)產(chǎn)生這種現(xiàn)象呢?我們找到的原因是由于對(duì)網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)較多,訓(xùn)練次數(shù)也比較多,使得網(wǎng)絡(luò)產(chǎn)生了過(guò)學(xué)習(xí)的現(xiàn)象。網(wǎng)絡(luò)控制器對(duì)訓(xùn)練數(shù)據(jù)的跟蹤控制效果極好,從圖13中可以看到,網(wǎng)絡(luò)控制倒立擺的輸出與參考模型的輸出基本重合。而控制器的推廣控制效果卻并不令人滿意,當(dāng)參考信號(hào)的類型稍微變化一下,網(wǎng)絡(luò)控制器已經(jīng)不能給出跟蹤的控制效果了。圖16中的網(wǎng)絡(luò)控制器對(duì)訓(xùn)練數(shù)據(jù)的最終性能為0.00065左右,很小,這也給過(guò)學(xué)習(xí)現(xiàn)象了一點(diǎn)暗示。為了解決神經(jīng)網(wǎng)絡(luò)的過(guò)學(xué)習(xí),提高神經(jīng)網(wǎng)絡(luò)控制器的推廣控制能力,我們又進(jìn)行了實(shí)驗(yàn)3。實(shí)驗(yàn)步驟分別用A3,B3,C3表示。
4.2.3實(shí)驗(yàn)三
1)實(shí)驗(yàn)三的神經(jīng)網(wǎng)絡(luò)控制器的訓(xùn)練
本次實(shí)驗(yàn)用變化較慢的chirpsignal給參考模型產(chǎn)生訓(xùn)練控制器的數(shù)據(jù)。同時(shí)對(duì)每組數(shù)據(jù)的訓(xùn)練次數(shù)由10次降到8次。網(wǎng)絡(luò)控制器參數(shù)選擇如下:
從圖18中可以看到訓(xùn)練結(jié)束時(shí),控制器對(duì)訓(xùn)練數(shù)據(jù)的performance在0.005左右,對(duì)比圖16可見(jiàn)網(wǎng)絡(luò)控制器性能大大減弱,這從圖19中也可看到,對(duì)訓(xùn)練數(shù)據(jù)網(wǎng)絡(luò)控制倒立擺的輸出并不像圖13所示的實(shí)驗(yàn)二中跟蹤的那樣好。
2)神經(jīng)網(wǎng)絡(luò)控制器的驗(yàn)證
圖20中分別給出了用四種不同的驗(yàn)證信號(hào)驗(yàn)證神經(jīng)網(wǎng)絡(luò)控制器的結(jié)果,可以看到用神經(jīng)網(wǎng)絡(luò)控制的帶有狀態(tài)反饋的倒立擺能夠較好的跟蹤參考模型的信號(hào),而且具備一定的推廣能力。然而需要承認(rèn)用此種方法控制的倒立擺跟蹤參考模型的輸出時(shí),跟蹤誤差仍然較大,不像當(dāng)前的很多智能控制方法那樣控制精度很高。這是由于此種控制方法本身所決定的,由于它是一種離線學(xué)習(xí),在線應(yīng)用的方法,存在推廣誤差也是必然的。如果在訓(xùn)練控制器之前就對(duì)模型將要跟蹤的信號(hào)有所了解,專門(mén)針對(duì)此類信號(hào)訓(xùn)練網(wǎng)絡(luò)控制器對(duì)提高控制器的控制精度有較好的幫助。此外,由于這是離線學(xué)習(xí),在線應(yīng)用的方法,對(duì)于控制器的實(shí)現(xiàn)比較容易,將訓(xùn)練好的控制器固化在低成本的單片機(jī)內(nèi)就能實(shí)現(xiàn)控制作用。但是對(duì)分析系統(tǒng)的穩(wěn)定性,魯棒性卻無(wú)法進(jìn)行。
5結(jié)束語(yǔ)
本文首先利用狀態(tài)反饋穩(wěn)定了倒立擺系統(tǒng),再將穩(wěn)定的倒立擺系統(tǒng)看作一個(gè)整體進(jìn)行神經(jīng)網(wǎng)絡(luò)辨識(shí)和控制。在整個(gè)過(guò)程中,可以看出神經(jīng)網(wǎng)絡(luò)對(duì)倒立擺動(dòng)態(tài)系統(tǒng)的模型建立得比較準(zhǔn)確,但對(duì)控制而言,想要得到一個(gè)控制精度相對(duì)較高,推廣能力又比較好的控制器卻不太容易,這是由于該方法是一種離線調(diào)參,在線應(yīng)用的方法,在離線調(diào)整參數(shù)也屬于stateofart的形式,沒(méi)有固定的參數(shù)整定方法,只能靠不斷的仿真試驗(yàn)進(jìn)行。總的說(shuō)來(lái),此種方法簡(jiǎn)單易行,容易實(shí)現(xiàn),但是卻不能系統(tǒng)地分析穩(wěn)定性,魯棒性等系統(tǒng)的重要特性。
參考文獻(xiàn)
[1]劉麗,何華燦.倒立擺系統(tǒng)穩(wěn)定控制之研究[J].計(jì)算機(jī)科學(xué),2003,33(5):215-218.
[2]葛鎖良,陳學(xué)軍,邱丹.神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)控制及其在二級(jí)倒立擺中的仿真[J].自動(dòng)化技術(shù)與應(yīng)用,2005,24(6):4-6.
[3]徐麗娜.神經(jīng)網(wǎng)絡(luò)控制[M].北京:電子工業(yè)出版社,2003.
[4]郭釗俠,方建安,苗清影.倒立擺系統(tǒng)及其智能控制研究[J].東華大學(xué)學(xué)報(bào)(自然科學(xué)報(bào)),2003,29(2):122-126.
[5]聞新.MATLAB神經(jīng)網(wǎng)絡(luò)應(yīng)用設(shè)計(jì)[M].北京:科學(xué)出版社,2001.
[6]高巖,雍容.倒立擺控制實(shí)驗(yàn)系統(tǒng)的算法研究[J].實(shí)驗(yàn)技術(shù)與管理,2005,22(5):20-24.