王思君
(云南省煤礦安全技術培訓中心,云南昆明 650205)
磁懸浮以不接觸方式實現對象物體在目標位置的懸浮控制。因為沒有機械接觸,所以具有功耗低、污染小的優勢。該技術在交通運輸、航空航天以及工業生產中有可觀的應用前景[1-2]。電磁場的分布特征使得對象系統具有明顯的非線性和建模不確定性[3-4]。因此,懸浮控制策略的適應性改進是一個值得長期研究的問題。
從既有結論可見,PID方案控制結構簡單,易于實現,但控制精度不高,對環境適應性差,于是相應改進方案成為關注方向。比如,以神經網絡逼近、模糊控制等智能化方法得到控制律,可減小模型不確定性的影響[5];采用LQ優化測算控制參數,可降低控制參數選擇對調試經驗的依賴程度[6]。將智能優化算法與反饋控制相結合,采用分數階控制可改進控制精度[7]。系統運行時的干擾因素是無法準確測量的,這里考慮如何在確保系統穩定性和魯棒性的同時,提高系統的控制精度和自適應能力。
針對擾動不確定時的控制參數不容易整定問題,基于神經網絡監督,采用前饋加反饋的監督控制方法確保系統具有良好的性能,提出基于RBF網絡監督的神經網絡監督控制(NNSC)。監督網絡通過權值學習整定成為主控方式,而當系統出現干擾時,傳統反饋控制器重新起作用,確保系統的穩定性和魯棒性。以固高GML1001試驗裝置參數為基礎數據,通過Matlab仿真驗證并分析了所得方案的性能。
單自由度磁懸浮試驗裝置的基本原理如圖1所示。通過電磁線圈輸入電流的調節來控制磁場引力F(i,x),當懸浮小球受到向上的電磁引力與其所受重力達到平衡時,小球便能懸浮在目標位置。從系統輸入(輸入電流i)到系統輸出(懸浮距離x)之間的數學關系可以通過小球的力學分析和線圈的電磁分析得到。

圖1 懸浮裝置原理分析
在圖1所示系統中,忽略小球受到的不確定干擾力,則被控對象小球在此系統中只受電磁引力和自身重力的影響,其在豎直方向的動力學方程為:
式中:x為小球質心與電磁鐵磁極之間的氣隙(以磁極面為零點);m為小球的質量;g為重力加速度,g=9.8 m/s2。
假設電磁鐵未工作在磁飽和狀態下,且每匝線圈中通過的磁通量都是相同的,則瞬時繞組線圈電感為:
式中:μ0為空氣磁導率,μ0=4π×10-7;S為電磁鐵橫截面積;N為線圈繞組匝數。
那么,磁場的能量為:
定義K=μ0SN2/2,則小球受到的電磁引力為:
可知,電磁引力與氣隙是非線性的反比關系,這也是磁懸浮系統不穩定的根源所在。
當小球處于平衡狀態(i0,x0)時,它所受合力為零,即:
在平衡位置對式(4)進行線性化處理,略去高階項后,可得電磁鐵繞組中的瞬時電流i、氣隙x之間的關系模型為:
下面設計控制方案,實現調節控制電流使小球穩定懸浮在平衡位置的目的。
以式(6)為受控系統的基礎模型,進行磁懸浮控制律的設計。
利用系統線性化模型,可以通過時域設計方式得到PD控制律[8]。記串聯PD控制器的傳遞函數為:
通過穩定性判據,可知保持磁懸浮系統穩定須有:Kp<-0.113 3,Kd<0。
再考慮系統過渡過程性能,即超調量和調節時間要求,以欠阻尼閉環穩定為設計目標,通過模型匹配方法,可得到控制參數:Kp=-20,Kd=-0.072 8。
磁懸浮系統網絡監督控制結構如圖2所示。圖中所示的控制環節由兩部分組成:傳統PD控制和基于RBF網絡的監督控制。系統啟動初始以PD控制實現閉環運行。同時,前饋RBF神經網絡控制器以PD控制器的輸出信息進行網絡權值的學習,通過迭代調整逐步減弱反饋控制輸入,實現RBF網絡控制器從訓練到主控的轉變。事實上,此處RBF網絡的本質是模擬了被控對象的逆模型[9]。但是,當外部干擾信號d顯著變化時,反饋控制器會再次起主導作用。
圖3為前饋RBF網絡的內部結構。由于圖2所示結構中的網絡輸入是一維的,所以,在圖3中僅有一個輸入。RBF網絡只需要調節網絡權向量W=[w1,…,wm]T,因而具有算法簡單、運行快的優點。

圖3 RBF神經網絡結構
網絡輸入為系統輸入r(k),網絡的徑向基向量為H=[h1,…,hm]T,其中hj為高斯基函數,即:
式中:Cj為網絡第j個節點的中心向量,Cj=[c11,…,c1m]T;bj為節點j的基寬參數,bj>0,j=1,…,m;并記B=[b1,…,bm]T為高斯函數的基寬參數。
則RBF網絡的輸出為:
式中:m為RBF網絡隱層神經元的個數。
此時,所得控制律為:
式中:upd(k)和un(k)分別為PD控制器和RBF網絡控制的輸出分量(圖2)。
根據神經網絡監督控制原理,要想使得神經網絡控制器占主導地位,設網絡調整的性能指標為:
為實現神經網絡權值的優化,進一步嘗試采用搜索效率高、容易得到全局最優解的布谷鳥算法完成式(9)中網絡權值的調整。
選擇目標函數為:
記網絡權值W=[w1,…,wm]T為巢穴位置,以式(12)為適應值,布谷鳥算法以迭代方式搜索最優巢穴,即為最優解。下面對最優解(巢穴)的搜索算法進行說明。
Step1,初始化。對巢穴位置初始化并作為最優位置向量,記g0=[W1(0),W2(0),…,Wn(0)]T。
Step2,位置更新。保留上一代最優巢穴位置分量Wb(k-1),進行全局隨機探索游走,其搜索公式為:
這里,α為網絡權值學習率,隨機萊維飛行服從的分布為Levy~u=t-1-β,(0<β≤2)。
得到新巢穴的位置后,對其測試,并與上一代的巢穴gk-1=[W1(k-1),W2(k-1),…,Wn(k-1)]T進行對比,用適應值較好的巢穴位置替換較差的巢穴位置,從而得到較優的新的巢穴位置gk=[W1(k),W2(k),…,Wn(k)]T。
Step3,新解評估。用隨機數r表示宿主鳥發現外來者的概率,并與預設概率pa比較,若r>pa,則隨機重置Wp(k+1),反之保持,最后保留測試值較好的一組巢穴位置Wp(k+1)。測試這組巢穴,用較好的巢穴位置替代較差的巢穴位置,得到一組新的巢穴位置:gk=[W1(k),W2(k),…,Wn(k)]T。
Step4,迭代優化。找出最后得到的gk中最優的一個巢穴位置Wb(k)和最優值fmin。若達到預定的迭代次數或精度要求,則輸出全局最優值fmin和對應的全局最優位置Wb(k)。反之,返回Step2繼續迭代更新。
在Matlab/Simulink軟件環境下對所得系統的性能進行仿真分析,檢驗所得懸浮控制系統的有效性。系統分析重點為兩個目標:
1)懸浮小球實現對目標位置的穩定快速跟蹤;
2)在干擾存在時,系統具有一定的魯棒性和自適應能力。
并通過比較分析反饋PD控制和網絡監督控制的作用。
以固高GML1001磁懸浮試驗裝置參數構建對象仿真模型,其主要參數由表1給出。

表1 懸浮系統主要參數列表
結合第1部分的模型分析,可得被控對象為:
取采樣時間為1 ms,采用z變換進行離散化,經過變換后的離散化對象為:
設定目標信號為在平衡點上下浮動5 mm的位置,指令信號為幅值為0.005的方波信號。網絡隱層神經元個數取為4,網絡結構為1-4-1,網絡的初始權值取0~1的隨機值,高斯函數的參數值取Cj=[-2 -1 1 2]T,B=[0.5 0.5 0.5 0.5]T。采用控制律(10)和權值調整算法(13),網絡權值學習率為α=0.05,預設概率pa=0.25。對所得系統進行仿真分析。權值搜索迭代設定為300,布谷鳥算法的迭代過程如圖4所示。

圖4 布谷鳥算法迭代過程
對目標方波信號進行跟蹤,模擬隨機干擾信號的影響,在控制分量中加入相當于控制信號強度10%的隨機干擾,圖5給出了系統的仿真輸出。從圖中可見,實線表示的小球懸浮位置準確跟蹤了虛線表示的目標信號。在0.4 s對懸浮小球施加脈沖干擾(觸碰),控制律能夠很快消除不確定干擾所造成的影響。

圖5 隨機干擾性的位置跟蹤
圖6 給出的是系統運行0.5 s時間內的控制律,同時給出反饋控制分量和前饋網絡控制分量。從圖中可以看出,當系統穩定運行時,前饋網絡控制分量起主要作用,而當目標信號發生變化或者出現干擾時,反饋控制分量重新恢復作用,以此保證系統的穩定性及自適應能力。這正是網絡監督控制的優勢。

圖6 隨機干擾下的控制律
進一步分析神經網絡監督控制(NNSC)相對于PD反饋控制的優勢。僅在0.1—0.2 s施加上述干擾,并在0.4 s模擬外部觸碰脈沖。分別獨立采用兩種控制方案進行仿真,所得控制結果如圖7所示。
從圖中可見,僅用反饋控制時,系統對干擾信號仍具有較好的魯棒性,能夠克服其影響而保持穩定運行;但系統目標跟蹤準確性受到影響,存在穩態誤差。實線表示的網絡監督控制方案NNSC則不存在穩態誤差,僅僅在干擾影響下產生小幅波動。
表2比較了圖7中兩個輸出信號的典型性能指標,可見增加了前饋監督的NNSC控制方案在過渡過程穩定性和跟蹤精度方面都優于PD反饋控制。

表2 控制性能比較列表
圖8對控制律分量進行了比較分析,PD控制量在0.25 s跟蹤信號變化時短暫切換為主要控制信號。需要說明的是,PD控制量相對于網絡控制量具有更好的快速性,其原因在于RBF網絡權值的調整是基于反饋控制進行的。也就是說,NNSC控制的網絡監督作用需要通過對系統前饋控制器的學習才能逐步成為主導,是網絡的自學習過程。

圖8 圖7對應的控制律
磁懸浮技術在一些領域已經具有了一定試驗性應用基礎。目前,以提高系統控制精度、改良其容錯性為目標的控制方案的研究成為值得長期關注的問題。結合試驗數據,總結如下:
1)針對不確定干擾影響下的磁懸浮位置控制問題,提出基于前饋網絡監督的NNSC控制方案,仿真結果驗證了所得方案的有效性。以22 g小球為控制對象,0.04 s內實現了5 mm的位移控制,且對不確定干擾具有一定魯棒性。
2)監督網需要對原有反饋控制器進行學習,以完成其網絡權值的調整,這使得網絡監督控制完全起主導作用需要一個過渡過程。
3)在擬合復雜非線性控制信號的問題中,神經網絡的大規模并行計算、冗余性、自學習以及自適應能力可為控制理論帶來生機。