蘇嶺東,趙 成,馬祥林
(1.國網徐州供電公司,江蘇 徐州 221000;2.杭州邦友安派智能科技有限公司,浙江 杭州 310012;3.常州致科自動化科技有限公司,江蘇 常州 213001)
在實際工業生產過程中,控制對象往往具有非線性、時變不確定性以及控制過程中各種非線性非高斯噪聲的干擾,難以建立精確的數學模型,參數自整定方法繁雜,因此常規的PID 控制器往往難以達到良好的控制效果[1-2]。近年來,在工業控制領域也出現了神經網絡PID 控制,大大提升了PID 控制器的性能。文獻[3]提出了神經網絡PID 控制的智能算法。文獻[4-5]討論了RBF 網絡在PID 參數整定中的應用,取得了一定效果。但是在實際生產過程中存在大量噪聲,由于噪聲的干擾使得目標信噪比很低,在噪聲的干擾下,會導致Jacobian 值出現波動,RBF 學習過程出現偏差,系統魯棒性下降。
此外,在實際設定值跟蹤系統中,控制對象具有非線性,噪聲具有非高斯、非線性特點。常用的擴展卡爾曼濾波要求噪聲獨立或相關的高斯噪聲,無法適用于非線性、非高斯環境。
近年來,粒子濾波算法(Particle Filter,PF)在非高斯、非線性系統中得到了廣泛應用。PF 粒子濾波算法是基于Monte.Carlo 思想發展而來的一種濾波方法,擺脫了擴展卡爾曼濾波時隨機量必須滿足高斯分布的制約條件[6-10],為解決非線性、非高斯干擾問題提供了新的思路,并廣泛應用于工業控制系統[11-12]。文獻[13]在假設模型已知情況下提出了一種基于粒子濾波的復合控制系統,取得了較好的效果。
針對以上問題,本文提出了一種基于粒子濾波和RBF 辨識(PF-RBF)的單神經元PID 控制系統。利用RBF 神經網絡對非線性函數的高精度逼近以及自學習的快速性,將PF 和RBF 神經網絡結合,對被控對象過程實時建模,為系統提供精確的 信息(即控制對象輸出對控制輸入的靈敏度信息),取代常規的近似算法,在保留PID 控制魯棒性高和可靠性好等特點的同時,提高控制系統的動態響應性能和抗干擾能力。
粒子濾波(PF)算法是在序貫重要性采樣基礎上發展起來的一種非線性、非高斯濾波方法,其基本思想是:通過尋找一組在狀態空間中傳播的隨機樣本對概率密度函數p(xk|zk)進行近似,以樣本均值代替積分運算,從而獲得狀態最小方差估計,而這些樣本即稱為“粒子”。采用數學語言描述如下:對于平穩的隨機過程,假定k-1 時刻系統的后驗概率密度為p(xk-1|zk-1),依據一定原則選取n個隨機樣本點,k時刻獲得測量信息后,經過狀態和時間更新,n個粒子的后驗概率密度可近似為p(xk|zk)[14-16]。隨著粒子濾波數目的增加,粒子的概率密度函數逐漸逼近狀態的概率密度函數,粒子濾波估計即達到了最優貝葉斯估計的效果。
具體實現可按如下步驟進行[17-18]:
步驟1:初始化,設k=0 時,i=1,2,…,N;從p(xk|xk-1,yk)中隨機抽取n個樣本;
步驟2:逐點計算對應的p(xk|yk-1)和p(xk|yk);
譯文:…Lusang King kowtowed and died in a sitting posture…

步驟6:k→k+1,返回步驟3。
通常情況下,系統的Jacobian 信息由常規方法構造,即,或用符號函數替代計算,然而在近似計算Jacobian 信息的過程中,難免會降低自整定的精度和抗干擾能力。
為了保證Jacobian 信息的精度,利用PF 和RBF 神經網絡具有結構簡單,訓練過程快速易行的特點,對被控對象過程實時辨識,為系統提供精確的Jacobian 信息。相比傳統的辨識方法,PF 和RBF 神經網絡對時變非線性自校正模型不僅結構簡單,而且具有更高的精度和自適應能力。如圖1所示,由于在系統辨識的過程中存在非線性、非高斯噪聲,利用PF 對系統輸出yout進行濾波,用e2=ye-ym作為目標函數訓練RBF 神經網絡,來保證辨識的精度,進而提高Jacobian 值精度和抗干擾能力。

圖1 基于PF&RBF 的PID 參數自整定結構圖
PF 和RBF 系統辨識算法如下[1-3,5,8]:
在系統辨識結構中,X=[x1,x2,…,xn]T為網絡的輸入向量。設RBF 網絡的徑向基H=[h1,h2,…,hj,…,hm]T,其中徑向基hj選擇高斯基函數:

網絡的第j個節點的中心矢量為:

設網絡的基寬向量為:

式中,b1為節點j的基寬度參數,且為大于零的數。網絡的權重為:

系統辨識器的性能指標函數設計為:


辨識網絡的輸出為:

式中,η為學習速率,α為動量因子,yout為系統輸出,ym為系統辨識輸出,ye為粒子濾波輸出,根據前文的算法步驟計算得出。
關鍵的Jacobian 信息可由如下算法得到:

式中,x1=u(k)。
人工神經網絡PID(Artificial Neural Network PID,ANNPID)控制器通過學習算法進行權系數調整,實現自適應、自組織功能,具有結構簡單,反應快,信號變化適應性好,魯棒性強等特點。典型的神經網絡學習算法包括有監督的Hebb 算法、無監督的Hebb 算法、有監督的Delta 算法等,其中Delta 算法速度快、精度高,故本文選用Delta 算法,基本算法如下[13]:

圖2 表明RBF 神經網絡在學習階段出現了偏差,隨后能夠較好地跟蹤PF 濾波輸出,表明系統辨識效果良好,反應速度快,辨識時間約為0.006 s。

圖2 有PF 濾波時系統的階躍響應
圖3 表明在遇到非高斯噪聲時,PF 和RBF 神經網絡辨識輸出波動幅度小,魯棒性強,能夠較好地跟蹤目標輸入,保證了系統辨識的精度。
圖4 顯示了Jacobian 值在噪聲干擾下有濾波和無濾波情況下的數據,可以看出,在無濾波情況下噪聲干擾使得Jacobian 值出現了波動,產生了誤差,無濾波時Jacobian 信息為-0.020 5,有PF 濾波時Jacobian 信息為-0.0 101,雖然穩定后相差不大,但這將對系統的動態性能產生不利的影響。并且在系統響應曲線第一次達到期望值和有噪聲干擾時,無PF 濾波時Jacobian 值會出現嚴重的跳躍,造成網絡參數需要多次訓練來重新調整,使響應曲線出現較大超調。而有PF 濾波時Jacobian 值波動明顯減小,系統輸出曲線平穩上升,超調量較小。

圖3 有噪聲干擾時的系統輸出響應

圖4 神經網絡辨識輸出的Jacobian 值
圖5 表明系統在有PF 時和無PF 時動態性能的比較,可以看出系統的控制性能得到了提高,具體動態性能指標如表1 所示。由此可見,基于PF 和RBF 辨識的PID 控制可以明顯減小2 階系統的調節時間和超調量,并且可以預見粒子數越多,系統響應的動態特性會越好。最后PID 參數自整定的結果分別為80.011 1、50.007 6、6.578 2。

圖5 單位階躍輸入時2 階系統輸出響應

表1 單位階躍輸入時二階系統動態性能指標
圖6 表明3 階加純延時控制系統在有粒子濾波時的抗干擾能力和超調量比無粒子濾波時系統響應有顯著提高。但PF 作為一種采樣貝葉斯算法,一方面,隨著粒子數的增加,更加趨近狀態的真實后驗概率密度,使得系統抗干擾能力提高,對抑制非線性非高斯干擾時具有明顯優勢。另一方面,隨著系統階數和粒子數的增加,算法計算量隨之增大,使得系統上升時間明顯變大,系統響應速度變慢。

圖6 單位階躍輸入時3 階系統輸出響應
長期以來,工業過程控制中對不精確模型和非線性非高斯干擾較難控制,本文采用PF 和RBF 神經網絡辨識的方法消除非線性、非高斯噪聲對控制系統的影響,提高了神經網絡辨識的精度,從而輸出精確的Jacobian 信息。仿真實例表明,相對于無PF 濾波的RBF 辨識的控制系統,本文提出的方法能改善控制系統的性能指標和抗干擾能力。但PF屬于一種數值仿真技術,采用大量粒子模擬概率分布,故計算量大,如何提高系統實時性和計算效率有待近一步改進。