張 進
(北京國電智深控制技術有限公司,北京 102211)
20世紀50年代以來,現代控制理論逐步發展,形成了許多有效的控制理論與方法,如最優控制、魯棒控制等。然而,尤其在工業領域,由于各種擾動和噪聲的存在,要對被控對象進行精確的建模十分困難,導致現代控制理論魯棒性差,難以用于實際。同時,即使能順利對被控對象進行較為精確的模型,建立的模型往往是極為復雜的高階強非線性時變系統,難以用于控制器的分析和設計,實際應用中成本過高。
考慮到實際系統和工業控制過程中時刻產生著豐富的輸入輸出數據,如何在被控對象模型未知的情況下基于過程數據設計控制律成為了控制理論界需要解決的問題,因此,研究數據驅動控制理論和方法有著重要的意義。1994年,由候忠生提出的無模型自適應控制(model free adaptive control,MFAC)即是一種典型的數據驅動控制方法。無模型自適應控制僅利用被控對象的輸入輸出數據進行控制器的設計和分析,實現了未知非線性被控對象的參數自適應控制,擺脫了控制器設計對被控對象數學模型的依賴[1]。
MFAC方法針對離散時間非線性系統使用了一種全新的動態線性化方法,引入偽偏導數(pseudo partial derivative,PPD),在閉環系統的每個動態工作點建立等價的線性化數據模型,基于此數據模型進行控制系統的的分析和設計;同時,PPD參數也根據被控對象的輸入輸出數據進行動態的更新。與傳統的自適應控制相比,MFAC僅依賴于實時過程數據,不需要對被控對象進行精確的建模,相比于傳統的最小二乘法對模型進行更新,對線性化模型的更新過程也較為簡單易行,計算量小。同時,MFAC方法計算量更小,也有著更好的魯棒性。
目前,MFAC方法已廣泛用于控制系統設計中,也有很多學者提出了MFAC的改進策略,如文獻[2]提出一種改進的緊格式無模型自適應控制方法,其自適應控制律包含兩項時變比例控制項和時變積分控制項,提升了控制器響應速度。文獻[3]基于遺傳算法,提出了一種參數整定方案,將多參數問題轉化為單參數問題,同時加速了初期計算。文獻[4]將MFAC與迭代學習控制相結合,進而考慮系統輸出數據經由均勻量化器進行量化處理的過程,并設計了一種編碼解碼量化機制,利用較少的輸入輸出數據,就可以實現跟蹤誤差的零收斂。文獻[5]提出一種雙閉環MFAC控制方案,并將其用于電站巡檢機器人控制中,取得了良好的效果。盡管如此,在實際工業現場應用中,MFAC也存在著一些缺陷,常規的MFAC方法只應用前幾個時刻的輸入和輸出建立線性化數據模型,而實際工業對象常常存在大遲延環節,因此線性化模型的輸入量大大增加,導致PPD的參數量增加,根據實時數據對PPD進行更新愈加困難,影響控制效果。對于工業現場常見的多入多出系統,針對這些問題,本文提出一種基于回聲狀態網絡(Echo State Network,ESN)預測的多入多出無模型自適應控制器,用ESN對系統輸出進行預測,消除系統遲延的影響,減少PPD參數,加快PPD收斂速度,減少控制器的運算量。以汽包爐機組協調控制系統為對象,證明了這種改進MFAC 方法的可行性與有效性。
本文第一章介紹背景,第二章介紹全格式動態線性化的多入多出無模型自適應控制的基本原理,第三章介紹ESN網絡預測方法,第四章將改進的的MFAC方法用于協調控制系統,第五章總結。
考慮如下MIMO非線性離散對象:

其中:u(k)∈Rm,y(k)∈Rm分別是k時刻的系統輸入和輸出;Ly,Lu是兩個未知的整數,代表系統的偽階數,假定系統為m輸入m輸出,f()是未知的非線性函數。
根據模型線性化方式的不同,MFAC可分為基于緊格式的動態線性化的MFAC(CFDL-MFAC)、基于偏格式的動態線性化的MFAC(PFDL-MFAC)和基于全格式的動態線性化的MFAC(FFDL-MFAC),其中,FFDL-MFAC在模型中考慮固定長度滑動窗口內的輸入和輸出變化量,使其更適用于復雜對象的控制器設計中,MIMO非線性系統(1)的FFDL數據模型可以表示為:

為系統的偽偏導數:

考慮如下控制輸入準則函數:

其中λ>0,是一個權重因子,用于調節控制量增量的大小。將式(2)代入準則函數(4)中,對u(k)求導,并令其等于零,可得:

其中,ρi∈(0,1],i=1,2...,Ly+Lu,為步長因子,用于提升控制算法的自由度,φ(k)為偽偏導數的估計值,由輸入輸出數據估計,其估計準則函數為:

其中μ>0為權重因子,極小化指標函數(6),可得偽偏導數的估計算法為:

結合控制律(5)和偏導數估計算法(7)即可得到MFAC控制方案。
由此可見,在控制過程中,被控對象的偽梯度可根據輸入輸出數據實時調整,因此盡管控制律的設計使用線性模型,對于非線性和時變系統MFAC也有著良好的控制效果。由推導過程可看出,當被控對象為線性定常系統且模型已知時,若取λ=0且Lu和Ly取值精確,FFDL-MFAC方法等效于傳統的自適應控制,但是FFDL-MFAC不用對系統進行復雜的建模過程。同時,通過引入步長因子,FFDL-MFAC方法有著更高的可調自由度以及設計靈活性。然而,由偽梯度的更新過程中可以看出,FFDL-MFAC方法需要在線調節一個m×(Lu+Ly)的向量,當被控對象存在大遲延時,偽梯度向量長度過長,增大了其估計難度,限制了MFAC的應用領域。
在實際工業現場中,時間遲延是廣泛存在的問題之一,遲延會嚴重影響控制器控制效果,甚至引起被控量發散;因此,解決遲延問題對控制效果有著重要的影響。針對遲延問題,已有很多學者提出了解決方案,如1958年提出的史密斯(Smith)預估控制,就是一種針對純滯后系統設計的控制策略,其基本思想是通過引入一個和被控對象并聯的補償器對純滯后進行削弱和消除。經過史密斯預估器的補償,純滯后環節被轉移到了閉環控制回路之外,因而不會對系統產生不利影響,只是將原輸出信號推移了遲延時間,不會改變輸出信號的波形和性能表現。然而,這種方式需要精確的被控對象數學模型,否則無法對遲延進行精確的補償,難以用于工業現場實踐。20世紀70年代興起的預測控制也是一種針對大遲延系統的控制方案,其基本思想是利用預測模型來預估過程未來的偏差值,以滾動優化的方式確定當前的最優輸入策略。預測控制雖然同樣需要對象模型,但是由于反饋校正機制的存在,預測控制有著更強的魯棒性。然而,預測控制的計算過程中需要進行復雜的尋優計算,對控制的實時性帶來了挑戰。近年來,隨著人工神經網絡的發展,由于其強大的擬合能力、自學習能力和一定的魯棒性,在控制理論中得到了廣泛的應用。為了解決以上問題,本文考慮用回聲狀態網絡(Echo State Network,ESN)對被控對象進行預測。ESN是一種新型的遞歸神經網絡,與一般的BP網絡不同,ESN是一種動態網絡,它利用前一時刻的狀態來計算下時刻狀態,有助于保持過去的信息更加持久。它的主要特點是利用隨機稀疏連接神經元組成的儲備池來代替傳統神經網絡中的隱層,唯一需要訓練的參數是輸出權值矩陣。因此,網絡的訓練過程大大簡化,ESN的結構如下:

其中u是輸入向量,x是儲備池的向量,y是輸出向量,W是儲備池權重矩陣,Win是輸入權重矩陣,Wb是輸出反饋權重矩陣,Wo是輸出權重矩陣,f()是儲備池激活函數,ESN的訓練過程包括3個步驟:
1)初始化:隨機初始化矩陣W,Win,Wb并確定儲備池的大小N、簡單地將x的初始狀態x(0)設置為零向量。
2)根據輸入數據,遞推地計算狀態向量x。
3)通過輸出數據和狀態向量由最小二乘法計算Wo:

采集被控對象的輸入輸出數據,以k+τ時刻的輸出為目標信號(τ為遲延),對網絡進行訓練,即可實現對被控對象輸出的預測。將訓練好的網絡與被控對象并聯,將網絡輸出當做實際輸出設計控制律,即可消除被控對象中遲延的影響。
為了驗證本文提出控制方法的有效性,將其應用到330MW汽包爐機組協調控制系統中,火電機組協調控制系統是將鍋爐、汽機及輔機作為一個整體加以控制的十分復雜的大遲延、多變量控制系統,其任務是接受并處理外部負荷指令,使機組能較快地適應負荷的增減,同時保持汽壓在允許范圍內變化,其數學模型可以表述為:
磨煤機與水冷壁動態:

鍋爐核心狀態空間模型:

汽輪機傳遞函數模型:

其中,主要的輸入變量為進入爐膛的燃料量和主汽門開度,主要的輸出變量為主蒸汽壓力和機組負荷。由模型可見,燃料量對主汽壓和負荷的影響是一個大遲延大慣性的過程,而主汽門對輸出的影響較快。為了機組快速響應AGC指令,目前常規的控制策略是用主汽門控制負荷,燃料量控制主汽壓力,根據主汽門開度對燃料量施加一定的前饋,使燃料量提前動作。DEB400控制策略便是最常用的一種機組協調控制策略[6],根據主汽壓力、汽包壓力和汽輪機一級壓力構造汽機能量需求信號,以汽機的能量需求作為鍋爐負荷指令,實現精準能量平衡。然而,這種控制方式本質上還是pid控制,難以從本質上解決大遲延、強耦合、非線性的問題。因此,考慮將本文控制方案用于協調控制系統中,由ESN對主汽壓進行預測,預測值進入控制律的計算,同時,以采集到的主汽壓數據通過增量式最小二乘法對網絡進行在線更新,提升控制器的魯棒性,其控制方案框圖如圖1所示。

圖1 控制系統方框圖
因此,首先需要采集模型數據,對主汽壓進行預測。從模型的5個主要工況點附近采集20000組數據,將其劃分為訓練集、驗證集和測試集,根據驗證集上的擬合效果調整網絡結構和參數,最終建立合理的ESN神經網絡,在部分測試集上的擬合效果如下:

圖2 ESN預測效果圖
建立了神經網絡預測模型后,便能將其用于控制率的設計中。分別在定壓和滑壓運行條件下對控制算法進行驗證,t1=500s時,機組定壓運行,負荷指令以0.1MW/s的速率由315MW下降至290MW,主汽壓力指令保持不變,為17.5MPa;t2=3000s時,機組滑壓運行,負荷指令以6MW/min的速率由290MW下降至265MW,主汽壓力指令緩慢下降至17.15MPa;控制量和被控量與DEB400方法的對比如下:

圖3 控制效果對比
由此可見,相比于DEB400直接能量平衡控制,本文控制方法有著明顯的優勢。如圖4所示,由于負荷對主氣閥門響應較快,因此改進MFAC方案與DEB400方法對負荷指令均有著較好的跟蹤效果,動態性能接近。在主汽壓控制方面,兩種方式控制方式有著較為明顯的差距。在滑壓運行時,由于對主汽壓進行了精確的預測,所以改進MFAC方法超調量大大減小,其波動幅度也有相應減小。因此,無論是定壓運行還是滑壓運行,改進MFAC方法都有著良好的控制性能,在保證負荷指令跟蹤速度的同時也盡可能降低了主汽壓的擾動。

圖4 控制量對比
為了解決工業現場中常見的大遲延問題,本文基于多變量MFAC控制方案,并用ESN神經網絡對被控對象輸出進 行預估。這種方法無需復雜的建模過程,大大減小了計算量,簡單易行。為驗證方案有效性,對330MW汽包爐機組進行了仿真試驗并與傳統的DEB400控制方案進行對比,實驗證明,本文控制方法具有良好的控制品質,減小了主汽壓的波動,提升了機組協調控制系統的性能,有助于保證機組安全靈活運行。