孫 劍 蒙 西 喬俊飛
隨著人口增長、快速城市化和全球化,全球每年約產生20 億噸城市固體廢棄物(Municipal solid waste,MSW),預計到2030 年,將達到25.9 億噸,城市固體廢棄物處理問題日益突出[1].目前,對于不能直接資源回收的MSW,一般采用衛生填埋、堆肥和焚燒等方式進行處理.相比其他處理方法,城市固體廢棄物焚燒 (Municipal solid waste incineration,MSWI)技術具有無害化、減容化和資源化的優點,代表了MSW 處理技術的發展趨勢.截至2019 年底,中國已建有MSWI 處理廠389 座,年無害化處理固體廢棄物12 174.2 萬噸[2].然而,MSW成分復雜且隨季節天氣變化,其熱值的穩定性難以保證.因此,高效、穩定的焚燒控制技術一直是MSWI 過程控制的研究重點.
煙氣含氧量是焚燒爐運行過程中的重要工藝參數之一,與實際焚燒過程關系密切.若煙氣含氧量不足,則說明爐內焚燒不充分,不完全焚燒熱損失就會增加,飛灰含碳量也會增大;若煙氣含氧量過高,則排煙損失就會增加,不僅帶走大量的熱量,還會增加排煙耗電量,焚燒效率也會降低.此外,煙氣含氧量不足還會使爐膛中產生還原性氣體,在這種氣氛中,灰中熔點較高的三氧化二鐵 (Fe2O3)和一氧化碳(CO)等還原性氣體反應生成熔點較低的氧化鐵(FeO),易造成爐膛結焦,影響生產安全[3].
在傳統工業燃燒過程控制中,一般通過專家經驗調節給風量和給料量,進而控制煙氣含氧量.但是,由于操作員的經驗、專長與水平不同,以及控制過程中經常出現的異常情況,煙氣含氧量的精準控制一直是燃燒過程控制的難題之一.比例-積分-微分(Proportion-integration-differentiation,PID)控制器因具有操作簡單、運行可靠和調節方便等優點,已在工業過程控制中得到廣泛應用[4-6].雖然PID 控制方法原理簡單,工程實現容易,但很容易產生超調或振蕩,且難以勝任多輸入/多輸出(Multi-input and multi-output,MIMO)復雜系統的優化控制任務.隨著智能控制技術的發展應用[7-9],自抗擾控制[10]、線性二次調節控制[11]、神經網絡控制[12]等方法也已成功應用于各種燃燒過程的煙氣含氧量控制.其中,模型預測控制(Model predictive control,MPC)是一種基于特定范圍內目標函數優化的先進控制策略[13-15],能夠處理有約束、多變量、多目標的控制問題,在普通燃煤鍋爐、焦炭爐和流化床等燃燒過程煙氣含氧量控制中已獲得一些應用.例如,文獻[3]建立基于最小二乘支持向量機的鍋爐煙氣含氧量預測模型,并在此基礎上結合粒子群算法求解預測控制中的非線性優化問題,實現鍋爐煙氣含氧量控制.文獻[16]提出一種基于混合數據驅動建模和預測函數控制策略的工業焦爐氧量調節方法.文獻[17]采用數據驅動的模糊C 均值(Fuzzy C-means,FCM)聚類和子空間辨識方法對模型參數進行識別,將模型預測控制與模糊多模型相結合以控制煙氣含氧量.
上述研究方法主要集中于解決MPC 應用中存在的兩個關鍵問題,即非線性系統的預測模型建模和MPC 的非線性優化問題求解.然而,在實際工業過程中,由于設備老化、結焦污垢和外部干擾等變化,過程模型往往也會隨時間發生變化,使用離線訓練的機器學習模型在干擾出現后可能無法正確預測系統未來動態,最終影響模型預測控制性能[18-19].近年來,使用過程數據在線更新預測模型是處理MPC 模型失配的一種可行方案.文獻[20]提出一種基于在線支持向量回歸的非線性模型預測控制方法,利用在線支持向量回歸的在線學習能力,實現模型在線自校正.文獻[21]針對具有外部擾動和參數不確定性的非線性系統,通過多層感知機的在線訓練,提出一種基于多層感知機的非線性自適應模型預測控制方法.文獻[22]利用在線更新遞歸神經網絡模型的方法,捕獲過程模型存在的不確定性,并建立基于遞歸神經網絡的預測控制方案.
針對MSWI 過程煙氣含氧量難以有效控制的問題,本文提出一種數據驅動的煙氣含氧量自適應預測控制方法.該方法采用自適應FCM 算法確定徑向基函數(Radial basis function,RBF)神經網絡隱含層神經元個數及初始中心,輔助建立準確的RBF 神經網絡預測模型,并且在實時控制過程中,根據預測誤差自適應調節模型參數.另外,借助梯度下降算法在滾動優化周期內優化控制目標函數,在線求解控制律,并基于李雅普諾夫穩定性理論分析控制系統的穩定性.最后,通過MSWI 廠實際數據,驗證了本文方法在煙氣含氧量預測建模和控制方面的可行性.
MSWI 過程是通過熱分解、燃燒、熔融等過程,使MSW 中的碳、氫、硫等元素與氧發生化學反應,達到無害化處理、資源化利用和快速縮減體積的目的.早期的固體廢棄物焚燒爐設計和運行主要借鑒了比較成熟的燃煤技術.目前,機械爐排焚燒爐技術在中國新建的MSWI 廠中占據主流,大多數焚燒處理廠使用的機械爐排技術主要從德國、丹麥、瑞士和比利時等發達國家引進[23].本文以北京某MSWI廠使用的日本田熊公司生產的SN 型階梯式(傾斜+水平)順推爐排焚燒爐為例,介紹MSWI 過程,具體工藝流程如圖1 所示.

圖1 MSWI 爐排爐工藝流程Fig.1 MSWI process with grate furnace
MSW 由收集車從收集點或轉運站裝車后被運送至固廢焚燒廠,并被傾倒在一個大型的固廢池中.經過5 至7 天的充分發酵,滲濾液慢慢流入滲濾液儲存池.通過自然壓縮、發酵作用和混合操作,可以降低MSW 含水量,提高入爐MSW 熱值,獲得較為均質的燃燒物,從而改善固廢焚燒效果.固廢池上方的抓斗混合MSW 后投入料斗.在進料器溜槽的底部,MSW 被推送至液壓驅動爐排,依次通過爐排的干燥爐排、燃燒爐排1、燃燒爐排2 和燃燼爐排進行焚燒.焚燒階段的助燃空氣取自固廢池,在滿足MSWI 所需空氣的同時,也有效防止了臭氣外溢.助燃空氣主要分為一次風(從爐排下方送入)和二次風(從爐排上方送入).一次風透過爐排上的氣孔吹送燃燒所需的大部分氧氣,二次風通過爐排上方壁的氣孔加入到燃燒過程中,其主要作用是輔助爐排上方的高溫煙氣進行二次燃燒.當焚燒溫度達到850 ℃~950 ℃時,有毒有害物質將得到充分分解.同時,為達到脫除氮氧化物的目的,采用選擇性非催化還原(Selective non-catalytic reduction,SNCR)工藝,向焚燒爐內噴入尿素溶液.然后,在余熱鍋爐中對高溫氣體進行熱利用,水被加熱成蒸汽用于驅動汽輪發電機產生電力.煙氣產物主要由氮氧化物、二噁英、碳氧化物、水、氧氣、非焚燒殘留物和其他酸性氣體(如二氧化硫(SO2)、氯化氫(HCL))組成[24].為防止二次污染,需要采用消石灰脫酸、活性炭吸附重金屬和有毒有害氣體,再經過煙氣凈化系統的除塵操作后,凈化后的煙氣在引風機的作用下,經煙囪排出[25].
由上述焚燒過程分析可知,MSWI 過程是非線性且時變的復雜動態過程,內部發生著多種物理和化學反應,傳熱傳質和多相流體流動,同時伴有高溫、高壓、多相耦合和多物理場共存相互作用,傳統的機理建模方法很難建立準確的數學模型.而且,機理模型通常要求具有足夠多能夠反映工況變化的過程參數,這在很大程度上依賴于科研和工程開發人員對實際工業過程物理和化學反應過程的認識,并需要在苛刻的假設條件下才能成立,例如假定模型是一維模型、助燃劑是空氣且由氧氣和氮氣組成、忽略揮發分析出時引起的熱量變化等.因此,機理模型的精度難以得到保證,也無法滿足MSWI 過程煙氣含氧量控制的實際需求.針對MSWI 過程煙氣含氧量控制問題,可以采用數據驅動方式建立MSWI 過程非線性系統模型,并在此基礎上驗證本文提出的自適應預測控制方法的有效性.
煙氣含氧量控制是MSWI 過程控制的重要一環,其穩定控制與否直接影響焚燒效率、處理成本和有毒有害污染物排放等方面.根據MSWI 過程現場控制經驗,煙氣含氧量一般應控制在4%~8%較為理想.目前,在中國MSWI 實際過程中,普遍采用的是人工控制和PID 控制.然而,MSWI 過程非線性和時變性的特點使得傳統的控制方法難以實現精準的跟蹤控制.因此,為了提高煙氣含氧量的控制性能,需要研究以預測控制為代表的先進控制技術.
MPC 的控制性能很大程度上依賴于預測模型的精度,當實際系統參數發生變化時,會存在標稱模型與實際系統失配的問題,此時如果仍采用標稱模型的預測控制器,會導致系統控制性能變差甚至不穩定[26].為解決這個問題,本文提出基于數據驅動的自適應MPC 方法,通過實際預測誤差實時在線調整預測模型的參數,使其與被控對象的動態變化保持一致.基于FCM-RBF 模型的煙氣含氧量自適應預測控制(FCM-RBF neural network based MPC,FCM-RBF-MPC)策略如圖2 所示,主要包括參考軌跡、基于梯度下降方法的滾動優化、基于FCM-RBF 網絡的煙氣含氧量預測模型和反饋校正等部分.

圖2 煙氣含氧量自適應FCM-RBF-MPC 策略Fig.2 Adaptive FCM-RBF-MPC strategy of oxygen content in flue gas
假設現在和未來控制時域內的控制動作集合為Δu(t),Δu(t+1),···,Δu(t+Hu),則通過預測模型可以預測未來時域Hp內的系統輸出一般要求控制時域Hu小于預測時域Hp.通過設計模型預測控制器,將煙氣含氧量的參考值跟蹤問題轉化為最小化目標函數式(1)的優化問題.本文采用在線梯度下降方法求解該優化問題:
1)參考軌跡.為了把當前輸出y(t)平滑地引導到設定值ysp(t),采用一階平滑濾波形式將參考軌跡設置如下:
式中,ar是調整因子,0<ar<1.
2)反饋校正.由于容易受到系統干擾或模型失配等因素影響,預測模型輸出yp(t)與實際輸出y(t)之間會存在偏差.為了縮小這種偏差,一般利用被控對象實際輸出與預測模型輸出的偏差進行反饋補償[27].MPC 通過滾動優化目標函數的方式確定一系列未來的控制動作后,它們并不會都逐一實施,而只執行當前控制輸入.此外,通過比較當前時刻的實際輸出與預測模型輸出,得到兩者的偏差,并用于校正模型下一時刻的預測值,從而使得預測結果更為準確.具體校正公式如下:
預測模型是模型預測控制算法的基礎,因此需要首先建立煙氣含氧量的預測模型.預測模型的作用是根據設定的輸入以及歷史信息來預測被控對象未來的輸出.在建立非線性動態預測模型時,系統可以表示為以下形式的非線性自回歸外生模型:
式中,u(t)和y(t)表示過程的輸入和輸出,f[·] 是MSWI 過程煙氣含氧量的預測模型,ny和nu是輸出和輸入的最大滯后.在忽略噪聲作用情況下,對于式(5)所表示的系統,當獲得過去的輸入/輸出信息后,系統的輸出估計yp(t)可以借助已建立的神經網絡預測模型得到.因此,為得到準確的輸出估計,需要建立能夠反映系統動態的預測模型.
RBF 網絡是由輸入層、隱含層和輸出層構成的前向網絡,因其簡單直觀的結構和優良的逼近能力,RBF 網絡一直是神經網絡領域研究的熱點[28].輸入層節點個數等于輸入向量的維數,輸出層節點個數等于輸出向量的維數,隱含層神經元個數根據需要確定.單輸出結構的RBF 網絡如圖3 所示.隱含層節點的激活函數采用較為常見的高斯函數:

圖3 RBF 神經網絡結構圖Fig.3 RBF neural network framework
網絡輸出為:
式中,x=(x1,x2,···,xm)T為l維輸入變量,hc代表隱含層神經元個數,yp表示輸入為x時網絡的輸出,ωj為隱含層第j個神經元到輸出層的權值,cj和δj分別是第j個神經元的中心向量和寬度.采用梯度下降法對網絡參數進行調整.
對于第t個樣本,網絡實際輸出和期望輸出之間的誤差e(t)定義為:
式中,y為實際值,N為樣本個數.隱含層第j個神經元的中心cj、寬度δj和輸出權值ωj更新公式如下:
式中,η1為學習率,具體梯度公式如下:
在RBF 神經網絡建模過程中,隱含層神經元個數、中心、寬度和網絡權值等參數初始值通常使用人工試錯驗證的方法來確定,所選參數初始值直接影響RBF 神經網絡建模效果,其中RBF 隱含層神經元個數和初始中心對建模效果影響較大.FCM算法是一種基于劃分的聚類算法,基本思想是使被劃分到同一類的對象之間的相似度最大,而不同類之間的相似度最小[29],但是需要人為給定初始聚類數目.因此,利用自適應FCM 聚類算法迭代計算出訓練樣本的聚類數目和聚類中心,作為RBF 神經網絡的隱含層神經元個數和初始中心.
假設P={p1,p2,···,pn}是一個有限數據集,其中,pg=(pg1,pg2,···,pgl)是第g個一維對象,B={b1,b2,···,bb}表示b個聚類,V={v1,v2,···,vb}表示b個l維聚類質心,U=(uig)(b×n)是模糊劃分矩陣,uig是第g個對象在第i個聚類中的隸屬度,其中:
目標函數是每個聚類中樣本到聚類質心的加權距離平方和,即:
式中,dig=‖pg-vi‖表示第g個對象和第i個聚類質心之間的歐氏距離.m(m>1)是模糊指數,控制著類群之間模糊重疊的數量,值越大,表示重疊的程度越大.
根據聚類準則,適當地模糊劃分矩陣U和聚類質心V,可以通過最小化目標函數JFCM獲得,基于拉格朗日乘子方法,U和V分別由下式計算:
為了使類間距離應盡可能大,類內距離應盡可能小,采用如下有效性函數衡量聚類效果,自適應確定模糊聚類數目[30]:
上述有效性函數LFCM(b)表示類間距離之和與類內距離之和的比值,所以,LFCM(b)越大,表示聚類結果越可靠.當LFCM(b)達到最大值時,聚類數目b為最佳聚類數目.其中,表示整體數據的中心向量:
自適應FCM 算法通過最小化目標函數JFCM的迭代過程來實現更新U和V,具體步驟如下:
1)分配初始值的聚類數目b=2、LFCM(1)=0、模糊指數m、最大迭代次數Imax和閾值ξ;
2)根據隸屬度的約束,隨機初始化模糊劃分矩陣U(0);
3)根據式(18)計算b類聚類質心V(s);
5)根據式(17)計算U(s+1),返回步驟3);
6)計算LFCM(b).如果LFCM(b-1)>LFCM(b-2)且LFCM(b-1)>LFCM(b),則停止迭代;否則,執行b=b+1 并轉至步驟3).
由于城市固體廢棄物成分的不確定性、操作員操作水平的差異性以及外部干擾的隨機性影響,難以用離線的非線性預測模型準確刻畫時變的MSWI 動態過程.此外,當實際過程的結構參數發生變化時,容易造成模型失配,會導致預測模型輸出和實際系統輸出之間的誤差增大,進而影響預測控制效果.為此,在控制過程引入模型參數自適應更新策略[31],在保證實際系統輸出與預測模型輸出間誤差最小的同時,讓每一時刻預測模型參數的變化也盡可能小,在線調節預測模型參數.模型參數自適應更新的目標函數定義如下:
式中,γ>0 為權系數,用以控制參數的變化速度,θ為FCM-RBF 預測模型中的參數{c,ω,δ},nθ為模型參數的個數.
對式(21)可以采用如下梯度下降公式更新參數向量:
當滿足設定精度要求或最大迭代次數的更新終止條件后,即可求得t時刻自適應調整后的預測模型參數.
在線優化控制的基本思想是在MPC 未來的控制序列中,選擇當前的控制輸入來最小化目標函數[32].目標函數由以下向量重新定義:
式中,η2>0 是梯度下降的學習率.由式(27)易知:
將式(29)代入式(28),則:
式中,n=1,2,···,Hp,m=1,2,···,Hu.由文獻[33]可知,式(34)可簡化為:
對于RBF 網絡:
其中
當控制時域Hu為1 時,預測控制器的計算量較少,可以克服該控制方法在求解優化問題時需要進行較大的矩陣運算問題,并取得令人滿意的控制效果[34].因此,本文設置Hu=1,則式(31)可表示為:
需要指出的是,用式(31)計算的最優控制輸入序列必須滿足穩定的MPC 迭代過程.控制權重參數ρ1和ρ2一般取正數,控制律序列的學習率η2只影響優化速度,而且η2的波動與控制穩定性無關.
定理1.將μ定義為FCM-RBF-MPC 優化過程的參數,如式(39)所示,如果其滿足下式條件,則該過程就是穩定的:
式中,λmax是g(t)gT(t)的最大特征值.
證明.為了分析穩定性,定義如下的李雅普諾夫函數:
則李雅普諾夫函數VC的差分形式為:
易知,E(t)的時間導數為:
式中,I是一個Hp階的單位矩陣.
引理1.定義矩陣函數 (kI-A)X=0,其中A是Hp×Hp階的對稱矩陣,X是Hp×1 階的向量.則A的特征值可以表示為k(a)=其中
利用式(45)和引理1,根據式(41)設置最優參數μ,可得 ΔVC(t)<0.根據李雅普諾夫穩定性理論,采用一階梯度優化方法的FCM-RBF-MPC 過程是穩定的.
本文以特定工況下的MSWI 數據驅動過程模型為研究對象,借助現場運行數據,首先,建立基于FCM-RBF 網絡的煙氣含氧量預測模型,使用自適應FCM 算法,確定RBF 網絡隱含層神經元個數及初始中心;其次,通過反饋校正環節對預測模型結果進行修正,并采用模型參數自適應更新策略在線更新預測模型參數;最后,采用梯度下降方法,在線求解每一時刻的最優控制量.煙氣含氧量自適應預測控制算法的實現步驟如下:
1)選擇合適的參數.包括RBF 神經網絡參數如學習率η1、網絡權值等;控制參數如預測時域Hp,控制時域Hu,參考值調整因子ar,控制權重因子ρ1、ρ2,控制輸入的學習率η2和模型參數自適應更新學習率λ.
2)選擇特定工況下分散控制系統采集的輸入/輸出數據構成樣本集,劃分為訓練集和測試集,并進行數據歸一化處理.使用自適應FCM 算法確定RBF 神經網絡隱含層神經元個數及初始中心,離線訓練FCM-RBF 神經網絡預測模型.
3)給定煙氣含氧量的設定值,并通過式(2)計算參考估計yr(t+i),i=1,2,···,Hp.根據已知的系統控制量u(t),系統實際輸出y(t),計算實際輸出與預測輸出之間的偏差err(t).
4)在第t+1 時刻,基于歷史輸入/輸出數據,通過FCM-RBF 網絡預測模型,可迭代求得預測輸出yp(t+i),然后通過偏差err(t)修正該預測輸出.
5)在預測時域Hp內,使用梯度下降方法得到雅可比矩陣依據式(31)計算控制時域Hu內的控制增量序列 Δu,并代入被控對象的數據驅動模型,得到系統實際輸出.
6)利用梯度下降法求解式(21)預測模型參數自適應優化問題,更新FCM-RBF 預測模型參數.
7)返回步驟3),重復整個過程.
本文使用的數據來自于現場分散控制系統采集的3 800 組實測數據,采樣間隔時間為1 s.選取2 660組數據(占70%)作為訓練樣本,1 140 組數據(占30%)作為測試樣本,建立基于自適應FCM-RBF網絡的離線預測模型,并在控制過程中采用模型參數自適應更新策略在線更新模型.為評估本文控制方法的有效性,利用帶有外部干擾的城市固廢焚燒過程煙氣含氧量控制實驗進行實驗驗證.
由于MSW 成分繁雜和焚燒過程的不確定性,實際MSWI 過程的運行情況復雜多變.MSW 質量流量和負荷波動是工況變化的重要表現,但是現場很難直接獲得具體數值.而給料速度調節量和爐排速度調節量能夠間接表征MSW 質量流量和負荷變化,從而識別不同工況.其中,爐排速度調節量又分為干燥爐排、燃燒爐排1、燃燒爐排2 和燃燼爐排共4 個區間,每段爐排下方分別對應有一次風流量分量.為設計和說明方便,本文僅對給料速度和各階段爐排速度調節量穩定時的一種典型工況進行建模研究.在該種工況下,煙氣含氧量(yo)被限定為主要與風量,即干燥爐排一次風流量xp1、燃燒爐排1 一次風流量xp2、燃燒爐排2 一次風流量xp3、燃燼爐排一次風流量xp4和二次風流量xs有關.所選輸入/輸出變量數據變化范圍見表1.

表1 輸入/輸出變量變化范圍Table 1 Range of input and output variables
為避免輸入變量物理意義和單位不同對結果的影響,需要首先進行數據歸一化預處理.此外,選取合適且精簡的特征變量是模型準確構建的前提,操作變量與煙氣含氧量的皮爾森相關系數γ如表2 所示,需要剔除[-0.11,0.11]范圍內相關性弱的變量,即最終選擇干燥爐排一次風流量xp1、燃燒爐排1一次風流量xp2和二次風流量xs作為特定工況下的操作變量,煙氣含氧量yo作為被控變量.

表2 操作變量與煙氣含氧量的皮爾森相關系數Table 2 Pearson correlation coefficient between manipulated variables and oxygen content in flue gas
在建立煙氣含氧量預測模型時,選取模型輸入/輸出階數ny=nu=2,則預測模型的輸入變量可寫為如下形式:
通過試湊法確定,設置自適應FCM 算法模糊指數m為5,最大迭代次數Imax為100,閾值ξ為0.00001,最終得到最優聚類數目b為26.將該最優聚類數目作為RBF 網絡隱含層神經元個數,聚類中心作為神經元的初始中心.初始權值、寬度隨機設置,學習率η1=0.05,訓練的期望均方誤差(Mean square error,MSE)設為0.01,最大訓練步數為200 步,采用梯度下降法對該網絡進行訓練.本文FCM-RBF 神經網絡與多層感知機(Multi-layered perceptron,MLP)神經網絡、RBF 神經網絡的煙氣含氧量預測效果如圖4 所示.

圖4 不同建模方法的煙氣含氧量預測效果Fig.4 Prediction effect of oxygen content in flue gas with different modeling methods
由圖4 可以看出,RBF 神經網絡和FCM-RBF神經網絡的煙氣含氧量預測準確性均優于MLP 神經網絡,但在波峰和波谷位置,兩種網絡仍有較明顯的預測偏差.為了進一步驗證FCM-RBF 神經網絡預測煙氣含氧量的有效性,采用均方根誤差(Root mean square error,RMSE)、平均絕對百分比誤差(Mean absolute percentage error,MAPE)和平均絕對誤差(Mean absolute error,MAE)評估預測性能.表3 列出了不同模型獨立運行30 次的預測性能指標平均值.

表3 不同建模方法的煙氣含氧量預測評價指標對比Table 3 Comparison of prediction evaluation indexes of oxygen content in flue gas with different modeling methods
式中,yd(t)、yp(t)和Q分別為觀測值、預測值和樣本數.
在表3 中,FCM-RBF 神經網絡預測煙氣含氧量的MAE、MAPE 和RMSE 分別為0.0307、0.0056和0.0417,與MLP 神經網絡和RBF 神經網絡相比,FCM-RBF 神經網絡的預測性能指標有明顯提升.這是因為自適應FCM 算法能夠幫助確定較優的RBF 神經網絡隱含層神經元個數及初始中心,降低隨機初始中心帶來的不確定性,提高RBF 神經網絡的預測精度.該模型能夠為模型預測控制提供反映MSWI 過程煙氣含氧量動態特性的精準預測模型.
為了驗證本文的自適應FCM-RBF-MPC 方法的有效性,對比了基于不同RBF 神經網絡預測模型的煙氣含氧量控制效果.選取預測時域Hp為5,控制時域Hu為1,參考值調整因子ar為0.1,控制權重因子ρ1和ρ2為1 和150,控制輸入的學習率η2為0.1,參數自適應更新學習率λ為0.05,最大更新步數為200 步,模型更新的期望均方誤差設為0.01,控制時間間隔為1 s.由于MSWI 實際過程存在不確定性干擾,為了模擬這種情況,在100 s 和300 s處起分別施加幅值為0.2 和0.5 的干擾v(t)如下:
考慮焚燒過程動態特性的非線性和不確定性,需要跟隨變化的煙氣含氧量設定值,并自適應調整控制器輸出.為了測試本文設計的自適應FCMRBF-MPC 控制有效性,對比實驗選取了采用RBF、FCM-RBF 和自適應RBF 神經網絡作為預測模型的數據驅動MPC.煙氣含氧量變設定值的FCMRBF-MPC 和自適應FCM-RBF-MPC 控制器跟蹤效果如圖5 所示,操作變量具體變化如圖6 所示,反饋校正誤差補償變化情況如圖7 所示.由圖5 可以看出,與FCM-RBF-MPC 方法相比,自適應FCM-RBF-MPC 方法能夠更及時地給出準確的控制輸出,使系統能夠更快地跟蹤煙氣含氧量的參考軌跡.由圖7 可以看出,預測誤差err(t)在控制起始階段、設定值變化階段和干擾施加初始階段的變化比較明顯,說明這些階段中的模型自適應更新預測結果與實際值仍存在較大偏差.當達到模型自適應更新的終止條件,而預測結果與實際值仍存在偏差時,反饋校正可以作為模型自適應更新的誤差補償來修正預測結果.

圖5 FCM-RBF-MPC 和自適應FCM-RBF-MPC 控制效果Fig.5 Control results of FCM-RBF-MPC and adaptive FCM-RBF-MPC

圖6 FCM-RBF-MPC 和自適應FCM-RBF-MPC的操作變量變化情況Fig.6 Changes of manipulated variables of FCM-RBF-MPC and adaptive FCM-RBF-MPC

圖7 反饋校正誤差補償變化情況Fig.7 Changes of feedback correction error compensation
此外,采用絕對誤差積分(Integral of absolute error,IAE)[35]、絕對誤差與時間乘積積分(Integral time absolute error,ITAE)[35]和最大絕對誤差(Maximal deviation from set-point,Devmax)[36]評價控制效果,具體公式如下:
式中,K是樣本總數,eOC代表煙氣含氧量參考值與真實輸出值之間的誤差.
表4 給出了不同RBF 神經網絡預測控制器用于煙氣含氧量控制的評價指標對比結果.可以看出,自適應FCM-RBF-MPC 的IAE、ITAE 和Devmax分別為0.0031、2.4152 和0.4226,與FCM-RBF-MPC算法相比,分別降低了27.90%、19.50%和14.61%;與自適應RBF-MPC 算法相比,分別降低了31.11%、30.23%和2.51%.結果表明,在給定的煙氣含氧量變設定值情況下,本文提出的自適應FCM-RBFMPC 方法具有更好的自適應性和抑制干擾能力,能夠對煙氣含氧量實現更精準的控制.

表4 不同RBF 神經網絡預測控制器性能指標對比Table 4 Comparison of evaluation indexes of different RBF neural network predictive controllers
面向MSWI 過程煙氣含氧量精準控制需求,本文提出一種自適應模型預測控制方法.首先,為降低隨機初始RBF 隱含層神經元個數及初始中心帶來的不確定性,建立基于數據驅動的自適應FCMRBF 神經網絡煙氣含氧量預測模型;其次,在控制過程中采用模型參數自適應調節策略,提高了預測模型的動態自適應性;接著,利用梯度下降方法方便快速地求解MPC 控制律,并基于李雅普諾夫穩定性理論證明了控制系統的穩定性;最后,基于MSWI廠實際數據建模和控制實驗,表明本文自適應FCMRBF 網絡建模方法具有較高的預測精度,本文自適應FCM-RBF-MPC 方法相對于其他RBF 神經網絡預測控制器,具有更好的設定值跟蹤性能,驗證了該方法在干擾存在情況下,仍然具有很好的自適應控制能力.后續將進一步研究該方法的節能應用效果和預測模型結構在線自適應調整機制捕獲更多未知工況.