朱鵬飛,夏陸岳,潘海天
(浙江工業大學化學工程學院,浙江 杭州 310032)
隨著化學工業的飛速發展,現代化工過程對產品質量指標及系統狀態的估計性能要求越來越高,但由于存在經濟、技術等諸多因素,導致難以有效實現這些質量指標或系統狀態的在線實時檢測。采用軟測量技術建立精確可靠的預測模型,是實現化工過程產品質量指標或系統狀態在線實時預測的一種較為可行的解決方法。
國內外相關研究者提出了多種軟測量建模方法,這些方法都有其各自的優勢與局限[1]。針對具體工業對象選擇建模,必須結合實際對象特性,才能建立具有可靠預測性能的軟測量模型。許多化工過程具有時變、非線性等特性,而且建模過程易受采樣數據不準確、工作點漂移等諸多因素的影響,導致單一軟測量模型在測量精度、泛化性能和穩定性等方面存在不足,難以準確描述具體對象的局部和全局特性。針對上述情況,一些研究者提出了混合建模、模型校正等處理方法。其中混合建模方法是將機理模型、經驗模型等多種形式的模型以并聯或串聯方式結合,充分利用機理建模和經驗建模等方法各自的優勢,可獲得更好的精度與泛化性能,適用于過程機理十分復雜的對象[2-4];模型校正方法是利用最新采集的觀測數據對原模型的參數或輸出進行校正,使模型得到實時更新,由于跟蹤了對象的最新動態特性,預測效果較為穩定,適用于訓練樣本小及動態特性復雜的對象[5-7]。
本研究汲取了混合建模和模型校正的先進思想,提出了一種基于改進Kalman 濾波算法的多模型融合建模方法。對經典Kalman 濾波算法進行改進,使其適用于非線性化工過程,將機理模型和數據驅動模型的輸出在線融合,組成混合模型。采用二次濾波、方差更新對混合模型的輸出及參數進行在線校正,優化混合模型的估計性能。將該多模型融合建模方法應用于氯乙烯聚合過程聚合速率的軟測量研究中,應用結果表明該建模方法能有效提高軟測量模型的預測精度和穩定性。
對于同一化工過程軟測量問題,可采用不同建模方法建立多種軟測量模型,若僅根據預測效果優劣取舍,會丟失一些過程的有用信息。許多化工過程常存在不斷變化且難以精確描述的隨機外部擾動,導致軟測量模型的輸出存在波動,而單一軟測量模型的抗干擾性較差,存在模型失配的風險。實現多種軟測量模型的有效融合,可充分利用各種數據樣本信息,從而達到改善軟測量模型預測精度與穩定性的目的[8]。
基于上述設計思想,本研究提出一種多模型融合的混合建模方法。利用多個不同類型的軟測量模型提供的信息交叉互補,采用多模型融合技術進行融合處理,最終形成統一的估計目標。其模型結構如圖1所示,圖中X1、X2分別表示數據驅動模型和機理模型的輸入,Yd、Ym、Yf分別表示數據驅動模型、機理模型、混合模型的輸出。

圖1 基于多模型融合的混合模型結構Fig.1 Diagram of hybrid model based on multi-model fusion
該混合模型采用并聯型結構,采用融合技術有效融合機理模型和數據驅動模型的輸出,從而建立混合模型,其中融合技術是影響混合模型預測性能的關鍵因素。常規融合技術是將多個子模型的輸出值進行線性加權組合,一般以組合模型預測誤差極小化為優化準則對權重系數進行離線調整,但難以適用具有時變特性且工藝參數波動較大的化工過程。本研究針對常規融合技術存在的不足對經典Kalman 濾波算法進行改進,在基于最優估計的Kalman 濾波算法遞推框架下實現機理模型和數據驅動模型輸出的融合,并將其應用于非線性化工過程軟測量建模研究中。
根據化工過程的非線性特點,采用合理的非線性數據驅動建模方法是保證混合模型性能的先決條件。在數據驅動模型建模過程中,模型結構是影響數據驅動模型預測性能的重要因素,若模型的輸入變量較多,雖然保證了信息的完整性,但會造成模型結構復雜、泛化性能降低與預測精度較差等不足,因此在盡量保留系統有效信息的前提下簡化模型結構具有積極意義。
核函數主元分析是一種有效的非線性系統數據挖掘方法。通過核函數把低維線性不可分的數據映射到高維空間,使之成為線性可分數據,再利用主元分析將高維的核空間數據變換成低維的特征主元變量,從而最大限度地簡化系統結構,并確保有效信息的完整性[9-11]。
混合核函數通過將不同類型的核函數結合,可顯著提高核函數性能[12]。將具有局部特性的徑向基核函數Krbf與具有全局特性的多項式核函數Kpoly加權組合成混合核函數,其具體計算公式為

式中,ρ表示權重系數。通過改變參數ρ可對混合核函數的局部與全局特性進行調整。
Krbf和Kpoly核函數的數學表達式分別如下

式(2)和式(3)中,σ表示RBF 核函數的寬度,c、d分別表示多項式核函數的參數項和階數。
K2PCA 算法的具體實施流程如下:
(2)對核函數矩陣按列零均值化,得到;
(3)按主元分析提取特征主元的一般化方法,得到的q個特征向量t=(t1,…,tq);
其中,訓練數據的核函數矩陣K和測試數據的核函數矩陣Kt按列零均值化方法如下


圖2 K2PCA-ANN 模型結構Fig.2 Structure of K2PCA-ANN model
人工神經網絡是一種有效的非線性智能建模 方法[13]。將混合核函數主元分析(K2PCA)和神經網絡(ANN)相結合,建立了一種基于K2PCA-ANN的數據驅動建模方法。該建模方法在不損失系統有效信息的前提下充分利用K2PCA 和ANN 各自的優勢,K2PCA 提取系統輸入的主元變量,ANN 逼近主元變量與目標變量之間的非線性映射關系[14]。K2PCA-ANN 模型結構如圖2所示,將K2PCA 降維后的主元作為BP 神經網絡的輸入,樣本數據輸出作為BP 神經網絡的輸出,從而建立K2PCA-ANN模型。
經典Kalman 濾波算法采取遞歸方式解決離散數據的線性濾波問題,使用過程方程和量測方程描述系統。
過程方程和量測方程的表達式分別為

式(6)和式(7)中,t表示時刻,Y表示系統狀態變量,A表示過程增益,B表示控制輸入增益,U表示控制輸入,Z表示測量變量,H表示狀態變量對測量變量的增益,ω和υ分別表示過程噪聲和測量噪聲,與其對應的方差分別為W和V。
系統狀態先驗估計方程的表達式為

由式(8)可知,根據上一時刻系統狀態 1tY-和控制輸入 1tU-可得到當前時刻的系統狀態預測值c,tY。
當系統為非線性或控制輸入U對狀態變量Y的影響為非線性時,A、B或為時變參數,增加了參數辨識的復雜程度。對此,一些研究者提出了多種改進方法,如擴展Kalman 濾波(EKF)[15]、無跡Kalman 濾波(UKF)[16-17]等,改進系統狀態先驗估計方程,使其能用于系統狀態的非線性預測。然而,上述改進方法不僅計算量較大,而且依賴嚴格精確的系統狀態模型,導致無法適用于系統狀態模型未知的對象。
結合經典Kalman 濾波算法的設計原理,將數據驅動模型應用于系統狀態的非線性預測中。利用前后時刻數據驅動模型輸出值的偏差估計系統狀態值的變化,避免了狀態估計方程中參數A、B的在線辨識困難,突破了經典Kalman 濾波算法對狀態方程的限制。
基于上述設計思想,改進后的系統狀態先驗估計方程如下

式中,Yf,t-1表示t-1 時刻混合模型的輸出值,Yd,t-Yd,t-1表示基于數據驅動模型的系統狀態預測值在t時刻相對t-1 時刻的變化量。將改進后的Kalman 濾波算法用于多模型融合技術研究中。
根據化工過程軟測量模型的特點,提出以下兩點假設:①機理模型具有較好的泛化性能,模型輸出值在系統真值附近波動;②因訓練樣本不足,數據驅動模型可能在真值附近發生偏移,但能把握系統的變化趨勢。
將數據驅動模型和機理模型分別應用于改進Kalman 濾波算法的過程方程和量測方程中,對應模型的輸出分別為預測值和測量值,過程方程和量測方程分別如下

測量值與狀態值為同一個變量,因此H=1。因此,可以利用經典Kalman 濾波算法的方程進行遞推估計。
改進Kalman 濾波算法的時間更新方程為

改進Kalman 濾波算法的狀態更新方程為

式(12)~式(16)中,P表示過程估計的協方差,K表示Kalman 濾波算法增益,Yh表示Kalman 濾波算法的最優估計值?;诟倪MKalman 濾波算法的多模型融合建模方法流程如圖3所示。
在Kalman 濾波算法的遞推框架下,系統狀態預測值Yc和機理模型預測值Ym按其預測的精度(W和V)自動在線調整權重(1K-和K),進行組合 預測得到Yh。最終實現了數據驅動模型和機理模型的預測融合,Yh即為融合輸出值。

圖3 基于改進Kalman 濾波算法的多模型融合建模方法Fig.3 Multi-model fusion modeling method based on improved Kalman filtering algorithm
采用改進Kalman 濾波算法實現數據驅動模型與機理模型的融合,雖然在一定程度上減弱了系統輸入測量噪聲對模型性能的影響,但仍無法完全去除,因此可對混合模型的融合輸出值Yh再進行相關處理,使得處理后的融合模型最終輸出值Yf更接近真值。
可采用線性滑動平滑作為二次濾波方法,該方法基于移動窗原理,適用于非線性過程的濾波處理。與常規移動平均法相比,還可避免濾噪帶來的滯后問題。
基于線性滑動平滑的二次濾波計算公式如下

式(17)~式(20)中,Linefit 表示線性擬合,a、b分別表示線性擬合的參數——斜率、截距。
Kalman 濾波算法的應用要求已知系統噪聲特性的先驗知識,即已知過程方程與量測方程的方差W、V,這一般可通過離線采樣分析得到。然而,化工過程系統具有受隨機干擾的不可預測性,導致軟測量模型的預測性能會在過程不同階段發生波動。若W、V保持為常數,將不利于Kalman 濾波算法的局部估計性能達到最佳。對此,可采用移動窗技術,在進行遞推濾波的同時在線估計W、V,并校正模型參數P、K,從而提高濾波精度。
設窗口長度為n,t時刻更新W和V的具體計算公式分別如式(21)和式(22)所示

首先根據式(17)~式(20)在線修正模型輸出,然后根據式(13)和式(14)、式(21)和式(22)在線自適應校正混合模型參數,最終達到使混合模型的估計性能盡可能最優的目的。
通過采集現場工藝變量數據,采用軟測量技術實現聚合速率在線估計,可以進一步估算聚合反應過程的轉化率,從而實時掌握聚合過程進度和控制反應終點,并為聚合反應過程的控制、優化等相關研究提供基礎條件[18-19]。以某廠30 m3聚氯乙烯生產裝置為研究對象,開展聚合速率軟測量研究。
4.1.1 K2PCA-ANN 模型 根據氯乙烯懸浮聚合過程的工藝特點,聚合速率數據驅動模型的輸入變量為:聚合時間T、釜內壓力P、聚合溫度Tr、夾套冷卻水進口溫度TJi、夾套冷卻水出口溫度TJo、夾套冷卻水流量FJ、中間注水溫度Tin和中間注水流量Fw;聚合速率數據驅動模型的輸出變量為聚合速率。在K2PCA-ANN 建模前進行數據標準化等預 處理。K2PCA 算法的參數設置如下:多項式核函數的參數項c=1,階數d=1;RBF 核函數的寬度σ=5;PCA 累計貢獻率的提取效率p=0.90。主元累計貢獻率的具體內容見表1。由表1可知,輸入樣本數據經過 K2PCA 處理后,共提取了4 個主元。

表1 主元累計貢獻率Table 1 Accumulative contribution rate of principal component
在建立K2PCA-ANN 聚合速率預測模型過程中,BP 神經網絡的具體參數設置如下:網絡拓撲結構為4×4×1,隱含層為logsig 型函數,輸出層為purelin 型函數,采用Levenberg-Marquardt 訓練方法。
選取一組測試數據(測試數據1),通過改變混合核函數權重系數ρ對模型預測精度進行比較,以確定最佳的權重系數ρ。具體比較結果見表2,其中MAPE、MRE 分別表示平均絕對百分比誤差和最大相對誤差。由表2可知,權重系數ρ選擇0.7 為佳,表示局部核函數在建模過程中占主要作用。

表2 不同ρ 的K2PCA-ANN 聚合速率模型預測性能比較Table 2 Comparison of performance of K2PCA-ANN with different ρ
4.1.2 熱力學機理模型 量熱法是通過對熱平衡參數(如流量、溫度等)進行在線測量,基于聚合反應器的熱平衡模型計算得到反應熱,從而進一步估算出聚合速率[20-21]。
氯乙烯聚合過程為放熱反應。對聚合反應釜進行熱量傳遞平衡分析,可以得到聚合釜與冷卻水夾套之間的熱平衡方程、夾套內的熱平衡方程分別如下

其中,Qr表示反應放出的熱量,Qwall表示釜壁向冷卻水夾套傳遞的熱量,QlossW表示中間注水移走的熱量,QlossJ表示夾套冷卻水移走的熱量,QaccuR、QaccuJ分別表示聚合釜內和夾套內的熱累積。由于聚合過程溫度控制平穩且夾套冷卻水溫度變幅小,因此可忽略夾套冷卻水和聚合釜內的熱累積變化。
根據式(23)和式(24),可建立氯乙烯懸浮聚合過程聚合速率模型

4.1.3 混合模型 將氯乙烯聚合過程熱力學機理模型的輸出Ym和K2PCA-ANN 數據驅動模型的輸出Yd,采用式(12)~式(22)進行遞推計算,得到融合模型的最終輸出Yf。由離線分析獲得的知識,設置初始的W=0.1、V=1.2、P=0,方差更新的移動窗口和線性平滑濾波的滑動窗口長度均為5,若數據點未到設定窗口長度則按已有數據長度進行。
熱力學機理模型和K2PCA-ANN 模型的預測結果(測試數據1)如圖4所示。由圖4可知,兩種模型都能大致反映出聚合速率的變化趨勢,但K2PCA-ANN 模型的預測性能更佳。在聚合反應過 程的前期與后期,聚合速率變化較大,工藝變量的頻繁波動導致其測量值帶有較多噪聲,而K2PCA 在提取主元過程中濾除了部分噪聲,因此K2PCA-ANN模型的聚合速率預測曲線較平滑。

圖4 熱力學機理模型和K2PCA-ANN 模型的 預測結果(測試數據1)Fig.4 Predictions of thermodynamic model and K2PCA-ANN model (test data 1)
為了比較說明熱力學機理模型和K2PCA-ANN模型的泛化能力,選用了另一組測試數據(測試數據2),兩種模型的預測效果如圖5所示。由圖5可知,熱力學機理模型的預測性能未發生明顯變化,而K2PCA-ANN 模型的預測值則發生了偏移,這是由于生產條件或操作區域偏離訓練樣本數據范圍時K2PCA-ANN 模型未進行有效學習,導致其泛化能力變差。
對圖4和圖5進行比較可知,熱力學機理模型的預測值在真實值附近波動,因此可通過濾波處理改善其預測穩定性。采用基于改進Kalman 濾波算法的多模型融合建模方法建立聚合速率混合模型,該模型的聚合速率預測結果(模型校正處理前后)如圖6所示。

圖5 熱力學機理模型和K2PCA-ANN 模型的 預測結果(測試數據2)Fig.5 Predictions of thermodynamic model and K2PCA-ANN model (test data 2)

圖6 經模型校正處理前后的混合模型預測 結果(測試數據2)Fig.6 Predictions of hybrid model with smoothening-filtering method or not (test data 2)
對圖5和圖6進行比較可知,與單一的熱力學機理模型或K2PCA-ANN 模型相比,混合模型由于利用機理模型和數據驅動模型各自的特點進行了互補修正,預測值的波動幅度減小,預測準確性得到了提高。經過模型校正處理后,修正了混合模型輸出,并優化了Kalman 濾波算法參數,預測穩定性得到了進一步提升,能夠準確反映氯乙烯聚合過程聚合速率的變化趨勢。
為定量衡量各種模型(圖5和圖6)的預測性能,采用MAPE(平均絕對預測誤差)、MRE(最大相對誤差)和MSE(均方根誤差)作為預測性能指標。4 種聚合速率預測模型的性能指標數據見表3,表中 a ~d 分別表示熱力學機理模型、K2PCA-ANN 模型、混合模型、混合模型+模型校正。

表3 4 種聚合速率預測模型的預測性能比較Table 3 Performance comparison of four polymerization rate models
由表3可知,混合模型具有更好的預測精度,相應的MAPE、MRE 和MSE 指標數值明顯改善,體現了多模型融合預測的優勢。經過模型校正處理后的混合模型泛化能力和魯棒性較好,能夠適應氯乙烯聚合過程工作點較寬的實際工藝狀況,進行有效預測。
針對聚合物生產過程單一軟測量模型存在的
預測效果不穩定問題,提出了一種多模型融合建模方法。在基于最優估計的Kalman 濾波算法的遞推框架下,將機理模型和數據驅動模型有效融合,構成混合模型,并協調二次濾波和方差更新對混合模型的輸出及參數在線校正,與單一軟測量模型相比有效減少了隨機因素的影響,增強了模型預測的穩定性。氯乙烯聚合過程聚合速率軟測量的應用結果表明,采用該建模方法建立的混合模型具有優良的預測性能,具有在聚合物生產過程優化與控制的研究中進一步推廣應用的潛力。
[1]Cao Pengfei (曹鵬飛),Luo Xionglin (羅雄麟).Modeling of soft sensor for chemical process [J].CIESC Journal(化工學報),2013,64 (3):788-800
[2]Yang Huizhong (楊慧中),Zhang Suzhen (張素貞),Tao Zhenlin (陶振麟).A hybrid model for inference estimation of the performance figure in polymerization process [J].Journal of Chemical Engineering of Chinese Universities(高校化學工程學報),2003,17 (5):552-558
[3]Zahedi G,Lohi A,Mahdi K A.Hybrid modeling of ethylene to ethylene oxide heterogeneous reactor [J].Fuel Processing Technology,2011,92 (9):1725-1732
[4]Mjalli F S,Ibrehem A S.Optimal hybrid modeling approach for polymerization reactors using parameter estimation techniques [J].Chemical Engineering Research and Design,2011,89 (7):1078-1087
[5]Wang J S,Guo Q P.D-FNN based soft-sensor modeling and migration reconfiguration of polymerizing process [J].Applied Soft Computing,2013,13 (4):1892–1901
[6]Wu Yao (吳瑤),Luo Xionglin (羅雄麟).Design of output data fusion soft sensor based on adaptive extended Kalman filtering algorithm [J].CIESC Journal(化工學報),2010,61 (10):2627-2635
[7]Chen K,Ji J,Wang H,et al.Adaptive local kernel-based learning for soft sensor modeling of nonlinear processes[J].Chemical Engineering Research and Design,2011,89 (10):2117-2124
[8]Chen Huayou (陳華友),Hou Dingpi (侯定丕).Combination forecasting model based on forecasting effective measure with standard deviate [J].Journal of Systems Engineering(系統工程學報),2003,18 (3):203-210
[9]Muller K R,Mika S,Ratsch G,Tsuda K,Scholkopf B.An introduction to kernel-based learning algorithms [J].IEEE Transaction on Neural Networks,2001,12 (2):181-201
[10]Wang Huazhong (王華忠),Yu Jinshou (俞金壽).Studies on modeling using mixture of kernels partial least squares and its application to soft Sensing [J].Computers and Applied Chemistry(計算機與應用化學),2007,24 (2):239-242
[11]Jaya John,Vinodhini B,Karthik S.Estimating missing values using mixture kernel regression [J].International Journal of Computer Applications in Engineering Sciences,2012,2 (2):83-88
[12]Wang Qiang (王強),Tian Xuemin (田學民).Soft sensing based on KPCA and LSSVM [J].CIESC Journal(化工學報),2011,62 (10):2813-2817
[13]Gao Shuzhi (高淑芝),Gao Xianwen (高憲文),Wang Jiesheng (王介生).Soft-sensor modeling of polymerizing process based on multi T-S fuzzy neural network optimized with harmony search algorithm [J].Chinese Journal of Scientific Instrument(儀器儀表學報),2011,32 (3):495-500
[14]Yang Min (楊敏),Hu Bin (胡斌),Fei Zhengshun (費正順),Zheng Pingyou (鄭平友),Liang Jun (梁軍).Soft-sensing research on the gas phase ethylene polymerization in fluidized bed reactor based on DPCA-RBF network [J].Chinese Journal of Scientific Instrument(儀器儀表學報),2010,31 (3):481-487
[15]Ge Quanbo (葛泉波),Li Wenbin (李文斌),Sun Ruoyu (孫若愚),Xu Zi (徐姿).Centralized fusion algorithms based on EKF for multisensor non-linear systems [J].Acta Automatica Sinica(自動化學報),2013,39 (6):816-825
[16]Cang Wentao (倉文濤),Yang Huizhong (楊慧中).Application of UKF algorithm in soft sensor for deactivation of the catalyst [J].Computers and Applied Chemistry(計算機與應用化學),2013,30 (12):1397-1400
[17]Franklin David Rincón,Marcelo Esposito,Pedro Henrique Hermes de Araújo,Claudia Sayer,Galo Antonio Carrillo Le Roux.Calorimetric estimation employing the unscented Kalman filter for a batch emulsion polymerization reactor [J].Macromolecular Reaction Engineering,2013,7 (1):24-35
[18]Ng C W,Hussain M A.Hybrid neural network—prior knowledge model in temperature control of a semi-batch polymerization process [J].Chemical Engineering and Processing,2004,43 (4):559-570
[19]Zeaiter J,Gomes V G,Romagnoli J A,Barton G W.Inferential conversion monitoring and control in emulsion polymerisation through calorimetric measurements [J].Chemical Engineering Journal,2002,89 (1-3):37-45
[20]Fana S J,Alpay E.Calorimetric estimation for a batch-loop emulsion polymerisation reactor [J].Chemical Engineering Science,2004,59 (13):2811-2815
[21]BenAmor S,Colombie D,McKenna T.Online reaction calorimetry.applications to the monitoring of emulsion polymerization without samples or models of the heat-transfer coefficient [J].Industrial & Engineering Chemistry Research,2002,41 (17):4233-4241