李奇安,郭 強
(遼寧石油化工大學 信息與控制工程學院,遼寧 撫順113001)
乙烯裂解爐燃料氣系統是乙烯裝置中的重要設備,用于連續、平穩地向裂解爐提供燃料氣,保證裂解反應所需的高熱量[1].燃料氣的熱值是影響裂解爐爐管出口溫度(coil outlet temperature,COT)的主要因素.燃料氣系統中化學反應復雜、不確定干擾因素多,難以建立有效的熱值機理模型[2].而在線熱值儀的測量結果存在明顯的測量滯后[3],不能有效地用于爐管出口平均溫度的實時控制.采用過程數據建立這些難測變量的軟測量模型是解決此問題的有效方法之一[4].
早期的軟測量建模技術是基于歷史數據建立離線模型,主要方法包括人工神經網絡(ANN)[5]、主元分析(principal component analysis,PCA)[6]及偏最小二乘(partial least squares,PLS)[7]等.早期的離線模型雖然能夠較好地擬合歷史數據,但是由于缺乏在線學習能力,早期的軟測量建模技術存在2方面的問題:其一,模型的泛化能力嚴重依賴對初始建模樣本的選擇,如果所選的初始建模樣本不能涵蓋所有工況,則模型的泛化能力難以得到保證;其二,即使收集到足夠多的歷史數據,如何選擇良好的模型類型及參數以保證模型能夠適用于所有工況,同時盡量減少模型的復雜度,仍然是一個需要權衡的問題.因此,離線模型的性能在投用一段時間后會逐漸降低[8].
大多數工業過程都具有慢時變特性,造成這種現象的主要原因包括輸入物料的改變、催化劑活性失活及元器件磨損等,因此,工業過程需要一個具有自適應能力而不是固定不變的模型[9].為此很多研究者提出了在線建模方法.何曉斌等10]提出了一種可變移動窗主元分析法(variable moving window principal component analysis,MWPCA)用于過程狀態的自適應監控,該方法根據樣本數據迭代更新相關函數矩陣,并結合移動窗技術(moving window technique)和R-特征值分解算法(rank-rsingular value decomposition,R-SVD)建立新的PCA模型.仿真結果顯示MWPCA可以有效地用于慢時變過程的自適應監控.Li等[11-12]提出了迭代PCA/PLS算法用于過程的建模與監控,通過在PCA/PLS中引入迭代更新算式,使得模型可以根據新樣本自適應更新模型.Wang等[13]提出了一種將PLS算法與Hammerstein神經網絡相結合的PLS-based HRNN建模方法,其中PLS技術分解高維數據,Hammerstein神經網絡擬合非線性動態過程函數,仿真結果顯示該建模算法可以有效地用于鋁酸鹽產量的在線自適應預測.
目前,工業領域中應用較多的仍然是基于滑動窗口和迭代PCA/PLS的建模技術[14-16],仍然存在滑動窗口尺寸難于選擇、每樣本數據更新所需計算量大、PCA算法不能反映建模所需的輸入輸出變量間的關系以及PLS算法不能建立非線性模型等問題.因此,工業過程還缺乏一套有效的非線性自適應在線建模算法.
增量式支持向量機[17]是支持向量機(support vector machine,SVM)[18]的在線自適應版本,該算法既保留了支持向量機的優點,同時又具有在線自適應能力,因此,在處理很多實際問題時表現出優良的性能[19-21].
近似線性依靠(approximate linear dependence,ALD)條件可以有效地用于監控慢時變工業過程的漂移現象并減少每樣本更新策略所帶來的計算負荷,常作為模型的更新決策條件[22-23].
乙烯裂解爐燃料氣熱值軟測量模型目前主要采用離線建模法,劉漫丹等[2]將模糊邏輯系統、小腦關節控制器和神經網絡結合,開發出了一種智能化的神經網絡算法.仿真結果顯示,該算法具有更好的平滑能力和泛化能力,基于該算法的熱值軟測量系統,長期應用在具有強烈干擾的現場環境下,顯示出了良好的熱值預測準確性.楊思遠等[3]利用小波神經網絡的降噪和非線性函數近似能力,提出了一種小波神經網絡模型,用該模型對裂解爐燃料氣熱值進行測量,可以減少被“污染”的現場數據對模型預測精度的影響.張照娟[24]提出了一種具有遞歸環節的動態模糊神經網絡,并運用改進的粒子群算法優化模糊神經網絡的模型參數,最后利用這種方法“測量”燃料氣熱值,取得了較好的效果.
但是基于上述離線算法建立的模型缺乏自適應能力,隨著工況的變化,模型在投用一段時間后會出現性能惡化甚至無法使用的現象.為此,本文運用Online SVM建模算法建立一個具有在線學習能力的熱值軟測量模型,該算法將增量式支持向量機(ISVM)與近似線性依靠(ALD)條件相結合,通過選擇滿足ALD條件的獨立新樣本更新SVM模型來保證算法的適時性.
Online SVM建模算法包括2部分:1)基于增量式支持向量機(ISVM)的非線性建模方法;2)基于近似線性依靠(ALD)的模型更新條件.
增量式支持向量機最初由Cauwenberghs等[17]提出,它使傳統的支持向量機具有在線增加或刪除樣本,同時不需要重新訓練整個學習機器的能力.早期的ISVM只能處理分類問題,Ma等[20]將其推廣,使其可以解決回歸估計問題.
假設存在訓練集T= {(xi,y i),i=1,…,l},其中xi∈Rn,n為輸入空間維數,χi表示訓練樣本,y i∈R,y i表示模型的輸出,l為樣本總數.支持向量機算法的目標是在訓練集T上尋找一個盡可能平滑的回歸函數f(χ),在最大偏差ε內近似所有目標輸出y i,f(χ)可以通過如下對偶最優化問題得到[17].

式中:Qij=k(xi,xj)為核函數,i,j為樣本標號,αi、α*i、αj及α*j為對偶系數,C是懲罰參數.ISVM 的目標就是在每個樣本點上最小化式(1),而不用重新訓練整個模型.式(1)屬于凸最優化問題,其最優解應滿 足 KTT(Karush-Kuhn-Tucker)條 件.設h(xi)=f(xi)-y i為邊界函數,θi=αi-α*i為對偶系數差值,根據KTT條件,全體樣本被分成支撐集S、誤差集E和余集R[20].

當獲得新樣本時,ISVM算法將重新分配上述集合中的樣本點直到KTT條件重新滿足.同理,當舊樣本刪除時,也按照此算法而不需要重新訓練學習機器.
離線模型選擇新樣本點進行模型更新時,要考慮到這些樣本的多樣性和線性依靠性,只有選擇那些獨立新樣本進行更新,才能保證模型的適時性.為此本文選用ALD條件來判斷新樣本可否用于模型更新,ALD更新條件如下[23]:

式中:xi(i=1,…,k)為訓練樣本,k為樣本數;xk+1為新樣本;ν為預先定義的正閾值;δk+1為新樣本的近似誤差值.更新算法的主要思想是通過計算新樣本相對于建模樣本的近似誤差值δk+1,并比較其與閾值ν的關系,來判斷是否采用新樣本更新模型.當δk+1≤ν時,說明新樣本與建模樣本是線性依靠的,可以運用建模樣本來線性表出,因此不需要進行模型更新;當δk+1>ν時,新樣本與建模樣本是線性獨立的,因此需要進行模型更新.
對于式(3)的求解,Tang等[23]給出了詳細的推導步驟,當新樣本點加入時,通過求解δk+1關于a的微分,可以得出新樣本的近似誤差值δk+1、新樣本及建模樣本間的關系式,表示如下:

式中:k k+1=xk+1·xTk+1為新樣本歸一化值,xk+1為新樣本歸一化向量,~Kk=Xk·XTk為建模樣本矩陣,Xk為建模樣本歸一化向量,~kk=Xk·xTk+1為建模樣本與新樣本相關矩陣.
以下給出Online SVM算法的偽代碼:

在ALD更新條件中,對閾值ν尚無系統的選擇方法,通常由專家經驗設定.較高的ν會減小機器的負擔,但是會降低模型預測準確性;較低的閾值雖然能夠提高模型預測準確性,但是也增加了計算消耗,因此,在建模前選擇合適的ν非常重要.
在石油化工行業中,由于裝置的化學反應復雜、干擾因素多等原因,傳統的機理建模方法往往難以實現.軟測量建模方法經過多年來的發展,其理論體系已日趨完善,在石化行業中已有很多成功的應用.如裂解爐出口乙烯和丙烯收率的軟測量及催化裂化分餾塔粗汽油干點軟測量等[25].在建立軟測量模型的過程中,建模對象的工藝分析過程非常重要.
以某廠燃料氣系統為例,其簡易工藝流程圖如圖1所示.穩態工況下,乙烯裝置自產甲烷氫并入燃氣儲罐F1作為裂解爐燃料;動態工況下,乙烯裝置自產甲烷氫減少,儲罐F1的壓力發生波動,為了保持儲罐F1壓力的穩定,液化石油氣(LPG)燃料并入儲罐F1補足.可見燃料氣熱值主要受燃料氣組份流量和壓力波動的影響.因此,在熱值軟測量建模時應選擇燃料氣流量,燃料氣壓力和LPG壓力作為軟測量模型的輸入變量,而燃料氣熱值則為輸出變量.

圖1 燃料氣系統工藝流程圖Fig.1 Fuel gas system process chart
根據裂解爐燃料氣熱值的影響因素,并結合Online SVM算法,提出裂解爐燃料氣熱值在線建模方法,該方法包括離線訓練和在線模型更新2個模塊,流程如圖2所示.
熱值 影 響 因 素 輸 入 向 量 X= {(qv,p1,p2)i,i=1,…,k-1},熱值輸出向量Y={y i,i=1,…,k-1},其中qv、p1及p2分別為燃料氣流量、燃料氣壓力和LPG壓力,k為樣本總數,y i為樣本i下的燃料氣熱值.
2.2.1 離線訓練模塊 離線訓練模塊的功能是基于離線數據訓練得到初始熱值軟測量模型.將燃料氣流量、燃料氣壓力和LPG壓力作為輸入變量,燃料氣的熱值作為輸出變量送入SVM回歸機中進行學習,得到熱值模型的結構如下:

式中:b為偏置項.在初始訓練中,離線數據集的選擇應該盡量覆蓋所有工況,這樣可以減少新樣本的加入,進而減少模型的更新次數.
2.2.2 在線更新模塊 在線更新模塊的功能是使離線模型學習有價值的新樣本,保證熱值模型在新的工況下仍能準確預測熱值.現場裝置采集到的新樣本首先需要經過ALD條件判斷,以保證所選擇的新樣本相對于建模樣本是近似線性獨立的,然后運行ISVM算法對新樣本進行學習,得到新模型后替換離線模型.

圖2 基于Online SVM的裂解爐熱值軟測量流程圖Fig.2 Soft sensor procedure of calorific value based Online SVM
仿真實驗中使用合成數據、Benchmark數據和燃料氣熱值數據對Online SVM建模算法進行仿真研究.首先運用合成數據和Benchmark數據驗證該算法的有效性,然后將其用于燃料氣熱值實驗,以檢驗算法的自適應性.在仿真實驗中,將SVM[17]和LS-SVM[27]算法與本文算法進行對比研究.采用均方根誤差(RMSE)和平均絕對誤差(MAE)作為評價建模精度的準則.將RMSE和MAE定義如下:

式中:y i、?y i分別表示燃料氣熱值的真實值和預測值,l為樣本總數.
合成數據仿真由Tang等[23]中的非線性函數產生:

式中:z為合成數據輸入,z∈ [-1,1];Δisy為噪聲,Δisy∈[-0.1,0.1];χjsy為非線性函數輸入;F為非線性函數輸出;isy=1,2,…,6,jsy=1,2,…,5.

圖3 合成數據在線預測圖Fig.3 Prediction results of testing samples for synthetic data

表2 合成數據測試結果Tab.2 Testing result for synthetic data_______
從第90個樣本點開始,過程處于突變工況.從圖3中可以看出,此時SVM和LS-SVM算法無法適應這種突變,不能準確地預測輸出,而Online SVM建模算法依靠在線學習能力,能適應工況的改變并準確預測輸出的變化.圖4為測試樣本ALD值與閾值的對比圖,圖4中σ=log(δk+1)為ALD值.從圖中可以看出,超過閾值的樣本主要集中在后半段,對應于過程的突變工況.

圖4 合成數據ALD值圖Fig.4 ALD value on synthetic data
運用3個經典的合成數據集:Friedman 1、2和3[26]來測試提出算法的預測性能.每個數據集共有100個樣本,分別將標準差為0.1的高斯噪聲加入其中.隨機選擇60個樣本用于訓練,40個樣本用于預測.測試結果如表3所示.表3中,tcpu為執行時間,UN為樣本更新數目.測試結果表明:1)LSSVM與Online SVM、SVM相比,具有較快的運算速度,這主要是由于LS-SVM算法引入了誤差范數,使得不等式二次規劃求解問題轉化為二次規劃求解問題,大大降低了計算復雜度,但是也使得所有的樣本都變成了支持向量[27];2)Online SVM 具有在線學習能力,因此,與SVM、LS-SVM相比,具有較好的預測準確性.

表3 Friedman數據集測試結果Tab.3 Testing results for Friedman data Friedman
Benchmark數據集來源于現實事件,主要用于測試機器學習算法的性能.這里選用波士頓房價(Boston housing)和計算機性能(Comp-active)數據集進行仿真驗證[22].波士頓房價數據集包括13個輸入變量和1個輸出變量,共計506個樣本點.數據集根據戶口普查數據預測波士頓各地區房價均值.計算機性能數據集包括12個輸入變量和1個輸出變量,共計6 192個數據點.數據集根據系統活動狀態預測電腦的CPU利用率.仿照Friedman仿真實驗,隨機選擇56個波士頓房價樣本和50個計算機性能樣本測試模型的泛化能力,測試結果如表4所示.從表4中數據可以看出:1)Online SVM預測準確性最高,學習現實世界問題的能力強;2)隨著樣本數量的增加,Online SVM需要的運算時間變長,這主要是由于大樣本非線性規劃問題的求解過程計算消耗大,如果樣本量適度,則可以忽略計算消耗問題.
根據某廠裂解爐燃料氣系統現場采集的數據,運用Online SVM建模算法進行建模預測.為了模擬工業現場的時變性,將采集的130個樣本,分成C1、C2和C3.其中C1包括50個樣本,C2包括50個樣本,C3包括30個樣本.隨機選擇C1和C2中的各40個樣本組成訓練集,剩余的樣本和C3組成測試集.對于離線訓練模型來說,相對于C1和C2,C3屬于突變工況.訓練數據和測試數據的分組情況如圖5所示,其中y為燃料氣熱值.

圖5 訓練數據和測試數據分組示意圖Fig.5 Train sets and test sets schematic diagram of packet
熱值實驗的仿真結果如圖6所示,表5為熱值實驗的詳細測試結果.從表5和圖6中可以看出,具有在線學習能力的Online SVM算法即使處于突變情況仍能很好地預測熱值.
圖7為模型在線學習過程中,新樣本ALD值與閾值的對比圖.從圖7中可看出,超過閾值的樣本同樣集中在后半段.由于在ALD更新條件中,閾值v的選擇對建模預測精度和建模速度都有非常大的影響,表6給出了閾值v不同時,模型性能的變化情況.表6表明:隨著閾值v的增大,參與更新的樣本點減少、模型的預測精度下降,訓練時間大大減少.如表6中最后一列所示,當v=ln(-30.5)時,雖然訓練時間縮短為0.7 s,但同時RMSE和MAE增加到了17.76和11.97.

表4 Benchmark數據集測試結果Tab.4 Testing result for Benchmark data

圖6 燃料氣熱值在線預測圖Fig.6 Prediction results of testing samples for calorific value

表5 燃料氣熱值測試結果Tab.5 Testing result for calorific value

圖7 熱值數據ALD值圖Fig.7 ALD value of calorific value data

表6 不同閾值下熱值模型性能測試結果Tab.6 Performance comparison for calorific value model under different threshold
基于Online SVM的熱值軟測量建模算法,能夠用于燃料氣熱值的在線預測,預測模型的性能可以滿足工業現場的應用要求.建模過程中通過判斷新樣本的ALD值,不但能夠檢測出過程的突變情況,同時又能避免樣本更新所帶來的計算負荷,提高了模型的學習效率.ALD條件中閾值v的選擇對模型的性能存在較大影響,使用者應該根據實際情況選擇合理的值.
本文算法經過一定的修改,還可以用于其他的軟測量建模領域.下一階段研究工作的重點將圍繞如何優化Online SVM的求解過程以縮短計算時間,以及如何更新模型參數和模型樣本以減少對模型預測精度的影響展開.
(
):
[1]劉崇明.乙烯裝置燃料氣系統設計缺陷及改進[J].乙烯工業,2001,13(4):33- 37.LIU Chong-ming.Ethylene plant fuel gas system design defects and improvement[J].Ethylene Industry,2001,13(4):33- 37.
[2]劉漫丹,杜文莉,錢鋒.裂解爐燃料氣熱值的模糊神經網絡軟測量[J].計算機集成制造系統-CIMS,2003,9(5):412- 416.LIU Man-dan,DU Wen-li,QIAN Feng.Soft sensing system of fuzzy-neural network for cracking fuel gas enthalpy[J].Computer Integrated Manufacturing System,2003,9(5):412- 416.
[3]楊思遠,徐佩亮,王振雷.基于小波神經網絡的熱值軟測量建模[J].石油化工自動化,2011,47(4):34- 37.YANG Si-yuan,XU Pei-liang,WANG Zhen-lei.Modeling of soft measurement for calorific values based on wavelet neural network[J].Automation in Petro-Chemical Industry,2011,47(4):34- 37.
[4]THAM M T,MONTAGUE G A,MORRIS A J.A soft-sensors for process estimation and inferential control[J].Journal of Process Control,1991,1(1):3- 14.
[5]YANG Y X,CHAI T Y.Soft sensing based on artificial neural network[C]∥ Proceedings of the 1997 American Control Conference.America:[s.n.],1997,1:674- 678.
[6]ROTEM Y,WACHS A,LEWIN D R.Ethylene compressor monitoring using model-based pca[J].American Institute of Chemical Engineers Journal,2000,46(9):3- 14.
[7]ZHANG H W,LENNOX B.Integrated condition monitoring and control of fedbatch fermentation processes[J].Journal of Process Control,2004,14(1):41- 50.
[8]KADLEC P,GRBIC R,GABRYS B.Review of adaptation mechanisms for data-driven soft sensor[J].Computers and Chemical Engineering,2011,35(1):1- 24.
[9]WANG X,KRUGER U,LENNOX B.Recursive partial least squares algorithms for monitoring complex industrial processes [J].Control Engineering Practice,2003,11(6):613- 632.
[10]HE X B,YANG Y P.Variable mwpca for adaptive process monitoring[J].Industrial and Engineering Chemistry Research,2008,47(2):419- 427.
[11]LI W H,YUE H H,VALLE C S.Recursive pca for adaptive process monitoring [J].Journal of Process Control,2000,10(5):471- 486.
[12]QIN S J.Recursive pls algorithms for adaptive data modeling[J].Computers and Chemical Engineering,1998,22(4):503- 514.
[13]WANG W,CHAI T Y,YU W.Modeling component concentrations of sodium aluminate solution via hammerstein recurrent neural networks[J].IEEE Transactions on Control System Technology,2012,20(4):971- 982.
[14]WANG X,KRUGER U,IRWIN G W.Process monitoring approach using fast moving window pca[J].Industrial and Engineering Chemistry Research,2003,11(6):613- 632.
[15]CHOI S W,MARTIN E B,MORRIS A J.Adaptive multivariate statistical process control for monitoring time-varying processes[J].Industrial and Engineering Chemistry Research,2006,45(9):3108- 3118.
[16]FAISAL A,SALMAN N,YEONG K Y.A recursive plsbased soft sensor for prediction of the melt index during grade change operations in HDPE plant[J].Korean Journal of Chemical Engineering,2006,26(1):14- 20.
[17]CAUWENBERGHS G,POGGIO T.Incremental and decremental support vector machine learning[C]∥ Proceedings of the 2001 in Advances in Neural Information Processing Systems.Spain:NIPS,2001,13:409- 415.
[18]VLADIMIR N V.Statistical learning theory[M].New York:Wiley,1998.
[19]LASKOV P,GEHL C,KR UGER S.Incremental support vector learning:analysis,implementation and applications[J].Journal Machine Learning Research,2006,7(1):1909- 1936.
[20]MA J S,THEILER J,PERKINS S.Accurate on-line support vector regression[J].Neural Compute,2003,15(11):2683- 2703.
[21]GIOVANNI M,FRANCESCO P.Learning to trade with incremental support vector regression experts[C]∥ HAIS'08 Proceedings of the 3rd International Workshop on Hybrid Artificial Intelligence Systems.Spain:HAIS,2008,5271:591- 598.
[22]ENGEL Y,MANNOR S,MEIR R.The kernel recursive least squares algorithm[J].IEEE Transactions on Signal Processing,2004,52(8):2275- 2285.
[23]TANG J,YU W,CHAI T Y.On-line principal component analysis with application to process modeling[J].Neuro Computing,2012,82(1):167- 178.
[24]張照娟.動態模糊神經網絡的研究及在燃料氣熱值軟測量中的應用[D].上海:華東理工大學,2008.ZHANG Zhao-juan.Research on dynamic fuzzy neural network and its application to soft sensing for calorific value[D].Shanghai:East China University of Science and Technology,2008.
[25]孫優賢,褚健.工業過程控制技術(方法篇)[M].北京:化學工業出版社,2005:376- 383.
[26]JEROME H F.Multivariate adaptive regression splines[J].The Annals of Statistics,1991,19(1):1- 67.
[27]SUYKENS J A K,BRABANTER J D,LUKAS L.Weighted least squares support vector machines:robustness and sparse approximation[J].Neurocomputing,2002,48(1):85- 105.