鄒涵
(南京工業大學電子與信息工程學院,江蘇 南京 211816)
非線性動態WPLS航煤干點軟測量
鄒涵
(南京工業大學電子與信息工程學院,江蘇 南京 211816)
針對煉油工業過程存在的多變量、非線性和數據動態性問題,提出一種自回歸移動平均模型與徑向基函數-加權偏最小二乘相結合的非線性動態建模方法。首先建立基于徑向基函數-加權偏最小二乘方法的軟測量模型,然后利用自回歸移動平均模型對數據進行時序分析校正,將動態誤差信息加入到模型中去,實現模型的動態裝換。將該方法應用到加氫裂化航煤干點的軟測量建模中,從而獲得比徑向基函數-加權偏最小二乘算法更高的預測精度。
徑向基函數;自回歸移動平均模型;偏最小二乘;干點;軟測量
在煉油工業的生產過程中,干點是衡量分餾產品質量的一個關鍵指標,直接影響到其質量和收率的高低。但是,該指標是規格參數,無合適的在線分析儀進行測量,只能離線分析且時間長。因此,建立性能優良的干點軟測量模型,可以實現干點質量指標的預測,并為生產操作提供指導。目前,軟測量已提出很多方法,有多種全局多元線性回歸方法[1-3],具有簡潔明確的表達形式,但難以描述非線性系統。為了處理非線性問題,又提出了多種非線性軟測量方法[3-4],然而由于過程生產中自身控制要求的改變、本身特性的變化以及現場環境對其影響,使得過程生產通常處于動態,利用靜態建模方法難以體現動態特性,造成模型預測精度低且不能持續使用。所以僅僅考慮非線性特性是不夠的,需要將對象的動態信息融合到模型中去。
本文提出一種自回歸移動平均(autoregressionmnving average,ARMA)模型與徑向基函數-加權偏最小二乘(Radial basis function-Weighted partial least regression,RBF-WPLS)相結合的軟測量方法。該方法首先建立基于RBF-WPLS的軟測量模型,即將具有非線性樣本數據映射到高維特征空間中,在高維特征空間中建立WPLS線性回歸模型;然后,利用ARMA模型對數據進行動態估計,通過增加動態校正環節,實現了對靜態模型的動態校正。
1.1 加權偏最小二乘回歸
加權偏最小二乘回歸方法是對偏最小二乘回歸方法的改進算法。下面對PLS原理[5]做簡單描述:
設樣本容量為n,自變量數據矩陣X為n×p(n>p)維,因變量數據矩陣Y為n×q(n>q)維,提取PLS主元采用NIPALS算法[6]。設T是前t個PLS成分組成的n×t維隱變量矩陣,且有T=XU,則PLSR模型

式中:U——p×t維轉換矩陣;
C——t×q維回歸系數矩陣;
E——n×q維的殘差矩陣。
在NIPALS算法中可同時計算出C與U,則q個因變量的預測值可以如下回歸方程計算:

現實情況中,由于每個樣本貢獻率不同,導致其權重也不同。為了體現這種情況,可以采用加權回歸方法[7],即對各個樣本賦予不同的權值,權值回歸模型為

式中:W——權值系數。
權值大小需根據樣本和預測對象之間的歐氏距離來分配大小。歐式距離與預測能力呈負相關關系[7]。即樣本與預測對象的歐式距離越大,所分配的權值將越小。確認權值系數有很多種方法,本文采用一種較簡單的方法。設權值分配參數為m(m為正整數),則與預測對象歐式距離最近的前m個樣本權值為1,其余樣本權值為0。
1.2 徑向基函數-加權偏最小二乘回歸
徑向基函數-加權偏最小二乘回歸算法是在加權偏最小二乘算法之前進行徑向基函數的非線性變換。通過輸入空間映射到一個新的空間,輸出層在新的空間中進行線性組合,從而將線性不可分問題轉化為線性可分[8]。本文采用最常用的高斯徑向基函數做為隱含層節點的徑向基函數。其隱含層節點的加權輸出為

式中:λi——隱含層輸出的權值系數;
m——徑基個數;
ci,σi——第i個是高斯函數的中心和寬度參數;
‖·‖——歐式范數。
RBF網絡中需要學習3個參數,即高斯函數的中心ci、寬度σi以及隱含層輸出的權值系數λi。高斯函數的中心ci和寬度σi可以采用K-均值聚類方法[9]確定,權值系數λi可以采用偏最小二乘方法算出。
ARMA模型[10]是研究時間序列、用于平穩時間的重要方法。即序列的當前值除了與自身的過去值存在關系,并且還與其以前進入系統的外部干擾存在一定的依賴關系,則該模型在表現刻動態特性時,模型中既包括自身的滯后項,也包括過去的外部干擾誤差項。通常ARMA模型可表示為

對其引入后向算子B有:Bxt=xt-1,B2Xt=Xt-2,(c為常數)。對于上述ARMA模型表達式,分別令:

則式(5)轉變為如下表達式:

式中:xt——正態、平穩的時間序列;
at——隨機干擾誤差項;
B——延遲算子;
φ(B),θ(B)——算子多項式。
模型稱為p階自回歸、q階滑動平均模型,記作ARMA(p,q)。
ARMA(n,n-1)模型具有將隨機平穩系統逼近到任意精度的功能,通過遞增法逐步逼近,需找適合的n值,確定模型階數n。同時,n以2為遞增量,不需要對ARMA(n,n-1)((q≠p-1))模型的討論,從而降低復雜度[11]。
對于ARMA(n,n-1)模型階次的確定,利用F校驗方法來判定。從n取1開始逐漸增大取值,直到獲得滿意的模型階次。設H0:φ2n+2=0,θ2n+1=0,Q0為ARMA(2n+2,2n+1)模型殘差平方和,Q1為ARMA(2n,2n-1)模型殘差平方和,則:

式中:s——被校驗參數的個數;
r——模型參數的總個數;
n——樣本長度。
若F>Fa,則H0不成立,模型將繼續增加階次;否則,ARMA(2n,2n-1)是合適的模型。而Fa的值可由F分布表和預先給定的置信度a來確定。
首先利用RBF-WPLS算法建立軟測量預測模型,將該模型訓練輸出值y?m與真實測量ym值相減,
得到一個關于輸出值誤差Δym的時間序列值,利用ARMA(n,n-1)模型對該時間序列進行建模,得到關于預測誤差的ARMA模型。將以上兩個模型相結合進行模型預測時,RBF-WPLS模型輸出值減去ARMA模型的誤差值,即得到輸出變量的預測結果。該模型結構框圖見圖1。

圖1 基于RBF-WPLS和ARMA的軟測量模型結構
其實現過程步驟如下:
(1)將每個訓練樣本作為RBF的基向量(ci=xi,i=1,2,…,n),使得隱含層節點個數等于樣本數。對輸入矢量x執行非線性變換,得到隱含層輸出矢量Ri(x)(i=1,2,…,n),即

式中:e——大于0的常數。
將得到的輸出矢量Ri(x)組成n×n維的隱含層輸出矩陣Ri(x)。
(2)采用WPLS回歸方法,假定提取的主元個數為t(t=1,2,…,p);權值分配參數為m(m=t+1,t+2,…,n-1)。
(3)利用舍一交叉驗證的思想,在所有樣本n中選出一個樣本來,設為xi(i=1,2,…,n)。將其作為測試樣本,剩余n-1個樣本均作為訓練樣本。并且在訓練集中,將與測試樣本距離最近的m個樣本權值設為1,其余樣本權值設為0。構建權值矩陣W。
(4)分別對自變量矩陣X和因變量矩陣進行加權處理,得到m×p維的自變量矩陣Xm=WX和m×q維的因變量矩陣Ym=WY。
(5)通過NIPALS算法,從自變量矩陣Xm中提取t個主元,構建m×t維隱變量數據矩陣Tm,t同時計算對應的p×t維轉換矩陣Um,t和t×q維回歸系數矩陣Cm,t。
(6)采用相對誤差平方和Em,t來確定m和t的值對于1到n記錄每個Em,t的值。其中y?j為測試樣本xj的預測矢量為其第l個分量;yjl為第j個實際測量值。
(7)構建相對誤差矩陣R,將每個Em,t值對應輸入其中,并在矩陣其他沒有對應的位置添入+∞。當誤差矩陣中Em,t取最小值時,即為Em,t的最優目標值,對應行列分別記為m0和t0。
(8)對于預測對象,將權值分配參數取為m0,提取的主元個數取為t0,按(2)~(6)步驟建立回歸模型。
(9)將訓練樣本集經過WPLS模型處理后,得到一組模型輸出值y?m,將其與真實測量值ym相減,得到關于訓練輸出值誤差時間序列值Δym,對該時間序列進行ARMA建模,確定ARMA(n,n-1)模型階數。模型階數n的確定采用遞增系列法逐步逼近,找到最合適的n值。
(10)利用上述兩個模型對測試樣本進行仿真,軟測量模型最終的輸出值即為

以某石化公司加氫裂化裝置為研究背景,經現場了解工藝情況及相關性分析后發現:航煤干點主要受10個變量的影響:航煤抽出量x1,回流溫度x2,回流量x3,輕石腦油抽出量x4,重石腦油抽出點溫度x5,重石腦油抽出量x6,進料量x7,進料溫度x8,塔釜溫度x9,塔頂壓力x10。現將10個變量作為模型的輸入變量,以分餾塔的航煤干點作為輸出變量,對現場數據進行采集,并剔除病態數據,共采集了174組數據。將其中的124組作為訓練數據,其余的50組作為測試數據,采用ARMA-RBF-WPLS方法建立航煤干點軟測量模型。根據上述ARMA-RBF-WPLS建模步驟,需要尋找Em,t的最小值來確定權值分配參數和主要個數。由趨勢性分析得到Em,t取最小值時,分別對應的權值分配參數m為93,主元個數t為8,并選出與預測對象之間歐氏距離最小的93個樣本,其權值分配為1,剩余樣本權值分配為0,得到加權樣本。
ARMA模型參數階數的確定,從ARMA(2,1)模型開始,以2為步長,建模ARMA模型,每當n增加時,通過F準則去檢驗判定。當模型增加到ARMA(5,4)時,與ARMA(4,3)對比發現在預定的顯著誤
差水平上F值下降不顯著,所以模型階數應停止增加,選擇ARMA(4,3)為航煤干點的軟測量模型。

圖2 ARMA-RBF-WPLS模型預測結果與實際值對比
圖2給出了ARMA-RBF-WPLS模型預測值與工廠實際值對比曲線。
為做對比,采用相同數據用RBF-WPLS方法建立干點預測模型。圖3給出了RBF-WPLS模型預測值與工廠實際值對比曲線。從表1和圖2~圖3可以看出,ARMA-RBF-WPLS模型與RBF-WPLS模型相比,結構更加精確,誤差更小,更好地反映了航煤干點的變化趨勢。在50組檢驗樣本中,采用ARMA-RBF-WPLS模型的均方差為1.2268℃,82%的樣本誤差小于±1℃,98%的樣本誤差小于±2℃;采用RBF-WPLS模型的均方差為1.6514℃,70%的樣本誤差小于±1℃,90%的樣本誤差小于±2℃。ARMARBF-WPLS模型與RBF-WPLS模型對比,顯示出更高的擬合精度。

圖3 RBF-WPLS模型預測結果與實際值對比

表1 ARMA-RBF-WPL模型和RBF-WPLS模型的結果比較
通過利用RBF-WPLS和AMRA相結合的方法實現了系統動態過程的非線性軟測量建模,利用AMRA模型克服了RBF-WPLS算法難以描述動態特性的缺點,利用歷史輸出值對當前時刻的影響實現了預測誤差的動態估計,體現了系統的動態特性。將該方法應用于加氫裂化第一分餾塔航煤干點的預測,仿真結果驗證了該方法與RBF-WPLS軟測量模型相比具有更高的預測精度。
[1]Bastion P,Esposito V V,Michel T.PLS generalized linear regression[J].Computational Statistics and Data Analysis,2005,48(1):17-46.
[2]石琳,湯佳佳,于濤,等.基于樣條變換的非線性PLS的反應高爐爐溫的參數預測[J].鋼鐵研究學報,2013,25(2):22-25.
[3]蔡華斌.基于神經網絡的電機轉矩軟測量研究[J].中國測試技術,2007,33(2):50-52.
[4]Nicolai B M,Theron K I,Lammertyn J.Kernel PLS regerssion on waveler transformed NIR spectra for prediction of sugar content of apple[J].Chemoertrics and Intelligent Laboratory Systems,2007,85(2):243-252.
[5]顏學峰.基于徑基函數-加權偏最小二乘回歸的干點軟測量[J].自動化學報,2007,33(2):193-196.
[6]計智偉,吳耿鋒.基于層次聚類算法和偏最小二乘的特征選擇[J].計算機工程與設計,2009,30(21):4931-4935.
[7]劉海濤,魏汝禪,蔣國萍.基于加權偏最小二乘回歸的軟件成本估算方法[J].計算機工程,2012,38(21):36-39.
[8]賈明興,趙春暉,王福利,等.基于RBF神經網絡的非線性主元分析方法[J].儀器儀表學報,2008,29(3):453-457.
[9]韓敏,劉曉欣.基于互信息的分布式輸入變量選擇多元序列預測研究[J].自動化學報,2012,38(6):999-1006.
[10]閻平凡,張長水.人工神經網絡與模擬進化計算[M].北京:清華大學出版社,2000:46-48.
[11]Ives A,Abbott K C,Ziebarth N L.Analysis of ecological time series with ARMA(p,q)model[J].Ecology,2010,91(3):858-871.
Soft sensing for dry point of jet fuel based on nonlinear dynamic WPLS
ZOU Han
(College of Electronics and Information Engineering,Nanjing Technology University,Nanjing 211816,China)
A nonlinear dynamic modeling method combining auto-regressive and moving average and radial basis function-weighted partial least squares regression is presented to solve the problem according to the requirements for refining industrialprocesses with multivariable,nonlinear and dynamic data.Firstly,this approach built RBF-WPLS model.Then,ARMA models use the data correction timing analysis,and dynamic error message will be added to the model to achieve a dynamic model.Finally,the proposed ARMA-RBF-WPLS was used to predict the dry point of jet fuel in hydrocracking unit,and it obtained highly precise prediction results compared with RBF-WPLS methods.
radial basis function;ARMA model;partial least square;dry point;soft sensor
TP273;TE62;O224;O241.5
:A
:1674-5124(2014)03-0121-04
10.11857/j.issn.1674-5124.2014.03.032
2013-11-16;
:2014-01-22
鄒 涵(1990-),男,江西豐城市人,碩士研究生,專業方向為復雜過程的先進控制。