999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于核慢特征回歸與互信息的常壓塔軟測量建模

2017-10-13 15:31:16蔣昕祎杜紅彬李紹軍
化工學報 2017年5期
關鍵詞:特征方法

蔣昕祎,杜紅彬,2,李紹軍

?

基于核慢特征回歸與互信息的常壓塔軟測量建模

蔣昕祎1,杜紅彬1,2,李紹軍1

(1華東理工大學化工過程先進控制與優(yōu)化技術教育部重點實驗室,上海200237;2中國石油天然氣股份有限公司獨山子石化研究院,新疆克拉瑪依833699)

針對工業(yè)過程的非線性及動態(tài)特性,提出了一種新的慢特征回歸軟測量方法。該方法首先通過添加時延數(shù)據(jù)構造動態(tài)數(shù)據(jù)集,利用互信息最大化準則篩選變量從而減少信息冗余的影響。同時該方法在慢特征分析的基礎上引入核函數(shù)擴展,加強模型處理非線性數(shù)據(jù)的能力,并將獲得的核慢特征用于回歸建模。核慢特征分析通過分析樣本的變化,提取具有緩慢變化特征的成分,可以有效地刻畫工業(yè)過程的變化趨勢,提升回歸模型精度。最后該方法的有效性在常壓塔常頂油干點與常一線初餾點的軟測量模型中得到了驗證。

慢特征分析;互信息;動態(tài)建模;常壓塔;石油;預測

引 言

在原油蒸餾過程中,常壓塔頂及其側線的油品質量都會受到初餾點、終餾點、干點等指標的影響。為了能實時測量并監(jiān)控這些指標,可以使用在線分析儀或者人工離線分析的方法,但前者維護成本高、后者時滯大及精度低的問題都會影響產(chǎn)品質量。目前,許多學者利用軟測量技術來解決此類問題,近年來數(shù)據(jù)儲存及獲取的便利使得數(shù)據(jù)驅動軟測量方法得到了廣泛應用。Shang等[1]將深度神經(jīng)網(wǎng)絡引入軟測量建模,估計常壓塔重柴油95%分餾點,通過半監(jiān)督學習充分利用了工業(yè)數(shù)據(jù),模型精度優(yōu)于神經(jīng)網(wǎng)絡等方法。Li等[2]利用多核學習與核主元分析改進了最小二乘支持向量機,建立了常壓塔航空煤油干點與閃點的軟測量模型。Napoli等[3]針對小樣本建模問題,通過樣本重采樣與噪聲注入構成多個數(shù)據(jù)集,集成多個神經(jīng)網(wǎng)絡,證明了其在煤油冰點軟測量建模中的有效性。其他算法如偏最小二乘法[4-5](partial least square,PLS)、主元回歸[6](principal component regression,PCR)、高斯過程回歸[7-8](gaussian process regression,GPR)等也廣泛應用于軟測量建模。

工業(yè)過程一般具有緩慢變化的動態(tài)特性,歷史數(shù)據(jù)之間往往存在時間關聯(lián),歷史數(shù)據(jù)也會影響模型構造,因此常會引入時延變量構造動態(tài)模型[9-10]。引入時延變量的新數(shù)據(jù)集包含了各變量的歷史信息,使得后續(xù)構造的模型能更有效地利用歷史數(shù)據(jù)中的隱藏信息。

為了能從數(shù)據(jù)中提取出有效信息,常用的特征提取方法有主成分分析、獨立成分分析等。前者通過特征提取使得新成分的方差最大,后者通過特征提取使得新成分間的相關性最小,這兩種方法都是從變量角度出發(fā)構造新的成分,但都未分析樣本間的變化情況。Wiskott等[11]在2002年提出了慢特征分析(SFA),并將其應用于目標識別。與一般特征提取方法不同的是,SFA從樣本的角度出發(fā),分析樣本的變化情況,提取出變化緩慢的新成分,反映過程數(shù)據(jù)的動態(tài)信息。近年來許多學者在其論文的基礎上提出了改進算法并應用于模式識別[12-14]、盲源信號分離[15-16]、過程監(jiān)控[17-19]等領域。文獻[20-21]將其應用于質量指標預測與軟測量建模,通過工業(yè)數(shù)據(jù)證明了慢特征回歸(SFR)要優(yōu)于傳統(tǒng)的軟測量方法。

慢特征回歸可以有效地利用數(shù)據(jù)的動態(tài)特性,但是該方法是基于二項式擴展,處理非線性數(shù)據(jù)的能力較差,同時當模型的變量過多時,時延動態(tài)數(shù)據(jù)集的構造與二項式擴展方法必然會造成維數(shù)災難問題,也可能導致過擬合的問題。因此,針對工業(yè)過程非線性與動態(tài)特性的問題,本文提出了一種新的慢特征回歸方法,該方法在其基礎上利用核函數(shù)擴展,加強模型處理非線性數(shù)據(jù)的能力。同時構造具有時延變量的動態(tài)數(shù)據(jù)集,為了避免出現(xiàn)信息冗余,分析各時延變量與主導變量間的互信息值,篩選變量進行核慢特征回歸(kernel slow feature regression,KSFR)。常壓塔的常頂油干點及常一線初餾點的軟測量模型驗證了本方法優(yōu)于傳統(tǒng)建模方法,具有更高的預測精度。

1 核慢特征回歸

1.1 慢特征回歸

慢特征回歸(SFR)是一種基于慢特征分析的回歸方法,主要分成兩個部分:(1)慢特征分析;(2)慢特征線性回歸。

1.1.1 慢特征分析 慢特征分析(SFA)是由Wiskott提出的一種在快速變化的時序數(shù)據(jù)中抽取緩慢變化特征的批量學習算法。SFA不僅能夠得到全局最優(yōu)解,而且其特征可以按照變化速率快慢依次提取。

現(xiàn)有訓練數(shù)據(jù)tr={(),()}=1,2,…,n,慢特征分析的目標是要從現(xiàn)有的維輸入數(shù)據(jù)矩陣()={1(),2(),…,x()}中提取到維變量()={1(),2(),…,T()},同時變量T()具有變化緩慢的特征。

為了從輸入數(shù)據(jù)中提取慢特征,需要尋找一組映射函數(shù)()={1(),2(),…,f()},使得()=(())的每個變量盡可能變化緩慢,一般采用關于時間的一階導數(shù)平方的均值來衡量變化速率。優(yōu)化問題框架如下[22]

并滿足以下3個條件

(2)

(4)

在線性情況下,慢特征的提取與主元提取類似,每個慢特征T()都是所有輸入變量的線性組合T()=()。假設輸入數(shù)據(jù)()已經(jīng)標準化處理,那么式(1)、式(3)就可以寫為

(6)

結合式(5)、式(6)可得

由式(7)可知,使其成立的權向量滿足

W=W(8)

其中,=(1,2,…,w)為特征向量構成的特征矩陣,是由廣義特征值1,2,…,構成的特征值對角陣,且1<2<…<。將w=Bw代入式(7)得

可以通過求解式的廣義特征值,獲得特征矩陣,映射輸入數(shù)據(jù)獲得慢特征。通常,這個優(yōu)化問題的求解可以通過兩步奇異值分解(SVD)來實現(xiàn),推導流程如圖1所示。具體分為以下4個步驟。

圖1 SFA流程圖

Fig.1 Flow chart of SFA

(1)標準化。首先將輸入數(shù)據(jù)()={1(),2(),…,x()}標準化預處理,各變量的標準化結果為,構成標準化后的輸入數(shù)據(jù)bz()={1bz(),2bz(),…,bz()},其中={1,2,…,}與={1,2,…,}分別是輸入數(shù)據(jù)的均值向量以及標準差陣。為了公式簡化,下文用()表示已經(jīng)標準化后的數(shù)據(jù)。

(2)非線性擴展及中心化。接著對輸入數(shù)據(jù)()進行非線性擴展。考慮到非線性問題,在預處理時通常需要非線性擴展,SFA采用的是二次多項式擴展

()=(())={1,…,x,11,12,…,xx} (10)

這樣維輸入數(shù)據(jù)通過二項式擴展(?)變成了維,其中。然后對擴展后的數(shù)據(jù)()進行中心化,構成中心化后的輸入數(shù)據(jù)c()=()-,其中是各變量的均值向量。為了公式簡化,下文用()表示經(jīng)過非線性擴展與中心化的輸入數(shù)據(jù)。

(3)白化處理。為了能滿足式(3)、式(4)的條件,繼續(xù)對()進行白化處理。白化處理可以使各變量不相關,同時為單位方差。定義=〈()T()〉表示()的協(xié)方差陣,由SVD可知=UT,白化矩陣=-1/2T,白化后的數(shù)據(jù)為

()=()T=()-1/2(11)

因此,可得〈()T()〉=。將()=()T與=〈()T()〉代入

ST=(12)

需要注意這里會出現(xiàn)=diag{1,2,…,}里的特征值極小的情況。白化的一個作用就是去相關,因此本文設置閾值=1×10-7與比較,舍棄小于的特征值,從而實現(xiàn)降維。

(4)求取映射向量及相應慢特征。上面幾個步驟已經(jīng)把變量進行了預處理,使其滿足單位方差、零均值以及互不相關,同時也實現(xiàn)了非線性擴展,最后確定映射向量,按照式(8)可得

w=Bw(14)

由于可能會出現(xiàn)非滿秩情況,直接用廣義特征值求映射向量會出現(xiàn)計算錯誤,故需要白化處理將問題轉換成一般特征值求解[22]。

將式(14)左乘白化矩陣

w=SBw(15)

將式(12)、式(13)與T(T)-1=代入式(15)可得

通過這幾步代換,只需要一般SVD就可求出矩陣,即的協(xié)方差陣的特征向量,從而得到慢特征映射向量

(17)

最后,利用映射得到第個慢特征T()=()。由式(9)可知,慢特征變化快慢由矩陣的特征值決定,因此第一慢特征的映射向量1就是矩陣最小特征值1對應的特征向量與T的乘積,然后第二慢特征的映射向量2就是第二小特征值2對應的特征向量與T的乘積,依次類推可得其他慢特征。

1.1.2 慢特征回歸 獲得維慢特征()={1(),2(),…,T()}后,通過最小二乘回歸求出輸出向量()與維慢特征()的回歸系數(shù),最后利用回歸系數(shù)就可以預測新輸入數(shù)據(jù)的對應輸出。

1.2 核慢特征回歸(KSFR)

慢特征分析在數(shù)據(jù)預處理階段,為了加強算法處理非線性數(shù)據(jù)的能力,一般會采用多項式擴展的方法,但當數(shù)據(jù)維數(shù)過多時,多項式擴展會導致維數(shù)災難問題,嚴重影響運算速度與精度,而且這種擴展并不能顯著提高算法處理非線性數(shù)據(jù)的能力,特別是對于一些復雜的工業(yè)過程,其高維數(shù)據(jù)之間往往存在很強的非線性,這時多項式擴展的弊端就會凸顯出來。

核技巧(kernel trick)是一種處理非線性數(shù)據(jù)的方法,它通過非線性變換將低維空間的樣本映射到高維特征空間,只要選取合適的非線性變換,就能將原輸入空間的非線性問題轉化為高維特征空間中的線性或近似線性問題。經(jīng)過非線性映射,數(shù)據(jù)集得到以下變換

為了克服維數(shù)災難,需要引入核函數(shù)。對任意的均滿足(x,x)=K,j=()T(),即將高維空間的內積運算轉化為輸入空間的核函數(shù)運算。高維矩陣=T中的每個元素都用核函數(shù)表示,稱其為核矩陣[23]

(19)

常用的核函數(shù)有多項式核函數(shù)、指數(shù)型核函數(shù)、高斯徑向基核函數(shù)等,本文采用學習能力強的高斯徑向基核函數(shù)

這樣,利用核函數(shù)替代多項式擴展從而加強算法處理非線性數(shù)據(jù)的能力,實現(xiàn)核慢特征回歸。其主要改進在非線性擴展部分,用核函數(shù)擴展的數(shù)據(jù)替代非線性擴展的(),這樣對應的優(yōu)化目標就是[24]

(21)

同時求解映射向量的廣義特征值問題就轉換為

W=W(22)

核慢特征回歸(KSFR)的具體步驟如下。

(1)訓練部分tr={(),()}=1,2,…,n

① 標準化,獲得標準化后的數(shù)據(jù){(),()},均值,及標準差,

③確定,獲得的白化矩陣,分別求得白化后的數(shù)據(jù),利用白化實現(xiàn)降維

=T(23)

=AST(24)

④ 求取的特征向量,并轉換為映射向量,映射得到慢特征

(26)

=(27)

⑤利用最小二乘法求得慢特征與標準化的輸出數(shù)據(jù)間的回歸系數(shù)=(T)-1。

(2)測試部分te={te()}=1,2,…,n

① 利用標準化測試數(shù)據(jù)。

③ 利用映射向量,獲得慢特征te

te=te(28)

④ 預測測試數(shù)據(jù)輸出值′p=te

⑤ 反標準化,獲得最終預測值p。

利用核函數(shù)擴展改進慢特征回歸提升了算法處理非線性數(shù)據(jù)的能力,同時也避免了多項式擴展的維數(shù)災難問題,可以提升算法性能。

2 動態(tài)建模與互信息變量選擇

在工業(yè)過程中,各變量數(shù)據(jù)的采集一般都是按照固定時間進行的,各采樣點間存在明顯的時間相關性,當前時刻的數(shù)據(jù)并不能完全刻畫過程的動態(tài)信息。因此為了獲得工業(yè)過程數(shù)據(jù)的動態(tài)信息,考慮歷史數(shù)據(jù)對于當前的影響,可以引入時延變量數(shù)據(jù)構造動態(tài)數(shù)據(jù)集。

原數(shù)據(jù)集為={(),()}=1,2,…,n,其中()={1(),2(),…,x()},輸入變量共有維,每個變量有個樣本。引入時延階數(shù),就可以構造動態(tài)數(shù)據(jù)集,輸入變量變成了(+1)維,即()≡{(),(-1),(-2),…,(-)}。動態(tài)數(shù)據(jù)集的構造使得模型趨于動態(tài),有利于分析工業(yè)數(shù)據(jù),但是同樣也造成了維數(shù)過大的問題,過多的時延變量會導致信息冗余,最后可能會發(fā)生過擬合問題。因此,可以通過變量選擇進行降維處理[25]。本文采用互信息(mutual information,MI)。

互信息能夠反映兩個變量之間的統(tǒng)計依賴程度,其定義來源于信息論中熵的概念。熵也稱作信息熵或Shannon熵,通過數(shù)值形式來表達隨機變量取值的不確定性程度,從而描述相應變量的信息含量大小。變量的信息熵定義如式(29)所示,其中()為的概率密度分布函數(shù)。

互信息表示的是兩個隨機變量之間的關聯(lián)程度,即給定一個隨機變量后,另一個隨機變量不確定性的削弱程度。

(30)

其中,p(),p()和p,y(,)分別是變量與的邊緣概率密度函數(shù)以及聯(lián)合概率密度函數(shù)。可以通過核密度估計或者直方圖法來估計密度函數(shù)。核密度估計雖然估計精度較高,但是需要選擇核函數(shù)以及設置帶寬;直方圖法則實現(xiàn)簡單,只需要等間隔地劃分變量與的數(shù)據(jù)構成的二維平面,判斷符合子區(qū)間的樣本個數(shù),從而依次確定邊緣以及聯(lián)合概率密度函數(shù)[26]。

當變量與是相互獨立或者完全無關時,互信息(,)等于0,即兩變量之間不存在共同擁有的信息。當變量與相互依賴程度很高時,互信息(,)會很大,即兩變量之間存在較多的共同信息[27-28]。基于互信息的變量選擇準則有很多[29],本文采用的互信息最大化準則,即通過比較不同變量與因變量間的互信息值,從中選擇互信息較大的變量作為具有統(tǒng)計相關性的有效變量。

3 基于DMI-KSFR的軟測量方法

基于核慢特征回歸與互信息的軟測量建模流程如圖2所示。

(1)在原始訓練數(shù)據(jù)的維輸入tr()的基礎上引入時延階數(shù),構造(+1)維動態(tài)數(shù)據(jù)集d_te()≡{tr(),tr(-1),tr(-2),…,tr(-)},使得數(shù)據(jù)集包含各變量的歷史信息,充分考慮過程的動態(tài)性,同時對測試數(shù)據(jù)輸入te()構造相同時延階數(shù)的動態(tài)數(shù)據(jù)集d_te()。

(2)針對動態(tài)數(shù)據(jù)集的第(=1,2,…,+)個維變量,計算其與訓練數(shù)據(jù)輸出tr間的互信息

MI,y=(x,tr) (31)

將這MI,y∈1×(kd+k)個互信息值降序排列,選擇前個最大值對應的變量,構成動態(tài)互信息輸入數(shù)據(jù)集DMI_tr()∈×NC。同時對測試數(shù)據(jù)的動態(tài)數(shù)據(jù)集te()選擇相同的變量構造DMI_te()。

(3)對動態(tài)互信息輸入數(shù)據(jù)集DMI_tr(),進行核慢特征分析,獲得各個核慢特征的權向量以及各核慢特征tr,j,同時利用訓練獲得的權向量構造測試數(shù)據(jù)的核慢特征te,j。

(4)對得到的核慢特征tr和訓練數(shù)據(jù)輸出tr建立最小二乘回歸模型,獲得模型回歸參數(shù)=(Ttrtr)-1trtr。最后利用回歸參數(shù)估計測試數(shù)據(jù)的輸出p。

4 常壓塔質量指標軟測量建模研究

常壓蒸餾塔是煉油企業(yè)的首要生產(chǎn)裝置,其生產(chǎn)水平的高低直接影響著原油的利用率和企業(yè)的經(jīng)濟效益。作為一種典型的多側線采出蒸餾塔,常壓塔從側線分別抽出煤油、汽油、柴油等產(chǎn)品。這些側線餾分經(jīng)汽提塔提出輕組分,經(jīng)換熱回收一部分熱量分別冷卻后送出裝置。塔底未經(jīng)汽化的重油經(jīng)過熱水蒸氣提出輕組分后,作減壓塔進料。為了使塔內各部分的汽、液負荷比較均勻,并充分利用回流熱,在塔中各側線抽出口之間打入中段循環(huán)回流[30]。

常壓塔餾出產(chǎn)品需要控制以下質量指標:常頂油(石腦油)的干點,常一線油(汽油)的閃點、冰點、餾程,柴油的凝點、95%餾出溫度等。本文分析的是常頂油干點以及常一線初餾點。干點和初餾點都是油品的重要質量指標,初餾點會影響到本側線油品的質量與上一側線油品的收率。干點則會干擾本側線的產(chǎn)品質量與下一側線的餾分收率[31]。本文利用基于核慢特征回歸與互信息的方法分別對常頂油干點和常一線初餾點進行軟測量建模。

本文使用了兩個指標來評判算法性能,分別是均方根誤差(RMSE)與可決系數(shù)(2)

4.1 某常壓塔常頂油干點軟測量建模

常壓塔頂部的主要產(chǎn)品是常頂油,常頂油經(jīng)過脫丁烷塔后生成石腦油。常頂油的干點越高,會導致其產(chǎn)出油品的重組分過高,影響其油品質量,使得后續(xù)生成的石腦油中芳烴含量過高,不適于裂解反應,影響乙烯、丙烯等產(chǎn)量。為了建立常頂油干點的軟測量模型,本文選擇6個輔助變量,分別是常頂壓力、常頂溫度、回流溫度、采出比、常頂循流量和常一、二、三線的采出量。常頂油干點數(shù)據(jù)集總共有500組樣本,前400組用于模型訓練,后100組用于模型效果測試。

本方法需要設置的參數(shù)是動態(tài)數(shù)據(jù)集的時延階數(shù)、互信息最大化選擇的變量個數(shù)以及高斯核函數(shù)的核寬度。本文對訓練數(shù)據(jù)集采用十折交叉驗證設置階數(shù)=1,這樣總的變量就有6×(1+1)=12個,并通過互信息的方法選擇11個相關變量,具體比較見圖3。通過多次試驗設置高斯核寬度為450。

首先,觀察提取到的核慢特征的情況。圖4、圖5分別是訓練數(shù)據(jù)與測試數(shù)據(jù)中提取到的前4個變化最緩慢的核慢特征,可以發(fā)現(xiàn)每個核慢特征的變化情況都不同。縱向比較各核慢特征,可以發(fā)現(xiàn)第一核慢特征變化最緩慢,而越到后面的特征變化越快。橫向比較訓練數(shù)據(jù)與測試數(shù)據(jù)的核慢特征,可以發(fā)現(xiàn)兩者的變化趨勢基本是一致的,具有相同的變化頻率。因此核慢特征分析可以有效地提取到變化緩慢的信息。

為了驗證本方法的有效性,需要縱向比較幾點改進對于模型性能的影響,選擇以下方法。

(1)慢特征回歸SFR,采用非線性擴展。

(2)動態(tài)慢特征回歸(dynamic SFR,DSFR),通過動態(tài)建模構造數(shù)據(jù)集后,采用非線性擴展。

(3)核慢特征回歸(KSFR),采用核函數(shù)擴展的慢特征回歸。

(4)動態(tài)核慢特征回歸(dynamic KSFR,DKSFR),通過動態(tài)建模構造數(shù)據(jù)集后,采用核函數(shù)擴展的慢特征回歸。

(5)本方法DMI-KSFR,通過動態(tài)建模與互信息變量選擇構造數(shù)據(jù)集后,采用核函數(shù)擴展的慢特征回歸。

圖6是不同方法的預測值與實際值的比較,圖中各點橫坐標表示的是預測值,縱坐標表示的是實際值,數(shù)據(jù)點離對稱軸虛線越近,則表示預測效果越好。分析圖6和表1可以發(fā)現(xiàn),本文的幾點改進可以提高模型性能。引入動態(tài)建模的思想,可以從動態(tài)角度分析工業(yè)數(shù)據(jù),提高模型精度;利用核函數(shù)擴展替代原有的二項式擴展,可以加強模型處理非線性數(shù)據(jù)的能力;加入互信息變量篩選,可以剔除動態(tài)建模造成的變量冗余問題,進一步提高模型精度。RMSE與2的提升表明后續(xù)改進提升了模型的擬合程度。

表1 不同方法的比較

圖7是本方法對于測試數(shù)據(jù)的預測效果。分析圖7與圖5可以發(fā)現(xiàn),整體數(shù)據(jù)具有一定的周期性,使得圖6存在數(shù)據(jù)點處于同一水平線,即這些點的實際值都是相同或近似的。本方法獲得的預測值與實際值構成的數(shù)據(jù)點離中心虛線最近,因此本方法可以有效地提升模型的預測精度。

4.2 某石化常壓塔初餾點軟測量建模

某石化煉油裝置常一線的主要產(chǎn)品是汽油。常一線初餾點過低,會使其輕組分過高,影響本側線的油品質量,同時影響上一側線的油品收率。因此需要通過軟測量建模實時分析常一線初餾點指標,保證工況正常運行。

為了建立常一線初餾點的軟測量模型,本文選擇11個輔助變量,分別是常頂回流量、常頂循流量、常一中流量、常壓塔塔底汽提蒸汽量、汽提塔塔頂溫度、重沸器出入口溫度、常一中油出入口溫度、汽提塔油氣溫度、常一線汽提塔出口溫度等。本數(shù)據(jù)集共有135組樣本,樣本采樣間隔為1 h。本文選擇前100組數(shù)據(jù)作為訓練數(shù)據(jù),后35組數(shù)據(jù)作為測試數(shù)據(jù)。

這里需要設置的參數(shù)還是時延階數(shù)、互信息選擇的變量個數(shù)以及高斯核寬度。本文對訓練數(shù)據(jù)集采用十折交叉驗證設置階數(shù)=2,這樣總的變量就有11×(2+1)=33個,并通過互信息的方法選擇31個相關變量,具體比較見圖8。通過多次試驗設置高斯核寬度為470。

為了分析本方法的優(yōu)越性,與其他傳統(tǒng)建模方法進行橫向比較,選擇以下方法。

(1)動態(tài)慢特征回歸(DSFR),通過動態(tài)建模構造數(shù)據(jù)集后,采用非線性擴展的慢特征回歸。

(2)反向傳播神經(jīng)網(wǎng)絡(back propagation neural network,BPNN)。

(3)動態(tài)核偏最小二乘回歸(dynamic KPLS,DKPLS),通過動態(tài)建模構造數(shù)據(jù)集后,采用KPLS回歸。

(4)核慢特征回歸(KSFR),采用核函數(shù)擴展的慢特征回歸。

(5)本方法DMI-KSFR。

圖9是各方法預測值與實際值的比較。分析圖9與表2可以發(fā)現(xiàn),本文方法與BP神經(jīng)網(wǎng)絡,DKPLS以及DSFR等傳統(tǒng)方法相比,具有一定的提升。DSFR采用動態(tài)建模的思路,但是沒有使用有效的非線性擴展方法,故效果最差;BP神經(jīng)網(wǎng)絡的非線性擬合能力較好,但是沒有考慮數(shù)據(jù)的動態(tài)特性;DKPLS雖然運用了核函數(shù)擴展,但是KPLS方法也沒有考慮動態(tài)特性;本方法在KSFR核函數(shù)擴展的基礎上采用動態(tài)數(shù)據(jù)集以及互信息變量選擇,提升了算法性能。

表2 不同方法的比較

圖10是本方法對于測試數(shù)據(jù)以及全部數(shù)據(jù)的預測效果,其中小圖是全部135組樣本的預測效果,可以發(fā)現(xiàn)盡管從第120個樣本點開始數(shù)據(jù)變化趨勢與之前不同,但是本方法仍能有效地預測出常一線初餾點的趨勢,并獲得了不錯的效果。

5 結 論

本文提出了一種基于核慢特征回歸的軟測量建模方法,并應用于具有非線性和動態(tài)特性的工業(yè)過程。動態(tài)數(shù)據(jù)集的構造以及互信息變量篩選使得用于建模的數(shù)據(jù)不僅具有動態(tài)信息而且避免了信息冗余的問題;核函數(shù)擴展使得慢特征分析處理非線性數(shù)據(jù)的能力得到了顯著的提升。核慢特征可以更好地刻畫復雜工業(yè)數(shù)據(jù)的變化趨勢,提高回歸模型的精度。常頂油干點與常一線初餾點軟測量建模的實驗結果表明本方法具有較好的預測效果,與傳統(tǒng)方法相比也有一定的提升。

References

[1] SHANG C, YANG F, HUANG D,. Data-driven soft sensor development based on deep learning technique[J]. Journal of Process Control, 2014, 24(3): 223-233.

[2] LI Q, DU Q, BA W,. Multiple-input multiple-output soft sensors based on KPCA and MKLS-SVM for quality prediction in atmospheric distillation column [J]. International Journal of Innovative Computing, Information and Control, 2012, 8(12): 8215-8230.

[3] NAPOLI G, XIBILIA M G. Soft sensor design for a topping process in the case of small datasets[J]. Computers & Chemical Engineering, 2011, 35(11): 2447-2456.

[4] GALICIA H J, HE Q P, WANG J. A reduced order soft sensor approach and its application to a continuous digester[J]. Journal of Process Control, 2011, 21(4): 489-500.

[5] 袁小鋒, 葛志強, 宋執(zhí)環(huán). 基于時間差分和局部加權偏最小二乘算法的過程自適應軟測量建模[J]. 化工學報, 2016, 67(3): 724-728. YUAN X F, GE Z Q, SONG Z H. Adaptive soft sensor based on time difference model and locally weighted partial least squares regression[J]. CIESC Journal, 2016, 67(3): 724-728.

[6] YUAN X F, HUANG B, GE Z Q,. Double locally weighted principal component regression for soft sensor with sample selection under supervised latent structure[J]. Chemometrics & Intelligent Laboratory Systems, 2016, 153: 116-125.

[7] YU J, CHEN K, MORI J,. A Gaussian mixture copula model based localized Gaussian process regression approach for long-term wind speed prediction[J]. Energy, 2013, 61(6): 673-686.

[8] YANG K, JIN H P, CHEN X G,. Soft sensor development for online quality prediction of industrial batch rubber mixing process using ensemble just-in-time Gaussian process regression models[J]. Chemometrics & Intelligent Laboratory Systems, 2016, 155: 170-182.

[9] 劉國海, 蘇勇, 楊銘, 等. 基于多準則和高斯過程回歸的動態(tài)軟測量建模方法[J]. 東南大學學報(自然科學版), 2015, (6): 1086-1090. LIU G H, SU Y, YANG M,. Dynamic soft sensor modeling based on multi-criterion method and Gaussian process regression [J]. Journal of Southeast University (Natural Science Edition), 2015, (6): 1086 -1090.

[10] 阮宏鎂, 田學民, 王平. 基于聯(lián)合互信息的動態(tài)軟測量方法[J]. 化工學報, 2014, 65(11): 4497-4502. RUAN H M, TIAN X M, WANG P. Dynamic soft sensor method based on joint mutual information [J]. CIESC Journal, 2014, 65(11): 4497-4502.

[11] WISKOTT L, SEJNOWSKI T. Slow feature analysis: unsupervised learning of invariances[J]. Neural Computation, 2002, 14(4): 715- 770.

[12] WU C, DU B, ZHANG L. Slow feature analysis for change detection in multispectral imagery[J]. IEEE Transactions on Geoscience & Remote Sensing, 2014, 52(5): 2858-2874.

[13] FRANZIUS M, WILBERT N, WISKOTT L. Invariant object recognition and pose estimation with slow feature analysis[J]. Neural Computation, 2011, 23(9): 2289-2323.

[14] ZHANG Z, TAO D. Slow feature analysis for human action recognition[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2012, 34(3): 436-450.

[15] MINH H Q, WISKOTT L. Multivariate slow feature analysis and decorrelation filtering for blind source separation.[J]. Image Processing IEEE Transactions on, 2013, 22(7): 2737-2750.

[16] 何會會, 李鋼虎, 要慶生, 等. 用慢特征分析算法實現(xiàn)水聲信號盲分離[J]. 聲學技術, 2014, 33(3): 270-274. HE H H, LI G H, YAO Q S,.Blind source separation of underwater acoustic signals by using slowness feature analysis[J].Technical Acoustics, 2014, 33(3): 270-274.

[17] SHANG C, HUANG B, YANG F,. Slow feature analysis for monitoring and diagnosis of control performance[J]. Journal of Process Control, 2016, 39: 21-34.

[18] SHANG C, YANG, GAO X Q,. Concurrent monitoring of operating condition deviations and process dynamics anomalies with slow feature analysis[J]. AIChE Journal, 2015, 61(11): 3666-3682.

[19] ZHANG H Y, TIAN X M, CAI L F. Nonlinear process fault diagnosis using kernel slow feature discriminant analysis[J]. IFAC-Papers on Line, 2015, 48(21): 607-612.

[20] SHANG C, YANG F, GAO X Q,. Extracting latent dynamics from process data for quality prediction and performance assessmentslow feature regression[C]// American Control Conference (ACC). Chicago: IEEE, 2015: 912-917.

[21] SHANG C, HUANG B, YANG F,. Probabilistic slow feature analysis-based representation learning from massive process data for soft sensor modeling[J]. AIChE Journal, 2015, 61(12): 4126-4139.

[22] KONEN W, KOCH P. The slowness principle: SFA can detect different slow components in non-stationary time series[J]. International Journal of Innovative Computing & Applications, 2011, 3(3): 3-10.

[23] 王桂增, 葉昊. 主元分析與偏最小二乘法[M].北京: 清華大學出版社, 2012: 106-107. WANG G Z, YE H. Principal Component Analysis and Partial Least Squares [M].Beijing: Tsinghua University Press, 2012: 106-107.

[24] BOHMER W, GRUNEWALDER S, NICKISCH H,. Generating feature spaces for linear algorithms with regularized sparse kernel slow feature analysis[J]. Machine Learning, 2012, 89(1/2): 67-86.

[25] SOUZA F, SANTOS P, ARAUJO R. Variable and delay selection using neural networks and mutual information for data-driven soft sensors [C]// Emerging Technologies and Factory Automation (ETFA).Spain: IEEE, 2010: 1-8.

[26] MODDEMEIJER R. On estimation of entropy and mutual information of continuous distributions[J]. Signal Processing, 1989, 16(3): 233-248.

[27] 童楚東, 藍艇, 史旭華. 基于互信息的分散式動態(tài)PCA故障檢測方法[J]. 化工學報, 2016, 67(10): 4317-4323.TONG C D, LAN T, SHI X H.Fault detection by decentralized dynamic PCA algorithm on mutual information[J].CIESC Journal, 2016, 67(10): 4317-4323.

[28] JIN H P, CHEN X G, YANG J W,. Adaptive soft sensor modeling framework based on just-in-time learning and kernel partial least squares regression for nonlinear multiphase batch processes[J]. Computers & Chemical Engineering, 2014, 71: 77-93.

[29] BOLN-CANEDO V, SNCHEZ-MAROO N, ALONSO-BETANZOS A. Feature Selection for High-Dimensional Data[M]. Springer Publishing Company, Incorporated, 2015: 17-24.

[30] 金思毅, 李悅卿, 夏茂森. 常減壓裝置常壓塔塔頂汽油干點的軟測量[J]. 化工進展, 2006, 25(s1): 74-76. JIN S Y, LI Y Q, XIA M S. Curde colmun gasoline end point soft-sensing of atmospheric and vacuum unit[J].Chemical Industry and Engineering Progress, 2006, 25(s1): 74-76.

[31] 唐孟海, 胡兆靈. 原油蒸餾[M]. 北京: 中國石化出版社, 2007: 44-45. TANG M H, HU Z L.Crude Oil Distillation [M]. Beijing: China Petro-Chemical Press, 2007: 44-45.

Atmospheric tower soft sensor based on regression and mutual information of kernel slow features

JIANG Xinyi1, DU Hongbin1,2, LI Shaojun1

(1Key Laboratory of Advanced Control and Optimization for Chemical Processes (Ministry of Education), East China University of Science and Technology, Shanghai 200237, China;2Research Institute of Petro China Dushanzi Petrochemical Company, Karamay 833699, Xinjiang, China)

A novel soft sensor method based on slow feature regression (SFR) was proposed for industrial process with nonlinear and dynamic characteristics. First, a dynamic dataset was built by adding time-delay data and information redundancy was reduced by selecting variables according to mutual information maximization criteria. Then, kernel function was introduced into slow feature analysis(SFA)to improve capability of processing nonlinear data and the kernel slow features were used for regression. Through analysis of sample variation, kernel slow feature analysis(KSFA)could extract components with slowly varying dynamics, characterize trend of industrial process effectively, and improve precision of regression modelling. Finally, effectiveness and feasibility of the proposed method were verified by soft sensor model of constant top oil dry point and constant first line dropping point in atmospheric tower.

slow feature analysis; mutual information; dynamic modeling; atmospheric tower; petroleum; prediction

10.11949/j.issn.0438-1157.20161395

TP 274

A

0438—1157(2017)05—1977—10

李紹軍。

蔣昕祎(1993—),男,碩士研究生。

國家自然科學基金項目(21676086,21406064)。

2016-09-29收到初稿,2017-01-22收到修改稿。

2016-09-29.

Prof.LI Shaojun, lishaojun@ecust.edu.cn

supported by the National Natural Science Foundation of China (21676086,21406064).

猜你喜歡
特征方法
抓住特征巧觀察
新型冠狀病毒及其流行病學特征認識
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
學習方法
抓住特征巧觀察
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 日韩黄色大片免费看| a级毛片一区二区免费视频| 国产免费网址| 欧美精品黑人粗大| 久久频这里精品99香蕉久网址| 欧美成一级| 欧美在线观看不卡| 91九色视频网| 毛片久久久| 91在线精品麻豆欧美在线| 久久综合九色综合97婷婷| 在线播放真实国产乱子伦| 亚洲综合片| 曰AV在线无码| 国产第一页第二页| 亚洲无码日韩一区| 国产永久在线观看| 精品国产成人a在线观看| 操操操综合网| 伊人色在线视频| 免费无码又爽又黄又刺激网站| 天堂网国产| 香蕉在线视频网站| 又爽又大又黄a级毛片在线视频| 欧美三級片黃色三級片黃色1| 色综合婷婷| 国内老司机精品视频在线播出| 欧美视频在线观看第一页| 久久网综合| 国产亚洲欧美另类一区二区| 国产91色在线| 香蕉eeww99国产在线观看| 天天激情综合| 国产成人一区在线播放| 亚洲第一区在线| 国产成人调教在线视频| 天堂岛国av无码免费无禁网站 | 国产在线视频福利资源站| 色欲色欲久久综合网| 国产极品美女在线| 国产无码在线调教| 老色鬼欧美精品| 午夜国产精品视频| 超薄丝袜足j国产在线视频| 麻豆AV网站免费进入| 毛片免费试看| 五月天丁香婷婷综合久久| 99尹人香蕉国产免费天天拍| 亚洲无线观看| 国产18页| 亚洲综合狠狠| 久青草免费在线视频| 久久精品国产在热久久2019| 在线无码九区| 亚洲综合天堂网| 欧美成人第一页| 国产av无码日韩av无码网站| 国产精品久久久久久搜索| 亚洲二区视频| 亚洲色中色| 国产亚洲欧美在线中文bt天堂 | 国产精品免费露脸视频| 香蕉精品在线| 99成人在线观看| 日本道综合一本久久久88| 免费av一区二区三区在线| 狼友视频一区二区三区| 久久精品人人做人人爽电影蜜月 | 亚洲一区毛片| 日本www色视频| 国产凹凸视频在线观看| 蜜桃视频一区二区| 在线观看无码av免费不卡网站 | 亚洲视频无码| 国产一区在线视频观看| 99在线视频免费观看| 99一级毛片| 国产1区2区在线观看| 91精选国产大片| 国产91高跟丝袜| 欧美中出一区二区| 欧美 亚洲 日韩 国产|