陳 沖,閆珠,趙繼軒,何為,2,梁華慶
(1.中國石油大學(北京)信息科學與工程學院,北京 102249;2.中國石油集團安全環保技術研究院有限公司HSE檢測中心,北京 102206)
氮氧化物(Nitrogen Oxide,NOx)是一種常規大氣污染物質,依據GB31570—2015《石油煉制工業污染物排放標準》中要求,現有企業自2017 年7 月1 日起執行其標準排放限值,NOx 的排放濃度限值應小于或等于100 mg/m3[1],這使得很多煉化企業在NOx 減排問題上面臨著巨大的挑戰;然而,由于催化裂化(Fluid Catalytic Cracking,FCC)工藝過程的復雜性,其建模分析一直是領域研究的熱點和難點[2]。FCC 過程建模方法可以分為機理建模法[3]和統計建模法[4]。FCC 是一個高度非線性和相互強關聯的系統,原料油性質、反應再生催化劑性質以及反應操作工況條件等因素都會影響到反應過程和產物收率,建立基于機理的反應動力學模型十分困難[5]。
針對工業生產活動中污染物排放數據的非線性和異質性,基于數據驅動的統計建模方法可以捕捉機理建模的復雜性,并表現出良好的性能[4]。隨著第三撥人工智能熱潮的開始,以深度學習為代表的神經網絡方法在實際生產活動領域的應用越來越廣泛,如文獻[6]中提出了一種基于改進的動態主成分分析(Dynamic Principal Component Analysis,DPCA)和多層神經網絡(Multilayer Neural Network,MNN)的神經估計模型,研究了FCC 裝置生產質量控制中碳3(C3)濃度參數的預測,從實際過程變量中推斷C3濃度。研究結果表明,該方法預測具有較好的可靠性和準確性。
長短期記憶(Long Short-Term Memory,LSTM)網絡能夠更好地刻畫時間序列所蘊含的數據關系,廣泛應用于文本分析[7]、金融時間序列預測[8-9]以及圖像識別領域(如步態識別等)[10],在時間序列數據上獲得了良好效果。在多維度時空數據處理上,將其他方法與LSTM 結合分別從空間、時間上提取數據特征,成為一種研究趨勢。比如文獻[11]中提出了一種混合模型,引入了3D 卷積神經網絡和2D 卷積神經網絡以更好地了解臺風形成特征的空間關系。實驗結果表明,混合模型CNN-LSTM(Convolutional Neural Network-Long Short-Term Memory)的效果優于數值預測模型。
雖然FCC 裝置的NOx 排放濃度是單一維度的時間序列數據,但其具有非平穩、強非線性等特征,直接采用LSTM 方法進行預測難以達到令人滿意的結果,需先對信號進行分解預處理,再應用LSTM 方法。集合經驗模態分解(Ensemble Empirical Mode Decomposition,EEMD)[12]是一種噪聲輔助數據分析方法,其分解原理是將增加的白噪聲與不同尺度的組成成分均勻地填充整個時頻空間;文獻[13]中提出了自回歸綜合移動平均(Autoregressive Integrated Moving Average,ARIMA)模型結合EEMD 深入提取數據特征,來預測年徑流時間序列,實驗表明EEMD-ARIMA 融合模型性能優于ARIMA;文獻[14]中利用EEMD 原始振動信號,結合小波包變換(Wavelet Packet Transform,WPT),有效提取了故障早期敏感特征,驗證了模型在故障診斷問題上的有效性;文獻[15]中基于EEMD 和LSTM 提出了一種電力負荷序列預測方法,以避免數據的高非線性與非平穩性對預測精度的影響,但對于不同階次的IMF 分量均輸入到同等深度的LSTM 網絡中,容易造成低階IMF 序列對應模型訓練過程中出現過擬合的問題。
為了挖掘NOx 排放序列內部蘊含的數據規律,提高預測精度,本文提出了基于EEMD和LSTM的耦合模型。首先采用EEMD 對信號進行分解預處理,將信號分解為若干固有模態函數(Intrinsic Mode Function,IMF),將原始數據的非平穩性與非線性特征分解到子序列中;接著采用相關性分析子序列,將子序列分成高頻與低頻兩個類別,分別輸入結構不同的LSTM 網絡中,最后重構各分量的預測結果。實驗結果表明,本文模型能為非平穩、非線性數據預測方法提供有益參考。
希爾伯特-黃變換(Hilbert-Huang Transform,HHT)方法[16]是一種分析非線性和非平穩信號的有力工具,其包含經驗模態分解(Empirical Mode Decomposition,EMD)和希爾伯特變換(Hilbert Transform,HT)兩部分。EMD 可以將原始信號分解成為一系列IMF 分量,從高頻到低頻依次排列,將復雜的原信號視為這一系列IMF 疊加之和,IMF 子序列之間互相獨立,可以是線性或非線性序列。EMD 不同于傅里葉變換,不需要基函數,而是基于信號本身進行分解,因此適用于任何數據信號,擺脫了傅里葉變化的局限性;但是EMD 得到的IMF 分量往往存在模態混疊現象。Wu 等[12]在進行實驗時,利用白噪聲頻譜均勻分布的特性,在待分析信號中加入白噪聲,使不同時間尺度的信號自動分離到與其相適應的參考尺度上。
EEMD 的分解原理基于零均值噪聲的特性,認為噪聲經過多次平均計算后會相互抵消,集成均值可以直接視作最終結果。分解步驟主要分為四點:
1)在目標數據s(t) 中添加白噪聲序列noise(t),x(t)=s(t) +noise(t)。
2)將添加白噪聲的數據x(t)進行EMD 為IMF 分量。
3)重復步驟1)和步驟2),每次分解之前都添加不同的白噪聲序列。
4)將每次得到的IMF 分量做集成平均處理后作為最終結果。
步驟2)中x(t)進行EMD 表示如下:

其中:rn(t)是分解提取n個IMF 后的信號殘余分量,通常是信號的直流分量;imfi(t)是EMD 得到的第i個固有模態函數。得到的子序列若要成為IMF 分量需要滿足下面兩個條件。
1)該子序列中極值點的個數Nz和過零點的個數Ne需要滿足以下關系:

2)在任意時間點,該序列f(t)由局部極大值和局部極小值確定的上、下包絡線的均值為0,即:

由于上述兩個條件的嚴苛,在實際分解過程中,判斷成為IMF 的條件往往根據標準差Sd來決定:

EMD 的具體分解步驟如下:
1)尋找x(t)全部的極值點,分為局部極大值和局部極小值組。
2)通過三次樣條插值法,分別獲得光滑的波峰、波谷擬合曲線,即為x(t)的上包絡線和下包絡線。
3)取兩條極值擬合曲線均值得到平均包絡線m(t)。
4)將原始信號減去均值包絡線,得到疑似IMF 分量h(t)=x(t)-m(t)。
5)判斷h(t)是否符合IMF 條件:如果符合將作為第一個IMF 分量;否則作為新的原始信號,返回步驟1),再次篩選分析,直到滿足條件得到IMF 分量。
6)將步驟5)中IMF 分量從原信號中分離出去,得到ri(t)=x(t)-imfi(t),檢查是否滿足分解停止條件,即是否存在兩個以上的極值點:如果是則加入新的正態分布白噪聲序列,返回步驟1)繼續分解,進而得到所有的IMF 分量;否則,EMD 結束。
循環神經網絡(Recurrent Neural Network,RNN)由于其特殊的網絡模型結構解決了信息保存的問題,在處理時間序列時具有獨特的優勢。然而,RNN 在實際訓練過程中存在較多問題[17]。在使用反向傳播算法學習模型參數的時候,RNN 需要展開成參數共享的多層前饋神經網絡,歷史信息的長度就反映了展開的層數。過多的層數不僅使得訓練速度變得極慢,還會出現梯度消失和梯度爆炸問題,這樣一來,RNN 也就失去了提取長序列歷史信息的能力。為了解決上述問題,文獻[18]中提出了LSTM,隱藏層節點結構采用門控機制,通過遺忘門、輸入門、輸出門的組合,達到控制每個節點信息通過量的作用,結構如圖1 所示。

圖1 LSTM結構Fig.1 Structure of LSTM
遺忘門決定上一個時刻的單元狀態ct-1有多少保留到當前時刻ct。

其中:Wf是遺忘門的權重矩陣;[ht-1,xt]表示矩陣拼接;bf是遺忘門的偏置項,σ是sigmoid 激活函數。
輸入門決定當前時刻網絡的輸入有多少保存到單元狀態ct。

其中:Wi是遺忘門的權重矩陣;bi是輸入門的偏置;計算當前輸入的單元狀態,根據上一次的輸出和本次輸入計算。

當前時刻的單元狀態ct由上一次的單元狀態ct-1按元素乘以遺忘門ft,再以當前輸入的單元狀態按元素乘以輸入門it,將兩個積加和產生:

當前的記憶和長期的記憶ct-1組合在一起,形成了新的單元狀態ct,由于遺忘門的控制,LSTM 可以保存很久之前的信息,由于輸入門的控制,它又可以避免當前無關緊要的內容進入記憶,輸出門用來控制單元狀態ct有多少輸出到LSTM 的當前輸出值ht,即控制長期記憶對當前輸出的影響。

LSTM 的最終輸出由輸出門和單元狀態共同決定。

FCC 裝置中NOx 的排放數據受外界原料量等干擾,是典型的非線性、非平穩信號。本文提出基于EEMD 與LSTM 的耦合模型,將NOx 的排放濃度序列通過EEMD 為一系列IMF分量,有選擇地將強相關的子序列根據頻率高低分別送入不同深度LSTM 神經網絡,最后將子序列預測結果重構得到最終預測結果,模型結構如圖2 所示。

圖2 EEMD-LSTM模型結構Fig.2 Structure of EEMD-LSTM model
根據圖2,EEMD-LSTM 耦合模型主要分為以下3 個模塊:
1)EEMD。
原信號x(t)經過EEMD 之后,等于n個IMF 分量之和,如式(11)所示,其中IMF 分量與原序列等長。
2)IMF 分量提取。
計算每個imfi(t)(i=1,2,…,n)與x(t)的Pearson 相關系數,記為P={p1,p2,…,pn}。

pi定義為兩個連續變量(X,Y)的Pearson 相關性系數,等于它們之間的協方差除以它們各自標準差的乘積。

pi取值總是在-1~1,接近0 的變量被成為無相關性,接近1 或者-1 被稱為具有強相關性。根據p0篩選出相關性較大的IMF 分量集,其他分量將被舍棄。
3)LSTM 網絡預測。
針對每一個符合篩選條件的imf(t) ∈IMFpi≥p0,經過處理為對應網絡的監督數據集,樣本xi輸入到LSTM 單元中。假設預測未來第s步的數據信息,則通過隱藏層LSTM 單元的計算,各個時期輸出hi如式(14)所示,對應的長期記憶ci如式(15)所示:

第s步隱藏層單元輸出為Hi+s,送入到一層全連接網絡,激活函數采用ReLU,最后輸出s步的預測結果。

將模型預測輸出與理論預測結果基于均方根誤差(Root Mean Squared Error,RMSE)進行損失計算,利用適應性動量估計(Adaptive momentum estimation,Adam)算法基于訓練樣本數據迭代更新神經網絡權重,減小Loss值,優化模型。
實驗所采用數據集來源于我國某煉廠2016 年3 月至2017 年3 月FCC 裝置NOx 的排放數據,每相鄰兩條記錄時間間隔為40 min,共獲得10 000 條數據記錄。對于原始數據首先進行異常值的剔除,本文將用數據均值代替明顯的異常值,經統計可知,異常數據個數小于數據長度的0.5%。經過去除異常值后的信號序列如圖3 所示,對上述信號進行EEMD,獲得12 個IMF 分量,如圖4 所示。

圖3 預處理之后的數據Fig.3 Preprocessed data

圖4 IMF分量數據集Fig.4 Dataset of IMF subsequences
根據式(13)計算12 個IMF 分量與原信號的相關系數,結果如表1 所示。根據式(12),設置相關系數閾值p0=0.106 5,因此剔除IMF 分量1、2。

表1 IMF分量相關系數Tab.1 Pearson correlation coefficients of IMF subsequences
結合FCC 生產活動中的實際意義,本文選定預測步長為未來24 h 的數據信息,對應在實際數據中,為未來36 組的數據。為了評估本文EEMD-LSTM 耦合模型的性能,實驗選用LSTM 作為對照組,通過多次實驗給出兩種模型的最優實驗結果。
實驗中,兩層隱藏層分別設計為32、64 個神經元,單層隱藏層設計20 個神經元,分別作為EEMD-LSTM 耦合模型中不同深度的LSTM 網絡結構。為減小建模誤差,在進行網絡訓練之前進行數據歸一化處理;采用48 組連續NOx 排放數據作為LSTM 的輸入數據,對應得到36 組預測結果,反歸一化之后得到預測的真實值,便得到一個數據樣本的訓練結果。為了不減少樣本量,生成樣本時滑動窗口每次前進一個數據記錄,因此整個測試集得到的預測結果在中間時間點上是重復的,最后統一取均值作為該時間點的預測值。
本文按6∶2∶2 的比例劃分測試集、驗證集、測試集,經過300 次迭代,LSTM 模型以及EEMD-LSTM 耦合模型中的各個分量的網絡訓練均能達到收斂。為了更好地觀察模型的對比結果,采用RMSE、平均絕對誤差(Mean Absolute Error,MAE)以及決定系數(R2)三個指標進行評估模型性能,計算公式分別如下:


圖5 展示了EEMD-LSTM、LSTM 模型測試集預測結果與真實值的對比,其中EEMD-LSTM 耦合模型的預測值是由EEMD 的關鍵IMF 分量的子預測結果疊加得到的。整體來看,相較于LSTM,EEMD-LSTM 模型的預測結果與真實值大致吻合,從圖中局部放大區域(1)、(2)能夠更清晰看到這一點。LSTM 預測輸出相對平滑,缺少局部波動細節,與真實值對比上下波動幅度略??;而EEMD-LSTM 模型的預測結果與真實值曲線有較多重疊,體現了更多的局部波動細節。這說明EEMD-LSTM 對于數據特征的學習更精細,在局部極值點上表現了較好的預測能力。

圖5 模型預測值與真實值對比Fig.5 Comparison of predicted value and observed value of models
為了量化兩種模型的預測能力,從RMSE、MAE、R2三個評價指標上評估模型性能,結果如表2 所示。由表2 看出,實驗結果符合理論預期,EEMD-LSTM 耦合模型在RMSE、MAE指標上的誤差值均小于LSTM,前者相對于后者在這兩項上分別減小了46.7%、45.9%;在決定系數R2上,EEMD-LSTM耦合模型比LSTM 模型增大了43%。

表2 模型性能對比Tab.2 Comparison of model performance
LSTM 憑借其獨特的遺忘門、輸入門、輸出門設計,可以學習時間序列以往序列特征,保留當下時刻之前較長時期的記憶,在時間序列預測上比其他神經網絡有著不可比擬的優勢。但針對像FCC 裝置的污染排放數據而言,實際生產中受多項生產要素含量的影響,很難挖掘的深層數據特征,因此針對這樣的數據,LSTM 表現良好但仍有可優化的空間。而EEMD-LSTM 耦合模型將單一的原始序列分解為一系列固有模態函數,并且有選擇地保留IMF 分量,將包含高頻隨機噪聲多的分量舍棄,多角度、多層次地提取原始數據特征,能更好地學習數據的深層規律,進一步提升預測精度。
FCC 裝置中NOx 的排放數據受生產過程中的溫度、原料量、通風量等各項要素影響,傳統機理建模方法很難刻畫數據特征。本文提出一種基于EEMD 算法和LSTM 神經網絡的耦合模型EEMD-LSTM,將信號分解為不同特征尺度的平穩序列,經過皮爾遜相關性分析舍棄弱相關分量,有效減少高頻隨機噪聲的引入,將提取出的相關分量分別輸入LSTM 模型,重構模型輸出得到最終預測結果。經過實驗證明,EEMD-LSTM 與LSTM 模型均表現了良好的性能,但EEMDLSTM 耦合模型比LSTM 具有更高的預測精度,對原數據的擬合程度也更高。