馬永濤,邢江寬,羅坤,樊建人
(浙江大學 能源高效清潔利用全國重點實驗室,浙江 杭州 310027)
我國煤炭資源較為豐富,煤炭消費占據重要地位。據國家統計局統計[1],2020年,火力發電用煤約占煤炭消費總量的52.3%,在源源不斷地輸送電力的同時,產生了如SO2、NOX、PM2.5等大氣污染物。為控制大氣污染物排放,我國政府出臺了一系列的排放指標要求。濕法煙氣脫硫系統能夠有效脫除燃煤煙氣中的SO2,因此,其被大部分燃煤電廠采用,作為主要的脫硫手段。在脫硫系統實際運行時,運行人員多根據自身經驗調整優化系統運行參數,這樣無法保證系統全時段實現經濟穩定運行,因此,脫硫系統優化一直是研究者們關心的重要問題。
建立較為準確的濕法煙氣脫硫系統(Wet Flue Gas Desulfurization,WFGD)排放預測模型是對其進行進一步優化的基礎。第一性原理或機理模型,也被稱為“白箱”模型,通過聯立質量和能量守恒方程、運動學方程、熱力學方程和輸運方程等求解得到。這一類模型通常由有物理意義的相關參數來表征,并能在較大運行參數變化范圍內保持其有效性,但是其結構較為復雜,建模的成本較高[2]。脫硫塔中的脫硫反應是復雜、多變量、強耦合、非線性的過程[3],難以建立其機理模型。近年來,隨著計算機和人工智能技術蓬勃發展,使用過程數據來訓練機器學習等人工智能算法的數據驅動模型或“黑箱模型”,因其建模成本低,被學者們用來建立多種復雜過程的模型。Chen等人[4]提出了一種寬深結構的長短時記憶神經網絡模型,用來預測循環流化床的二氧化硫排放。Li等人[3]使用動態建模方法建立二氧化硫排放的預測模型,結果顯示動態神經網絡模型要優于其它模型。基于脫硫系統歷史運行和實時運行數據,建立SO2排放預測模型之后,可以在較短時間內用較低的成本來優化脫硫系統的部分運行參數。Guo等人[5]基于組合數學模型和人工神經網絡的SO2排放預測模型,使用粒子群算法優化濕法煙氣脫硫系統。葛志輝等人[6]使用聚類算法挖掘得到脫硫系統可調運行參數的目標值,并建立了脫硫系統優化運行的目標庫。但上述預測模型的建模準確性仍有待提升,并且大多為單目標優化研究,數據驅動的脫硫系統多目標優化需要進一步研究。
本文的研究目的是建立適用于濕法煙氣脫硫系統的SO2排放預測模型,然后基于該模型對濕法煙氣脫硫系統進行多目標優化。首先,本文基于某1000 MW燃煤電廠的運行數據,采用靜態建模和動態建模兩種建模策略,并對比建模效果;然后結合動態建模和一階差分預測(Differential Prediction,DP)方法,對比隨機森林(Random Forest,RF)、極致梯度提升(eXtreme Gradient Boosting,XGBoost)、支持向量回歸(Support Vector Regression,SVR)、深度神經網絡(Deep Neural Network,DNN)、長短時記憶(Long Short-Term Memory,LSTM )神經網絡五種機器學習算法的建模效果,用決定系數(coefficient of determination,R2)和均方誤差(Mean Squared Error, MSE)作為算法的評價標準。最后本文選取準確性較好的基于長短時記憶神經網絡算法訓練的模型作為SO2排放預測模型,使用多目標粒子群優化(Multi-objective particle swarm optimization,MOPSO)算法優化脫硫系統運行參數,將優化結果用來指導實際操作,實現脫硫系統穩定經濟運行。
在電廠機組實際運行時,由于設備故障等原因會產生明顯偏離數據正常分布的值,即異常值[7]。如果將這些異常值作為訓練數據的一部分,就會嚴重影響建模精度。如圖1所示,煙氣脫硫系統(Flue Gas Desulfurization,FGD)入口煙氣SO2濃度數據中有一些異常值,因此有必要對原始數據進行預處理,剔除異常值。本文采用箱形圖中使用的四分位距(Inter-Quartile Range,IQR)法來識別出原始數據中的異常值。找到任一維度數據的四分之一位數Q1,四分之三位數Q3,定義四分位間距QR為:

圖1 部分樣本的FGD入口煙氣SO2濃度值
數據的上邊緣Qup和下邊緣Qlow分別定義為:
其中scale為尺度,通常取值為3或1.5,超過上邊緣Qup或者低于下邊緣Qlow的點被認為是數據中的異常點。當scale取3時,剔除的值為極端異常值;當scale取1.5時,剔除的值為溫和異常值和極端異常值。
本文采用動態建模方法[3],如圖2所示,Xt(p×1)為當前采樣時間維度為p的輸入變量,Yt+1(l×1)為下一采樣時間維度為l的輸出變量。k為時間步,是一個超參數,可以根據實驗和經驗人工選取。若k值較小,可能無法包含足夠的遲滯信息;若k值較大,就會導致輸入變量的維度過大,從而延長訓練時間。使用動態建模方法可以將輸入變量重整如下:

圖2 靜態建模和動態建模示意圖
這樣,輸入變量就從p維擴展成了(k+1)×p維,總時間步為(k+1)。輸出變量則保持不變,維度仍為l維。
一階差分預測能減小預測數據的自相關性對預測結果的影響[4]。脫硫系統的數據具有明顯的自相關性,因此一階差分預測方法非常適用于對脫硫過程建模。本文結合動態建模和一階差分預測,采用公式如下:
其中yt+1為t+1時刻預測目標變量值;yt則為t時刻預測目標變量值;Δy即為兩個時刻預測目標變量的差值。本文所用模型通過預測Δy,再與yt相加,從而得到yt+1。
根據所使用算法不同,可以將機器學習模型分為集成學習、支持向量機和神經網絡等。下面對本文所使用的算法原理進行介紹。
1.4.1 隨機森林
由L. Breiman于2001年提出的隨機森林算法已經成為一個極度成功的算法,被應用于各種一般性分類和回歸問題上[8,9]。該算法是一種集成學習算法,通過訓練多個不同的隨機決策樹,并對每棵樹的預測結果取平均從而融合得到最終的預測結果。
1.4.2 極致梯度提升
極致梯度提升是由Chen和Guestrin于2016年提出的基于梯度提升且可擴展性較強的決策樹集成算法[10,11]。由于其在多種機器學習任務中能有較好的表現和較高的準確性,它被廣泛地應用在數據科學競賽和實際生活中。該算法通過整合樹模型和線性模型,最終做出預測,并使用正則化技術來防止過擬合。
1.4.3 支持向量回歸
支持向量回歸是一種有效的回歸分析方法,其用數據集的子集來構建一個函數估計[12],數學形式如下:
其中W∈Rn,為權重特征矢量;b為偏置。代表估計出的映射關系;W∈Rn,為輸入矢量。
支持向量回歸使用核函數將輸入數據映射到高維特征空間,將非線性問題轉換為線性問題來求解。徑向基函數(Radius Basis Function,RBF)是較為常用的核函數,它將輸入數據投射到無限維特征空間,描述如下:
1.4.4 深度神經網絡
深度神經網絡是深度學習的基礎。而模仿人類大腦行為的人工神經元則是構建深度神經網絡的基礎[13]。這個基礎的計算元稱為節點,它接收外部輸入,通過學習獲得內部權重和偏置參數,并利用這些參數產生輸出。深度神經網絡由輸入層、隱藏層、輸出層組成,每一層都由多個人工神經元組成,層與層之間通過權重連接。
1.4.5 長短時記憶神經網絡
長短時記憶(以下簡稱LSTM)神經網絡算法是一種善于處理非線性時序數據的神經網絡算法[14]。與深度神經網絡不同,LSTM網絡層內也建立了連接。這就使得LSTM能反映出序列中的相關信息,模型有了記憶能力,其記憶用細胞狀態表示。LSTM的記憶細胞由一個輸入門、一個輸出門和一個遺忘門組成[15]。這一結構使LSTM能夠基于先前狀態、當前記憶和當前輸入,從而決定哪些細胞受到抑制、哪些細胞得到激活。
LSTM的結構如圖3所示,其中xt表示當前輸入;Ct-1表示上一時刻的細胞狀態;ht-1表示上一時刻的隱狀態;ft表示遺忘門的狀態;it表示輸入門的狀態;Ct為候選細胞狀態;ot表示輸出門的狀態;Ct表示當前細胞狀態;ht-1表示當前隱狀態;yt表示當前輸出。σ(·)為sigmoid函數,作為門激活函數;tanh(·)是雙曲正切函數,作為輸入和輸出模塊的激活函數,數學描述如下所示:

圖3 LSTM的結構
粒子群優化算法是一個經典的群體智能算法,它被廣泛應用于單目標優化問題的求解上[16]。由于其收斂速度快和實施簡單,后來也被應用到多目標優化問題上。
第一個基于粒子群優化的多目標算法由Coello Coello等人提出[17]。在該算法中,帕累托(Pareto)支配被用來確定群體最優粒子和個體最優粒子,通過不斷更新最優解集(Archive)將非支配粒子保存作為群體最優粒子。本文所使用的算法流程如圖4所示:

圖4 多目標粒子群優化算法的流程圖
對回歸問題的評價標準主要有決定系數R2和均方誤差MSE,具體計算方法如公式(10)和公式(11)所示:
其中n為樣本總數;yi表示樣本i目標變量的測量值;為樣本i目標變量的預測值;為所有樣本目標變量的測量值的平均。R2的取值范圍為0~1,R2值越大,說明模型的預測能力越好;MSE越小,目標變量真實值和預測值之間的誤差越小,模型的預測能力越好。
以某1000 MW燃煤發電機組的濕法煙氣脫硫系統作為研究對象,收集到2022年10月至2022年11月間隔為54 s的系統相關運行數據,由文獻[18]、[19]可知,該采樣間隔是合適的,樣本數量為50000,這些數據中可能存在異常值或者被記錄下的非真實值,因此需要對其進行預處理,剔除異常值。
在獲得數據后,選取合適的參數作為機器學習模型輸入變量,將54 s后脫硫系統出口SO2濃度作為被預測量。隨后基于該預測模型,對脫硫系統開展多目標優化。
本文在選取模型輸入參數時,參考了相關文獻[3,5]。需要說明的是,煤的工業分析和元素分析作為影響SO2排放的重要參數,但在采樣數據所處的時間段內,煤質未發生顯著變化,因此為簡化模型,煤質信息未被選入輸入參數。
為了衡量不同輸入參數和被預測量之間的關系,本文首先計算異常值處理前各變量的皮爾遜相關系數rxy,計算方法如公式(12)所示,通常來說,rxy的絕對值越接近于1,兩個變量之間存在線性相關的可能性越大。將得到的結果用熱力圖表示,如圖5所示。隨后用1.1中所描述的四分位距法剔除異常值,本文scale取1.5,再次計算各變量的皮爾遜相關系數,將得到的結果用熱力圖表示,如圖6所示。最后使用處理后的70%的數據集去訓練得到隨機森林模型,運用模型特征重要度這一屬性得出各輸入參數的重要度,并記錄在表1中。

表1 不同輸入參數對模型的輸入重要性

圖5 數據預處理前模型輸入輸出變量彼此相關系數的熱力圖

圖6 數據預處理后模型輸入輸出變量彼此相關系數的熱力圖
其中rxy表示樣本x和樣本y之間的皮爾遜相關系數;xi和yi分別代表樣本x和樣本y中的第i個樣本;n為樣本總數。
對比圖5、圖6可得,雖然數據預處理后#1脫硫原煙氣SO2濃度和預測變量之間的rxy為-0.00019,但數據預處理前#1脫硫原煙氣SO2濃度和預測變量之間的rxy為0.24,并考慮其特征重要度為0.06985887,因此保留這一參數。同時,從圖6可以看出發電機功率、總燃料量、#1脫硫原煙氣流量和#1FGD入口煙氣壓力1這四個輸入參數存在一定程度的相關性,但為提高模型的預測能力,本文選擇全部保留。最終選為模型輸入參數的變量如表1所示。
為確定動態建模時所需總時間步,本文使用隨機森林和LSTM兩種機器學習算法,對比在不同時間步下模型的預測效果。不同時間步下數據預處理后總量不同,每個時間步下70%的數據作為訓練數據,30%的數據作為驗證數據。其中使用LSTM建模時結合了一階差分預測方法,而隨機森林未使用。結果如表2和表3所示:

表2 不同總時間步下隨機森林模型預測能力

表3 不同總時間步下LSTM模型預測能力
由表2和表3可得,不同總時間步下兩種模型的預測能力稍有差別。對隨機森林模型來說,總時間步為8小時,預測能力最好;對LSTM模型來說,總時間步為10小時,MSE最小,而總時間步為3小時,R2最大。這種情況是由總時間步不同和各總時間步下用于訓練和驗證的數據總量不同兩種因素共同造成的。因此結合文獻[3],同時為降低模型復雜度,本文將總時間步確定為5。
為使機器學習模型獲得較好的預測效果,通常需要對其參數進行調優,由2.3節可知,結合一階差分預測時模型的預測效果較好,因此本文對結合了一階差分預測的模型調整參數,同時總時間步設置為5小時,結果如下:
2.4.1 隨機森林模型參數確定
影響隨機森林模型預測效果主要參數為估計器數量,即nestimators,為確定其數值,采用五折交叉驗證,用MSE作為衡量標準,根據結果本文將nestimators設置為200,模型其它參數為默認值。該參數下模型的建模效果如表4所示。

表4 隨機森林模型的預測性能對比

表5 極致梯度提升模型的預測性能對比
2.4.2 極致梯度提升模型參數確定
影響極致梯度提升模型預測效果主要參數為估計器數量nestimators和學習率learningrate,為確定這兩個參數的取值,分別采用五折交叉驗證,用MSE作為衡量標準,根據結果本文將nestimators設置為100,learningrate設置為0.04,模型其它參數為默認值。當前參數下模型的建模效果如表五所示。
2.4.3 深度神經網絡模型參數確定
影響深度神經網絡模型預測效果主要參數為隱藏層神經元數量和隱藏層層數,為確定這兩個參數的取值,基于Pytorch架構,70%的數據作為訓練數據,30%的數據作為驗證數據,并對數據進行標準化處理,參數batchsize設置為256,初始學習率為0.001,并逐漸減小,進行L2正則化,最終用MSE作為衡量標準,結果如表6所示:

表6 不同隱藏層神經元數量和層數下DNN預測能力
結合表6數據,同時為降低模型復雜度,本文將隱藏層神經元數量設置為256,層數設置為2,其它參數為默認值。值得說明的是,除層數為1的模型外,為緩解過擬合,其它模型均使用了批標準化和丟棄,其中丟棄概率為0.1。
2.4.4 LSTM模型參數確定
影響LSTM模型預測效果的主要參數為隱藏層神經元數量和LSTM層層數,為確定這兩個參數的取值,基于Pytorch架構,70%的數據作為訓練數據,30%的數據作為驗證數據,并對數據進行標準化處理,參數batchsize設置為256,初始學習率為0.001,并逐漸減小,進行L2正則化,最終用MSE作為衡量標準,結果如表7所示:

表7 不同隱藏層神經元數量和LSTM層層數下LSTM預測能力
結合表7數據,同時為降低模型復雜度,本文將隱藏層神經元數量設置為256,LSTM層數設置為2,模型其它參數為默認值。值得說明的是,為提升模型預測效果,在LSTM層后添加一層線性層,同時為緩解過擬合,使用了批標準化和丟棄,其中丟棄概率為0.1。
綜上所述,本文確定了除支持向量回歸外的四個模型的參數,在此處需要說明的是,對支持向量回歸,本文選擇默認參數。
由2.4節可知,針對五種模型,本文確定了相關參數,通過比較可以獲得較好的SO2排放預測模型,隨后可以基于該模型,并結合多目標粒子群優化算法,對脫硫系統相關參數進行優化。本文選擇的待優化參數分別為#1FGD入口煙氣溫度1、#1吸收塔修正液位1、#1吸收塔漿液pH值、泵臺數。本文所研究的問題為多目標優化問題,目標函數為SO2排放預測函數和脫硫成本函數,該問題數學描述如下:
其中f1(DV,MV)為前面訓練好SO2排放預測函數;MV為操縱變量,即待優化參數,在給定范圍內變化;DV為干擾變量,即其它輸入參數;為脫硫效率;為脫硫塔出口SO2濃度;costWFGD為脫硫成本函數,即f2(DV,MV, ),以元/(kW·h)衡量,如公式(14)所示:
其中循環泵的運行成本Cpump和增壓風機的運行成本Cfan分別用公式(15)、(16)計算:
其中Ui,Ii,φi分別為第i個循環泵的電壓,電流和功率因子;Pelec是電價;load為發電機功率;Npump為漿液循環泵開啟臺數;G為煙氣流量;ΔPtower為脫硫塔的壓降;ηfan為增壓風機的效率。
在消耗石灰石的同時,會生成石膏,其能帶來一定的經濟回報。從石膏得來的收益可以用公式(18)表示:
由文獻[20]可知,離心式漿液循環泵始終在額定功率下運行,這樣可簡化循環泵運行成本的計算。
對多目標粒子群優化算法來說,本文將種群規模設置為100,代數為100,選擇方法為輪盤賭方法。在一次次迭代中獲得非劣解集,選取優化后參數值。
以上是數據驅動的脫硫系統多目標優化模型,下面第 3 節對該模型的效果進行比較分析和討論。
為驗證動態建模方法的有效性,本文使用SVR模型,對比其在靜態建模(即總時間步為1)和動態建模(即總時間步為5)情況下各自數據集上的預測性能,結果如表8所示:

表8 支持向量回歸在靜態建模和動態建模下預測性能對比
由表8可知,動態建模情況下SVR模型的預測性能要優于靜態建模,說明考慮了系統遲滯性的動態建模方法適用于對濕法煙氣脫硫系統建模。
為驗證一階差分預測方法的有效性,本文使用隨機森林模型,對比其在結合一階差分預測和未結合一階差分預測情況下各自數據集上的預測性能,結果如表9、圖7、圖8所示:

表9 隨機森林在結合一階差分和未結合一階差分下預測性能對比

圖7 結合一階差分預測下隨機森林模型在驗證集上預測性能

圖8 未結合一階差分預測下隨機森林模型在驗證集上的預測性能
結合表9、圖7和圖8可知,結合一階差分預測情況下RF模型的預測性能要優于未結合一階差分的情況,說明一階差分預測方法減小了脫硫系統數據具有的自相關性對建模的影響。
為確定預測性能最佳的機器學習模型,本文對比五種機器學習模型在結合動態建模和一階差分預測方法情況下各自數據集上的預測性能,各模型參數設置參照2.4節,結果如表10所示。

表10 五種機器學習模型的預測性能對比
由表10可知,DNN和LSTM模型的預測性能要優于其它三種模型,說明這兩種模型能較好地對濕法煙氣脫硫系統中的非線性過程建模。考慮到LSTM模型更適用于時序數據,且LSTM模型在驗證數據上MSE與訓練數據上MSE之差小于DNN模型,因此本文選取LSTM模型為最優模型,其建模效果如圖9、圖10所示,相對誤差在6%以內的數據占驗證集總量的70%以上,值得說明的是,在驗證集上,濃度在0~10 mg/m3之間的數據量僅為1,在其它濃度范圍內相對誤差小于5%的數據占比超過了50%。

圖9 LSTM在驗證集上的不同相對誤差范圍數據百分比

圖10 LSTM在驗證集上的不同濃度范圍內相對誤差小于5%數據百分比
在獲得最優SO2排放預測模型后,本文利用多目標粒子群優化算法,對濕法脫硫系統的部分運行參數進行優化,部分工況下優化結果表11所示。由表11可知,發電機功率較低時,脫硫成本一般較高。為降低脫硫成本,可嘗試減小循環泵開啟臺數。為進一步說明各參數對濕法煙氣脫硫系統的影響,本文分析了在發電機功率為380.442 MW情況下分別改變四個參數時WFGD出口SO2預測值和脫硫成本的變化情況,結果見圖11―圖14,豎虛線表示該參數的初始值。

表11 部分工況下脫硫系統優化前后效果對比

圖11 WFGD出口SO2預測值和脫硫成本隨#1FGD入口煙氣溫度1變化

圖12 WFGD出口SO2預測值和脫硫成本隨#1吸收塔修正液位1變化

圖13 WFGD出口SO2預測值和脫硫成本隨#1吸收塔漿液pH值變化

圖14 WFGD出口SO2預測值和脫硫成本隨泵臺數變化
由圖11―圖14可知,在給定工況下,濕法煙氣脫硫系統中#1吸收塔漿液pH值對脫硫過程影響較大,但并不是越大越好,實際運行時通常控制漿液pH值在一個合理范圍內,一般認為選擇在5.2~6.2為宜;從出口SO2濃度的視角看,另外三個參數的變化對其影響不大;但從脫硫成本的視角看,泵臺數的變化對其影響較大,泵臺數越多,脫硫成本越高,出口SO2濃度卻沒有明顯下降,另外三個參數對脫硫成本則影響較小。權衡出口SO2濃度和脫硫成本,#1FGD入口煙氣溫度1的選擇在98.281 ℃,#1吸收塔修正液位1選擇在9.667 m,#1吸收塔漿液pH值選擇為5.397,泵臺數選為2臺,此時脫硫成本下降了18.44%,出口SO2濃度則由于#1吸收塔漿液pH值的提升有一定程度的下降。
綜上所述,本文提出的方法可以用來對濕法煙氣脫硫系統開展優化。
本文針對燃煤電廠濕法煙氣脫硫系統脫硫過程建模存在的模型準確性不足的情況,采用數據驅動建模方法,通過箱形圖對異常值進行識別刪除,使用動態建模和一階差分預測方法,用機器學習算法對濕法脫硫系統進行建模,對下一采樣時間的脫硫系統出口二氧化硫濃度進行了預測,用決定系數和均方誤差判斷所建立模型的優劣,并對比不同機器學習算法的預測效果,選出效果較好的模型;并進一步基于數據驅動的脫硫過程模型,根據多目標粒子群優化算法,得到優化后的帕累托最優解集,在脫硫成本和出口SO2濃度之間權衡,在最優解集中選擇優化的脫硫系統運行參數值。主要有以下幾點結論:
1)由訓練結果可以得出,動態建模加一階差分預測的方法顯著優于靜態建模方法,說明動態建模加一階差分預測的方法能較為準確地表征復雜的脫硫過程。
2)通過對比不同機器學習算法的結果,得出LSTM神經網絡的建模能力略優于其它算法,說明LSTM神經網絡能更好地處理時間序列數據。
3)根據多目標優化結果,隨著脫硫成本的上升,出口SO2濃度逐漸下降;在實際運行時,運行人員可以根據優化結果,在脫硫成本和出口SO2濃度兩者之間權衡,實現經濟穩定運行。