黃遠紅,黃清寶
(廣西大學電氣工程學院,廣西 南寧 530004)
DE-ELM在水煤氣組分濃度軟測量建模中的應用
黃遠紅,黃清寶
(廣西大學電氣工程學院,廣西 南寧 530004)
水煤氣組分(H2、CO、N2、CO2、O2)濃度是合成氨煤制氣最關鍵的工藝參數之一,其與生產過程安全、穩定和成本控制密切相關。由于實時在線測量設備成本極高、維護困難、技術難度大,一般企業仍采用人工分析化驗法。針對人工分析化驗的方法造成的測量數據準確度差、滯后時間長、人為影響因素大,不利于煤制氣生產過程的操控等問題,提出利用差分進化算法優化極限學習機(DE-ELM)神經網絡系統,建立水煤氣組分濃度的軟測量模型,測量水煤氣組分各濃度。將改進的方法與逆向神經網絡(BP)、廣義回歸神經網絡(GRNN)、極限學習機(ELM)的水煤氣組分濃度軟測量模型進行對比分析。對比結果顯示,基于DE-ELM的水煤氣組分濃度軟測量模型精度更高、泛化性能更好,所測數據與實際生產數據吻合度更高,能更好地滿足合成氨造氣爐生產過程的實時調控要求。
安全; 軟測量; 神經網絡; 模型; 優化控制; 迭代; 極限學習機
合成氨工業[1]在國民經濟中具有重要的地位。其原料水煤氣的主要成分[2]為氫氣(H2)、一氧化碳(CO)、氮(N2)、二氧化碳(CO2)、氧氣(O2),這些成分的濃度難以實現實時、在線測量。一般企業只能通過人工取樣(主要為H2、CO、N2、CO2、O2)手動分析,實現對水煤氣組分濃度的檢測,但無法保證數據的連續性、實時性、穩定性和準確性。
極限學習機(extreme learning machine ,ELM)[3]神經網絡以其學習速度快、泛化性能好的優點被大量應用于軟測量建模[4],但由于ELM的連接權值和閾值是隨機選取的,隱層神經元節點數較大,導致極限學習機存在結構復雜、仿真時間過長等缺點。為此,引入差分進化算法(differential evolution method,DE),基于種群的全局搜索策略,確定ELM的最優初始權值[5],以改善ELM網絡的結構。該方法為差分進化算法優化極限學習機(DE-ELM)。
根據造氣爐的生產過程與特點,選取與水煤氣組分有極大關系的在線生產數據作為輸入變量,手動離線檢測數據作為輸出變量,采用DE-ELM方法構建水煤氣組分濃度的軟測量模型,并與BP、GRNN、ELM的軟測量結果進行比對分析,證明其在模型精度和泛化能力上的優勢。
1.1 ELM
ELM于2004年由黃廣斌提出,是一種簡單、易用、有效的單隱層前饋神經網絡(single hidden layer feedforward neural network,SLFN)。ELM網絡拓撲結構[6]如圖1所示,其隱層只有一層節點。

圖1 ELM網絡拓撲結構圖
圖1中:輸入變量為xi(i=1,2,...,n),中間隱層有i個神經元,輸出層有m個神經元;輸入層與隱層間的連接權值為ω,隱層與輸出層的連接權值為β,隱層神經元閾值為b;網絡有Q個樣本的訓練集,輸入矩陣為X,輸出矩陣為Y,隱層神經元激勵函數為g(x)。
網絡輸出T為:
T=[t1,t2,...,tQ]m×Q
(1)
式中:j=1,2,...,Q;ωi=[ωi1,ωi2,...,ωin];xj=[x1j,x2j,...,xnj]T。
式(1)又可表示為:
Hβ=T′
(2)
式中:T′為矩陣T的轉置。
當激活函數g(x)無限可微時,ELM的參數無需全部調整(ω和b可以隨機選擇,且恒定),可通過求解以下方程組的最小二乘解獲得:
(3)
其解為:
β=H+T′
(4)
式中:H+為隱含層輸出矩陣H的Moore-Penrose廣義逆。
1.2 差分演化算法
差分演化算法[7-8]是1995年由Storn等人提出的一種基于群體進化的算法。該算法具有種群內信息共享和記憶個體最優解全局收斂能力、魯棒性較強的特點。算法流程如下。
①種群初始化:隨機選擇個體p(滿足約束條件),并組成大小為NP的種群。
pi={pi1,pi2,...,pij}
(5)
式中:i=1,2,...,NP;j=1,2,…,D,D為自變量個數。
(6)

②變異操作:從種群中隨機選擇三個個體(pr1,g、pr2,g、pr3,g),且互不相等。
vr,g+1=pr1,g+Fg(pr2,g-pr3,g)
(7)
式中:vr,g+1為新構造的向量;F為縮放因子;g為代數。
式(7)只表示其中一種變異策略,不同的要求可設定不一樣的策略(公式)。
③交叉操作:新個體vr,g+1(變異操作)與xi(父代)離散交叉得到更新的個體ui。
(8)
式中:交叉概率CR∈[0,1];rand(i)為第i個向量產生的[1,D]間隨機整數。
④選擇操作:新生代與上代變量的適應值比較,值小者進入下一代,否則保留。
(9)
2.1 生產流程
固定床間歇氣化法采用交替吹風和制氣的方式生產水煤氣,完成一次吹風和制氣的過程稱為一個工作循環。一個循環包括5個階段:吹風、一次上吹、下吹、二次上吹、空氣吹凈。
2.2 工藝條件
合成造氣流程工藝條件包括溫度、吹風速度、水蒸氣用量(上吹、下吹)和其他輔助及安全監控參數[9]。
①溫度:造氣爐的溫度主要是指氣化層溫度,但由于氣化層溫度難以測量,操作工一般參考造氣爐的其他相關溫度(上、下氣道和爐條)測量值進行操作;爐溫越高,水煤氣產量越高,一氧化碳、氫氣的含量濃度就越高;但爐溫也不能超過煤的灰熔點,以避免爐內結疤。
②吹風速度:一般換算成吹風量(一次加氮)計算;吹風速度越快,爐溫提升越迅速,但風速過大也會破壞正常氣化條件。
③水蒸氣用量(上吹、下吹):水蒸氣用量直接關系到水煤氣的產量與質量。用量大則產氣量大,但水煤氣質量差;用量小則產氣量少。
④其他輔助及安全監控參數:爐條電流、爐條轉速、爐上/下壓力等。
3.1 模型描述
受控于造氣爐運行參數的水煤氣各組分濃度,對于液氨的生產、成本控制以及安全環保等各方面極為重要,但連續在線測量極為困難;而軟測量技術[10-11]能夠采用相對容易獲得的過程變量(輔助變量)數據,通過計算機的數學運算,與難以測量的待測變量(主導變量)建立數學關系(軟測量模型),以軟測量模型實現水煤氣組分濃度的實時檢測并進行相關研究。
3.2 模型形式的確定
DE-ELM神經網絡算法的主要流程為:ELM網絡確定、差分進化算法優化相關參數、最優參數的DE-ELM訓練和仿真。該算法具體流程如圖2所示。
3.3 模型評價指標
均方根誤差(RMSE)可用來衡量仿真值與真值之間的偏差。
(10)
式中:i為樣本個體;n為樣本總數;yi為仿真輸出值;y為樣本輸出量。

(11)
軟測量模型訓練時間以仿真運行時間長短作為判斷網絡優劣的依據之一。
4.1 樣本數據的預處理
4.1.1 建模樣本數據的選取
為了真實地反映水煤氣組分濃度,即主導變量,共收集了與組分濃度密切相關的11類在線實時數據,作為測量模型的輸入變量(即輔助變量,各變量具體作用見2.2節);選取2015年的2 784組主導/輔助變量數據作為樣本。輔助變量部分樣本數據如表1所示。
4.1.2 樣本數據的預處理
建模數據直接采集生產中儀表測量的真實數據(2 784組),數據離散性、突變和誤差相對較大。對此,先采用小波降噪和一維中值濾波對數據進行預處理;然后對樣本數據進行歸一化處理,使數值分布在[-1,1],便于數據的處理。
4.1.3 樣本數據的功能劃分
因數據量大,考慮到生產過程的復雜性和工藝操作習慣、生產時段的差異,從樣本數據交叉等距抽取3/4數據(2 088組)作為訓練樣本,另外等距的1/4數據(696組)為測試樣本。
4.2 DE-ELM相關參數的確定
ELM網絡結構采用11個輔助變量、5個主導變量,對于隱層神經元節點數(hiddennum)的選擇尚無很好的確認最佳值方法(以下通過不同節點數試驗確定較好的節點數),激勵函數采用常見的“Sigmoid”函數,而輸入-隱層的連接權值和閾值通過DE算法尋找最優組合值。

表1 輔助變量部分樣本數據(在線測量)
DE需考慮的參數較多,有種群規模、最大迭代次數、搜索上/下限、縮放因子、交叉概率、測試方程索引、變異策略等。本模型主要考慮種群規模(population size)和最大迭代次數(max interation)對測量的影響。
4.3 軟測量模型仿真及驗證分析
應用Matlab7.0軟件平臺對DE-ELM軟測量模型進行仿真,選擇5個主導變量之一的H2濃度(最重要的組分)作為仿真分析的依據。
4.3.1 隱層神經元節點數對模型的影響
采用不同的隱層神經元節點數對DE-ELM網絡進行仿真,結果如表2所示。

表2 隱層神經元節點數的性能評價對比
從表2的數據來看:不同隱層神經元節點對仿真影響差別不大:神經元節點數越多,擬合誤差越小、相關系數越大,但是重要的是泛化誤差并沒有規律,而且運行時間變得很長;神經元節點數的增加,對測量模型的誤差和相關系數影響不是特別明顯,但是時間卻是成倍的增長。從整個運行效果來看,隱層神經元節點數可適當取小一點,在對精度沒有特別要求的前提下,模型能夠快速運行。
4.3.2 種群規模對軟測量模型的影響
采用不同的種群規模對DE-ELM網絡進行仿真,結果如表3所示。

表3 種群規模的性能評價對比
從表3數據來看,種群規模對軟測量模型的影響較大。種群規模越大,則差分選擇優質個體的幾率相對較大,擬合誤差、相關系數或泛化的效果越好,誤差減少的幅度較大。但與此同時,運行時間也會隨種群的增大而相應增加。
4.3.3 最大迭代次數對軟測量模型的影響
采用不同的最大迭代次數對DE-ELM網絡進行仿真,結果如表4所示。

表4 最大迭代次數的性能評價對比
從表4數據來看,最大迭代次數對軟測量模型影響較大。但從仿真的結果來看,它對模型的影響并不表現出單純的正比關系,這是由于模型仿真的隱層神經元節點數、種群規模及最大迭代數較小,極易受縮放因子、交叉概率、變異策略等影響,導致出現局部極小值問題。
4.3.4 不同算法的軟測量模型的對比
分別采用DE-ELM、BP、GRNN、ELM等神經網絡對軟測量模型效果進行對比,結果如表5所示。

表5 不同算法的性能評價對比
從表5數據來看,利用DE-ELM軟測量模型的效果非常顯著:①由于需用ELM計算個體的適應度值,其運行時間比單純的ELM算法長,但仍比BP算法速度提高了十幾倍;②四種算法得到的仿真誤差、相關系數都比較接近,說明這四種模型均能很好進行仿真;③DE-ELM的擬合能力與GRNN接近,比BP、ELM精度更高,其泛化性能優于其他三個模型,說明其有更強的泛化能力。
真實數據、DE-ELM和ELM對H2濃度的泛化曲線對比如圖3所示。

圖3 泛化曲線對比圖
4.3.5 分析結果
綜合以上的分析,DE-ELM軟測量模型在魯棒性、泛化能力以及運行時間上比其他三種流行算法模型更具綜合優勢。利用最優參數給出的DE-ELM軟測量模型性能評價指標如表6所示。
表6 DE-ELM軟測量模型性能評價指標表
Tab.6 Performance evaluation indexes of soft-sensing modeling based on DE-ELM

組分濃度擬合精度泛化精度擬合誤差RMSE擬合相關系數R2泛化誤差RMSE泛化相關系數R2CO24.3254e-70.986770.0186680.97140O20.0107156.1841e-90.918500.0011040.84614CO8.5017e-70.987930.0752870.96871H20.0107151.5384e-70.997050.0029520.97060N21.6277e-70.984770.0297620.93213
差分進化算法優化極限學習機(DE-ELM)的水煤氣軟測量模型,具有精度高、用時短、魯棒性強和泛化性能好等優點,克服了人工取樣、手工化驗的延遲性,消除了人為因素的影響;同時,由于輔助變量取自制氣工藝的關鍵參數,對生產過程的調控也有非常重要的指導作用。本文既對影響DE-ELM模型的關鍵參數進行仿真分析,又與當前流行的BP、GRNN、ELM算法軟測量模型進行比對分析。對比分析結果表明,DE-ELM軟測量模型的仿真時間更短、精度更高、泛化性能更好。因此,該軟測量模型在實際生產過程中有較高的應用價值。
[1] 崔恩選.化學工藝學[M].北京:高等教育出版社,1990:163-164.
[2] 施湛青.氮肥工業與生產操作[M].北京:全國化工技術培訓教材編委會,1987:7-8,11-20.
[3] HUANG G B,ZHU Q Y,SIEW C K.Extreme learning machine:theory and applications[J].Neurocomputing,2006,70(1-3):489-501.
[4] 潘立登,李大宇,馬俊英.軟測量技術原理與應用[M].北京:中國電力出版社,2009.
[5] ZHU Q Y,QIN A K,SUGANTHAN P N,et al.Evolutionary extreme learning machine[J].Pattern Recognition,2005,38(10):1759-1763.
[6] 孫鑫.極限學習機結構優化及其應用研究[D].南寧:廣西大學,2014.
[7] 劉明廣.差異演化算法及其改進[J].系統工程,2005,23(2):108-111.
[8] 趙斌.基于改進差分進化算法的火電廠負荷分配問題研究[D].武漢:武漢理工大,2013.
[9] 陳志偉.影響造氣爐運行的幾個重要條件[C]//第二十二屆全國造氣技術年會,2014:51-52.
[l0]林盛,梁強,高樹奎.軟測量技術在石化過程中的應用[J].當代化工,2009,38(2):182-184.
[11]梁玉明,王雁芬.軟測量技術在化工生產中的應用[J].云南化工,2012,39(6):57-59.
Application of DE-ELM in Soft-Sensing Modeling for Component Concentration of Water Gas
HUANG Yuanhong,HUANG Qingbao
(School of Electrical Engineering,Guangxi University ,Nanning,530004,China)
The concentration of components (H2、CO、N2、CO2、O2) in watergas is one of the most important process parameters in the synthesis ammonia gas production,and it is closely related to safety,stability,and cost control of the production process.For the real-time online measurement equipment is extremely high in cost,difficult in maintenance and hard in technology,the methods used in general enterprises are mostly based on manual analysis in laboratory and feature many disadvantages,such as low accuracy,long time delay,and with various human factors that are not conductive to gas production.Aiming at these problems,to measure the concentration of each component,the soft-sensing model is set up by using differential evolution extreme learning machine (DE-ELM) neural network system.The soft-sensing model is analyzed and compared with back propagation (BP) neural network,generalized regression neural network (GRNN),and extreme learning machine (ELM).The results show that soft-sensing modeling based on DE-ELM has higher accuracy and better generalization performance,the measured data are more consistent with the actual production data,and it can better satisfy the needs of real time regulation and control of the actual production process of synthesis ammonia gas-making furnace.
Safety; Soft-sensing; Neural network; Model; Optimal control ; Iteration; Extreme learning machine
minβ‖Hβ-T′‖
黃遠紅(1969—),男,在讀碩士研究生,工程師,主要從事工業過程自動化方向的研究。E-mail:hyhlh@126.com。 黃清寶(通信作者),男,碩士,副教授,主要從事過程控制、智能控制方向的研究。E-mail:3177151@qq.com。
TH81;TP391.9
A
10.16086/j.cnki.issn 1000-0380.201702020
修改稿收到日期:2016-09-05