白 鵬,王 浩
(山西省信息產業技術研究院有限公司,山西 太原 030012)
鋼鐵企業高爐在生產過程中會產生可燃性的氣體,這些氣體是高爐生產過程的副產品,統稱為高爐煤氣[1](Blast Furnace Gas,BFG)。高爐煤氣的主要成分是CH4、CO、CO2等氣體。高爐煤氣可以作為熱風爐、軋鋼加熱爐等其他冶金設備的燃氣,從而降低冶煉的額外燃料消耗,減少對環境的污染[2]。高爐煤氣發生量的準確預報預測是實現高爐煤氣合理調度使用的前提,針對高爐煤氣的特點建立準確的預測預報模型意義重大。
綜合國內外研究現狀,對于高爐煤氣生成量的預測主要有時間序列模型、灰色時序模型、人工神經網絡模型等[3]。因其發生量的不確定性以及生成量受多變量影響的特點,目前人工神經網絡模型是高爐煤氣預測的主流方法。但是人工神經網絡是通過權值調整實現不斷學習,自身的結構復雜、魯棒性差,容易陷入局部最優。基于此本文提出一種改進遺傳算法優化的反向傳播網絡模型,用來預測高爐煤氣的生成量。
人工神經網絡預測模型是根據仿生學的經驗,模擬神經元網絡形成的一種模型方法。其中最常用的是BP神經網絡模型[4]。本文根據高爐煤氣系統的特點,采用BP神經網絡模型進行預測。首先建立BP模型的結構,在此將BP網絡分三層即輸入層、中間層和輸出層。假設輸入層的節點數為m個,隱含層節點數為n,輸出層節點數為o。輸入層的第i個節點記為xi,隱含層第j個節點記為hj,輸出層第k個節點記為yk。輸入層節點與隱層節點的網絡權值記為wij,隱層節點與輸出層節點的網絡權值為vjk。
則輸入層計算公式為:
xi→i=0,1,2,…,n.
(1)
隱含層計算公式為:
(2)
其中:函數f(·)稱作激勵函數。
輸出層計算公式為:
(3)
對網絡聯結權值進行調整,沿誤差減小的方向不斷調整網絡聯結權值。在BP學習算法中,對樣本集中的第r個樣本,輸出層期望輸出用dr表示,實際輸出記為yr,目標函數E可以表示為:
(4)
聯結權值的調整公式為:
(5)
(6)

高爐的生產過程伴隨著復雜的理化過程,簡而言之就是爐內的鐵礦石與石灰石在氧氣環境下發生一系列高溫高壓反應,最終生成鐵水和爐渣,并從爐頂放出煤氣的過程。可見高爐煤氣生產過程受多種因素制約,這里以山西某鋼鐵企業1號高爐實際生產數據為統計樣本,選取與高爐煤氣生成量關聯度最大的五個因素為輸入量,分別為焦比(kg·t-1)、煤比(kg·t-1)、風量(m3·min-1)、風溫(℃)、風壓(kPa);輸出為煤氣生成量。網絡結構為三層BP神經網絡,隱含層的激勵函數選擇雙曲正切函數。
遺傳算法(Genetic Algorithm)是一類借鑒生物界的進化規律(適者生存,優勝劣汰遺傳機制)演化而來的隨機優化搜索方法。其基本的算法流程包括產生群體、選擇、交叉、變異等操作。但是傳統的遺傳算法也存在收斂慢、易早熟等問題。針對此問題,提出一種交叉概率和變異概率的自適應調整方法。引入了自適應變異概率函數與自適應交叉概率函數Pc與Pm。可以看出,自適應變異概率函數與交叉概率函數在平面上是一條平滑的曲線,個體的適應度大于群體的平均適應度時,由自適應變異與交叉概率函數可以得到一個較小的變異概率,這樣的設計有利于優秀的個體保留其優秀的“基因”,而在個體的適應度小于群體的平均適應度時,由自適應變異概率函數可以得到一個較大的變異概率,這樣的設計有利于較差的個體加劇其變異。自適應變異概率函數與自適應交叉概率函數如下:
(7)
(8)
其中:Pcmax與Pmmax分別為群體中的最大交叉概率與最大變異概率;F′為本次適應度;β和η均為自適應系數因子,用來控制自適應函數的具體形狀。通過變異概率函數和交叉概率函數控制進化的程度,從而避免了遺傳算法局部最優與早熟的缺點。
利用改進的遺傳算法對BP神經網絡的初始權值進行優化,從而改變傳統BP神經網絡的初始權值是隨機給定的方法。改進遺傳算法優化后的初始權值就已經是空間內尋優后的解,然后將這組最優解代入神經網絡權值中,再進行反向傳播運算調整,可以得到比傳統BP神經網絡泛化能力更高的模型。
神經網絡模型的數學最優解模型可以抽象為:
(9)

其約束條件為:
(10)
其中:E為損失函數;yk(xi)為神經網絡輸出的實際值;w與v分別為m*o與o*n的向量。通過改進的遺傳算法可以求得神經網絡的權值vjk與wij,具體的訓練步驟如下:
(1) 設置初始神經網絡的結構,包括輸入層、隱含層、輸出層的節點個數。
(2) 設置遺傳算法進行所需要的參數:初始種群數量N,最終迭代代數T,初始交叉率Pc0和變異率Pm0,自適應交叉函數與變異函數的系數β與η以及染色體的長度L等信息。
(3) 生成初代種群。
(4) 進行種群的選擇交叉和變異操作,其中變異概率與交叉概率使用上一小節的自適應函數方法確定,即個體的適應度小于種群的平均適應度時,自適應地給定較大的交叉概率和變異概率,反之自適應地給定較小的交叉概率和變異概率。
(5) 如果達到遺傳的代數或者小于目標函數值,則遺傳算法結束,將得到的權值輸入BP神經網絡。若沒有達到條件則重新執行第(4)步。
(6) 將優化的權值代入BP神經網絡進行反向傳播運算,調整權值。最終得到泛化后的神經網絡模型。
仿真所用數據采樣自山西某鋼鐵企業DCS系統數據庫,截取了某一個時間段內的風溫、風壓、煤比等影響煤氣生產的數據,作為訓練集訓練神經網絡,輸出預測的煤氣生成量。首先設定改進遺傳算法的種群數量N、染色體長度L、初始交叉概率Pc0與初始變異概率Pm0、自適應交叉與自適應變異概率函數的系數β與η以及迭代次數T。這里設置種群數量N=50,染色體長度L=7,初始交叉率Pc0=0.7,初始變異率Pm0=0.03,自適應系數因子β=1,η=-1,迭代次數T=100次。然后設置BP神經網絡的結構,由風溫、風壓、焦比、煤比等五個影響因素作為輸入層,輸出層為煤氣發生量的預測值,中間隱含層的神經元個數可由文獻[5]給出的公式進行計算:
(11)
其中:n為隱含層神經元的個數;m為輸入層的節點數,m=5;o為輸出層節點數,即預測輸出o=1;q為調整常數,在此處取q=1。則中間隱含層的神經原個數n=4。改進的遺傳算法進化曲線如圖1所示。

圖1 傳統遺傳算法和改進遺傳算法進化曲線比較
由圖1可以看出,改進后的遺傳算法在第20代就基本收斂,而傳統的遺傳算法約在60代處才發生收斂。這是由于交叉概率與自適應變異概率自適應選取,使個體普遍獲得了向著更加優秀的方向進行“繁衍”。由此得到,改進后的遺傳算法具有局部與全局的快速尋優能力。
圖2是使用普通BP神經網絡預測的高爐煤氣數值與使用改進遺傳算法優化后的BP神經網絡預測的高爐煤氣數值比較。

圖2 普通BP神經網絡和優后BP神經網絡 高爐煤氣生成量預測曲線比較
由圖2可以看出:高爐煤氣生成量的特點是數值快速波動,無明顯的規律性;普通的BP神經網絡模型隨著學習的進行,泛化能力逐漸變差,不適合預測大波動特點的數據,預測的誤差大;而經過改進遺傳算法優化后的BP神經網絡模型,由于在訓練初期就選擇了遺傳算法優選的權值,在模型的構建上更加有針對性,預測的結果更加貼合真實數值,具有較好的泛化能力,能夠用于預測高爐煤氣這種大波動的數據。
表1定量給出普通BP神經網絡模型預測值與改進遺傳算法優化的BP神經網絡模型預測值在絕對百分比誤差(MAPE)、均方誤差(MSE)和均方百分比誤差(MSPE)三個指標上的比較結果。由表1可以看出,改進遺傳算法優化的BP神經網絡預測值在三種指標上均優于普通BP神經網絡模型預測數值。

表1 誤差定量分析
本文建立了高爐煤氣改進遺傳算法優化的BP神經網絡模型用于預測,通過引入自適應變異概率與自適應交叉概率函數,加速了個體的進化速度。經過仿真驗證可得出,改進后的遺傳算法比傳統的遺傳算法具有更快的收斂性,可以更快地在整體空間進行尋優。
利用改進的遺傳算法優化BP神經網絡的權值,并將優化后的BP神經網絡用于高爐煤氣的預測,仿真結果表明:經過優化的BP神經網絡在預測高爐煤氣數值時表現出良好的泛化能力,預測誤差比普通的BP神經網絡更低,預測的結果更加精準。