馬 湧 孫彥廣
(冶金自動化研究設計院混合流程工業自動化系統及裝備技術國家重點實驗室 北京 100071)
蒸汽是鋼鐵企業生產和生活所必需的能源,蒸汽能耗占企業能耗總量的10%左右。在大型聯合鋼鐵企業里,蒸汽系統具有大時滯、大慣性、非線性等特點的復雜對象。面對這樣的復雜運行狀況,管理人員基本還是依靠多年來的生產所運行積累下的經驗指揮系統運行[1],難以避免發生放空、降質使用等情況,造成極大的浪費。國內外學者對此展開了研究,文獻[2-4]的研究對方程求解易于陷入局部最優解,造成得到解是非最優解。文獻[5]根據特定企業生產實際,從供應和生產兩端分別入手進行求解,該方法通用性有待改進。
本文基于鋼鐵企業蒸汽調度歷史記錄,建立決策樹模型,并進行調度規則求解,得到優化的企業調度規則系統,從而有效提高管網操作水平和效率,保證管網高效安全運行。
某鋼鐵企業蒸汽管網由S1、S2、S3三個壓力等級管網構成。S1管網壓力相對較高,其汽源和用戶數量較少,結構簡單。S2管網有8個供汽源和20個主要用戶。S3蒸汽管網又稱作低壓蒸汽管網。該鋼鐵企業蒸汽管網系統整體結構圖如圖1所示。

圖1 某鋼鐵企業蒸汽管網結構圖
該鋼鐵企業蒸汽系統是多汽源、多用戶系統,其日常調度嚴格按照事先制定規則執行。例如,以一個管網的波動周期為例,根據企業的調度規則,當管網壓力處于上升區間時,首先判斷汽源鍋爐是否還有可調節余量,若有則調控汽源鍋爐,減少供汽量最大調節幅度每次10 t/h;若壓力繼續上升并超過A2則調節CDQ汽輪機,減少抽汽量,增大發電功率;若壓力超過A3,則增大海淡產量,以及提高換熱站使用S2的蒸汽量;若壓力繼續升高,則要開啟放散閥以保證管網的運行安全。
反之,當壓力低于正常運行值時,首先增加汽源鍋爐供汽量,若達不到目標要求,則增加CDQ抽汽量,壓力持續降至A6則需海淡減產,換熱站增用S3,減少S2用量,直至調整300 MW發電機組增加供汽量。調控過程如圖2所示。

圖2 一個管網波動周期內調控示意圖
在該大型鋼鐵企業蒸汽管網系統中,S1管網用戶單一,且規模較小,其控制和調度較為簡易。S3管網為低壓管網,用戶均為穩定長期低壓用戶,管網波動較小,對管網沖擊有限。S2管網連接幾乎全部的生產用戶和所有供汽源,波動頻繁,對管網的沖擊較大,因而S2管網調度難度最大。
蒸汽系統運行的調度控制指標分為三個區間,分別是:綠區,0.7~0.85 MPa,正常工作區間;黃區,0.6~0.7 MPa,0.85~0.95 MPa,偏離正常狀態、需調整區間;紅區,小于0.6 MPa,大于0.95 MPa,不能滿足生產或極有可能引起生產故障的非法區間。
總的調度原則是保證管網大部分時間在綠區運行,減少黃區運行時段,消除紅區運行工況。
決策樹是一種算法結構,其結構即為決策型樹狀結構,與流程圖的樹形結構類似[6],樹的根節點是頂層節點。決策樹的選擇分裂規則很多,屬性選擇度量方法是較為常見的一種[7-9]。其主要思想為一種啟發式方法,即將給定類標號的訓練樣本集的數據S按照“最純”的標準劃分為單個類。在建立決策樹算法的過程中,如何建立最佳分裂屬性顯得非常重要和關鍵,而屬性選擇度量的方法又多種多樣,如信息增益、增益率、GINI(基尼)指標、距離度量以及相關度等方法[10]。本文所主要介紹的選擇度量方法是信息增益屬性度量方法。
1948 年,香農(C.E. Shannon)提出信息論后,把熵(Entropy) 定義為衡量一個系統混亂程度的統計量,其中熵值越大,則表明系統越混亂,反之則越小。信息論中對信息量(Information)和熵(Entropy)也分別作出明確的定義和解釋:
Information=-log2(pi)
(1)
Entropy=-∑pilog2(pi)
(2)
式中:pi為該樣本屬于某類別的概率值。
? 劃分前數據集的熵:
對于樣本集合S,有s個數據;對于分類屬性C劃分了m個分別不同的離散值c1,c2,…,cm(即表明數據樣本S最終要被分成m個類別)。樣本數s1,s2,…,sm對應的分類屬性值分別為c1,c2,…,cm。則劃分之前,樣本集S的總熵值:
(3)
式中:pi是S集中任意一個樣本屬于類別ci的概率,并用si/s估計。
? 劃分后數據集的熵:
設{a1,a2,…,an}是屬性A對應的n個不同的離散屬性值,則可使用屬性A將數據集S劃分為n個子集{s1,s2,…,sn},對應其中每個子集Sj中所有樣本的屬性A都是aj。
設子集Sj中的全部樣本數為sj,其中分類屬性值為c1,c2,…,cm的樣本數為s1j,s2j,…,smj,則子集Sj的熵為:
(4)
式中:pij=sij/sj,是Sj中樣本分別屬于類別ci的概率。
使用屬性A把數據集S劃分成n個子集后,S的總熵為n個子集的熵的加權平均:
(5)

? 信息增益:
信息增益是用來表示系統中由于分類而獲得的信息量,其量度是由系統熵的增減而定。把S劃分前后的熵差定義為數據集S按屬性A劃分后的信息增益,公式如下:
Gain(A)=I(s1,s2,…,sm)-E(A)
(6)
鋼鐵企業蒸汽系統優化調控是一個極其復雜的問題,許多優秀的調度員在長期的工作中,通過對自己調度經驗的總結與沉淀,形成了一些經驗型的調度知識。這些調度知識不僅是鋼鐵企業的寶貴財富,同時也構成了鋼鐵企業能蒸汽態優化調控專家系統的知識庫中的核心知識。專家知識主要包括主動調整和被動調整,其中主動調整包括主動計劃調度和被動計劃調度,被動調整是指事故狀態下調度相關的調度原則。
以該大型鋼鐵企業蒸汽管網某時段內18條調度記錄為例,調度記錄中包括三個條件屬性和一個決策屬性。其中調度狀態包括:主動計劃調度、被動計劃調度、事故狀態調度;管網波動原因為導致管網管網不平衡的用戶或者汽源;管網調節量是指需要達到管網平衡所需要調節的量;調度方案為決策屬性變量,是最終調度人員采取的調度手段。調度人員值班記錄如表1所示。

表1 調度人員值班記錄表

續表1
上述樣本集S的總熵(期望信息)為:
0.471 1+0.513 3+0.430 8=
1.415 2
(7)
調度狀態信息熵:


1.312 9
(8)
信息增益:
Gain(調度方式)=1.415 2-1.312 9=0.102 3
同理可得其他屬性的信息增益:
Gain(管網波動原因)=0.015 5
Gain(管網調節量)=0.010 6
可以看出Gain(調度方式)最大,即有關調度方式的信息對分類幫助最大,提供最大的信息量。根據增益最大化原則,選擇調度方式作為測試屬性,將訓練集分成兩部分,即生成兩個節點,然后再對這兩個節點依次遞歸使用以上方法。生成決策樹如圖3所示。

圖3 蒸汽管網調度決策樹
調度規則決策樹的形成是基于現場的專家知識庫系統以及事實庫最終形成調度規則決策樹,對于形成的決策樹,按照“if-then”的形式從樹根到樹葉獲取調度規則,更加適于計算機編程實現。例如數據集有屬性X、Y、Z,可以得到的調度規則為ifX=“x1” andY=“y1” thenZ=“z1”。將上面樹狀的調度決策樹表示成易于計算機語言來表示的“if-then”形式如下:
在主動調度方式下:
① IF (海淡計劃性增減用汽&&調整量為20 t/h)
THEN {增減干熄焦抽汽量;}
② IF (海淡計劃性增減用汽&&調整量為25 t/h)
THEN {130鍋爐增減供汽量;}
③ IF (高爐計劃性檢修&&調整量為10 t/h)
THEN {130鍋爐增減供汽量‖增減干熄焦抽汽量;}
④ IF (煉鋼RH計劃性不用汽&&調整量為10 t/h)
THEN {35 t啟動鍋爐減供S1蒸汽;}
在被動調度方式下:
IF (壓力過高達到黃區)
THEN {干熄焦發電機組減抽汽量;}
在上述調度過程中,蒸汽調度的調整以保持管網平衡為基本原則,同時要符合產用汽設備的能力限制等條件。
選取該企業連續兩個月正常生產情況下,前一個月采用原有調度方式,后一個月采用決策樹系統進行調度。然后將兩個月管網運行狀況進行對比分析。在決策屬系統應用前,管網運行的區間分布為:綠區占72.62%,黃區占27.05%,紅區占0.33%。投入決策屬系統后紅區工況消除,黃區運行時間降至10.8%,綠區運行時間時間提高到89.2%。具體對比如圖4所示。蒸汽決策樹規則系統提高了管網運行效率和安全性能,對蒸汽系統的管理調度提供了有針對性的決策支持。

圖4 決策樹規則系統應用前后效果對比圖
蒸汽系統是鋼鐵企業生產生活所必備能源之一,以上應用結果表明,建立一套有效的綜合蒸汽管網調度控制系統可全面提升企業的蒸汽系統管理水平,保證蒸汽管網的安全高效運行。
本文以決策樹方法理論為基礎,研究了鋼鐵企業蒸汽管網調度規則系統。根據決策樹原理的系統熵及決策屬性等方法,結合現有企業調度規則庫、專家知識庫以及事實庫,以典型的決策樹算法建立某鋼鐵企業蒸汽管網調度規則決策樹系統。驗證表明,該決策樹規則系統可大大提高管網綠區運行時間,減少黃區運行時段,消除紅區工況,使得管網調度策略更加合理安全,有效提高蒸汽管網運行效率,保證管網更加安全運行。