王天宇 趙 珺 王 偉 王天鑫
鋼鐵生產是高耗能和高排放的生產過程,能源介質的發生與消耗在其中起到了至關重要的作用.隨著煤炭、石油等一次能源的緊缺,充分利用鋼鐵生產過程中產生的副產煤氣不但可以提高企業節能降耗水平,還可減少煤氣放散對環境的污染[1].而在生產工藝和設備狀態相對固定的情況下,對于能源系統的優化調度逐漸成為實現節能降耗的重要手段.
一些現有的能源優化調度研究已經在文獻中有所報道,包括強化學習[2]、基于數學規劃方法[3-4]、案例推理[5]以及因果關系建模[6]等.其中,文獻[2]提出了一種結合專家經驗和生產計劃的能源動態調度策略.文獻[3]采用預測-調度兩階段方法,首先利用高斯過程回歸對不確定條件下的能源需求進行預測,從而建立關于容量約束的優化調度模型.文獻[4]提出了一種新穎的數學規劃模型,研究了燃氣系統緩沖用戶中富余煤氣的優化配置.針對連續生產過程建模,文獻[5]設計了一種稀疏模糊推理方法,用于推測具有動態特征的調度知識.此外,一種基于粒度因果關系的方法被用來挖掘間歇性生產特征下能源產消過程的因果關系,進而建立基于因果推理調度模型[6].在智能學習與優化調控方面,文獻[7]針對離散時間最優控制設計,介紹了集成學習逼近器和強化公式的評價智能方法.文獻[8]設計了一種基于折扣廣義值迭代的智能算法,有效解決了一類復雜非線性系統的最優跟蹤控制問題.文獻[9]結合神經標識符學習和啟發式動態規劃算法,解決了非仿射離散時間系統的最優跟蹤控制問題.上述方法在智能優化控制領域提出了創新性的思路.然而,由于生產工況的多樣性,能源系統的運行條件可能會實時變化,需對能源發生、消耗和存儲過程中所包含的多工況知識進行有效表示,并衡量它們對調度模型的影響,進而實現對于調整方向和調度量的有效判斷.
針對包含多工況特性的建模方法,文獻[10]結合條件指示變量(專家知識) 和條件驅動聚類建立工況劃分模型,可將時間尺度的非平穩和瞬態過程巧妙地還原到不同的條件切片中,在同一條件切片內揭示相似的過程特征.文獻[11]針對操作條件切換和生產產品變化,提出一種條件判別自編碼器來表征穩態模式,并設計了基于注意力的評估器對暫態特征進行描述.此外,文獻[12]提出了一種具有魯棒性的指數平穩子空間分析算法,探索用于非平穩過程監控的自適應策略.上述研究可以有效結合專家經驗和實際數據,提出了面向多工況特性的精確建模方法.然而其主要針對工業暫態特性和過程監控問題進行分析,而本文方法側重于研究工業能源產消變化的穩態過程.
近年來,基于深度網絡的表征學習技術受到廣泛關注.通過以低維向量的形式表達研究對象的語義信息,可以提高知識獲取、表示和推理的性能.其中,對比學習側重于從大規模數據中挖掘潛在信息,提高下游任務的數據表示能力.例如,文獻[13]通過預先訓練的教師模型學習知識表示,并采用聚類方法將其簡化為偽標簽,然后使用偽標簽訓練下游學生網絡,以提升圖像分類精度.文獻[14]采用動量對比學習實現新冠病毒的CT 圖像快速診斷.目前,對比學習方法還被廣泛應用于語義分析[15]、推薦系統[16]和視覺表示[17]等研究領域,但在能源系統知識型工作中應用較少.而由于能源系統優化調度過程需結合機理知識、專家領域知識和運行數據中的隱含知識,包含復雜工況條件,因此采用深度對比網絡獲取顯性/隱性知識將是有益的嘗試.
粒度計算理論是通過粒度化的方式對不同尺度和層級的數據進行統一描述,促進了可用數據和存在性關系的知識組織方式[18].針對副產能源系統調度問題,通過時間跨度、幅值和線型等三維特征構建能源數據的粒度知識表示,提出了基于協同條件聚類的長期預測模型[19].針對工業實際對于建??煽啃缘男枨?分層粒度計算方法[20]被用來建立區間形式的預測模型.以設備變量信息粒為基本處理單元,粒度計算還結合了模糊邏輯和強化學習來獲得動態調度策略[21-22].考慮到目前對比學習主要應用于具有顯式語義描述的領域,因此對于工業能源系統的知識型工作,可采用粒度計算方法從能源數據中提取語義特征,為深度網絡提供更為豐富的數據信息.
本文面向鋼鐵燃氣產消過程的多工況特征,提出了一種基于分層粒度對比網絡的調度知識獲取與建模方法.首先通過粒度化的方式劃分和描述能源數據,形成多維度特征語義表示.為了提取多工況調度知識,利用專家經驗數據劃分樣本,構建基于粒度對比學習的知識表征網絡,并采用多層次的學習策略來學習經驗數據具有的多工況類別特性.為進一步挖掘出深層次的隱藏信息,提出了一種基于閉環反饋機制的分層對比網絡模型.據我們所知,本文工作是對比學習首次應用于鋼鐵工業能源系統的知識提取與優化調度領域.實驗部分結果表明了本文方法獲得的知識表示可擬合出專家水平的調度策略,并能夠有效提高燃氣系統的建模精度.
本文結構如下: 第1 節就典型燃氣系統結構和優化調度過程中涉及的知識型工作作出簡單介紹及分析;第2 節描述基于分層粒度對比網絡的知識獲取及建模方法;第3 節給出大量的仿真實驗,充分驗證所提方法的有效性;第4 節對全文進行了總結和展望.
鋼鐵燃氣系統是工業生產與能源消耗相互耦合的主體.圖1 所示為一個典型能源系統(高爐煤氣系統) 結構圖,主要由煤氣發生用戶(高爐)、傳輸管網、煤氣柜以及一系列煤氣消耗用戶4 部分組成.其中,4 座高爐作為發生單元,每小時可以向傳輸管網輸送約180 萬立方米煤氣.傳輸系統包括管網、混合站和壓力站.消耗用戶主要包括煉焦爐、熱軋廠、冷軋廠、化工產品回收(Chemical product recycling,CPR)、低壓鍋爐(Low pressure boiler,LPB)、合成單元(Synthesis unit,SU) 和發電機.由于4 座高爐在產生高爐煤氣的同時,其自身配備的熱風爐在切換過程中會消耗大量高爐煤氣,導致流入管網的煤氣流量頻繁波動.此外,在生產過程中還會出現諸多異常狀態,如高爐減風、設備參數變化等.為維持能源系統的平衡穩定,現場操作人員需要監控各能源用戶的運行狀態,進而作出能源產消的工況判斷,在必要的情況下對一些可調整用戶(如電廠、低壓鍋爐等) 的煤氣消耗量做出調整(如圖2 所示),以保證煤氣柜的安全運行,達到節能減排的目的.

圖1 典型鋼鐵工業燃氣系統結構圖Fig.1 A typical structure of the gas system in steel industry

圖2 燃氣產消多工況特征及調度過程Fig.2 The multi-condition characteristics and their scheduling process of gas generation and consumption
考慮到燃氣系統的復雜結構,導致很難對整個系統的能源產消過程建立機理模型.另一方面,單純基于數據的方法無法區分出不同調度工況下的系統運行狀態及差異.而知識型工作自動化能夠將經驗和數據緊密聯系,有針對性地提取不同工況條件下的深層次調度知識,并通過知識的表示及處理方法實現精準的判斷和創新性的決策任務[23].因此,如何從數據中提取出與調度工況和系統狀態相關的知識,構建關于鋼鐵副產能源系統的知識獲取及表示方法,對于其優化調度工作具有重要意義.
考慮到燃氣產消過程的復雜工況及其對于調度決策的影響,本文提出一種基于分層粒度對比網絡的調度知識獲取與表示方法.整體架構如圖3 所示,可分為三個階段,即數據預處理與粒度化、分層粒度對比網絡構建及調度實施階段.

圖3 所提方法整體框架圖Fig.3 The overall framework of the proposed method
第一階段將主要用戶數據進行濾波處理,根據能源數據的波動語義構建特征信息粒.第二階段利用專家經驗知識建立粒度對比網絡,形成定性的工況知識表示.而后通過定義輸出層得到現有知識表示的評價函數,依據定量的評價反饋結果添加表示層,并利用分層對比學習模型細化工況特征表示.
第三階段,首先根據能源用戶的實時狀態,根據建立的分層對比網絡獲得多工況特征的組合向量,而后根據不同的下游任務建立相關預測及調度模型,獲得完整的調度方案.
目前深度對比學習主要用于處理文本、圖像等具有顯式語義描述的領域,通過對圖片數據的增強(如隨機剪切、隨機顏色失真等) 來構建適用于處理圖像信息的表示形式.針對包含時變信息和多因素影響的工業能源系統數據,采用粒度計算的方式提取語義信息,形成適合于下游深度網絡的數據表示形式.考慮到能源數據的波動趨勢包含豐富的生產實際意義,不同的趨勢特征往往對應不同的設備運行或能源產消工況,本文首先根據數據的趨勢特征劃分數據粒,并建立相對應的特征描述方式.
在一般情況下,工業時間序列可以劃分為時間維度上的一系列連續趨勢片段(信息粒),這些片段可由一組原型基底通過橫向和縱向的伸縮變換進行近似[19].本文構建了1/4 周期的正弦曲線作為基底(如式(1)所示),每組基底可以代表一類典型的波動趨勢(單調性和凹凸性).此外,采用直線來描述曲線為單調線性的特殊情況.

其中,φ代表不同的正弦周期.這樣一來,可通過基底的橫向和縱向的伸縮變換來近似任意的趨勢片段,如y=Asin((2/π)Dx+φ)表示對基底進行了橫向伸縮尺度D(時間跨度) 和縱向伸縮尺度A(波動幅值) 之后的近似曲線.
為了匹配原始時間序列并獲得基于趨勢的粒度,本文根據單調和凹凸特性對數據序列進行劃分.借鑒文獻[19]中的方式,給定序列X={x1,x2,···,xn},首先需要判斷X中每個數據點xi領域內小段曲線的趨勢特征(單調性、凹凸性),記為數據點xi的標識Fi.考慮時間序列的一階和二階動態特性,命名為{Δ2,Δ3,···,ΔN}和{E3,E4,···,EN},其中Δi=xi-xi-1,Ei=Δi-Δi-1.根據單調性、凹凸性定義,Δi及 ΔiΔi-1分別表示數據點xi與xi-1之間小段曲線的單調性及時間序列在點xi-1處的單調性變化,同時Ei表示該段曲線的凹凸性.具體的數據點標識判斷標準如下所示,其中i=3,4,···,N.為了實現信息粒的語義劃分,依次檢索X中每個數據點的標識Fi,在數據點標識發生改變處劃分數據.

在實際應用中,可根據運行過程中不斷產生的能源數據判斷當前序列的趨勢特性是否發生變化,以此來劃分數據序列,并構建在線樣本的粒度化輸入.需要注意的是在信息粒劃分之前,本文采用經驗模態分解(Empirical mode decomposition,EMD)對原始的訓練數據進行濾波.由于EMD 過程需要計算由各個極值點形成的包絡線,因此需等待數據到達極值之后再進行濾波.若需要立即給出調度策略,亦可將當前時刻作為極值點,并結合歷史數據來進行濾波計算.
為反映能源用戶運行狀態的語義特征,劃分后的數據粒G被進一步描述為三維特征向量的形式,包括其對應的橫向和縱向伸縮尺度D和A,以及代表基底類型的線型特征L[19],記為G={D,A,L}.
本文基于第2.1 節中的信息粒的語義描述,利用調度過程中的專家經驗知識(如調整方向、調整量大小等) 劃分潛在空間的對比學習樣本,提出粒度對比網絡模型實現副產能源系統的調度知識粗提取.
對比學習通過潛在空間中的對比損失來最大化相似工況樣本不同隱性特征之間的一致性,從而學習知識的表示形式[17].傳統對比學習方法通過吸引或排斥來構建類似于二分類的處理方式.考慮到由專家經驗知識帶來多分類情況,因此不同于傳統方法,本文對所建立的模型執行多個訓練步驟.在訓練過程中首先根據調整方向進行二分類的對比學習,之后通過構建具有不同調整量大小的輸入樣本再進行多次學習,使得輸出的表示向量能夠區分多類別的專家知識.
對比網絡模型的輸入為能源發生、消耗以及存儲等流量數據,即其中e表示不同調度事件,n為輸入因素個數.該網絡結構如圖4 所示,可分為以下5 個部分:

圖4 粒度對比網絡結構圖Fig.4 The structure of the granular contrastive network
1) 首先根據歷史時刻的專家經驗κ(調整方向、調整量大小等) 將數據樣本定性地劃分為不同的子集 {si1,si2,···},{sj1,sj2,···},···.
2)采用第2.1節中的粒度化方式對樣本子集中的各輸入因素數據進行語義增強,即

3) 基于神經網絡的編碼器f(·)從數據的粒度化特征描述中提取表示向量.為了學習各輸入因素粒度變量的時變特性,本文采用長短時記憶(Longshort-term memory,LSTM)網絡[24]來獲得he,τ=,其中τ為數據劃分后信息粒序列的時間步.為網絡的隱藏表示,計算為

其中,T為LSTM 時間步長.在LSTM 中,采用門控機制調節內部記憶單元的輸出以學習輸入序列數據的復雜表示[25].其中存儲單元可記憶任意時間間隔的信息,并且由3 種門管理出入單元的信息流.輸出(簡化為hτ) 可被看作為輸入、隱層狀態hτ-1以及存儲單元狀態cτ-1的加權組合.其中,遺忘門fτ,輸入門iτ,存儲單元cτ,輸出門oτ和隱層狀態hτ可被計算為

其中,fti表示信息粒G中的特征描述,即{D,A,L}.可以看出式(4)~ 式(6)依賴于hτ-1和當前的輸入,并且式(6)中的cτ和式(8)中的hτ與它們前一時間步的值相關.將式(6)代入式(8)得到關于歷史值的加權形式,即

從式(9)可以看出,hτ不僅包含了先前時間步的信息,還與各粒度特征的加權信息相關.而傳統神經網絡的非線性預測器,其輸出是輸入的簡單加權組合,使得權值未能隨著序列而改變,無法考慮到燃氣系統產、消、儲數據所包含的時序關聯和粒度語義特征之間的協同關系.因此,本文采用LSTM可更為靈活地計算非線性權值,將能源產消用戶的時間依賴關系及特征語義關聯反映到hτ和cτ中.


圖5 樣本數據知識表征的計算過程描述Fig.5 The calculation process of the knowledge representation of sample data
5) 為對比學習任務定義損失函數.給定輸入樣本集{se},假設樣本集中包含屬于不同潛在空間的樣本si和sk,粒度對比學習的任務旨在通過知識表示向量zi,zk對樣本進行區分.
損失函數使得同一潛在空間樣本(i,j)的表示向量相近,而區分不同空間樣本(i,k)的表示.本文定義損失函數如下

其中,p表示與zi屬于同一潛在空間的樣本個數;q為不同空間樣本個數;d(u,v)表示向量間的距離,這里采用余弦相似度來衡量.從式(10)中可以看出,假設樣本數量為N,若在訓練模型時使用了所有可能的數據對,則用于訓練的數據信息量可達到N(N-1)/2.也就是說相比于經典的有監督學習方法,對比學習模型的訓練過程要多出近似于(N-1)/2個樣本,因此能夠更為高效地利用相對稀疏的專家調度數據.
上述過程獲得的工況表示雖然可以涵蓋大部分系統運行情況,但是無法獲取經驗數據中更深層次的隱性知識,本節進一步提出一種分層粒度對比學習模型實現知識的細化表示.
定義驗證集{s1,s2,···,sl},根據第2.2 節學習到的模型得到相應的工況表示{z1,z2,···,zl}.在此基礎上,添加輸出層來學習下游任務,對獲取的知識表示進行評價.本文通過在工況表示的基礎上增加MLP 層來擬合能源系統調度時刻的調整量,進而判斷當前的工況表示是否能夠滿足實際應用條件.若樣本數據集的誤差高于某一設定的閾值,即

其中,ye為真實調整量.說明當前的空間表示無法覆蓋該樣本集中所隱含的工況知識.這種情況下需進一步采用對比學習的方式擴展空間表示,以區分與驗證集中的其他樣本,直到所有的樣本均滿足評價函數條件為止,因此,較小的閾值θ會增加對比網絡的層數.本文在知識粗提取的基礎上,通過選擇合適的閾值,使得模型能夠有效覆蓋隱含的調度工況和特征.分層粒度對比學習網絡的結構如圖6 所示.

圖6 分層粒度對比網絡結構Fig.6 The structure of hierarchical granular contrastive network
圖6 中最底層所示的網絡為傳統的LSTM 網絡,在知識細化過程中LSTM 的層數不斷增多,以提取更深層次的隱藏信息.中間層為采用MLP 的特征映射層,用于獲得工況知識的表示向量,并在此基礎上構建對比學習損失函數.在實際應用過程中,共增加了2 層對比網絡,以權衡知識獲取表現和網絡模型復雜度.需要注意的是,由于多層網絡中當前層級需要學習與上一層級不同的隱性特征,因此損失函數中各個層級的特征表示均為相互排斥.本文定義第i層粒度對比網絡的損失函數如下

其中,r為未滿足條件的樣本數,l為驗證集樣本總數.
在訓練過程中,采用一種批次訓練方式,從低層次到高層次依次訓練LSTMi及MLPi,即在完成低層級的網絡訓練后,若根據判斷條件需進一步增添對比學習層,則在保持現有層級權值參數不變的情況下訓練下一層級的網絡模型.因此,本文提出的分層粒度對比網絡在訓練過程可有效避免由深層網絡結構帶來的梯度消失影響.
分層粒度對比網絡的實施過程如圖7 所示,輸入樣本se到模型中得到多層級的工況知識表示{z1,z2,···,zn},將n個知識表示拼接為行向量[z1,z2,···,zn]以整合不同層級的特征,并定義輸出層來實現知識表示的加權和選擇.

圖7 分層粒度對比網絡實施過程Fig.7 The implement process of the hierarchical granular contrastive network
為了驗證本文方法的有效性,采用國內某鋼鐵企業高爐煤氣系統2019 年4 月的實際運行數據,從中選取了200 組調度時刻(來自現場人工記錄).數據采樣間隔為1 分鐘.按照5 : 4 : 1 的比例將樣本隨機劃分為訓練集、驗證集和測試集.訓練集和驗證集分別用于知識粗提取和知識精煉過程,測試集用于測試模型效果.每個數據集均包含煤氣過剩和短缺情況(通過人工調度量進行區分),代表不同的能源系統運行狀態.考慮由數據采集與監視控制系統(Supervisory control and data acquisition,SCADA)采集的工業數據本身包含異常點、噪聲及缺失數據,因此在建模之前需要進行數據預處理過程,包括對原始數據進行異常點刪除、缺失數據填補和濾波去噪.此外,在數據輸入到分層對比網絡之前,需對粒度化的特征輸入進行歸一化處理,以提升網絡模型的收斂速度.
采用Tensorflow 深度學習平臺和NVIDIA TITAN Xp 圖形處理單元執行實驗,模型中LSTM 單元和MLP 均為單隱層結構(每層包含128 個節點),通過隨機正態分布初始化網絡權重,并選取均方誤差作為最小化的損失函數.訓練過程中采用Adam 算法優化求解,其他主要參數設置如下: 用于每次訓練過程的數據批尺寸batch_size=10;訓練回合數training_epoch=40;優化算法學習率learning_rate=5 × 10-4.
鋼鐵燃氣系統的調度過程需通過對能源存儲量的實時估計來確定調整時刻,并根據調度模型計算出系統調整量.本文基于多層粒度對比學習訓練得到的特征表示,通過定義不同的輸出層來實現對于系統調整量的估計任務.
圖8(a)比較了不同學習階段的調度量計算結果.其中以人工調度數據作為基準參照,對比了專家知識的二分類、多分類對比學習以及提出的分層網絡模型結果.調度量為正數表示煤氣剩余,此時操作員制定合理的調度方案,通過增加一些可調用戶的消耗量以降低柜位高度;否則視為煤氣短缺情況.從圖8(a)中可以看出,基于專家知識的學習過程無法判斷出第5 個測試樣本的系統運行狀態(如圖8(a)圓圈中所示),給出了錯誤的調度方向.而經過多層對比學習后,這些狀態可被所提出的模型準確辨識,說明了本文方法對于深層次調度工況知識獲取的有效性.

圖8 調度量結果對比Fig.8 Comparative results of scheduling amount
此外,圖9 給出了各階段對比模型的計算結果對于專家調整量的絕對誤差.以平均絕對誤差(Mean absolute error,MAE),平均絕對百分誤差(Mean absolute percentage error,MAPE) 和均方根誤差(Root mean square error,RMSE) 作為評價指標,這些指標通過下式計算

圖9 各階段對比學習模型的誤差比較Fig.9 Absolute error of the scheduling amount during different contrastive learning phases

其中,n為測試樣本數量,yi為真實值,y?i為估計值.此外,表1 列出了詳細的誤差統計結果.從圖9和表1 中可以看出,基于專家知識的多分類模型相比于二分類模型在擬合效果方面無明顯提高,這說明僅利用定性或顯性知識構建的對比學習模型不足以覆蓋隱含的調度工況或特征.而進一步建立的分層次粒度對比網絡可通過多層次的定量學習幫助模型達到與調度專家類似的水平,表明所提分層次結構對于隱性調度知識具有學習能力.

表1 各對比學習階段的誤差統計Table 1 Error statistical results of different contrastive learning phases
為了說明本文所建立的多工況知識模型的有效性,選取一些常見的數值擬合和調度方法,即深度學習方法(LSTM)[26]、強化學習調度方法(Actorcritic)[22]和核函數方法(最小二乘支持向量機,Leastsquares support-vector machine,LSSVM)[27]作為對比,所用方法的參數均通過試錯的方式進行優化調整.類似地,圖8(b)、圖10 以及表2 給出了各方法對于調整量的計算結果及誤差和耗時比較.如圖8(b)中圓圈部分所示,LSSVM 和LSTM 方法對于調度方向的判斷存在偏差,這可能是因為這兩種方法僅通過輸入與輸出數據的非線性關系進行建模和擬合,無法考慮到能源系統多工況運行場景.由于采用關于調度評價指標的優化模型,Actor-critic 方法能夠準確判斷出測試樣本的調度方向,但從圖10和表2 中的結果可以看出,其對于人工經驗的擬合結果不及本文方法.表2 中還給出了提出方法與各對比方法的計算耗時(Time consumption,TC) 統計.由于采用核學習的方式,LSSVM 的計算耗時最短;與傳統有監督學習方式不同,Actor-critic 需要從環境中學習相關特征,因此其學習過程需要更長的時間;而所提方法的訓練過程包含了知識粗提取和知識精煉兩部分且網絡結構更為復雜,因此相比于經典的LSTM 方法更為耗時.考慮到由于副產能源調度具有事件驅動特征,相鄰調度過程往往間隔數小時以上,因此所提方法不足1 分鐘的訓練代價能夠滿足工業現場的調度需求.

圖10 不同方法獲得的調度量絕對誤差對比Fig.10 Absolute error of the scheduling amount obtained by the comparative algorithms
進一步地,比較表1 中二分類和多分類知識學習與表2 中對比方法的擬合精度可以發現,無論是否進行分層次學習,采用專家經驗知識構建表征學習模型相比于傳統方法對于調度量估計方面具有優勢,這也說明了知識-數據協同建模相比于單純的數據驅動方法在能源調度方面的優勢.

表2 各對比方法的誤差及耗時統計Table 2 Statistical results of error and time consumption of the comparative algorithms
鑒于鋼鐵燃氣調度屬于一類事件驅動的決策過程,因此對于調度時刻的準確判斷亦十分重要.現有的調度方法大多采用預測建模的方式來估計能源存儲量的變化趨勢,進而作出調度判斷和決策.本文選取LSSVM 作為柜位預測模型,分別采用單工況建模和多工況模型(基于知識表示劃分訓練樣本后,建立組合預測模型) 來驗證所獲得調度知識的有效性.根據生產現場的長期調研可知,由于生產作業部門在日間需要進行方案制定、計劃調整、檢測分析等會議,導致其生產頻率比夜間的頻率低,因此柜位多接近于存儲上限,而夜間場景的柜位相對較低,本文分別考慮了這兩種場景下的預測建模精度.
圖11 所示為不同場景下的對比結果.表3 中進一步給出了結果的誤差統計.很顯然根據所提出的調度知識網絡對輸入數據進行工況劃分后,所建立的組合模型相比于單工況模型具有更高的預測精度.上述結果表明,本文所提出的分層粒度對比網絡能夠對調度過程中包含的多工況知識進行認知和表示,而對于知識的有效運用則有助于提高燃氣系統的建模精度.

表3 不同場景下的煤氣柜位預測誤差統計Table 3 The error statistics of the gas tank level prediction under different situations

圖11 通過知識表示構建多工況組合模型與單一預測建模的結果對比Fig.11 Prediction modeling results with and without using the granular contrastive learning model for extracting multiple working-condition knowledge
對于鋼鐵燃氣系統的實時有效調度是實現企業節能降耗和智能制造的關鍵.考慮到燃氣產消過程包含多工況特征,本文通過粒度計算的方式提取能源數據語義特征,提出了一種基于多層粒度對比網絡的知識獲取與建模方法.其優勢在于能夠有效獲取多工況及深層次的調度知識,從而有助于能源系統的建模過程和調度判斷.實驗部分計算和對比了不同工況下的預測精度及調度策略,結果表明提出方法獲得的知識表示可進一步提高建模精度,并達到與人類專家一致的決策水平.
另一方面,由于所提方法尚無法實現基于調度評價的知識和策略優化過程,因此一些相關的改進工作值得進一步關注.首先,可建立相關評估體系來指導對比學習中潛在空間的劃分,進一步實現知識發現、更新知識表示.其次,所提出的知識表示架構還可結合強化學習實現對于調度策略的優化過程,將對比學習獲得的知識表示作為強化學習狀態來約束學習環境,可簡化狀態空間,以提升學習表現和收斂能力,獲得更優的調度策略.