趙帥,顧煜炯,李欣,盧禹,趙俊榮
(華北電力大學能源動力與機械工程學院,北京 102206)
燃煤機組是電力行業高碳減碳的重中之重。進一步深入開展燃煤機組的節能減排工作,保證機組高效運行,減少碳排放,對實現“雙碳”目標至關重要[1]。目前,燃煤機組中供熱機組運行容量占比達70%以上。供熱機組運行參數繁多,在供熱期和純凝期機組運行工況復雜、差異較大,因此優化運行對煤電機組節能改造顯得至關重要。同時,供熱機組在供暖期間,其“供熱”和“供電”復雜多變,機組重要參數波動較大,一般規程不能給出明確的優化指導,運行人員也缺乏不同工況的實際運行經驗,因而亟需了解機組各工況下的運行調整基準值。如何根據能效狀態基準,對機組靈活運行調整是一個重要的問題。
最初,機組能效狀態的基準值通過熱力計算的方法,利用機組設計值,進行熱力實驗值建模研究。然而,隨著機組的長期運行、設備老化、檢修,初始基準值很難反映機組的實際運行狀態。近年來,電廠的廠級監控信息系統(SIS)中存儲了大量歷史數據,這些數據反映了機組真實運行狀態和設備參數的數據信息,為機組能效狀態基準的數據挖掘提供了基礎[2-5]。而數據挖掘的方法主要分為以下幾種:其中文獻[6]采用?方法來進行能耗基準狀態確定,使其在不同的運行邊界中?破壞最小;文獻[7]利用模糊C—均值算法,確定了典型負荷區間內所對應鍋爐參數基準值;文獻[8]采用加權模糊C—均值聚類算法,確定了鍋爐運行參數基準值,從而實現對鍋爐系統的優化運行。文獻[9]利用灰色關聯度,分析選取與熱耗率相關性強的指標作為模型輸入參數,并基于υ-SVM 建立了可控邊界參數與熱耗率的回歸模型;文獻[10]采用K-means 聚類算法,獲得煤電機組能效特征指標的基準值,并利用廣義回歸神經網絡,建立能效特征指標與供電煤耗的回歸模型;文獻[11]采用K-means 聚類算法,獲得各工況高位特征指標基準值,并通過長短期記憶(long-short term memory,LSTM)神經網絡獲得各工況下供電碳排放最優基準值;文獻[12]提出了變工況能效基準值挖掘方法。針對供熱機組,上述方法缺乏對于供熱期和純凝期2 個不同時期復雜工況以及對整個機組集成耦合特性的研究。
針對供熱機組多元工況下的能效狀態基準問題,本文提出了一套基于數據驅動的能效狀態基準模型方法。首先,利用區間估計的方法對歷史數據進行穩態篩選;其次,針對機組供熱期和純凝期,采用等間隔分類的方法,進行相應的工況劃分;然后,采用高斯混合模型算法模型,確定典型工況下的能效狀態基準樣本,并進一步估計其概率密度分布,從而確定該工況能效狀態指標的基準區間;最后,基于某320 MW 供熱機組實測數據進行模型驗證和在線運行監測,優化并指導機組運行,從而達到供熱優化、節能減排的目標。
供熱機組的歷史運行數據具有多樣性、耦合性以及動態變化的特點,體現了機組真實的運行狀態[13]。因此,在通過歷史數據挖掘能效狀態基準值之前,需要對歷史數據進行篩選處理。能效狀態基準庫建立流程如圖1 所示。

圖1 能效動態基準工況庫建立流程Fig.1 Establishing process of the energy efficiency dynamic benchmark working condition database
首先,需要剔除歷史數據中的無效數據,其中無效數據包括由于通信異常產生的缺失值以及機組啟停機工況的數據;其次,以負荷、供熱流量為特征變量,利用區間估計的方法,對歷史數據進行穩態篩選;然后,以環境溫度、負荷以及供熱流量為特征變量,對機組純凝期和供熱期2 個階段進行工況劃分;最后,基于每個工況下的歷史數據樣本,采用高斯混合模型(Gaussian mixture model,GMM)算法,獲得該工況下能效狀態最優的基準值樣本,并進一步估計其概率密度分布,從而確定該工況能效狀態指標的基準區間。
能效基準狀態確定分析采用機組歷史運行數據,這些原始數據反映了機組的實時運行狀態,其涉及復雜多樣的運行工況,諸如穩態以及非穩態,同時還包含啟停機、變負荷等過程。考慮到供熱機組的運行工況常處于動態變化這一客觀情況,需對歷史數據進行穩態篩選,去除啟停機、變負荷以及非穩態數據,從而建立機組穩態工況庫。
供熱機組既滿足電廠生產電產品的同時,也利用汽輪機中做完功的蒸汽為用戶提供熱產品。因而,選用負荷、環境溫度和供熱流量作為判別穩態及非穩態的特征參數。當負荷和供熱流量均較為平穩,能穩定在一定范圍內時,機組處于穩定運行狀態;反之,在非穩定狀態下,其波動范圍比較大[11]。以負荷為例,其判別方法為:

式中:pt和p0分別表示t時刻負荷的測量值和真實值;m表示負荷的變化速率;δ表示負荷的隨機誤差且服從正態分布。
穩態與非穩態過程的差別在于負荷響應速率是否為0。對于m值大小的估計,采用相鄰2 個時刻負荷的差值Δp,其計算公式為:

由于δt~N(0,σ2),差值Δp的期望為m,則Δp~N(m,2σ2)。考慮到時間序列的影響,m可以采用時間窗口內樣本統計量的均值進行估計:

式中:h表示滑動時間窗口內樣本數目。
為保證估計可靠性,本文采用區間估計方法:

式中:m1和m2是給定顯著水平α下的2 個統計量。
若置信水平為(1-α),則認為m的真實值在置信區間(m1,m2)內。因此,若區間(m1,m2)不包含0,則認為在該時間段內,機組負荷處于非穩態工況。同理,環境溫度和機組供熱流量判定也如此。當機組負荷、環境溫度以及供熱流量均處于穩態時,則認為機組在該時間段內處于穩態工況。
機組在穩態工況下的運行狀態也會受負荷、供熱流量以及環境因素等邊界條件的影響[14-16]。為降低機組運行能效狀態評估的難度,隔離邊界條件的影響,在篩選基準樣本前對穩態數據進行工況劃分。在環境因素中,溫度對機組運行狀態的影響較大,因而選用環境溫度作為工況劃分的特征變量。供熱機組包含純凝期和供熱期2 個階段:在純凝期,供熱流量為0,因而選用負荷和環境溫度這2 個影響機組運行較大的參數作為工況劃分的特征變量;在供熱期,則選用負荷和供熱流量作為工況劃分的特征變量。
采用等間隔分類的方式對穩態數據進行工況劃分,需預先確定負荷、環境溫度以及供熱流量變化范圍的最大最小值,以及其劃分的間隔。基于等間隔工況劃分的計算邏輯為:

式中:C1i表征機組純凝期的工況劃分;C2i表征機組供熱期的工況劃分;Tmin和Tmax分別表示環境溫度的最低值與最高值;Pmin和Pmax分別表示負荷的最小值與最大值;Gmin和Gmax分別表示供熱流量的最小值與最大值;ΔT、ΔP以及ΔG分別表示環境溫度、負荷以及供熱流量的工況劃分間隔。
該機組的工況劃分標準見表1。

表1 邊界條件范圍及劃分間隔Tab.1 Boundary condition range and division interval
采用該方法常會出現一些沒有樣本或樣本數目較少的工況,需要對這部分無效工況予以剔除。
能效狀態基準值是指機組在當前運行邊界條件下,實際可達到的最低熱耗率時所對應的參數值,反映了機組的最佳運行水平[17-19]。只有正確獲得能效狀態指標的基準值,才能更準確地計算出機組偏離基準值所造成的各項經濟損失,從而有效確定機組運行能耗的薄弱環節。
GMM 算法融合了參數估計法與非參數估計法的優點,不局限于特定的概率密度形式。如果子模型足夠多,它能夠以任意精度逼近任意的連續分布。本文采用GMM 算法對單一工況下的樣本數據依據相似性進行聚類,根據事先定義的篩選標準選擇某一類或某幾類簇中數據作為基準樣本,然后進一步估計其概率密度分布,從而確定基準區間。
GMM 算法的參數估計采用最經典的算法,即最大期望值(expectation maximum,EM)算法。EM算法是一種迭代算法,用于含有隱含變量的概率模型的參數估計,通過迭代求取極大似然的參數值。其目標函數為:

式中:X為參數變量;K為子模型個數;ωk為第K個子模型的權重系數;?k(X|θk)為第K個子模型的概率密度函數。
GMM 算法子模型數目對應的物理意義是機組狀態類別的數目。為了確定GMM 算法子模型個數,選用AIC 評價準則(CAIC)。AIC 評價準則建立在熵的概念上,提供了一種權衡模型復雜度與擬合數據優良的評價辦法,其定義為:

式中:ln(L)代表模型的對數似然函數。
隨著子模型個數增加,模型復雜度也隨之增加,CAIC會先減小后增大。選擇CAIC最小時對應的子模型個數,作為GMM 算法的最佳子模型個數。
比較GMM 算法不同的聚類組下的數據樣本,選擇平均熱耗率最低的一組數據作為基準樣本,并進一步估計其概率密度分布,從而確定能效狀態基準區間。
概率密度函數估計通常采用樣本去估計其概率密度函數,本文采用非參數核密度估計(kernel density estimation,KDE)方法[20],其通用表達式為:

式中:N為樣本總數;h為帶寬或平滑參數;xi為給定樣本;K(x)稱為核函數,常用核函數有均勻核函數、高斯核函數以及三角核函數等,本文采用高斯核函數進行概率密度估計。
采用等間隔的工況劃分方法常常會出現部分沒有樣本或樣本數目不足的無效工況。針對于這部分無效工況,基于已獲得的各工況基準值,采用BP(back propagation)神經網絡訓練的方法,預測出這部分工況的能效狀態基準,從而構建出供熱機組多元工況下能效狀態基準工況庫。
BP 是一種典型的多次前饋神經網絡,其訓練包括信息的向前傳播和誤差的反向傳播2 個過程。通過比較模型的輸出和預期輸出值,根據輸出誤差不斷調整神經元的權重,從而實現輸入到輸出的非線性映射關系[21-22]。其隱含層的目標函數為:

式中:f(x)為隱含層激勵函數;ω為輸入層神經元的權值;a為隱含層的閾值;i為輸入層神經元個數;j為隱含層神經元個數。
BP 神經網絡模型一般包含輸入層、隱含層和輸出層3 層神經元。該模型的輸入參數為環境溫度、負荷以及供熱流量3 個邊界條件,輸出參數則是該工況條件下能效基準狀態指標的基準值。利用已獲取的工況下的能效狀態指標的基準值作為樣本訓練神經網絡,實現多元工況下能效狀態基準的預測,從而構建出供熱機組多元工況下能效狀態基準工況庫。
以某電廠的亞臨界320 MW 機組中間再熱兩缸兩排汽凝汽式汽輪機為對象。該機組于2015 年進行供熱改造,采取打孔抽汽供熱。選用該機組近2 年的歷史數據進行分析,時間跨度從2018 年6 月到2020 年6 月,采樣頻率為1 min,總共計1 051 200 組數據。經過數據清洗和穩態篩選后,共計366 846 組樣本存入穩定工況數據庫中。
以供熱機組負荷和供熱流量相鄰時刻的差值作為特征量,對歷史數據進行穩態篩選。滑窗的長度取30,顯著水平α取0.05。經穩態判別后,篩選后剩余的穩態工況樣本有366 846 組,穩態篩選比例是0.349。選用5 000 組數據對比穩態判別后的結果如圖2 所示。由于考慮到環境溫度變化幅度較小,故當負荷和供熱流量同時滿足時,該組數據被視為穩定數據。

圖2 穩態篩選前后對比Fig.2 Comparison before and after steady-state screening
由于數據樣本量大且覆蓋工況數目較多,選用表征機組外部約束條件的負荷、供熱流量以及環境溫度,對機組進行工況劃分。負荷的劃分間隔是10 MW,供熱流量的劃分間隔是20 t/h,環境溫度的劃分間隔是2 ℃。
在供暖期間,供熱機組運行靈活。通過對歷史數據的統計,機組負荷的變化區間在100~320 MW,供熱流量的變化區間在20~280 t/h,組合后共計528 個工況。統計每個工況內穩態樣本的數目,最終得到有效工況196 個。圖3 可視化展示了供暖期196 個工況的樣本密度。

圖3 供熱工況熱度Fig.3 Heat map of heating conditions
從圖3 可以看出,在這2 年的運行中,供熱機組在供暖期間,最常運行在負荷220~230 MW、供熱流量120~140 t/h 的工況區間內,命名為工況A。
機組在純凝期時,通過對歷史數據的統計,機組負荷的變化區間在100~320 MW,環境溫度的變化區間在-2~36 ℃,組合共計460 個工況。統計每個工況內穩態樣本的數目,最終得到有效工況366 個。圖4 展示了純凝期366 個工況的樣本密度。從圖4 可以看出,在這2 年的運行中,熱電聯產機組在純凝期間,最常運行在負荷150~160 MW、環境溫度16~20 ℃的工況區間內。

圖4 純凝工況熱度Fig.4 Heat map of pure condensation conditions
以工況A 時的數據樣本為例,說明基準值挖掘過程。利用GMM 對工況A 的樣本進行聚類,并計算樣本點對于GMM 的對數似然。工況A 的最佳聚類樣本數為3,表2 為3 個類別的樣本數和對應的熱耗率均值。

表2 GMM 聚類結果Tab.2 GMM clustering results
圖5 展示了基于GMM 的工況聚類結果,并用不同顏色進行標注。為展示該工況在三維空間的數據分布特點,選用熱耗率、負荷和供熱流量3 個特征指標。考慮到能效優化這一問題,可以進一步選取熱耗率最低的第2 類樣本作為基準值樣本,然后根據基準樣本進行核密度估計,獲得工況A 下各能效狀態特征指標的基準區間,結果見表3。

表3 工況A 能效狀態指標的基準區間Tab.3 The benchmark interval of the energy efficiency status index for working condition A

圖5 基于GMM 的工況A 聚類結果Fig.5 Clustering results of working condition A based on GMM
依次計算各工況下的能效狀態指標的基準區間,將其帶入多元工況下能效狀態基準回歸模型,構建出該供熱機組全工況下的基準值工況庫。其中工況庫中包含負荷、供熱流量及環境溫度等邊界條件。選取各工況下熱耗率最低的穩態樣本作為基準樣本,并根據其分布確定該工況的基準區間。圖6給出了供熱期各工況對應的熱耗率。

圖6 熱耗率與負荷和供熱流量的關系Fig.6 The relationship between and among heat consumption,load and heating flow
圖7 展示了機組能效狀態指標實測值與相應工況下的最優基準區間。

圖7 優化界面展示Fig.7 Operation optimization display interface
機組實際運行時,通過外部約束條件獲得機組實時目標工況,然后從動態基準工況庫中匹配相應工況的基準區間。根據實時值和基準區間之間的偏差,對機組各相應指標參數不斷進行調整,為機組的優化運行提供實時監測和指導,使機組能夠長時間安全穩定高效地運行。通過電廠實際測算,機組熱耗率整體可降低12.5~50.0 kJ/(kW·h)。由此可見,該方法所建立的能效狀態動態基準工況庫,對供熱機組節能減排及優化運行具有指導意義。
1)針對機組歷史數據的穩態和非穩態數據并存的情況,提出了基于負荷和供熱流量差值區間估計的穩態判別模型;在穩態數據的基礎上,對機組供熱期和純凝期分別做出不同的工況劃分標準;通過GMM 算法模型,對每個工況下的穩態樣本進行訓練,獲取該工況下的基準值樣本;在此樣本的基礎上,進一步估計其概率密度分布,從而確定能效狀態基準區間。
2)以某320 MW 供熱機組為研究對象,對其進行能效狀態基準區間的確定,并通過插值的方法,獲得全工況下的基準值庫。此外,根據機組實時運行狀態,動態更新調整基準值工況庫,從而構建能效基準狀態動態工況庫。
3)通過在機組控制中心安裝部署能效基準狀態動態工況庫,分析結果可為供熱機組在全工況下,提供有效的運行優化指導建議,使機組能夠高效穩定地運行,進而達到節能減排的目的。