999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于BayesianOpt-XGBoost的煤電機組碳排放因子預測

2024-01-29 07:58:28趙敬皓王娜娜蔣嘉銘田亞峻中國科學院青島生物能源與過程研究所泛能源大數據與戰略研究中心山東青島266101山東能源研究院山東青島266101青島新能源山東省實驗室山東青島266101青島科技大學信息科學技術學院山東青島266061
中國環境科學 2024年1期
關鍵詞:特征模型

趙敬皓,王娜娜,蔣嘉銘,田亞峻*(1.中國科學院青島生物能源與過程研究所,泛能源大數據與戰略研究中心,山東 青島 266101;2.山東能源研究院,山東 青島 266101;3.青島新能源山東省實驗室,山東 青島 266101;.青島科技大學信息科學技術學院,山東 青島 266061)

全球氣候變暖問題已經引起國際社會的普遍關注,燃煤發電作為二氧化碳排放的重點行業,深入地對其碳減排進行精細化研究,刻不容緩.開展準確全面的碳核算是推進碳減排進程的關鍵,目前燃煤發電機組碳核算大多采用國際通用的IPCC 方法計算得到[1-2],該方法適用于粗略地把控宏觀區域的碳排放情況,Liu 等[3]指出,IPCC 推薦的默認碳排放因子大約高估了40%.研究人員通過類推法和窮盡法,使用了詳細的機組運行數據,按照IPCC 的公式計算出了不同機組的碳排放水平,但發電機組的詳細技術并不公開,相關運行信息也難以統計,限制了該類方法的推廣和應用[4].因此,如何根據有限機組信息,解決數據缺失問題,科學地預測其碳排放因子非常重要.

近年來,部分研究學者將目光投向人工智能領域.使用人工智能技術預測碳排放水平可以避開企業不愿意披露數據等問題.劉淳森等[5]基于LSTM模型對中國交通運輸業碳排放量進行預測研究.Umit 等[6]使用深度學習、支持向量機和神經網絡對土耳其交通運輸業相關能源需求和碳排放進行了預測.余文夢等[7]利用隨機森林研究了我國縣域層面的碳排放因子的關鍵影響因素及其時序演進特征.Sun 等[8]提出基于隨機森林算法對CO2排放進行預測,采用飛蛾火焰優化算法對初始權值和偏差進行優化,以河北省1995~2015年數據為例驗證模型的有效性.

文獻調研發現,此類預測研究存在如下不足:相關研究多集中于建筑業、交通業等行業,或從地區層面進行研究,缺少對燃煤發電等高碳排放行業的精細化研究;以LSTM 等神經網絡算法為代表的深度學習模型需要大量數據進行訓練,當面對數據量不足的情況時,其擬合能力往往劣于梯度提升樹類型的機器學習算法.

本研究采用相對較易獲得的機組信息特征數據對燃煤發電、供熱的碳排放因子分別進行建模模擬,并設計算法將難以獲得的特征進行替代消除,旨在通過機器學習和統計學方法,對燃煤電廠機組碳排放進行科學分析,彌補真實場景數據獲取層面的不足,使得模型更具有普適性,更好的消除數據壁壘.

在機器學習預測領域研究中,XGBoost[9]算法對連續值和離散值實驗數據都有很好的適應性,在處理數據量少導致的過擬合問題以及處理高維特征數據上具有很強的優勢,也被廣泛應用與環境領域的數據建模[10].本研究使用的數據集來自各省區多個燃煤電廠,該數據集數據量較少、離散變量多、數據維度高,與XGBoost 算法有著很好的契合性.同時,在模型參數優化方面,貝葉斯參數優化可以實現模型超參數自動優化選擇[11],既降低了人工調參帶來了偶然因素的影響,又可以避免傳統網格搜索的高時間和空間復雜度問題.因此,本研究基于XGBoost算法挖掘分析機組信息特征與發電、供熱碳排放因子的相互關系構建預測模型,同時基于貝葉斯參數優化算法進行最優參數自動選取.然后基于特征標準化方法,消去難以獲得的特征并重新訓練,并將模型預測結果和公開數據進行了對比以驗證模型的性能.最后,利用訓練好的模型對省區排放水平進行預測和分析,并給出相應的結論和建議.

1 數據來源及分析

本研究基于全國各省多家燃煤電廠的機組數據(北京市、香港特別行政區、澳門特別行政區、臺灣省、西藏自治區數據暫缺),根據國家能源局發布的2022年全國電力工業統計數據,截止到2022年底,全國火電裝機容量約為133239 萬kW,其中煤電裝機約占84%,裝機容量約為112228 萬kW[12-13],該數據集中全國機組裝機容量共計112140.73 萬kW,約占全國總煤電機組裝機容量的99.9%左右.

由能源專業知識背景分析可知:燃煤發電碳排放因子由機組參數和燃煤屬性兩個參數決定[14-16],相關影響因素分析如下.

1.1 機組參數分析

燃煤電廠發電、供熱煤耗受多種因素影響.具體而言,按照鍋爐蒸汽的溫度和壓力不同將發電機組參數分為超超臨界(25~31MPa,580~610℃)、超臨界(24~26MPa,538~560℃)、亞臨界(15.7~19.6MPa,538℃)等類型,機組容量表征發電機組的額定發電功率,按發電機組裝機容量可以分為6 級機組規模(即1000MW 以上、600~1000MW、300~600MW、200~300MW、100~200MW 和100MW 以下),同一技術特征發電機組的裝機容量越大,其發電效率越高[4];此外,供電煤耗還與燃煤電廠機組類型,冷卻方式有關,而冷卻方式的選取又和機組和所處的地理因素的相關,如位于海邊的電廠多選用海水直冷技術等;因此本研究從機組靜態參數和地理信息參數兩個方面設計機組特征.

1.2 煤炭屬性分析

煤炭屬性主要由燃煤電廠所使用的煤炭種類和機組的使用情況綜合決定.煤炭通常分為無煙煤、煙煤、貧煤和褐煤等種類,不同煤種的元素組成各不相同,單位熱值的碳含量差異顯著[17],因此煤種也是影響煤電機組碳排放的重要因素.然而在真實環境中,電廠各機組使用的煤炭種類,以及其真實的單位熱值、灰分、揮發份等數據難以獲取.用于表征煤種的主要特征如煤炭熱值、燃煤灰分、燃煤揮發分,會因電廠實際生產過程中使用的煤種、工藝、設施不同而有所不同,主要表現在:(1)部分電廠采用多種煤種混合的混煤,其摻燒比例無法統一,不同比例的混合煤種,其燃燒的穩定性、燃盡率以及其他物性各不相同[18];(2)即使是相同的煤種,因為煤質等原因,其熱值也有波動.由于電廠工藝和設施的差異,煤的入廠熱值與入爐熱值又有一定變化[19].因此,科學地去除煤種的不確定性帶來的影響,是將碳排放因子預測模型推廣和應用的關鍵.

2 方法與模型搭建

2.1 XGBoost 算法原理

梯度提升決策樹(GBDT)最早由Friedman 等[20]提出,是一種迭代的決策樹算法,該算法由多棵決策樹組成,所有樹的結論累加起來作為最終結果.決策樹是一種樹形結構,其中每個內部節點表示一個屬性判斷,每個分支代表一個測試輸出,最后每個葉子節點代表一種分類結果.GBDT 算法原理是基于以前的樹,不斷形成新的決策樹來擬合之前預測的殘差,使預測值與真實值的差距不斷減小,使目標函數接近最小方向.

極致梯度提升(XGBoost)是一種集成學習算法,其出眾的效率和良好的預測準確度引起了廣泛關注,在表格類型的數據的處理方面,其表現可以超過大多數深度神經網絡(DNN)框架和傳統機器學習算法.XGBoost 的整體目標函數如下式所示:

2.2 貝葉斯參數優化算法原理

對參數進行優化是提升模型擬合能力的重要方法,傳統網格搜索(Grid-Search)是基于遍歷的查找方式,搜索空間大,耗時長,在參數維度較多時不具備應用價值.貝葉斯參數優化是基于貝葉斯原理和高斯過程回歸的機器學習模型超參數自動優化方法[21],能夠充分利用歷史采樣信息,得到新的采樣點,自動選取參數采樣區間,有效避免了網格搜索帶來的高耗時問題,對于20 維以內的參數空間有良好的效果.

貝葉斯參數優化過程包含兩個部分:基于貝葉斯原理的目標函數統計模型和決定下一步采樣空間的函數.根據已經嘗試的參數,每次迭代多個函數,用于評估剩余的參數空間.其主要計算過程包含如下步驟:

(1)輸入以下信息:模型訓練函數f,超參數搜索空間X,采集函數S,先驗模型M;

(2)基于f 和X 初始化最優參數組合D;

(3)假設M 服從高斯分布,基于D、 x(x ∈X)和輸出值y 計算出該高斯分布 p(y | x ,D);

(4)通過采集函數S 獲得使訓練函數f 損失值最小的參數xi,即xi←argmaxx∈XS(x,p(y | x,D));

(5)基于參數 xi重新訓練,得到輸出,即yi←f(xi);

(6)令D ← D ∪(xi,yi),更新當前最優參數組合;

(7)重復步驟(3)~(6),直至獲得最優參數組合.

2.3 特征標準化方法

標準化是機器學習模型在回歸任務中常用的解耦變量與預測指標的技術,被廣泛應用在氣象領域和圖像領域[22].標準化操作,即基于多個維度特征,預先訓練一個穩定模型后,結合一定尺度的多次重采樣得到新數據集,通過對新數據預測并取平均的方法,計算出不含部分特定特征的平均結果,可以更加確定地觀察到數據是如何受到除指定因素之外的其他因素影響.

結合標準化的技術,可以有效計算出燃煤電廠機組在使用不同煤種時的平均碳排放因子,從而獲得基于不包含煤種特征數據訓練而來的穩定模型.

2.4 模型設計

圖1 系統框架Fig.1 System Structure

3 實驗與模型評估

經觀察數據,有1092 個機組樣本特征完整性較好,通過已知的機組發電煤耗、供熱煤耗、所用煤種的熱值等信息,利用《中國發電企業溫室氣體排放核算方法與報告指南(試行)》[23]的公式,可以計算出機組的發電、供熱碳排放因子,實驗中用這部分數據訓練模型;剩余機組數據由于特征不可獲得,難以通過計算得到其碳排放因子,需要通過模型對機組進行預測,因此將這部分數據作為樣本外數據.

此外,部分機組關鍵屬性缺失,且其中大部分機組年代久遠,裝機容量小于30MW,國家已規定予以限期淘汰,因此保留裝機容量大于30MW 且特征較為完整的5096個機組樣本,合計裝機容量為108388.00萬kW,覆蓋率達到96.52%.其中,山東省、內蒙古自治區機組分布較多;青海省等地區機組分布較少.各省機組數量及平均裝機容量分布如圖2、圖3所示:通過對數據集的分析可知,真實電廠數據集存在如下問題:

圖2 各省燃煤機組分布數量Fig.2 Number of coal-fired units distributed by province

圖3 各省燃煤機組平均容量Fig.3 Average capacity of coal-fired units in each province

(1)機組靜態特征數值完全相同的機組,由于使用煤種不同,其碳排放因子也有所差異,若直接按照同屬性的機組直接取平均值,可供訓練的機組數將由3080 余個減少到482 個,由于部分屬性組合所包含的機組數少,碳排放因子方差大,將帶來較大的誤差.

(2)與煤種相關的特征:入爐位低位熱值、燃煤揮發分、燃煤灰分,在樣本外數據中缺失比例均高于90%,屬于非常難以獲得的特征.

因此,通過數據預處理、基于煤種特征建模和基于煤種標準化去特征3 個步驟,獲得基于機組特征的碳排放因子預測模型,從而達到了模型在樣本外數據上可用的目的,具體實驗過程如下:

3.1 數據預處理及特征工程

為了更好地利用數據進行挖掘分析,本研究對樣本數據進行預處理來提高數據質量.首先,個別樣本存在明顯偏離正常范圍的特征,屬于異常值,為避免帶來誤差,在訓練建模時予以刪除;其次,根據電廠所在經緯度,通過開放數據庫opentopodata[24]的API接口,自動獲得電廠對應位置的海拔信息;此外,部分離散特征存在表述差異,即不同表述表示同一屬性(如“空冷-直接空冷”和“直接空冷”),預處理時將其進行統一.最后,對機組的離散特征進行了獨熱編碼處理,對于連續型特征,進行對數化處理,以減小特征的尺度,消除異方差性質,使數據更加平穩.具體特征處理方式見表1.

表1 特征統計及預處理方式Table 1 Feature pre-processing methods

3.2 數據實驗

使用十折交叉驗證來訓練并得到最優模型,即每次訓練過程均將特征處理后的數據集按照8:1:1的比例劃分為訓練集、驗證集和測試集,在訓練集上訓練模型,使用驗證集來控制訓練的過程,當驗證集連續100 輪迭代沒有出現性能提升時,終止訓練并保留最優模型,最后在測試集上檢驗模型的真正性能.十折交叉驗證可以避免單次訓練的偶然性因素,即通過多次訓練、驗證來證明模型的魯棒性.

將所提出的模型與GBDT、根據經驗參數的XGBoost 進行消融實驗,并且與深度神經網絡(DNN)中的 CNN-BiLSTM-Attention 模型[25]進行了對比實驗,使用MSE、R2等指標對模型擬合結果進行了評估,十折交叉驗證中測試集的平均對比結果如表2所示.

第二天大天白亮,桃花伸手去推高木,卻像碰到了石頭,冰涼冰涼的;她呼地坐起身來,輕輕地呼喊著高木,將手放到他的心口,依舊冰涼冰涼的。桃花縮回手,扭頭看了一眼窗外。但她什么也沒有看到,窗外的陽光白到無窮黑,吞沒了整個世界。

表2 不同模型性能評價對比Table 2 Evaluation results of different models

經貝葉斯參數優化后的預測結果如圖4所示.

圖4 模型擬合效果Fig.4 Fitting results of the model

對部分機組的預測結果與基于發電量、供熱量對應的燃煤消耗計算而來的碳排放因子進行抽樣對比檢驗,對比如表3所示.

表3 預測結果抽樣Table 3 Samples of prediction

本實驗中,95%以上機組的發電和供熱碳排放因子預測誤差小于10%,很好地用更少的特征擬合了《中國發電企業溫室氣體排放核算方法與報告指南(試行)》中基于化石燃料燃燒計算碳排放的公式計算的煤電機組發電、供熱碳排放因子,從而在不使用煤炭性質參數、發電、供熱量等數據的情況下獲得了機組的平均碳排放因子,通過表2 的消融實驗與對比實驗證明,該模型具有有效性和魯棒性.

經過對比分析,供熱碳排放中誤差較大,是因為部分機組位于我國南方,機組供熱量與北方機組差距較大,影響了整體數據的平穩性,導致模型進行擬合時難度較大,但模型整體指標仍可接受.

3.3 基于煤種特征標準化的去特征方法及應用

為了去除難以獲得的煤種誤差,使模型更具有普適性,在上述模型表現穩定后,采取以下步驟進行煤種特征標準化,消去煤種特征并在樣本外數據集上進行應用.已有數據中,相同煤種對應了不同入爐煤低位熱值、燃煤揮發分、燃煤灰分值,我們對這三個特征按照煤種進行聚合(group-by)操作,得到每一個煤種對應的多個(低位熱值、燃煤揮發分、燃煤灰分值)組合,形成煤種特征的采樣空間.基于煤種與煤種特征組合采樣空間的映射關系,對訓練樣本進行重采樣,將訓練集從3080 余條樣本擴充到715 萬余條數據.使用訓練好的模型對重采樣后的數據集進行預測,得到不同機組使用不同煤種特征值的碳排放因子數據集.將擴充后的數據集按照機組靜態特征組合求平均,從而消去了難以獲得的煤種特征,得到該機組靜態特征組合下的平均碳排放因子.基于上述不包含煤種特征的數據,重新進行BaysianOpt-XGBoost 建模訓練,得到模型對樣本外數據進行預測,從而得到樣本外機組的標準碳排放因子.

基于消去煤種的數據集重新訓練模型后,得到十折交叉驗證后模型的平均指標如表4所示,由于煤種是與碳排放因子密切相關的特征,模型能力有一定程度的下降,但平均誤差仍小于5%,可以證明基于特征標準化的去煤種特征的有效性.

4 模型應用與分析

基于上述煤種特征標準化后的數據,分別對全國已知機組的發電、供熱碳排放因子進行了預測,并得到以下結果.

4.1 發電碳排放因子預測及分析

如圖5所示,煤電機組發電碳排放因子地區差異大,山東、四川等地區相對高,貴州、內蒙古等地區相對低;為驗證所得結果的有效性,在表5 中,基于2020年各地區燃煤發電量[26],通過《電力工業統計資料匯編》[27]中各地區燃煤發電標準煤耗值計算出發電煤耗,從而基于《指南》[23]公式,得到了各地區2020年發電因子的計算值,并與模型的預測值記性了對比.

表5 分省份燃煤發電碳排放因子預測結果評估Table 5 Evaluation of coal-fired units carbon emission factor on provincal level

圖5 各省區機組燃煤發電碳排放因子預測平均值Fig.5 Predicted mean carbon emission factors for power-generation in each province

如表5所示,除云南省外,其他所有地區預測結果與計算結果的絕對值誤差均小于10%,可以證明模型在燃煤發電二氧化碳排放因子預測問題上的可行性和有效性,以及基于標準化的去煤種特征方法的可行性.

如圖6a所示,絕大多數省份300MW 以下機組貢獻的碳排放最高,即機組滿負荷運行時,該部分機組發電排放的CO2更多;由圖6b 可知,不同省份均呈現出300MW 以下機組發電碳排放因子相對高,600MW 以上的機組碳排放水平相對低的情況.

4.2 供熱碳排放因子預測及分析

圖7 顯示,陜西等省區的燃煤供熱碳排放因子相對高;新疆、青海等地的供熱碳排放因子相對低.圖8a 顯示,多數省份高壓機組碳排放因子貢獻相對高;圖8b 顯示,亞臨界機組的供熱碳排放因子相對高.

圖7 各省區機組燃煤供熱碳排放因子預測平均值Fig.7 Predicted mean carbon emission factor of heat generation units in each province

圖8 各省區機組供熱碳排放因子與壓力參數類型分析Fig.8 Provincial analysis of carbon emission factors for heat-generation and unit pressure

本文基于Bayesian-Opt-XGBoost 算法實現了燃煤發電機組發電、供熱碳排放因子預測模型,在保證模型性能的前提下,提高了模型的泛化能力,得到了良好的結果,為基于人工智能的能源活動反演與預測的可行性提供了實例,也為利用人工智能方法解決跨領域交叉學科問題的相關研究提供了一定參考.

5 結論與建議

5.1 通過對機組屬性層面進行分析,機組的碳排放因子和機組容量整體呈負相關關系,且超臨界、超超臨界機組的碳排放因子更低.分析結果表明:從碳排放的角度上,裝機容量大、技術越新的燃煤發電機組環境行為更好[15].

5.2 從區域上看,平均裝機容量較低的省份,平均發電碳排放因子較高;但供熱碳排放因子整體呈北低南高的情況,這與我國區域供熱政策有一定關系.

5.3 對機組的供熱碳排放因子而言,盡管亞臨界機組的碳排放水平更高,但是大部分省區,高壓機組供熱碳排放因子之和所占比例最高,這也與各省不同壓力類型的機組數量分布有關.

5.4 對于已經投產的燃煤發電機組,應積極實施國家關于加快對低容量機組的超低排放改造的規定,淘汰不符合標準的機組,對服役時間長、流通效率低,熱耗高的機組進行改造.

5.5 對于計劃建造的新煤電機組,應盡可能采用超超臨界類型、容量較大的機組,充分發揮大容量機組的先進的工業技術,降低發電、供熱的碳排放水平.

猜你喜歡
特征模型
一半模型
抓住特征巧觀察
重要模型『一線三等角』
新型冠狀病毒及其流行病學特征認識
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 2021国产v亚洲v天堂无码| 亚洲欧美日韩成人在线| 青青热久免费精品视频6| 国产乱人伦AV在线A| 黄色福利在线| 亚洲人成网站色7777| 91亚洲精选| 91色综合综合热五月激情| av大片在线无码免费| 久久96热在精品国产高清| 一级毛片免费高清视频| 精品剧情v国产在线观看| 国产毛片一区| 亚洲无码A视频在线| 亚洲精品在线影院| 在线亚洲精品自拍| 国产成人精品男人的天堂| 欧美精品综合视频一区二区| 国产午夜无码专区喷水| 久久久久亚洲AV成人人电影软件| 欧美日韩国产在线观看一区二区三区 | 国产精品丝袜视频| 性喷潮久久久久久久久| 538精品在线观看| 伊人久久久久久久久久| 一本视频精品中文字幕| 国产精品香蕉在线| 亚洲欧美色中文字幕| aⅴ免费在线观看| 欧洲高清无码在线| 午夜性爽视频男人的天堂| 国产经典在线观看一区| 国产精品一区二区不卡的视频| 午夜精品久久久久久久99热下载 | 国产成人AV综合久久| 午夜国产精品视频黄| 蜜桃视频一区| 尤物亚洲最大AV无码网站| 欧类av怡春院| 欧美第一页在线| 中文字幕久久精品波多野结| 国产在线视频导航| 国产精品专区第1页| 制服丝袜无码每日更新| 91九色最新地址| 99re在线免费视频| 国产乱子伦视频在线播放| 国产新AV天堂| 无码区日韩专区免费系列| 国产真实乱人视频| 九九热精品免费视频| 青青草91视频| 亚洲日本中文综合在线| 国产精品综合色区在线观看| 国产乱人乱偷精品视频a人人澡| 三区在线视频| 亚洲a级在线观看| 国产91丝袜在线播放动漫 | 激情综合图区| 好吊色妇女免费视频免费| 日韩a级片视频| 国产乱人伦精品一区二区| 午夜高清国产拍精品| 香蕉久久国产超碰青草| 婷婷色丁香综合激情| 日韩不卡免费视频| 污视频日本| 一本大道东京热无码av| 国产精品久久久久久久久kt| 日本一区高清| 欧美国产综合视频| 国产亚洲视频中文字幕视频| 日韩在线影院| 欧美性久久久久| 香蕉eeww99国产在线观看| 日韩精品专区免费无码aⅴ | 国产综合精品日本亚洲777| 国产乱子伦无码精品小说 | 激情网址在线观看| 国产黑丝一区| 久久综合色88| 国产在线观看人成激情视频|