中圖分類號:TU832 文獻標志碼:A
Abstract: Accurate air conditioning load prediction enhances building energy management and optimization, demonstrating significant potential for energy savings. To enable rapid hourly cooling load prediction for diverse buildings in hot summer and cold winter zones,this study decouples building cooling loads,focusing specifically on envelope load prediction. First, a baseline XGBoost-based model for hourly envelope cooling load prediction was developed, with comparative analysis offour feature combinations revealing feature set D as optimal. Subsequently, a generalized prediction model adaptable to various oice buildings was created by applying differential corrections to the baseline model. Validated against EnergyPlus simulations using test buildings in Shanghai and Hangzhou, the XGBoost-predicted hourly envelope cooling loads showed strong agreement, confirming the model's generalizability and accuracy in predicting envelope thermal performance across different buildings.
Keywords: load prediction; machine learning; EnergyPlus software; XGBoost algorithm
隨著人們對舒適生活的不斷追求,社會對于能源的需求與日俱增,其中建筑能耗占社會總能耗的比重也持續遞增。例如建筑在夏季供冷季,所消耗的能耗可以占據到整個空調系統的 60%~ 80%0 。我國建筑空調系統在設計、運行階段都存在一定不足[2]。準確的冷負荷預測對于建筑節能具有重要意義,可以有效指導建筑能源側的供電策略,例如安排制冷機啟停、前饋控制、指導儲能計劃和電網調度等[3-6]。因此,建筑負荷預測是供熱(或供暖)通風與空氣調節(HVAC)系統預測控制的基礎。
根據建模方法不同,現有研究中的冷負荷預測模型可分為白箱模型、黑箱模型和兩者相結合的灰箱模型[7-8]。國內外學者提出了回歸分析、神經網路(ANN)、支持向量機(SVM)、隨機森林等算法。徐欣等[通過帶殘差修正的多元非線性回歸對日平均負荷進行了預測。該預測模型能使供暖季的日平均負荷精度控制在 15% 以內。Hu 等[1]建立了一種人工神經網絡模型來預測辦公樓的負荷需求和能耗,并對暖通空調系統的運行進行了優化。李凱[1]采用具有高斯核的支持向量回歸對建筑熱負荷進行了預測,結果表明測試集與訓練集數據的決定系數 R2 相近,差值在10% 以內。楊勝維等[12]的研究表明,在選擇恰當的輸入特征前提下,隨著輸入特征維度增加,隨機森林模型的訓練效率更高,對空調負荷的預測性能更好。邸躍強[13的研究表明,極端梯度提升(XGBoost)算法與SVM、隨機森林、神經網絡等算法相比具有調參簡單、魯棒性強的特點,適用于建筑冷熱負荷的短期預測。高英博[14]采用不同的機器學習方法對不同類型的建筑能耗進行了預測,結果表明XGBoost算法在4種類型建筑負荷預測上均有較高的準確性和適用性。Wang 等[15]等采用隨機森林算法進行了建筑能耗的精確預測。結果表明,隨機森林算法的預測精度明顯高于SVM算法。
上述模型能準確地預測特定建筑的空調冷負荷,但無法應用于夏熱冬冷地區其他辦公建筑的空調冷負荷預測。針對上述問題,本文建立基于XGBoost算法的基準建筑圍護結構負荷預測模型,并結合圍護結構負荷的差值修正,可使該模型在其他建筑與基準建筑之間進行轉換,以實現對其他辦公建筑圍護結構逐時冷負荷的快速預測。
1圍護結構負荷模擬
采用EnergyPlus仿真軟件可對不同類型的辦公建筑進行模擬得到辦公建筑的逐時冷負荷數據[16]。為了尋找適應不同辦公建筑的冷負荷預測方法,本文將建筑冷負荷解耦,僅對辦公建筑的圍護結構進行分析。
1.1基準建筑模型的建立
將處于夏熱冬冷地區的上海選為基準辦公樓建筑所在地。建筑熱工參數根據《GB50189—2015公共建筑節能設計標準》進行設定。基準建筑模型參數如表1所示。基準建筑三維圖如圖1所示。

1.2 圍護結構負荷差值擬合
利用EnergyPlus軟件對不同圍護結構建筑進行模擬,得到相應的圍護結構負荷。基于基準建筑的圍護結構模型,對不同工況下的朝向、窗墻比、體形系數、外圍護結構熱工參數分別進行差值擬合,從而實現對應用于其他建筑時的基準模型進行修正。得到的差值擬合公式及決定系數R2 如表2所示,其中: x 為基準建筑圍護結構負荷; y1,y2,y3 分別為不同建筑的北軸夾角、窗墻比和體形系數; z 為所計算建筑與基準建筑的圍護結構負荷差值;“傳熱系數小”表示外墻傳熱系數為(0.3,( ).6]W/(m2?K) ;“傳熱系數中”表示外墻傳熱系數范圍為(0.6,0.8] W/(m2?K) :“傳熱系數大”表示外墻傳熱系數范圍為(0.8,1.0]W/(m2?K) 。本文以圍護結構“傳熱系數大”作為基準(見表1)。圖2為不同圍護結構負荷差值。


2基于XGBoost算法的圍護結構負荷預測模型
2.1 目標函數確定
XGBoost算法參見文獻[17]。本文基于XGBoost算法對建筑圍護結構負荷進行預測,且圍護結構負荷與天氣參數密切相關。受多種因素的影響,其預測過程由兩部分組成: ① 確定目標函數,將圍護結構逐時冷負荷作為目標; ② 將不同的天氣參數和其他特征作為輸入,優化目標函數,從而達到最優解。XGBoost預測函數可表示為

式中:
為第i個樣本的預測值; fk(xi) 為第 k 棵決策樹模型對樣本 xi 的預測值; H 為整個回歸樹模型的集合; K 為訓練樹的數量。
由預測函數得到加入正則化項的目標函數
L(?) 為


式中:為一個可微的損失函數,用來衡量預測值
和目標值 yi 之間的差值;
為對模型復雜度的懲罰(正則化項); T 為給定的一棵樹的葉節點數; γ 、 λ 均為懲罰系數; |ω|2 為每棵樹葉節點上的輸出分數的平方。
2.2 目標函數優化
采用前向分步算法優化目標函數。設
為 第i個樣本在第 ?t 次迭代后的預測值,則有

式中:
為第 i 個樣本在第 t-1 次迭代后的預測值; ft(xi) 為第 t 次迭代新增的決策樹模型對樣本 xi 的預測值。
則目標函數可以表示為


式中: L(t) 為第 t 次迭代后的目標函數; C1 為常數項; n 為訓練集中的樣本總數; fi 為全體樹集合中的第 i 棵回歸樹。
對損失函數進行二次泰勒展開,即

式中:
為第 t-1 次迭代的損失函數,對于當前第 t 次迭代來說它是一個確定的常數;
C2 為常數項; gi 和 hi 分別為關于樣本的一階和二階梯度。
省略式(6)中的常數項得到

由式(7)可知,目標函數的結果取決于 gi 和hi 。因此,XGBoost算法能夠根據自身需求設置多種損失函數,只要該損失函數二階可導即可。
對式(7)進行拆分。將式(2)中對模型復雜度的懲罰的定義代入式(7),有

式中: ωj 為第 j 個葉節點權重; Ij={i|q(xi)=j} 為樹的第 j 個葉節點上所有樣本點的集合,即為給定一棵樹時,所有按照決策規則被劃分到第 j 個葉節點的樣本集合, q(xi) 為決策樹將樣本 xi 分配到的葉節點編號。
對式(10)進行求導,計算得到第 j 個葉節點的最佳權重 ωj* ,即

將式(11)代入式(10)中,得到相應的最優值。

式(12)可以作為一個評分函數來衡量樹q的好壞,也可以用于判定剪枝操作(防止過擬合),即根據損失函數是否減小來決定是否執行剪枝。XGBoost算法將式(12)作為判斷損失函數的標準。通過最小化 L(t)(q) ,該算法在提升預測精度與控制模型復雜度之間達成平衡,從而實現結構化風險最小化。
利用XGBoost算法進行決策樹節點劃分時,假定L和R分別表示某個節點切分后的左、右子節點,則切分后的損失函數 Ls 為

式中:
為左子樹的評分;
為右子樹的評分;
為未切分時節點的評分;(204號γ0 為加入新的葉節點時引入的復雜度代價;GL 、 GR 分別為左、右子節點的一階梯度; HL 、HR 分別為左、右子節點的二階梯度。
式(13)常用于評估切分的候選節點。
2.3基于XGBoost算法的圍護結構負荷預測方法
將XGBoost算法應用于基準建筑圍護結構負荷預測中,然后基于基準模型對相關參數進行修正,得到其他建筑的圍護結構逐時負荷,最后對XGBoost預測模型的預測性能進行評估。
具體步驟為:
(1)獲取基準建筑圍護結構負荷模擬數據,并將數據集分為訓練集、驗證集和測試集。(2)在訓練集上使用交叉驗證與網格搜索,進行初步調優,確定樹的數量、最大樹深、學習率、采樣率;然后在驗證集上進行測試,主要通過改變樹的數量來確定最終測試集的參數。(3)確立基于XGBoost算法的基準建筑圍護結構負荷預測模型。(4)利用測試集對預測模型進行測試。(5)通過差值擬合公式對預測結果進行修正。(6)對比模擬結果與預測結果之間的差異,并進行預測模型的評價。

3 實例預測
為驗證預測模型的泛化能力,本次模擬采用上海和杭州兩個城市的負荷數據。訓練集對應時間為6月5日一8月7日共計9周,驗證集對應時間為8月7日一8月13日,測試集對應時間為8月13日—8月25日,驗證集與測試集對應時間共計3周,占訓練集對應時間的 30% 左右。在訓練集上使用交叉驗證與網格搜索,進行初步調優,確定樹的數量范圍為 50~100 ,最大樹深為4,學習率為0.2,采樣率為0.8;然后在驗證集上進行測試,主要通過改變樹的數量來確定最終測試集的參數。
3.1預測模型輸入參數選擇
在以往針對建筑總負荷預測的研究[13-14]中,人們主要采用上一時刻建筑總能耗、室外溫度、室外相對濕度、日期、時刻、是否為工作日等作為模型參數。本文以圍護結構逐時冷負荷作為研究對象,為研究不同維度參數對模型預測結果的影響,分別設置了4種特征組合,如表3所示。
表3特征組合

對基于基準建筑模型的圍護結構數據進行訓練和預測。不同特征組合的模型預測結果的精度和擬合程度對比結果如圖4所示,其中:RMSE為均方根誤差; MAE 為平均絕對誤差。
從圖4可以看出,組合A的預測效果最差。隨著特征維度的增加,預測效果逐漸提升。預測效果最優的為組合 D 。因此,本文以組合D作為模型的特征輸入。

3.2 測試建筑圍護結構逐時冷負荷預測結果及分析
基于基準建筑模型對測試建筑圍護結構逐時冷負荷進行模擬。測試建筑參數如表4所示。

首先得到測試建筑的圍護結構負荷;然后采用差值擬合公式,將圍護結構負荷轉化為基準建筑模型的圍護結構負荷。先基于基準建筑模型進行預測,再將結果轉換為測試建筑圍護結構負荷,即可針對不同建筑進行圍護結構負荷預測。上海、杭州測試建筑圍護結構逐時冷負荷預測如圖5所示,其中:實際值為利用EnergyPlus軟件模擬得到的結果;預測值為利用XGBoost預

測模型得到的結果。
從圖5可知,在大部分時間該模型有較好的預測效果,能模擬出圍護結構負荷的逐時變化。這說明根據氣象參數和基準建筑模型的圍護結構負荷,就可對測試建筑圍護結構逐時冷負荷進行預測,且預測結果具有一定的合理性。利用平均絕對誤差 MAE 、平均絕對百分誤差 MAPE 和決定系數 R2 ,對XGBoost預測模型的預測性能作進一步評估[18-19]





式中: m 為數據樣本數量;
為逐時能耗平均值。
空調運行時對圍護結構逐時冷負荷的實際值與預測值進行對比。訓練集和測試集預測精度如表5所示。
現訓練不足的問題;上海測試集和杭州測試集的精度和決定系數 R2 相近,這表明測試建筑在兩個城市的測試集中均有較好的預測結果,均可反映圍護結構逐時冷負荷的變化。
從表5可知:測試集的精度和擬合度均略低于訓練集,這說明該模型的泛化效果較好,未出
4結論
建立基于基準建筑的XGBoost圍護結構負荷預測模型,使用交叉驗證、網格搜索的方法對參數進行初步調優,然后對不同特征組合的模型進行了測試。結果表明,特征組合D(基礎版 + 天氣情況 + 歷史氣象)的模型預測結果的精度和擬合度最優。將測試建筑作為模型預測對象,利用圍護結構差值擬合公式實現測試建筑與基準建筑之間的轉換,且采用特征組合D進行模擬得到的預測結果經轉換后與利用EnergyPlus軟件得到的模擬結果相近。研究表明基于基準建筑的XGBoost圍護結構負荷預測模型可應用于夏熱冬冷地區其他建筑的圍護結構負荷預測。
參考文獻:
[1] 陳丹丹.集中空調變水量水系統實時優化控制策略研 究[D].上海:上海交通大學,2007.
[2] 徐忠義,綦吉輝.建筑暖通空調系統節能優化設計分 析[J].居舍,2023(19):89-91.
[3] DING Y, ZHANGQ,YUANTH. Research on shorttermand ultra-short-termcooling load prediction models for office buildings[J]. Energy and Buildings, 2017,154:254-267.
[4] ZHANGL,WENJ,LIYF,etal.Areviewof machine learning in building load prediction[J]. Applied Energy, 2021,285:116452.
[5] 代業明,周瓊.基于改進Bi-LSTM和XGBoost的電 力負荷組合預測方法[J].上海理工大學學報,2022, 44(2):138-147.
[6] 賈鵬,陳劍波,王成武,等.基于能耗監管平臺的現有 醫院空調系統運行節能優化[J].能源研究與信息, 2023,39(2):82-87.
[7] SUN Y J, WANG S W, XIAO F. Development and validation ofa simplifiedonline coolingload prediction strategy for a super high-rise building in Hong Kong[J]. Energy Conversionand Management,2013,68:20一 27.
[8] WANG S W,MA Z J. Supervisory and optimal control ofbuilding HVAC systems:a review[J].HVACamp;R Research,2008,14(1):3-32.
[9] 徐欣,田喆.天津市辦公建筑供暖負荷中短期預測[J] 暖通空調,2016,46(4):50-54,11.
[10]HUJF,ZHENGWD,ZHANG SR,et al.Thermal load prediction and operation optimization of office building with a zone-level artificial neural network and rule-based control[J]. Applied Energy,2O21,300: 117429.
[11]李凱.基于機器學習的短期建筑供熱負荷預測[D]. 長春:吉林大學,2020.
[12]楊勝維,吳利瑞,劉東.基于隨機森林的航站樓負荷預 測及特征分析[J].建筑熱能通風空調,2021,40(12): 1-6.
[13]邸躍強.建筑冷熱負荷短期預測算法研究[D].天津: 天津大學,2019.
[14]高英博.基于機器學習的建筑能耗預測方法研究[D]. 北京:北京建筑大學,2020.
[15]WANG Z Y, WANG Y R, ZENG R C, et al. Random Forest based hourly building energy prediction[J]. Energy and Buildings,2018,171:11-25.
[16]杜洵,馬潤川,陳占虎,等.基于DeST和EnergyPlus 的某被動式辦公建筑能耗淺析[J].建設科技, 2022(16):13-17.
[17]陳振宇,劉金波,李晨,等.基于LSTM與XGBoost組 合模型的超短期電力負荷預測[J].電網技術,2020, 44(2): 614-620.
[18]FAIZOLLAHZADEH ARDABILI S,MAHMOUDI A, MESRI GUNDOSHMIAN T.Modeling and simulation controlling system of HVAC using fuzzy and predictive (radial basis function,RBF) controllers[J]. Journal of BuildingEngineering,2016,6:301-308.
[19]WUZB,LINP,PENGJQ,etal.Usingan ensemble machine learning methodology-bagging to predict occupants’thermal comfort in buildings[J].Energy and Buildings,2018,173:117-127.