吳賢國, 楊 賽, 王成龍, 王洪濤, 陳虹宇, 朱海軍, 王 雷
(1. 華中科技大學 土木與水利工程學院, 湖北 武漢 430074; 2. 中建三局集團有限公司, 湖北 武漢 430064;3. 南洋理工大學 土木工程與環境學院, 新加坡 639798 )
能源消耗一直是世界各國備受關注的問題,其中建筑能耗問題同樣需要引起重視。在建筑的使用階段,建筑外圍護結構對建筑能耗影響占50%,為了降低室內外環境的能量傳遞,合理選擇外圍護結構是十分關鍵的問題,因此,近年來,開展了通過提高建筑外圍護結構性能使建筑能耗降低的研究。
無論是國內或國外,在對建筑能耗進行研究時,側重于建筑能耗預測[1,2]和建筑能耗優化[3~5]。在建筑能耗預測研究中,任宏等[6]以STIRPAT(Stochastic Impacts by Regression on Population,Affluence,and Technology)模型構建城鎮建筑能耗影響因素模型,利用最小二乘法和嶺回歸分析對模型進行計算分析。莫甘茗[7]摸索出基于多元線性回歸的以建筑類型、面積為參數的建筑能耗預測與建筑節能分析模型。房濤等[8]首先通過單因素敏感性分析篩選出關鍵設計參數,然后通過正交試驗設計進行仿真計算,并進行多重線性回歸。Yang等[9]通過具有非線性自回歸外生結構的動態人工神經網絡,利用在線建筑運行數據定期更新建筑模型。Seyedzadeh等[10]提出了一種優化最大似然模型的方法,用于預測熱負荷和冷負荷,并可以搜索可能的參數空間。在能耗優化研究中,龐宇馨等[11]利用能耗模擬軟件DeST-c模擬研究該建筑在三種不同氣候分區下圍護結構熱工性能與建筑能耗的關系,并利用全壽命期費用評價方法進行評價。牧仁[12]利用能耗模擬軟件DeST-h計算圍護結構參數對冬季采暖能耗的影響,通過正交實驗得出優化方案。何立華等[13]將供暖和照明能量負荷之和作為目標函數,建立函數關系,以能耗最小化為目標,采用遺傳算法進行優化求解。Ferrara等[14]利用仿真模擬技術對建筑進行建筑能耗模擬,提出了近零能耗建筑方案設計原則并利用單目標優化方式對建筑能耗參數進行優化;Brinks等[15]以制定開發成本最優的解決方案為這項工作的重點,以滿足NZEB標準。其結果比德國現行(2015年)建筑標準的熱能需求低50%~75%。
以上研究均對建筑能耗研究有所貢獻,但建筑能耗預測無法充分將預測成果運用到實踐中,導致實際意義不大;同時以上建筑能耗優化沒有考慮多個目標,與實際情況不太符合,因此本文將利用RF-NSGA-II模型,先通過DesignBuilder和正交試驗獲取建筑能耗數據,再利用RF(Random Forest)對建筑能耗模擬數據進行預測,最后將建筑能耗預測回歸函數作為適應度函數之一,引入熱舒適度函數為另一個適應度函數,最后利用NSGA-II(Non Dominated Sorting Genetic Algorithm-II)算法對建筑能耗和熱舒適度進行優化,從而獲得符合實際意義的建筑能耗和熱舒適度最優解。
隨機森林(Random Forest,RF)作為一種機器學習算法,在2001年由Breiman提出。該算法可以用于解決處理分類和回歸問題,由于其強大的數據挖掘能力和高預測精度,廣泛用于預測和特征選擇等問題。
隨機森林回歸模型是在數據樣本X和預測變量Y的基礎上,生成依賴于隨機變量θ決策樹形成的,設單棵決策樹預測器h(X,θk)的預測結果為hi(X),則隨機森林回歸模型的最終預測結果表示為:
(1)
該算法通過對樣本數為ntree的原始數據進行隨機抽樣,得到ntree個訓練子集,然后將ntree個訓練子集生成相同分布的ntree棵決策樹,進而構成一個隨機森林模型h(X,θk),k=1,2,…,ntree,X表示輸入向量,θk是表示生成每棵樹生長路徑的向量。當RF樹生長時,假如樣本數據的特征數有M個,先設定一個小于M的正整數mtry(一般取M/3),在生成決策樹的過程中,需要對樹節點進行分割,隨機從M個特征中抽取mtry個作為候選特征,隨機子集中的每個節點用mtry個特征進行最佳分割,可以降低CART樹之間的相關性,進而降低隨機森林模型泛化誤差,且隨著決策樹數量的增加,森林的泛化誤差接近極限。隨機森林模型的預測平均泛化誤差可表示為:EX,Y(Y-h(X))2,當決策樹棵數ntree接近無窮大時,模型平均泛化誤差表示為:
EX,Y(Y-avkh(X,θk))2→EX,Y(Y-Eθh(X,θ))2
(2)
式中:avk表示取其平均值;Eθ表示求期望。
故單棵回歸樹的平均泛化誤差PE*(tree)表示為:
PE*(tree)=EθEX,Y{[Y-h(X,θ)]·[Y-h(X,θ*)]}
(3)
對于所有的θ,都能得到E(Y)=EXh(X,θ),則有:
(4)


Deb等[16]于2002年為改善遺傳算法多目標優化性能及精度,對NSGA進行改進,得到帶精英策略的非支配排序遺傳算法(NSGA-II)。NSGA-II的最大優勢就是大幅度降低計算復雜程度同時拓寬采樣空間[17]。
NSGA-II算法最核心的特點是快速非支配排序、擁擠距離及精英策略。其中NSGA的非支配排序為O(MN3),改進后非支配排序O(MN2)(M為目標數,N為種群大小),通過非支配排序的改善提升了種群排序的速度。擁擠距離法采用了擁擠度和擁擠度比較算子計算每個解的距離。第i個解的擁擠距離計算如下:
(5)

NSGA-II算法引入了精英策略,可以擴大采樣空間,提高了算法的運算速度和魯棒性的同時,避免最佳個體的丟失。
在各種研究領域中,所涉及的各種變量之間會存在高度非線性的復雜關系,為了獲取各種變量之間的具體函數關系,可以利用隨機森林模型替代傳統的數學函數。同時隨機森林模型作為遺傳算法適應度函數,可以實現精度更高,效果更好的優化。RF-NSGAII算法的具體流程如圖1所示。

圖1 基于RF-NSGA-II的建筑能耗多目標優化流程
1.3.1 DesignBuilder建筑能耗模擬
(1)基于BIM和DesignBuilder的建筑能耗計算
BIM(Building Information Modeling)技術具有可視化、協調性、模擬性、優化性四大優勢,因此將BIM技術做為核心技術應用到各種建筑項目軟件中,可以為建筑施工運營分析提供自動化、智能化基礎和平臺[18]。因此,本文利用Revit軟件建立BIM模型,然后將模型導入DesignBuilder軟件生成建筑能耗仿真模型,在DesignBuilder軟件中對模型的相應參數進行設置,實現對建筑模型的能耗進行計算。
(2)正交試驗獲取數據集
正交試驗設計方法既滿足試驗科學性,又可以顧及試驗的工作量以及復雜程度,因此本文采用正交試驗獲取建筑能耗數據集。首先依據建筑設計規范對每個圍護結構設計因子水平進行合理劃分,然后通過Allpairs軟件獲取正交設計水平表,最后,將建筑物BIM模型導入DesignBuilder中,并分別輸入經正交試驗得到的試驗方案進行各外圍護結構參數處在不同水平下的建筑能耗模擬,輸出DesignBuilder中獲取的建筑能耗結果。
1.3.2 基于RF的建筑能耗預測
Step1:數據獲取及預處理
本文研究的是建筑外圍護結構部分設計參數給建筑能耗帶來的影響,以建筑能耗仿真結果為數據預測樣本集,選擇與建筑能耗緊密相關的影響因素作為樣本特征值并作為預測模型的輸入指標。數據預處理主要是對建筑能耗數據進行歸一化,如果在預測過程中不進行歸一化處理,樣本中一些數據過大或過小,都會增加訓練過程中算法的負擔,會導致數據被淹沒或網絡不收斂。
Step2:隨機森林的參數設置及建模
(1)樣本分集
以原始數據集中大約2/3的數據作為RF模型的訓練樣本集,余下包含了原始數據集中1/3的數據作為RF模型的測試樣本集。
(2)參數選擇
建模過程中,主要涉及兩個參數:回歸樹的棵數ntree和隨機特征的數目mtry。ntree的值會影響隨機森林模型的訓練度和精確度,一般ntree的值越大,模型的精度越高;mtry控制了隨機森林模型屬性的擾動程度,mtry一般根據經驗公式確定,設數據集中的變量個數為P,默認情況下mtry=P(分類模型)或mtry=P/3(回歸模型)。
確定了兩個參數后,即可利用RF算法對訓練樣本集和測試樣本集建立起隨機森林回歸模型。
Step3:預測結果分析
為了驗證RF模型的預測精度,通過兩個模型性能的指標均方根誤差RMSE和擬合優度R2來進行檢驗。均方根誤差RMSE體現預測值與真實值的離散程度,擬合優度R2用于驗證預測值與真實值之間的擬合程度,兩個指標分別由式(6)(7)得出:
(6)
(7)

1.3.3 NSGA-II多目標優化
Step1:建立目標函數
(1)基于RF的建筑能耗目標函數
引入RF建筑能耗回歸預測算法替代傳統數學函數作為多目標遺傳算法中的目標函數,可以很好地解決輸入變量與輸出目標之間存在復雜非線性關系,無法給出具體函數表達式的問題。建筑能耗回歸函數f1如式(8)所示:
f1=RFregression(x1,x2,…,x7)
(8)
式中:x1~x7分別為外墻綜合傳熱系數、外墻太陽輻射吸收系數、屋面綜合傳熱系數、屋面太陽輻射吸收系數、外窗綜合傳熱系數、外墻得熱系數以及窗墻比。則建筑能耗目標函數用minf1表示。
(2)室內熱舒適度目標函數
室內熱舒適度是一個可以用來描述在客觀室內環境中,大多數人在心理和生理方面達到滿意狀態程度的重要指標,可用預測平均投票數PMV進行評價,正值表示熱,而負值表示冷,且值越接近于0表示熱舒適度越高。根據ISO 7730標準,建立基于人體熱平衡方程和主觀熱感覺的熱舒適度評價指標PMV公式[9]:
PMV=0.303×10-0.036M+0.0275×{M-W-0.014M(34-ta)-3.054[5.733-0.007(M-W)-Pa]-0.42(M-W-58.15)-0.0173M(5.867-Pa)-3.9610-8fcl(tcl4-ts4)-fcl·hcl(tcl-ta)}
(9)
式中:M表示人體新陳代謝率;W為人體做工的機械功率;ta為室內空氣溫度;tcl為著裝人體表面平均溫度;fcl為服裝的面積系數;hcl為對流換熱系數;Pa為人體周圍水蒸氣分壓力;ts為圍護結構輻射溫度。
(10)
式中:Fn j為圍護結構各表面面積;tn j為各圍護結構表面溫度。考慮外圍護結構設計參數,可得PMV與外圍護結構之間的關系式為:
PMV=0.303e-0.036M+0.0275{M-W-0.014M(34-ta)-3.054[5.733-0.007(M-W)-Pa]-0.42(M-W-58.15)-0.0173M(5.867-Pa)-3.9610-8fcl{tcl4-[(F外窗t外窗+F外墻t外墻+F屋面t屋面)/(F總+F屋面)]4}-fcl·hcl(tcl-ta)}
(11)
式中:F總為建筑外圍總表面積;F外墻,F外窗,F屋面分別為外墻、外窗和屋面的外表面積;t外墻,t外窗,t屋面分別為外墻、外窗和屋面的表面溫度。則基于外圍護結構設計參數的熱舒適度目標函數minf2如式(12):
minf2=min|PMV(x1,x3,x5,x7)|
(12)
Step2:建立目標約束范圍
為了使得生成的方案更加合理可行,需要對方案生成時的各個因素設定限制范圍,形成變量的約束條件,約束條件的一般形式如下:
bil≤xi≤biu
(13)
式中:xi為第i個設計參數;bil和biu分別為第i個設計參數值的下限和上限。
Step3:NSGA-Ⅱ多目標優化
當目標函數和約束條件都確定下來之后,便可基于NSGA-II算法實現多個目標優化,可以找到基于外圍護結構設計參數的Pareto最優解集。與傳統遺傳算法GA相比,NSGA-II算法的關鍵步驟主要有兩個:
(1)在設置初始種群后,NSGA-II算法將通過快速非支配排序后,利用三個遺傳機制獲得首批子代種群。
(2)第二代種群將父、子代合并,再一次通過快速非支配排序,計算個體之間擁擠距離之后,按步驟一再次產生新的子代種群。
Step4:基于理想點法獲取最優解
利用NSGA-II算法獲取的Pareto最優解集并不是唯一的解,為了獲取唯一最優解,可以采用理想點法。理想點是指利用各個目標的最優值組成的點E(ηEpoint,ZEpoint)。
找出對應的理想點后,計算Pareto最優解圖中各個最優解到理想點之間的距離Un,計算公式如下:

(14)
式中:(ηpareto,Zpareto)為最優Pareto前沿點對應的坐標;(ηEpoint,ZEpoint)為理想點對應的坐標。通過計算距離函數,最優點是距理想點最小距離的點:
Uopt=minUn
(15)
因此,利用理想點法可從Pareto前沿解集中確定使得多目標函數達到最優的一組最優解。
以鐵科高速公路松原至通榆(吉蒙界)段高速公路建設項目房建工程為例。本項目起自松原市與大廣高速交叉處拐脖店互通,經前郭縣、乾安縣后進入白城市境內,再經通榆縣,止于吉林省白城市通榆縣與內蒙古自治區科右中旗交界處(吉、蒙省界)。本項目的建設,對于貫徹落實國家振興東北老工業基地、“一帶—路”和東北亞開發開放等戰略,完善國家高速公路網與互聯互通大通道,改善沿線交通條件,促進區域優勢資源開發和經濟社會協調發展等均具有重要意義。圖2為該工程BIM模型效果圖。

圖2 BIM模型
由于外圍護結構設計參數對建筑能耗會造成較大的影響,因此,本文將外墻綜合傳熱系數、外墻太陽輻射吸收系數、屋面綜合傳熱系數、屋面太陽輻射吸收系數、外窗綜合傳熱系數、外窗得熱系數、窗墻比等7個圍護結構參數作為建筑能耗模擬參數變量,根據每個參數的建議取值范圍對因子水平進行合理劃分,利用Allpairs軟件設計正交表,如表1所示;并利用DesignBuilder模擬32組不同因子水平下的參數組合,依次輸入DesignBuilder中進行建筑能耗仿真,圖3為基于BIM-DesignBuilder建筑能耗模擬建模,正交試驗建筑能耗結果如表2所示。
將表2中的32組能耗模擬樣本數據作為建立隨機森林預測模型的原始樣本,隨機選取24組數據作為隨機森林模型的訓練集,用于學習建筑能耗和圍護結構參數的非線性映射關系,實現能耗預測,剩下的8組數據作為測試集以檢驗預測效果。并對所有樣本數據進行歸一化處理,將建筑能耗數據范圍控制在[-1,1]之間,避免因數據維度不同造成對預測結果的誤差。

表2 能耗模擬結果

圖3 基于BIM-DesignBuilder的建筑能耗模擬
2.3.2 參數優化
由于選取的訓練樣本特征數較少,決策樹參數最大特征數max_features可以設置為auto,最大葉子節點數max_leaf_nodes、決策樹最大深度max_depth均為默認;節點劃分最小不純度min_impurity_split默認為1×10-7。
基于python代碼進行隨機森林回歸模型調參,因此重要參數僅需考慮n_estimators,訓練性能評價指標為R2。圖4為訓練集真實值與預測值間的R2隨n_estimators變化曲線。從圖中可以看出,n_estimators為195時,R2最大值為0.9998,表明模型具有較高的預測精度和較強的泛化能力。

圖4 參數選擇結果
2.3.3 建筑能耗預測結果
利用上述優化后的參數,利用訓練集建立學習模型,分別輸出訓練集和測試集的能耗預測結果,如圖5,6所示。

圖5 訓練集預測結果

圖6 測試集預測結果對比
從圖5可以看出,訓練集對建筑能耗進行預測得到的結果與仿真模擬情況基本上一致,擬合度R2為0.9998,均方根誤差為0.0001,驗證了隨機森林預測模型精準的預測效果。從圖6可以看出,測試集對建筑能耗進行預測結果與仿真模擬基本上一致,擬合度R2為0.9858,均方根誤差為0.0066,充分驗證了訓練集預測擬合函數的正確性。
(1)RF建筑能耗目標函數
利用RF訓練后建筑能耗與外圍護結構參數的預測擬合關系,以能耗最低為目標利用式(8)建立建筑能耗目標函數minf1為:
f1=min(RFregression(x1,x2,x3,x4,x5,x6,x7))
(2)室內熱舒適度目標函數
為了獲得教學樓建筑室內的熱舒適度取值,將根據項目實際情況對相關參數進行設置,并根據上述參數的取值,代入式(12),由于PMV值趨于0時,舒適越高,故可得基于外圍護結構設計參數利用式(12)的目標函數minf2:
minf2=min|PMV(x1,x3,x5,x7)|
2.4.2 建立多目標約束范圍
多目標優化模型的約束條件基于GB 50176-2016《民用建筑熱工規范》被動式超低能耗綠色建筑技術導則》和GB 50189-2015《公共建筑節能設計標準》確定建筑外圍護結構設計參數的取值范圍,具體表示為:
2.4.3 基于NSGA-Ⅱ的多目標優化
針對采用的NSGA-II算法,將種群類型為雙向量即兩個目標種群規模設置為40,最大進化代數設為100,基于python的geatpy工具箱,根據建筑能耗和熱舒適度兩個目標函數,搜尋全局最優解,獲得最優Pareto前沿圖,如圖7所示,圖中包含40對最優解,表3給出了圖7中部分最優值點以及對應的決策變量組合。

圖7 最優Pareto前沿
2.4.4 基于理想點法的最優解
由2.4.3可知,基于NSGA-II算法所得到的最優解不存在唯一性,因此,為了獲得一組最優解,可以采用理想點法。建筑能耗與PMV所對應的最優值構成的理想點坐標為E(580875,0.912967),如圖8所示,得到理想點后,根據式(14)(15)可得建筑能耗多目標優化最優解(588513.6477,0.91238),表4為目標最優和實際值及其對應最優解。

表3 目標最優值及對應解

表4 目標最優和實際值及其對應最優解

圖8 多目標優化最優解
利用NSGA-II算法進行多目標優化后,建筑能耗和建筑室內熱舒適度均得到改善,項目建筑在原有圍護結構初始值下所產生的建筑能耗總量為692710 kW·h,在對建筑外圍護結構設計參數進行優化后,建筑能耗總量為588514 kW·h,比原設計的建筑能耗降低了15%,體現了建筑能耗優化具有較好的效果;原熱舒適度PMV的絕對值為1.21,優化后室內熱舒適度PMV的絕對值為0.91,比原設計的室內熱舒適度PMV的絕對值下降了24.8%,充分驗證了在進行多目標優化后,室內熱舒適度有明顯的改善。
(1)本文建立了一種基于RF-NSGA-II多目標優化模型,首先基于BIM利用DesignBuilder進行正交試驗能耗模擬,利用RF對建筑能耗實現高精度預測,將建筑能耗預測回歸函數作為適應度函數,以熱舒適度為另一個適應度函數,結合規范及工程項目的要求建立維護結果參數相關的約束條件,利用NSGA-II算法進行多目標優化,得到最優值。
(2)利用隨機森林對基于建筑外圍護結構設計參數的建筑能耗進行預測有良好效果。在對建筑能耗預測進行實例分析中,預測模型的擬合度高達0.9858,均方差為0.0066,充分體現了隨機森林預測模型的良好預測擬合效果,也證實了以隨機森林回歸函數作為建筑能耗目標函數的合理性。
(3)從NSGA-II算法多目標優化結果來看,建筑能耗和室內熱舒適度兩個目標均較原有設計有所改善,其中,建筑能耗從原有692710 kW·h降至588514 kW·h,比原有的建筑能耗降低了104196 kW·h,節能效果顯著;原有室內熱舒適度PMV的絕對值為1.21,優化后室內熱舒適度PMV的絕對值為0.91,PMV值降低了0.3左右,熱舒適度也得到了改善。該模型對工程實踐具有一定的指導作用。