鐘勝利,林堯林,黃興華
(1上海工程技術大學 機械與汽車工程學院,上海 201620;2上海理工大學 環境與建筑學院,上海 200093)
隨著經濟的快速發展和人們生活水平的提高,人們對改善居住環境條件的需求不斷增加。然而,在建筑能耗日益增長的趨勢下,大多數建筑設計者及研究人員往往關注的是如何降低建筑能耗,卻忽略了室內的環境質量,這一現象容易產生病態建筑綜合征(SBS)[1]。不舒適小時數作為衡量建筑性能的重要指標之一,受建筑圍護結構傳熱系數、窗墻比、建筑表面太陽熱吸收率等諸多建筑熱物理參數的影響[2]。
目前,通過數據挖掘軟件與模型預測技術,可以獲取影響不舒適小時數參數的基礎數據,并建立相關預測模型,使設計者在建筑設計早期快速準確的獲得室內熱舒適情況,從而為居住者提供一個健康舒適的室內環境。
關于利用逐步線性回歸方法建模和預測方面,蒲清平等[3]通過SPSS軟件建立了居住建筑能耗預測的逐步線性回歸模型,并對模型的擬合效果進行了檢驗。結果表明,模型預測年能耗與實際統計年能耗符合度達95%左右,說明模型具有較高的預測精度和較好的擬合效果;Amiri等[4]采用逐步線性回歸方法,建立了建筑能耗預測模型,并將預測與模擬結果進行對比分析。結果表明,二者之間的誤差是可以接受的,同時指出該方法簡單,能夠準確快速地對建筑能耗進行預測;Braun等[5]利用逐步回歸方法,分別建立了燃氣消耗和電力消耗預測模型,并將預測值與實際值進行了比較。結果表明,兩個模型的預測值都是令人滿意的;Hygh等[6]采用逐步線性回歸的方法,建立了4個城市不同氣候區供熱、制冷以及總能耗的預測模型,并與EnergyPlus模擬結果比較。結果顯示,預測數據與模擬結果吻合較好,同時也表明在設計初期,線性回歸可以作為一種有效的簡化模型來代替能耗模擬模型。
在熱舒適性建模與預測方面,孫斌等[7]利用BP網絡、GA-BP網絡、RBF網絡及Elman網絡,分別建立了熱舒適性指標預測模型。結果表明,GA-BP神經網絡的預測性能最佳,并指出其對權值和閾值的優化是以訓練時間為代價的;喻偉等[2]考慮到14個變量對建筑能耗和室內熱舒適狀況的影響,并建立了GA-BP網絡模型。通過對樣本數據進行訓練和測試,驗證了該模型具有較高的預測精度,同時表明人工神經網絡預測精度受樣本數據的影響;陸燁等[8]采用PSO-RBF的方法,建立了PMV指標預測模型,實現了對PMV指標的智能預測,并通過仿真計算表明,PSO-RBF網絡的預測誤差精度提高了79.5%,小于RBF網絡;朱嬋等[9]提出了一種基于改進的禁忌遺傳算法神經網絡的熱舒適度預測模型(TGA-BPNN),通過仿真實驗并與BP神經網絡及遺傳神經網絡相比,TGA-BPNN可以進一步提升模型預測的準確性,同時表明采用此方法存在算法運行時間長、空間復雜度大以及效率低等不足。
綜上所述可以發現,利用逐步回歸方法進行預測主要是針對建筑能耗,而對熱舒適性等建筑環境領域的研究很少。回歸模型不僅結構簡單,而且可以達到準確可靠的預測效果。而對于熱舒適性的預測普遍采用神經網絡。然而,利用傳統的神經網絡進行預測時,其預測結果誤差往往取決于樣本數據。大部分文獻都采用算法與神經網絡結合的方式,來提高預測精度。但其結構復雜程度會隨之增加,算法運行效率也會有所下降,即耗時又耗力。因此,本文采用逐步回歸方法,建立了集成PVT-M建筑的不舒適度小時數預測模型,并對模型的準確度以及預測變量的重要性進行了分析。
本文選取的居住建筑位于上海市,典型氣候特征為夏季悶熱,冬季濕冷。該氣候區的建筑物必須滿足夏季防熱、通風降溫要求,冬季應兼顧防寒取暖需求。
利用DesignBuilder建立了建筑模型,如圖1所示。建筑面積100 m2,高度4m,為了建筑在冬季能獲得更多的太陽輻射獲得熱量,建筑朝向采用了該地區最佳的南偏東15°方位。建筑采用光伏板、相變材料和特朗伯集熱墻(Trombe wall)結構。光伏板布置在屋頂,主要提供室內用電設備的能源消耗;建筑南向為帶有相變材料的特朗伯集熱墻,分為內層、中間層和外層3層。內層墻體結構為面磚層、XPS保溫層、混凝土層、相變材料層、石膏抹灰層,墻體上開了兩個通風孔,其主要作用是結合中間層的空氣腔來實現建筑的自然通風,從而降低室內的冷熱負荷,外層為玻璃幕墻。其它3面墻體都設置了外窗,且采取了遮陽措施。

圖1 建筑模型圖Fig.1 Building model diagram
1.2.1 自變量
本文選取的34個參數變量都是查閱相關文獻以及規范標準獲取的,參數涉及窗墻比、保溫層厚度、混凝土厚度、太陽熱吸收率、外窗類型、遮陽類型、夏季室內空調和冬季室內采暖溫度設定值、相變材料的類型、厚度以及相變溫度、光伏板的傾角和面積、Trombe墻的空腔厚度、幕墻厚度和通風口面積等。具體變量類型及取值范圍見表1。
表1中:G1-G16表示16種不同的外窗類型;L1-L9表示9種不同長度厚10 cm的懸挑混凝土板;P1-P5表示5種不同的相變材料;W6-W10表示5種不同厚度的玻璃幕墻,這些變量均屬于離散型變量。

表1 變量類型及數值范圍Tab.1 Variable type and numeric range
1.2.2 因變量
本文選取的目標函數為不舒適度小時數,可分為夏季不舒適度小時數和冬季不舒適度小時數,其數學表達式為[10]:

式中,T1為全年高于26℃的室內空氣溫度,T2為全年低于18℃的室內空氣溫度。
充足的樣本量是保證預測模型穩定性和準確性的關鍵。為了建立不舒適度小時數預測模型,需要建立一個以建筑設計參數為輸入,以不舒適度小時數為輸出的數據庫。本文采用了20世紀40年代由S.Ulam提出的蒙特卡洛抽樣方法(MCM)[11],MCM是一種隨機模擬抽樣方法,其工作原理如下:
(1)構造或描述概率過程;
(2)實現從已知概率分布抽樣;
(3)建立各種估計量。
利用該方法對選取的34個變量進行抽樣,最終確定了1 000個樣本。通過仿真軟件DesignBuilder對樣本進行模擬,來獲取不舒適度小時數。
線性回歸分析方法已被普遍應用于不同建筑的性能預測。S.Asadi等[12]發現多元線性回歸模型在建筑設計階段的早期應用,可以提高能源效率和減少排放。逐步線性回歸模型(SLR)屬于線性回歸的一種,由于變量個數和回歸模型的復雜性會對模型擬合優度產生顯著影響,逐步線性回歸可以采用正向選擇和逆向淘汰相結合的方法實現自動選擇自變量,從而確定自變量對因變量的影響程度大小。其模型描述如下:

式中,β0為回歸常數,β1,β2,β3,…,βp為回歸系數,通過最小二乘法確定回歸系數,使平方和誤差最小。
利用IBM SPSS Modeler數據挖掘軟件建立了不舒適度小時數逐步回歸模型,模型結構如圖2所示。采用步進(條件:當候選變量中最大F值的概率≤0.05時,引入相應變量;在引入方程的變量中,最小F值的概率≥0.1時,則剔除該變量)的方法,選擇進入或除去的自變量。在34個建筑設計參數中,逐步回歸方法建立的不舒適度小時數回歸模型保留了22個參數。

圖2 逐步回歸模型結構圖Fig.2 Stepwise regression model structure diagram
在回歸模型中,一般P≤0.05則認為具有顯著性,根據未標準化系數B值可以得到式(3)所示的不舒適度小時數回歸方程。不舒適度小時數回歸模型變量的回歸系數以及顯著性P值見表2。從表中可以看出,不舒適度小時數回歸模型的變量回歸系數所對應的P<0.05,說明模型的自變量和因變量之間有明顯的線性關系,建立的回歸方程是有效的。


在進行線性回歸分析時,共線性會使參數估計不穩定。方差膨脹因子(VIF)可以檢測多重共線性,它和容差(Tolerance)互為倒數關系,當VIF≥10時,說明變量之間有嚴重的多重共線性,其值越接近1,變量之間多重共線性越弱。從表2統計的數值來看,不舒適度小時數回歸模型相關變量的VIF均在1附近,說明這些變量之間共線性較弱。

表2 逐步回歸系數Tab.2 Stepwise regression coefficient
回歸方程的擬合優度檢驗,是檢驗樣本數據聚集在樣本回歸直線周圍的密集程度,從而判斷回歸方程對樣本數據的代表程度。擬合優度檢驗一般采用調整決定系數R2實現,該統計量的值越接近于1,擬合優度越好,R2可由式(4)-式(8)計算得到。


式中,S Sreg為回歸平方和;S Sres為殘差平方和;S Stot為總平方和;yi為真實值;fi為預測值;y-為平均值。
不舒適度小時數模擬值與SLR預測值的回歸如圖3所示。可以看出,模擬和預測的數據結果有很好的一致性,不舒適度小時數回歸模型的R2為0.845,顯示出較好的擬合效果。

圖3 不舒適度小時數模擬值與SLR預測值回歸圖Fig.3 Regression diagram of simulated value of discomfort degree hour and SLR predicted value
一個好的線性回歸模型必須滿足相關的所有假設,其中包括線性、獨立性、正態性、方差齊性等。圖4給出了不舒適度小時數回歸模型的標準化殘差正態概率P-P圖。由圖可見,所有的點都比較靠近對角線,且結合殘差統計表3得到的不舒適度小時數回歸的標準偏差為0.989(<2),說明回歸模型的殘差是呈正態分布的。

圖4 不舒適度小時數標準化殘差正態概率P-P圖Fig.4 P-P graph of standardized residual normal probability of discomfort degree hour

表3 不舒適度小時數殘差統計表Tab.3 Residual statistical table of discomfort degree hour
為了評價不舒適度小時數逐步回歸模型的準確度,采用相對誤差(RE)這一指標來進行衡量,其數學表達式如下:

式中,RP為利用SPSS軟件線性回歸的預測值,RS是利用DesignBuilder仿真軟件的計算值。
表4給出了1 000組預測樣本數據的相對誤差范圍。由此可見,利用SLR方法預測的不舒適度小時數最大值和最小值分別為5741.61和3791.59,相對誤差的最大值和最小值分別為16.03和-10.32,再結合圖5統計的不舒適度小時數相對誤差分層梯度范圍可以得出:相對誤差范圍在10%-20%的樣本只有8組,占樣本總數的0.8%,絕大多數樣本相對誤差范圍小于10%,其中相對誤差小于2.5%更是達到了一半以上,說明利用SLR能達到對不舒適度小時數較好的預測效果。

圖5 不舒適度小時數相對誤差分層梯度范圍Fig.5 Relative error stratified gradient range of discomfort degree hour

表4 不舒適度小時數相對誤差范圍Tab.4 Relative error range of discomfort degree hour
依據表2中列出的22個參數變量,為了分析每個自變量對不舒適度小時數的影響程度大小,采用單個自變量標準化系數值的絕對值與方程相關的所有自變量的絕對值和的比值作為評價標準。
通過表2的標準化系數,可以計算得到每個自變量所占比例大小,其統計結果如圖6所示。從圖中可以看出,夏季室內空調溫度對不舒適度小時數的影響程度最大,其次為冬季室內采暖溫度和東向窗墻比。前三者標準回歸系數所占比值分別為26.4%、14.8%和11.9%,PCM類型和光伏傾角對不舒適度小時數的影響程度最小,所占比例只有1%。

圖6 預測變量影響程度大小Fig.6 The degree of influence of predictive variables
本文利用逐步回歸方法,建立了集成PVT-M建筑不舒適度小時數模型。通過對模型分析,可以得到以下結論:
(1)在選取的34個設計變量中,利用逐步回歸方法建立的不舒適度小時數回歸方程中保留了22個參數,同時通過顯著性P值驗證了方程的有效性。
(2)在模型擬合優度方面,不舒適度小時數SLR模型的回歸系數為0.845,說明計算數據與預測數據之間具有較高的線性擬合度。
(3)在回歸模型誤差方面,相對誤差范圍小于2.5%的樣本數占半數以上,只有極少一部分樣本相對誤差范圍較大,說明SLR是一種可行的模型預測方法,能實現對不舒適度小時數的準確預測。
(4)在預測變量重要性方面,對不舒適度小時數影響程度最大的為夏季室內空調溫度,影響程度最小的為PCM類型和光伏傾角。