汪雨清(上海市建筑科學研究院有限公司, 上海 201108)
隨著國家建筑節能政策的持續推廣和智能化技術的不斷發展,全國各地大型公共建筑均建立了智能化樓宇監控系統(包括樓宇自控系統、綜合能源管理系統、能耗監測系統等),用于實時監測建筑能耗的變化規律。隨著建筑運行數據的不斷上傳和保存,智能化監控系統中的建筑運行數據越來越多。目前主要采用專業知識和數據挖掘的方式[1]對建筑運行能耗進行分析、提煉和發現,以期更好地指導建筑優化運行。
本文將采用數據挖掘技術中 K-means 聚類算法,對典型辦公建筑的全年逐日單位面積建筑運行用電量進行挖掘分析,并結合三類主要關鍵影響因素:室外氣候類別、日類別及小時類別確定了典型辦公建筑常見的 4 類運行模式。總結出 4 類運行模式基本符合正態分布規律,從而給出了該辦公建筑在不同運行模式下的合理能耗值,為后續進行建筑能耗預測、建筑能耗診斷提供前期技術鋪墊和支撐。
聚類分析是一種基于數據挖掘技術的聚類方式,是研究如何將研究對象(樣品或指標)按照多方面的特征進行綜合分類的一種多元統計方法[2]。其中,K-means 算法是聚類方法中應用最廣的一種方法。該方法是由 MacQueen 于1967 年提出[3]。該方法的核心算法思想是對于某個有 n 個數據(x1,x2,…,xn)的樣本,找到m個聚類中心(a1,a2,…,am),實現每個聚類中心與其周邊樣本數據之間的距離平方和達到最小。這個距離平方和即被稱為目標函數,如式(1)所示。

K-means 聚類算法可在多個載體實現。本次選取了Python 作為 K-means 運算的載體,主要流程如圖 1 所示。

圖 1 基于 Python 的 K-means 算法流程
當前,我國建筑用能約占全國能源消費總量的 27.5%,且能耗占比將隨著人民生活水平的提高逐步增加到 30% 以上。作為公共建筑重要組成部分,辦公建筑通常具有數量多、能耗強度高等特征[4],因此辦公建筑將是國家節能工作的重點。要想做好辦公建筑的節能工作,做好辦公建筑的能耗管理是一項必要且重要的工作,如能耗統計、能耗預測及節能診斷等。因此,首先需要明確各個辦公建筑的能耗運行規律。結合辦公建筑自身能耗監測系統,采用適當數據挖掘方法對建筑運行能耗數據進行處理和分析,可有效幫助建筑管理人員掌握建筑能耗運行規律和后續開展節能工作。
在國家節能政策的大力推動下,加上 AI 人工智能技術、物聯網技術的迅速發展,城市辦公建筑的能源管理已由早期的人工定時、定點巡視管理模式逐漸轉變為在線的建筑智能監控系統。建筑智能監控系統充分結合了現代計算機技術、現代控制技術和現代網絡通信技術,實現了對建筑各種機電設備運行狀態(包括啟停、故障、能耗等)進行全面的監測、控制和管理[5]。
基于典型辦公建筑能耗監測系統逐日能耗數據,首先采用 K-means 聚類算法實現運行能耗數據的自動分類,并關聯室外氣候參數及日類別(工作日或非工作日)后,進一步分析了各類能耗呈現的分布規律,給出了不同室外氣候參數下不同日類別下的建筑運行能耗臨界值。
典型辦公建筑位于夏熱冬冷地區,建筑性質為涉外標準乙級寫字樓建筑。建筑總層數 13 層,總建筑面積 21 241 m2。建筑主要功能區包括大堂、辦公區域、地下停車庫等,其中大堂層高 4.0 m,標準辦公建筑層高 3.2 m。建筑內部主要用能系統包括空調、照明、電梯、生活水泵等,空調形式為分體空調,電梯為客梯 3 部、貨梯 2 部。主要涉及能源為電和水。
基于建筑能耗監控系統,獲取了建筑 2018 年全年逐日運行能耗總數據。結合建筑總面積,可獲得建筑逐日運行的單位建筑面積能耗。通過 K-means 聚類分析,設定 K=4,將建筑運行單位建筑面積能耗分為 4 類,如圖 2 所示。圖 2中各簇數據中的淺灰色部分為相應簇數據的正常數據;黑色則為該簇數據的異常值,進一步分析時將剔除。

圖 2 建筑單位面積用電量聚類結果圖
重點分析了每簇類中 9:00~17:00 逐時能耗,關聯室外氣候和日類別兩類關鍵因素,具體如表 1 所示。

表 1 各簇數據與日期及室外氣候關聯
各簇數據確定特征分布后,按分布規律確定各簇數據的置信區間,從而給出實際運行能耗數據應處于的區間范圍。案例中不同簇數據呈現正態分布規律,計算相應的特征值[包括平均值、標準差值σ、2 倍標準差值 2σ、3 倍標準差值 3σ,如表 2 所示。

表 2 各簇類數據正態分布相關特征值
標準正態分布的置信水平可分別表示為 68.2%、95.4%、99.7%,對應置信區間為μ±1σ、μ±2σ、μ±3σ,標準正態分布置信區間圖如圖 4 所示。
為避免置信區間太窄導致無法包含全部有效數據,或置信區間太寬導致部分數據無實際有效數據樣本,本案例中各簇數據臨界值按 95.4% 的置信區間進行劃分確定,各簇類建筑單位面積用電量數據的有效置信區間如圖 5~圖 8 所示。
各簇建筑逐時單位面積用電量數據的置信區間臨界值如表 3 所示。

圖 3 各簇能耗數據特征分布

圖 4 標準正態分布及其置信區間圖示
將建筑單位面積用電量與室外氣候及日類別兩類因子關聯后,針對每天逐時時點 1~每天逐時時點 4 簇數據分別進行處理,剔除異常值,進行統計分析,可得每簇類建筑單位面積用電量數據的分布特征,基本呈現正態分布,如圖 3 所示。

圖 5 簇 1 數據 95.4% 置信區間圖示

圖 6 簇 2 數據 95.4% 置信區間圖示

圖 7 簇 3 數據 95.4% 置信區間圖示

圖 8 簇 4 數據 95.4% 置信區間圖示

表 3 各簇類數據有效置信區間臨界值
根據關聯日類別和室外氣候兩個關鍵因素,結合確定的不同簇建筑逐時單位建筑面積能耗可知,不同日類別、不同室外氣候下,建筑實際運行逐時單位面積能耗值應符合的臨界值如表 4 所示。

表 4 關聯法則下逐時單位建筑面積用電量臨界值
表 4 中,各簇數據臨界值基本可反映建筑在工作日或非工作日、不同室外氣溫下運行時的能耗情況。若某時建筑能耗高出相應臨界值,可及時提醒建筑樓宇能源管理人員,查找原因,排除用能浪費隱患。若某特定情況下,建筑能耗過低,在工作時間甚至為零,除建筑停業等情況,可查看是否因在線監測數據傳輸出現故障。
基于建筑能耗監測平臺實現建筑節能管理將隨著智能化技術不斷前行發展成為未來的主流趨勢。本文憑借K-means 聚類算法對建筑整體實際用能進行初步分析,將建筑整體運行能耗模式分為 4 簇。后關聯辦公建筑運行能耗影響最大的兩個因子—日類別和室外氣候,指出典型辦公建筑在不同日類別不同室外氣溫下,不同簇類運行模式下的逐時單位面積能耗臨界值,供后續建筑用能預測、預警及診斷。本研究旨在為智能化能耗監測系統能夠更好地服務于建筑節能運行管理提供一種理論研究和分析方法,供后續開展相關研究借鑒。