彭獻永,王波波,張騫
(1.艾默生過程控制有限公司,上海 201206;2.華電內蒙古能源有限公司土默特發電分公司,內蒙古 包頭 014100;3.江森自控日立空調科技(無錫)有限公司,江蘇 無錫 214000)
2008年修訂的我國《節約能源法》新增對公共機構節能管理要求。隨著《公共機構節能條例》2008年10月1日施行,公共機構節能需要在政府機關的積極推動下走在全社會前列,從大量的基礎性、示范性的能耗統計、審計工作和約束性的節能管理[1-3],轉軌到法制化的剛性管理上來。國家機關辦公建筑及大型公共建筑節能工作進入了快速發展的新階段,各省市機關辦公建筑和大型公共建筑相繼安裝分項計量系統,搭建公共建筑能耗監測平臺。從2010年起,深圳市、上海市、江蘇省等開始逐步建立城市級公共建筑能耗監測平臺。這些公共建筑能耗監管平臺在運營過程中積累了大量數據,既便于公共建筑節能管理工作的開展,也為公共機構節能的科學研究和政府制定政策提供數據支持。同時,公共建筑能耗監測平臺中的分項計量不僅提供了建筑設備詳盡的用能數據,而且建筑自控系統記錄的運行數據可以真實反映建筑的運行狀況。目前已有較多應用分項計量數據與系統運行數據都已表明,建筑暖通空調的能耗占建筑物總能耗的50%~60%以上,而建筑空調能耗中的55%又是冷熱源系統能耗。因此,從微觀層面看,建筑空調系統節能運行優化以及控制策略及時有效實現,都需要對空調負荷進行提前預測;從宏觀層面看,加強建筑負荷預測對于推進公共建筑能源管理和參與到電力需求側的需求響應管理,優化電網對公共建筑電力資源配置,具有重要意義。
基于大數據的建筑冷(熱)負荷預測,從研究方向上可以歸納為2個方面,即數據預處理、負荷預測算法的應用。本文圍繞這2個方面,對現有的大數據技術在建筑冷(熱)負荷預測的研究進展進行考察和總結,對已有的不同預測技術進行分析,同時也對大數據技術在大型公共建筑冷(熱)負荷預測領域未來發展做出展望。
針對建筑能源數據的特點,如建筑數據量大、數據質量不高,需要有針對性的數據預處理方法。數據質量主要體現在部分數據缺失、異常值等方面。在其他方面,對于缺失數據、異常數據經常采用刪除整條數據(所有數據屬性),或者以均值、中位值和眾值等簡單統計量填充替換的方法。顯然,從保持數據多樣性、充分利用數據中的其它可用屬性角度考慮,直接刪除和簡單填充數據的方法大多時候都不能適用于建筑能耗監測大數據的數據預處理。
文獻[4-6]應用小波分析算法對數據進行篩選。小波分析方法在處理大數據中的噪聲數據具有很好的適用性和很高的效率。文獻[7-8]應用數據挖掘的算法對建筑能耗監測數據中的異常值進行識別與修復,采用基于KNN算法的缺失數據填充、K-Means聚類的數據異常值和噪聲值識別(數據質量判斷)與基于PCA算法的多維度數據降維。
值得指出,上述研究多是具體場景下某些數據集合下的數據預處理,缺少對數據預處理方法的普遍適用性等問題的深入研究。例如對于常見的異常數據的識別與清洗算法:(K-Means算法)在數據預處理過程中易受異常值的影響;KNN算法對計算性能要求較高;而小波算法的耗時較長、效率較低。以上算法都有自身的適用性和局限性,如何改進這些算法在處理大數據的性能和適用性是將來進一步的研究內容。
建筑運行階段空調負荷是指制冷(或采暖)設備為滿足空調系統運行所提供的冷(熱)量,它比理論的空調房間冷(熱)負荷更為復雜,不僅受室外氣象、圍護結構、建筑使用狀況的影響,還受到空調系統的容量、控制調節等因素影響。建筑運行階段空調負荷預測的主要目的是為了預測建筑物的冷(熱)負荷求及用電量,是空調系統節能優化控制的基礎,是隨著空調系統復雜化和節能減排的需求發展起來的,將會給空調系統節能運行帶來明顯效益。由于建筑空調系統運行負荷的復雜性,空調負荷數據序列始終表現出非線性和動態特征,因此負荷預測一直是國內研究的難題和熱點。
目前國內建筑負荷預測研究主要集中在模型輸入變量和建模方法兩方面。以建筑冷負荷為例,在影響冷負荷預測的輸入變量上,對氣象參數、時間特征數、建筑使用狀況、冷凍水溫度等影響因素的選擇進行定量研究。在建模方法方面,主要歸納為三大類:①統計多元回歸模型,代表性的有ARMA,GARCH等,它們主要應用于線性回歸場合;②淺層網絡模型,代表性的有人工神經網絡(ANN)、支持向量機(SVM)、高斯過程(GP)模型等,它們既可用于線性回歸,也可用于非線性回歸,而且基于核技術的支持向量機和高斯過程在回歸領域得到了廣泛應用;③深度多層網絡模型,代表性的有深度自編碼網絡(DAEN)、深度信念網絡(DBN)等,它們對回歸影響因素進行學習,得到稀疏化的影響因子集,這樣可提高在線回歸速度。
考慮多維多變量影響的統計方法試圖通過回歸分析建立歷史數據樣本與未來建筑冷負荷之間的關系。迄今為止,多元線性回歸(MLR),自回歸積分移動平均(ARIMA)模型[9]都常用于建筑冷負荷預測。MLR通過模擬冷負荷和天氣條件之間的相關性來預測建筑冷負荷。文獻[10]應用層次分析法對最佳調整各個預報員的權重進行調整,從而改善冷負荷預測。文獻[11]開發了一個啟發多元線性回歸的主成分分析,以實現冷負荷預測任務。然而,盡管統計回歸模型通常需要更少的計算資源,但發現它們在非線性建模中的應用非常有限。
3.2.1 人工神經網絡
基于人工神經網絡的建筑冷(熱)負荷預測,通常由影響負荷的因素構成輸入單元,以能耗或負荷作為輸出單元。文獻[12]介紹了利用神經網絡方法進行負荷預測的基本理論和方法。文獻[13]應用徑向基函數(RBF)神經網絡和BP神經網絡模型對建筑物冷負荷仿真軟件的夏季不同月份的逐時冷負荷數據進行訓練和預測,仿真表明RBF神經網絡具有更高的預測精度及更好的泛化能力。文獻[14]以某地源熱泵空調系統為實測對象,根據實測的逐時負荷數據建立了人工神經網絡負荷預測模型,并預測了一個未來24小時逐時負荷。
3.2.2 支持向量機
支持向量機(SVM)算法的預測方法具有強大的非線性映射特性,近年來在空調負荷預測領域應用較廣泛。文獻[15-16]應用支持向量機算法對建筑能耗和空調系統負荷預測,得到相應的建筑能耗模型和負荷預測模型;研究顯示在特定的場景,支持向量機的預測效果要優于人工神經網絡。
支持向量機可以避免神經網絡結構選擇和局部極小點問題,有較高的泛化能力和學習能力,對小樣本預測效果明顯;但是對缺失數據較為敏感,對大規模樣本的學習速度慢。
3.2.3 高斯過程
短期負荷預測具有不確定性、隨機性等特點。概率式預測法中,基于貝葉斯概率論的預測方法,高斯過程回歸(Gaussian Process Regression,GPR)參數少,自適應確定超參數,非參數推斷靈活。與預測誤差分布特性的統計法相比,高斯過程提供一種置信度較高的解空間范圍解釋,預測結果有概率意義,而不需要統計歷史預測誤差。與基于分位數回歸的概率密度預測法相比,高斯過程不需要對每個分位點進行建模,模型結構更簡單。文獻[17]提出高斯回歸過程的兩種變體:緊湊回歸高斯過程、逐步高斯過程,對未來的預期能源需求進行建模研究,并與決策樹、人工神經網絡進行對比研究,高斯過程顯示出一定的優勢。基本高斯過程對大的樣本集的處理會造成較大的運行時間與運算空間。針對大量數據樣本處理效果不明顯,出現稀疏高斯過程回歸算法。
3.2.4 算法改進與融合
從算法的本身角度看,每個算法都有其自身的特點及適用性,單一的算法通用性較弱,預測精度也有限。多種預測算法融合是今后的一大發展方向,目的是充分發揮各個算法的優點,形成混合模型來提升算法性能。
文獻[18]以空調運行負荷實測數據為基礎,利用廣義回歸神經網絡(GRNN)建立混沌預測模型,對提前1小時和提前24小時的短期預測效果進行驗證。研究結果表明空調運行負荷可以利用混沌方法對負荷進行預測的模型簡單、魯棒性好的優點。文獻[19]提出了一種集成算法對建筑能耗和空調負荷進行預測,該集成算法融合了8種基本數據挖掘算法,其預測精度明顯優于單個基本算法模型。文獻[20]提出了一種iPSO-ANN的建筑用電量小時預測模型。應用改進的粒子群優化算法(iPSO)來調整ANN結構的權重和閾值,而主成分分析(PCA)用于選擇重要的建模輸入并簡化模型結構。比較結果表明,iPSO-ANN和GA-ANN模型的精度均高于ANN模型。從耗時的角度看,iPSO-ANN模型比GA-ANN方法具有更短的建模時間。文獻[21]建立了模糊C均值算法優化BP神經網絡復合模型。該模型先采用FCM算法對輸入參數進行聚類,針對不同類建立BP神經網絡預測模型,將待測樣本分類后進行預測,最后使用決策樹算法篩選預測結果中聚類不佳的部分進行加權優化。結果表明,神經網絡復合模型的性能明顯優于不聚類神經網絡。文獻[22]提出了一種基于混沌分析和支持向量回歸機的短期空調負荷預測建模方法。通過研究實際空調負荷序列的混沌特性,確定其混沌特征參數并選取支持向量回歸機進行預測;支持向量機建模過程使用粒子群算法進行參數尋優。仿真結果表明,空調負荷序列具有一定的混沌特性,使用混沌支持向量機方法的預測精度比單一支持向量機法預測結果的精度有了明顯提升。文獻[23]提出了一種基于人工智能和回歸分析的辦公建筑負荷預測方法,包括小波變換、支持向量機(SVM)和偏最小二乘回歸(PLS)。比較結果表明,該方法能夠在不同的時間范圍內實現高精度的動態負荷預測。以上的國內研究結果都表明,多種算法改進和融合有利于提高預測精度。
深度學習是指一系列機器學習算法,它們能在大數據中顯示非線性和復雜模式,且可以對狀態因素的潛在特征進一步學習。深度多層網絡代表性的模型有深度自編碼網絡、深度信念網絡等。深度學習既可以以監督方式建立具有給定輸入和輸出(即冷負荷)的預測模型,也可以用無監督方式從原始數據中提取有意義的特征作為模型輸入。
文獻[24]采用深度學習預測24小時建筑冷負荷曲線。分別以半監督和無監督兩種方式利用深度學習將其在冷負荷預測中的表現與典型的特征提取方法和建筑領域的流行預測技術進行比較。結果表明,深度學習可以增強建立冷負荷預測的性能,特別是當以無人監督的方式用于構建高級特征作為模型輸入時。使用由無監督深度學習提取的特征作為冷負荷預測的輸入可以明顯增強預測性能。這些發現具有啟發意義,可為建筑能源預測帶來更靈活有效的解決方案。文獻[25]提出了一種新的基于深度學習的預測模型,用于高精度的確定性冷負荷預測。該模型結合了經驗模式分解、深度信念網絡和集成技術。經驗模式分解用于將原始冷負荷數據序列分解為若干個具有更好的離群點和特性的數據子集。通過基于深度信念網絡的分層預訓練,有效地提取數據中隱藏的非線性特征和高水平的不變結構。此外,引入了集成技術并進行了適當設計,以減輕不確定性(即模型不確定性和數據噪聲)對預測精度的影響。仿真結果表明,與BP神經網絡、SVM預測算法相比,所提出的基于深度信念網絡的預測方法表現出很強的性能。深度學習方法應用于建筑物空調負荷預測,具有提高公共建筑能源系統運行性能的巨大潛力。文獻[26]提出了基于遞歸神經網絡的建筑能量預測策略。在模型中,每種策略都有兩個層面的獨特特征:①在高級別層,三種推理方法用于生成短期預測,包括遞歸方法、直接方法和多輸入多輸出(MIMO)方法;②在較低級別,最先進的技術被用于循環模型開發,例如使用一維卷積操作,雙向操作和不同類型的循環單元。研究結果用于短期建筑能量預測的深度遞歸模型,有助于彌合建筑專業人員與先進大數據分析之間的知識差距。
在公共機構監管平臺和大型公共建筑分項計量監測系統出現之前,建筑負荷預測的研究手段主要為基于理論、模擬、實驗等方法,存在著一定的局限性。近年來,在公共機構建筑能源監測平臺、大型公共建筑監測系統積累了大量的運行數據,為大數據技術的應用提供了很好的應用場景;另一方面,大數據技術的發展為建筑能源監測管理提供了優良的數據處理手段。建筑能源數據預處理有助于提高預測結果準確性,因此,建筑能耗數據針對性的預處理將會是今后一個重要的研究方向。
從目前研究來看,雖然基于大數據的建筑負荷預測的方法較多,在相關的研究中也取得了較好的效果,但是在實際工程應用中缺乏很好地驗證。目前的預測方法是否適合于實際工程,需要后續深入工程實踐。深度學習在建筑空調負荷預測的研究表現出巨大的潛力,有望為建筑能源預測帶來更加靈活有效的解決方案。
①建筑能源大數據的預處理需要從缺失數據的填充、異常數據的識別清洗以及數據的降維三個方面進行處理,為后續基于數據的建筑空調負荷預測奠定基礎。
②多種算法融合的混合模型是建筑空調負荷預測的主要研究方向;深度多層網絡及其改進,有望成為在建筑空調負荷預測領域里的一個很有發展前景的新興建模方法。
建筑空調負荷數據序列始終表現出非線性和動態特征,難以準確預測。充分發揮各算法的優點,多種算法融合建模是解決建筑空調負荷預測的主要手段。人工智能、大數據技術的發展為建筑空調負荷預測技術提供助力,深度多層網絡是一種具有巨大潛力的建筑空調負荷預測解決方法。