







[摘 要] 針對非侵入式負荷監測(NILM)具有靜態建模的局限性和辨識精度低等問題,構建了長短時記憶網絡(LSTM)自動編碼器,并搭載K-means聚類進行數據清洗,提出了一種KM-LSTM-AE方法,針對NILM在工業領域的空白,選用某工廠的真實能耗數據作為KM-LSTM-AE的測試數據集,實驗結果表明KM-LSTM-AE方法的辨識精確率較高,且耗時較短。
[關鍵詞] 長短時記憶網絡; 非侵入式負荷辨識; 自動編碼器; K-means聚類
[中圖分類號] TM714" [文獻標識碼] A
為了應對氣候變化和能源危機,風能和太陽能等可再生能源在世界各地都得到了廣泛的開發[1]。據研究,提高能源利用率[2]可以節省20%的建筑能耗。近年來,中國鋼鐵工業在保證產能的同時,對于節能工作也非常重視。2006-2018年間中國重點鋼鐵企業綜合能耗下降14%,由此可見中國對于如何降低工業能耗這一問題的重視程度,處于轉型升級階段的鋼鐵工業未來如何進一步降低能耗是中國節能工作的重點[3]。
用電負荷檢測作為現代電力大數據智能化技術體系[4]中的關鍵技術,一直是研究的重點。本文的工作是建立在LSTM的基礎上的。LSTM神經網絡是一種典型的深度神經網絡(DNN),由Mauch等在2015年[5]應用于NILM。文獻[6]將CNN與LSTM并行連接,提出了一種CNN-LSTM模型,充分利用兩個網絡的空間和時間的特征表達能力,減少了欠采樣的識別誤差。負荷的功耗需要建模為一個動態系統,而多標簽分類方法通常適用于靜態系統,文獻[7]結合多標簽分類技術改進了LSTM模型,把NILM建模為一個真實的動力系統,提高了辨識的準確性,但是這種多標簽分類方法只能判別電器的開關狀態,負荷分解效果有限。文獻[8]提出應用MATLAB小波分解提取出特征值建立特征庫進行負荷辨識,將信號數據進行HAAR小波分解,由數學建模得到特征值,辨識的準確率、召回率、查全率均表現較好,但是該文獻的驗證負荷種類比較少,還是有明顯的局限性。文獻[9]結合多元LSTM神經網絡提出了一種基于多元時間序列數據增強框架,解決了深度學習應用中分類平衡和樣本量不足的問題。除了傳統CNN和遞歸神經網絡(RNN)外,一些特定的深度學習結構,如Wavenet[10]、深度稀疏編碼[11]也被用來處理非侵入性負載分解[12]。
1 NILM基本框架
用電智能化提出以后,負荷監測受到了廣泛關注。目前的負荷監測技術分為侵入式負荷監測(Intrusive load monitoring,ILM)和非侵入式負荷監測(Non-invasive load monitoring,NILM)。侵入式負荷監測與分解是將傳感器安裝到每一個具體的待檢測設備上,每一個房屋都需要部署大量的傳感器,經濟性較差。非侵入式負荷監測克服了侵入式監測的缺點,通過數學算法分析數據的暫態特征和穩態特征,監測用戶負荷運行狀態[3]。
NILM是在入戶電表處安裝相關裝置統計總的電氣量,通過信號分解或其它智能手段分析負荷狀態和用電規律,并實現從總負荷電氣量到每一種設備電氣量的分解,從而預估每一種電器的用能情況。根據房屋或建筑物配電基礎設施中的數據采集端口進行的電力測量,可估計單個設備的用電信息,其中非侵入式工業負荷辨識系統示意圖如圖1所示。由電力入口采集到擬分析的電壓、電流信號后,輸入NILM客戶端進行分析,進行事件檢測與提取,根據提取的事件,輸出負荷分解結果。
現有的 NILM 方法可以大致分為基于事件和非基于事件的方法,具體取決于獲取設備事件的要求。基于事件的方法需要事件檢測和分類過程,以便進一步識別設備。信號的變化或不連續性稱為事件或邊沿,在NILM中被視為狀態轉換點。對于工業領域的NILM,文獻[13]以河南的某鋼鐵廠為例,對企業的原始負荷信號進行3層小波包分解,并且計算能量譜,實現了鋼鐵等企業主要生產工藝的有效分解,開啟了NILM應用于工業領域的先河。文獻[14]利用工業負荷單體功率大的特點構建有效描述事件波形的結構化特征空間,建立映射規則實現特征空間與解釋空間的對應,并通過類別判定完成事件解析與負荷辨識。文獻[15]考慮了不平衡數據造成的少數類誤判問題,采用熵權法計算特征權重,增加了少數類的分類準確性。
2 基于KM-LSTM-AE方法的NILM
目前實際應用最廣泛的循環結構網絡架構來自 于Hochreiter和Schmidhuber 提出的長短時記憶網絡 (long short term memory, LSTM) 模型[15], 其有效地解決了 RNN 中梯度消失的問題。 特別是在長距離依賴任務中, LSTM 的性能遠遠優于 RNN。" 梯度反向傳播過程將不再受到梯度消失問題的困擾, 可以對短期或長期依賴的數據進行精確建模。 LSTM 的工作模式與 RNN 的工作模式基本相同, 不同之處在于 LSTM 實現了更精細的內部處理單元, 可以實現時間序列信息的有效存儲和更新。
如圖2所示,LSTM單元中有三種類型的門:輸入門、遺忘門和輸出門。 門控可以看作是一個全連接層,LSTM通過這些門實現信息的存儲和更新。 更具體地說,門控是由Sigmoid函數和點乘運算實現的,門控不提供額外的信息。門控的一般形式可以表示為:
Gx=σWx+b(1)
σx=1/1+exp-x(2)
式中:σx為Sigmoid函數,是機器學習中常用的一種非線性激活函數,它可以將真實值映射為0~1之間,用于描述可通過的信息值。
由圖2可知,當值為1時,表示所有信息都可以通過,當值為0時,表示沒有信息可以通過。i,f和o分別代表輸入門、遺忘門和輸出門,代表相應元素相乘,W和b分別表示網絡的權重和偏差。
多標簽分類技術在某種意義上為真正的NILM帶來了希望,因為它不需要侵入式采集數據來進行訓練。目前已有的多標簽分類技術有以下2個缺點:1)只是在靜態問題上開發的,對于動態問題不適用,完成NILM只是通過簡單的窗口滑動完成。2)異常值監測及清洗不夠完全,影響后續的負荷識別效果。
為了解決上述問題,本文在LSTM的基礎上,把K-Means聚類和多標簽分類技術與LSTM框架結合,并使用了LSTM自動編碼器。有一些學者對LSTM自動編碼器的研究是在無監督的情況下進行的,如文獻[16]中,LSTM自動編碼器被用于視頻序列合成,在文獻[17]中,LSTM自動編碼器用于語音合成,這些都屬于合成問題。在本文的研究中,LSTM編碼器是以分析為目的進行工作的,提出了一種KM-LSTM-AE(AE,Autoencoder)分解方法,首先通過K-均值聚類進行初始數據篩選,聚類結果如表1所示。
本文中定義聚類數小于10的個案為異常值,采用同時期的數據進行異常值替換。用能耗量作為輸入,輸入的能耗信號表示為xi=x1i,x2i,…,xni,長度為n,LSTM自動捕獲和重構輸入信號相關的信息。LSTM在t時刻的隱藏層可表示為hti,當編碼至信號末時,hti是xi的矢量表示。解碼器與編碼器有相同的網絡結構,它學習的是重建輸入的翻轉版本,即xTi,xT-1i,…,x1i,實際的解碼信號為Ti,T-1i,…,1i。同時,編碼器的最終隱藏狀態hti被用作解碼器的初始隱藏狀態。綜上,所提出的辨識方法如圖3所示,其中編碼器和解碼器都采用LSTM獲取動態信號,編碼器的尾層通過全連接層(FCN)輸出標簽。
該模型的總體損失L為重構損失Lrec與多標簽損失Lcls之和。KM-LSTM-AE模型的重構損失可以表示為式(3),多標簽分類損失為式(4),總體損失為式(5)。
Lrec=1N∑Ni=1∑Tt=1xti-ti2(3)
Lcls=1N∑Ni=1∑Cc=1pci-p^ci2(4)
L=Lcls+γLrec(5)
其中:N是樣本總數,γ為重構損失的權重。由于該模型更關注的是多標簽分類損失,故將多標簽分類損失的權重加大,重構損失的權重減小,故將γ設為0.1。
3 實例分析
3.1 數據集和評價指標
由于工業生產設備復雜,用戶用電周期較長,用電量相對于家用負荷通常較大,NILM在工業領域的應用和研究相對較少。不同類型的負荷有不同的負荷特征,按照其運行狀態大致可分為3類:開關二狀態負荷為Type-Ⅰ型負荷,連續型狀態負荷為Type-Ⅱ型負荷,多狀態負荷為Type-Ⅲ型負荷。其中Type-Ⅲ型設備由于狀態較多變,規律性較差,一直是NILM研究中的難點。
本文提出的KM-LSTM-AE算法在同一臺服務器下的pytorch11.0環境下搭建神經網絡,在訓練模型時利用CUDA+GPU加速,采用自適應矩估計(Adam, Adaptive moment estimation)優化算法訓練模型。采用某企業2019年1月1日至2021年9月30日的設備能耗實測數據結合所提出的KM-LSTM-AE分解方法進行了分析。該數據集包含了電爐、車間變壓器、油壓機3種典型Type-Ⅲ工業設備的能耗數據,每個設備有24 096個樣本,樣本間隔為1 h。
首先對3種設備的能耗數據用K-均值聚類的方法進行數據清洗。 考慮到該數據集中的3種設備都是Type-Ⅲ型負荷, 通過觀察原始聚類中心可知, 將聚類數N設置為5較為合理, 如表1所示, 定義聚類數N≤20的標簽下的樣本為異常樣本, 采取同時期數據填補的方法進行填補, 清除異常值, 再用同樣的方法進行二次聚類, 聚類結果如表2所示。
選取2020年3月1日至2020年9月30日的數據對方法的有效性進行驗證,共計5136個數據,選取前90%的數據進行訓練,后10%的數據進行測試。3個設備分別訓練一個模型,提高辨識的準確性。設置求解器為Adam,一共訓練250輪,將梯度閾值設置為 1。指定初始學習率0.005,在125輪訓練后通過乘以因子0.2來降低學習率。
對于作為實驗的3種設備,考慮到工業設備的能耗區間較大,此處不再采用ON/OFF二狀態辨識。將3種設備按照能耗大小劃分為5個狀態來提升辨識的準確性,狀態劃分方式如下
狀態劃分↑能耗η1η2η3ONη2η1OFF
其中,ηi表示標簽編號。
圖4為3種設備的原始數據,每個設備有5136個樣本,選其中的523個原始數據進行展示。其中一號爐的能耗區間為0~1 300 kWh,車間變壓器能耗區間為0~680 kWh,油壓機的能耗區間為0~480 kWh。3種設備都屬于Type-Ⅲ型負荷,其中一號爐的能耗分布較為均勻,車間變壓器的能耗分布較為陡峭,油壓機的能耗基線位于250~350 kWh之間。
每個設備的測試樣本523個。為了方便觀察,每個設備選取30個測試樣本進行展示。
圖5為3種設備及總能耗的辨識結果, 綜合圖5的a、b、c、d可以看出,即使總能耗辨識出錯,但是單個設備的辨識結果也可以是正確的,所以設備數越多,辨識的難度越大。
本文方法只辨識設備所處的狀態,不直接辨識實際的能耗量,故選用文獻[20]定義的多標簽分類的評價方法。選用的評價方法是F1macro、F1micro、平均能耗誤差AEE,其中F1macro和F1micro是以單標簽分類定義的F1分數為基礎建立的。具體的計算方法為:
F1TP,FP,FN=2TP2TP+FP+FN(6)
F1micro=F1∑Ni=1TPi,∑Ni=1FPi,∑Ni=1FNi(7)
F1macro=1N∑Ni=1F1TPi,FPi,FNi(8)
其中,TPi、FPi、FNi表示標簽i的真陽性、假陽性、假陰性的數量,N為數據集中的標簽數。平均能耗誤差計算方法為:
AEE=∑Ni=1Av_Pi-∑Ni=1Ac_Pi∑Ni=1Ac_Pi(9)
其中,Av_Pi表示標簽的平均能耗,Ac_Pi表示標簽的實際能耗,N表示數據集中的標簽數。
3.2 對比實驗
選取了3種比較先進的NILM方法與本文提出的NILM方法進行比較。作為參照的3種方法分別是:TCN(Temporal convolutional neural network,TCN)[18],BH-FHMM[19], BP神經網絡[20]。文獻[18]改進了Seq2point采用的普通卷積,擴張因果卷積,比較符合時間序列預測規律,且該方法改善了長時運行設備數據獲取不充足的弱點,比較適合數據集中的工業負荷特征。文獻[19]根據用電習慣與電器運行狀態的關系,構建用電習慣模型,將FHMM與用電習慣模型結合構建了BH-FHMM。文獻[20]提出的算法是基于負荷運行模式的改進方法,先利用負荷分解算法得到負荷的工作電流信號,然后基于KD樹算法對負荷的工作電流信號進行處理,識別負荷的類型和運行周期,然后根據識別結果訓練BP網絡,擬合被辨識負荷的運行模式曲線。選取以上3種方法作為KM-LSTM-AE的對比方法,四種方法均采用前文提及的工業數據集進行實驗。實驗結果如表3所示。
由表3可以看出,4種辨識方法都存在一定程度的誤判,且在采樣區間40~60之間的辨識誤差均較大。但是對于3種設備,KM-LSTM-AE的總體表現較好,分解值與設備的實際運行值差距較小,其中油壓機的表現最好,辨識準確率達到99%。KM-LSTM-AE模型預測誤差占辨識總能耗的比值為0.01%~0.05%,對于企業的能耗預測及生產計劃可進行較科學的指導,3種設備的F1分數均高于其他3種辨識方法,平均能耗誤差AEE均低于其他3種方法。KM-LSTM-AE模型的效率如圖6所示。訓練時長為14.129 s,測試時長為0.122 s,相對于其他3種分解方法有較大的提升,訓練時長相比于TCN,BP神經網絡,BH-FHMM分別提高了38.88%、51.48%,81.91%。
4 結束語
KM-LSTM-AE方法將長短時記憶網絡(LSTM)編碼器與K-means聚類相結合,有以下幾個創新點:1)以分析為目的,編碼器和解碼器都采用LSTM獲取動態信號,編碼器的尾層通過全連接層(FCN)輸出標簽;2)在數據處理前端加入K-Means聚類,由異常聚類篩選異常值,采取同位填充的方法進行異常值清洗;3)針對工業領域的非侵入式負荷監測技術空白,采用某工廠真實的能耗數據集進實驗;4)選取BH-FHMM、BP神經網絡、TCN等模型與本文模型應用于同一數據集進行對比,實驗結果表明,辨識精確度及訓練效率都得到了提升。
在本文的測試數據中,出現了兩種或者三種方法在某一段采樣區間表現較差的情況,可能是由于數據清洗或模型訓練部分處理不足導致的,可作為下一步研究的方向,進一步提高辨識效果。
[ 參 考 文 獻 ]
[1] CREUTZIG F, GOLDSCHMIDT J C, LEHMANN P, et al.Catching two European birds with one renewable stone: Mitigating climate change and Eurozone crisis by an energy transition[J]. Renewable and Sustainable Energy Reviews,2014,38 (12):1015-1028.
[2] ARMEL K C, GUPTA A, SHRIMALI G,et al. Is disaggregation the holy grail of energy efficiency[J]. The case of electricity, Energy Policy, 2013,52 (21):213-234.
[3] 何坤,王立.中國鋼鐵工業生產能耗的發展與現狀[J].中國冶金,2021,31(09):26-35.
[4] 鄧松,岳東,朱力鵬,等.電力大數據智能化高效分析挖掘技術框架[J].電子測量與儀器學報,2016,30(11):1679-1686.
[5] LIU H, YU C M, WU H P,et al. An improved non-intrusive load disaggregation algorithm and its application[J]. Sustainable Cities and Society,2020,53:101918.
[6] ZHOU X X, FENG J R, LI Y. Short-term load forecasting based on frequency domain decomposition and deep learning[J].Energy Reports,2021,11(7): 5762-5771.
[7] SAGAR V, SHIKHA S, ANGSHUL M. Multi-lable LSTM autoencoder for non-intrusive appliance load monitoring[J]. Electric Power systems Research,2021,199:107414.
[8] 黃鎵登,何爽,寧錦韜,等.基于小波分析的家用電器負荷識別[J].電力大數據,2021,24(04):41-48.
[9] WU H P,LIU H.Non-intrusive load transient identification based on multivariate LSTM neural network and time series data augmentation[J].Sustainable Energy, Grids and Networks,2021,27:100 490.
[10] HARELL A, MAKONIN S, BAJIC′ I V, et al. A causal neural network for power disaggregation from the complex power signal[C]. ICASSP 2019-2019.IEEE Int. Conf. Acoust. Speech Signal Process.ICASSP,2019, 31:8335-8339.
[11] SINGH S,MAJUMDAR A.Deep sparse coding for non-intrusive load monitoring[J].IEEE Transactions on Smart Grid,2018,9(05): 4669-4678.
[12] JIHYUN K , THI-THU-HUONG L , HOWON K .Nonintrusive load monitoring based on advanced deep learning and novel signature[J].Computational Intelligence amp; Neuroscience, 2017, 2017:4216281.
[13] 白宏坤,卜飛飛,李文峰,等.基于復合分析算法的工業用戶非侵入監測研究[J].河南電力, 2021(S1):43-47.
[14] 段晶,李勇,張振宇,等.考慮辨識結果連續性的Type-Ⅲ型工商業負荷辨識方法[J].電力系統自動化, 2021, 45(24):8.
[15] HOCHREITER S, SCHMIDHUBER J. Long short-term memory[J].Neural Computation, 1997, 9(08):1735-1780.
[16] SRIVASTAVA N, MANSIMOV E, SALAKHUTDINOV R .Unsupervised Learning of Video Representations using LSTMs[C].ICML'15: Proceedings of the 32nd International Conference on International Conference on Machine Learning,2012,37:843-852.
[17] VINCENT W, YANNIS A,HANNA S,et al. Google's next-generation real-time unit-selection synthesizer using sequence-to-sequence LSTM-based autoencoders[C].Interspeech,2017.
[18] 劉仲民,侯坤福,高敬更,等.基于時間卷積神經網絡的非侵入式居民用電負荷分解方法[J].電力建設, 2021, 042(03):97-106.
[19] YIN B, LI Z, XU J, et al.Non-intrusive load monitoring algorithm based on household electricity use habits[J].Neural Computing and Applications,2024,10(01):1-19.
[20] 謝志遠,尹立亞.基于KD樹和BP神經網絡的非侵入式負荷識別算法[J].電工技術,2021(10):125-128.
[21] TABATABAEI S M, DICK S, XU W. Toward non-intrusive load monitoring via multi-label classification[J].IEEE Transactions on Smart Grid, 2017, 01(01):1-1.
[22] CREUTZIG F, GOLDSCHMIDT J C, Lehmann P, E, et al. Catching two European birds with one renewable stone: Mitigating climate change and Eurozone crisis by an energy transition[J].Renewable and Sustainable Energy Reviews, 2014, 38(5):1015-1028.
[23] WANG G N, YANG P, CHEN J Y. Short-term electric load prediction and early warning in industrial parks based on neural network[A/OL].Discrete Dynamics in Nature and Society[2021-09-11].https:∥onlinelibrary.wiley.com/doi/full/10.1155/2021/14353342021
Non-invasive Industrial Load Identification Based
on KM-LSTM-AE Method
CHEN Yifei1,2, WANG Fanrong1, LIU Yifan3
(1 School of Electrical and Electronic Engineering, Hubei Univ. of Tech., Wuhan 430070,China;
2 Powerchina Central China Electric Power Engineering Co.,Ltd" Zhengzhou 450007,China;
3 Wuhan National Optoelectronic Research Center,
Huazhong University of Science and Technology,Wuhan 430072, China)
Abstract: Non-invasive Load Monitoring (NILM) is widely used in non-invasive load decomposition. In order to solve the limitation of NILM static modeling and low identification accuracy, this paper proposes a KM-LSTM-AE method combining LSTM autoencoder and K-means clustering data cleaning, which is suitable for NILM in the industrial field. The real energy consumption data of a factory was selected as the test data set of KM-LSTM-AE. The experimental results show that KM-LSTM-AE method has high accuracy and short time consuming.
Keywords: LSTM;Non-invasive load identification;Autoencoder;K-means clustering
[責任編校: 閆 品]
[收稿日期] 2022-10-22
[基金項目] 國家自然科學基金(61873195)
[第一作者] 陳怡菲(1996-), 女, 湖北工業大學碩士研究生, 研究方向為非侵入式負荷分解。
[文章編號] 1003-4684(2024)05-0036-06