劉一銘, 李惠民, 王樂挺, Hasan RAFIQ
(1.山東理工大學(xué) 電氣與電子工程學(xué)院,山東 淄博 255049; 2. 山東網(wǎng)聰信息科技有限公司, 濟南 250013; 3. 山東大學(xué) 電氣工程學(xué)院, 濟南 250100)
近年來,全社會用電量高速增長[1],如何科學(xué)用電、引導(dǎo)用戶側(cè)提高用電效率引起了諸多關(guān)注[2-3]。與此同時,隨著物質(zhì)生活水平的提高,人們對用電體驗也提出了更高的要求。因此,作為與“堅強智能電網(wǎng)”相輔相成的“感知通信應(yīng)用擔(dān)當(dāng)”[4],泛在電力物聯(lián)網(wǎng)將智能用電技術(shù)視為一個關(guān)鍵組成部分。
非侵入式負(fù)荷監(jiān)測(NILM)為智能用電技術(shù)的一種,通過分析用戶電力進線處的電能數(shù)據(jù),得到用戶區(qū)域內(nèi)部存在的負(fù)荷類別及其用電信息。由此,電網(wǎng)可更科學(xué)地進行電網(wǎng)規(guī)劃、發(fā)電調(diào)度,制定動態(tài)電價政策[5];更準(zhǔn)確地訂立及核實需求響應(yīng)(DR),審核企業(yè)的能效信息[6]等,有助于電網(wǎng)的安全經(jīng)濟運行。對于家庭用戶來說,用電信息的透明化可幫助其了解自身的能耗構(gòu)成,促進節(jié)電意識的形成[7]。因此,相關(guān)領(lǐng)域的研究具有重要意義。
學(xué)界圍繞負(fù)荷辨識分解算法、NILM系統(tǒng)架構(gòu)等內(nèi)容開展了諸多研究。G.W.Hart開創(chuàng)性地提出了通過分析電力進線處的電壓電流來偵測負(fù)荷狀態(tài)的概念[8],并應(yīng)用了“狀態(tài)機”、特征域分析和動態(tài)時間規(guī)整等建模方法,為后續(xù)的NILM研究奠定了基礎(chǔ)。受限于目前智能電能表的采樣規(guī)格,實用性較強的低頻采樣負(fù)荷辨識成為研究熱點:J.Kelly等將負(fù)荷分解視為曲線變換映射問題,使用神經(jīng)網(wǎng)絡(luò)、隱馬爾科夫模型等算法對負(fù)荷行為規(guī)律進行了建模[9-10]。文獻[11-12]使用LSTM(長短時記憶)、CNN(卷積神經(jīng)網(wǎng)絡(luò))提取負(fù)荷曲線特征,再分解擬合負(fù)荷。但大小固定的窗口無法囊括完整激活,窗口滑動中可能采樣到差異較大的局部特征,導(dǎo)致模型訓(xùn)練難以收斂。此外,學(xué)者也研究了高頻采樣下的負(fù)荷暫態(tài)特征,利用時頻分析等手段挖掘諧波特征:文獻[13]以負(fù)荷電流的奇次諧波成分為特征,使用Adaboost集成多個弱分類器的判別結(jié)果。文獻[14]以功率、諧波分量作為輸入量,使用遺傳算法優(yōu)化負(fù)荷的開關(guān)狀態(tài)向量,但選用的功率特征值為常數(shù),與多態(tài)或功率波動大的負(fù)荷的實際功率有較大差別,準(zhǔn)確度不足。學(xué)者們也對NILM系統(tǒng)的構(gòu)成和實際部署問題進行了研究:文獻[15]提出了一種NILM云計算架構(gòu),分離了計算層和應(yīng)用層,提高了NILM系統(tǒng)與其他智能用電系統(tǒng)的互操作兼容性。
文章綜合算法精確性、智能電能表的采樣頻率和網(wǎng)絡(luò)通信限制等因素,提出了一種適用于電力物聯(lián)網(wǎng)邊緣計算場景的NILM算法。文章先后對NILM邊緣計算的三層框架進行了闡述,根據(jù)負(fù)荷投切事件的特征提出了激活檢測提取算法,并詳述了用于特征提取和識別的CNN架構(gòu),同時定義了三個激活特征作為補充。最后利用真實負(fù)荷數(shù)據(jù)分析驗證了文中算法。
泛在電力物聯(lián)網(wǎng)以工業(yè)物聯(lián)網(wǎng)為藍(lán)本,具有“整體感知、可靠傳輸和智能處理”的特點[16],與NILM的實時性、雙向性和計算復(fù)雜性相近,體現(xiàn)出對NILM的兼容性。
圖1展示了NILM邊緣計算架構(gòu)的構(gòu)成以及信息流,其各部分特點如下:
傳感層:由安裝在目標(biāo)用戶配電箱內(nèi)的采集單元、智能電能表等傳感器群組成,不間斷采集電能數(shù)據(jù)并上傳至邊緣網(wǎng)關(guān);
邊緣層:由具備輕量級計算能力的邊緣網(wǎng)關(guān)群構(gòu)成,負(fù)責(zé)對傳感數(shù)據(jù)進行激活檢測、提取、數(shù)據(jù)預(yù)處理,輸出數(shù)據(jù)上傳至云層;
云層:由GPU服務(wù)器群構(gòu)成,負(fù)責(zé)激活識別、歷史用電統(tǒng)計、能源分析管理并提供面向用戶的能源服務(wù)中心入口。

圖1 NILM邊緣計算架構(gòu)Fig.1 Edge computing architecture for NILM
邊緣計算模式下,傳感器產(chǎn)生的電能數(shù)據(jù)傳輸至距離較近的邊緣網(wǎng)關(guān),避免了直接與云層通信,彌補了傳感層外部通信不可靠的弱點,增加了整體穩(wěn)定性;邊緣網(wǎng)關(guān)一般為光纖接入,無帶寬瓶頸,可與云層以較低延時通信。因負(fù)荷激活具有稀疏性,實時傳感數(shù)據(jù)經(jīng)邊緣網(wǎng)關(guān)提取激活后,數(shù)據(jù)量可大幅減少,將減輕系統(tǒng)的通信壓力。
實際情況中,邊緣網(wǎng)關(guān)會不間斷接收智能電能表實時采集的數(shù)據(jù),故取最新n點有功數(shù)據(jù)為計算窗口Pt,使用中間時刻t標(biāo)記窗口:
(1)
式中x為單個數(shù)據(jù)樣本點;i代表窗口內(nèi)的樣本編號;此外,n應(yīng)為奇數(shù)。
負(fù)荷狀態(tài)發(fā)生改變的最直觀體現(xiàn)是功率曲線發(fā)生類階躍變化,樣本數(shù)據(jù)的離散程度也相應(yīng)增大。故可計算樣本的局部標(biāo)準(zhǔn)差、局部平均幅值來檢測潛在的激活事件。在不斷滑動窗口后,可篩選出負(fù)荷狀態(tài)改變點,并通過最大差分值的正負(fù)分類為候選投、切時刻集合Son與Soff:
Son={t|max(xt-xt-1)≥τ,{xt,xt-1}?Pt,
(2)
Soff={t|min(xt-xt-1)≤-τ,{xt,xt-1}?Pt,
(3)
where:
(4)

至此,候選類階躍點集合已經(jīng)產(chǎn)生,將進一步配對以上兩集合內(nèi)元素以得到激活事件的首尾時刻。取ton∈Son作為激活起始時刻,取C:{toff|toff>ton,toff∈Soff}作為激活結(jié)束時刻toff候選集合進行以下考核:
(1)負(fù)荷在正常狀態(tài)下應(yīng)有最小激活時長ω,且應(yīng)滿足最小激活間隔δ:
toff-ton>ω
(5)
toff?[t-δ,t+δ], s.t.t∈Son
(6)
ton?[t-δ,t+δ], s.t.t∈Soff
(7)
(2)激活過程中功率應(yīng)不小于起始背景功率:
?{xi|i∈[ton,toff],xi∈P}≥ζPb1
(8)
式中ζ為背景功率閾值倍數(shù);Pb1為區(qū)間[ton-5,ton]內(nèi)平均功率。
(3)激活發(fā)生前后的背景功率應(yīng)相仿:
|Pb1-Pb2|<ε
(9)
式中Pb2為區(qū)間[toff,toff+5]的平均功率;ε為誤差閾值。
(4)激活開始、結(jié)束造成的功率波動應(yīng)相仿:
|(Pton+1-Pb1)-(Ptoff-1-Pb2)|<γ
(10)
式中Pton+1與Ptoff-1為激活首、尾的功率;γ為誤差閾值。
以上條件中,(1)、(2)為必要條件,(3)與(4)為充分條件。遍歷集合C與Son并應(yīng)用以上規(guī)則,記錄滿足條件的激活始末時間戳ton、toff,若未發(fā)現(xiàn)有效激活,繼續(xù)等待并分析新上傳數(shù)據(jù)。
經(jīng)典的神經(jīng)網(wǎng)絡(luò)一般指由全連接層構(gòu)成的多層感知機(MLP),其每層的前向傳播可表示為:
(11)
式中w為神經(jīng)元權(quán)重;b為偏置分量;z為線性輸出向量;i為神經(jīng)元編號;l為層數(shù);σ為激活函數(shù);o為經(jīng)激活處理后的輸出向量。
卷積神經(jīng)網(wǎng)絡(luò)使用支持跨通道運算的卷積核代替了神經(jīng)元。文中的特征提取模型ConvNet1是一個純卷積網(wǎng)絡(luò),其卷積核在訓(xùn)練過程中能夠同步學(xué)習(xí)樣本在不同通道、不同尺度的特征。設(shè)輸入樣本形狀為(Hl,Wl,Dl),卷積核形狀為(H,W,Dl),其每層的前向傳播可表示為:
(12)
式中f代表卷積核;x為輸入矩陣;b為偏置分量;i,j,d分別代表矩陣的三個維度數(shù)據(jù)點的編號;l代表層數(shù)。
本激活識別算法使用CNN從樣本自動提取特征,結(jié)合其他三個補充性特征,通過Softmax卷積層生成負(fù)荷類別概率。
2.2.1 基礎(chǔ)特征提取
相對于高頻數(shù)據(jù)集中諧波分量對電流曲線形狀特征的影響,低頻采樣數(shù)據(jù)易于觀察負(fù)荷的啟停周期及激活期間各電氣量的宏觀變化規(guī)律[17]。選取低頻采樣的有功功率作為輸入量,并提取以下特征:
(1)激活長度l:
l=toff-ton
(13)
式中ton與toff分別代表負(fù)荷開啟和關(guān)閉的時刻,下同。
(2)中位激活功率Pmed:
Pmed=median(∑-min(∑))
(14)
式中 median()函數(shù)可返回輸入集合的中位數(shù);∑表示激活的有功功率數(shù)據(jù)點集合。
(3)激活發(fā)生時刻τ:
τ=hour((ton+toff)/2)
(15)
式中 hour()函數(shù)可返回輸入時間戳的對應(yīng)小時。
此外,同類負(fù)荷的激活曲線形狀較為相似(如抖動、爬升斜率等),故由卷積網(wǎng)絡(luò)ConvNet1提取激活曲線形狀特征。
2.2.2 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
本網(wǎng)絡(luò)存在四個輸入層I1、I2、I3、I4。其中I1為經(jīng)過預(yù)處理后的激活功率向量集合,I2為激活長度集合,I3為中位激活功率集合,I4為激活發(fā)生時間集合。I1將輸入至網(wǎng)絡(luò)ConvNet1進行特征提取,每一激活樣本輸出長度為16的特征向量后,與I2、I3、I4合并輸入至ConvNet2進行激活分類。最后,每個樣本輸出一個長度為i的One-Hot向量,代表i種激活類別的概率,組成向量集O1。網(wǎng)絡(luò)總架構(gòu)如圖2所示。

圖2 神經(jīng)網(wǎng)絡(luò)總結(jié)構(gòu)Fig.2 Topmost architecture of the neural network
2.2.3 特征提取卷積網(wǎng)絡(luò)ConvNet1
為增加卷積網(wǎng)絡(luò)的感受,便于神經(jīng)網(wǎng)絡(luò)在不同時間尺度捕捉激活特征并建立前后聯(lián)系,將一維時間數(shù)據(jù)重塑為二維矩陣,使用二維卷積核提取特征。對樣本集進行以下處理:
(1)為兼顧長激活,取輸入窗口長度為1 024。取激活的有功功率數(shù)據(jù),若樣本長度過小,填充0直至1 024長度;若過長,對樣本降采樣至1 024長度。同時保留樣本副本以便統(tǒng)計功耗;
(2)將此一維向量重塑成尺寸為32*32的二維矩陣。
此部分網(wǎng)絡(luò)主要由6層二維卷積層組成,結(jié)構(gòu)如表1所示。表1中,n代表訓(xùn)練樣本個數(shù),BN代表Batch Normalization層,Conv2D代表二維卷積層。
為減輕過擬合和梯度爆炸/消失,兩卷積層間穿插ReLU[18]激活層和Batch Normalization[19]層。為減輕因卷積運算帶來的邊界效應(yīng)而導(dǎo)致邊界數(shù)據(jù)逐漸丟失,對前三個卷積層輸出進行Zero-Padding;卷積核大小為5*5,特征圖譜尺寸保持在32*32。從第四層開始,采用一個與特征圖譜尺寸相同的卷積核對其不同通道的特征進行融合,以增加該部分輸出的非線性。輸出部分,采用一個Sigmoid卷積層對結(jié)果進行歸一化,由此就與其他的三個輸入值域相同,加快了模型收斂的速度,并避免了學(xué)習(xí)過程中的權(quán)重偏袒現(xiàn)象。

表1 特征提取卷積網(wǎng)絡(luò)架構(gòu)Tab.1 Architecture of the feature extraction convolutional network
2.2.4 激活分類卷積網(wǎng)絡(luò)ConvNet2
ConvNet1的輸出結(jié)果經(jīng)由Concatenate層與其他三個特征量合并成了1*1*20維度的矩陣,作為分類網(wǎng)絡(luò)的輸入。其后,采用一個1*1二維卷積層對特征進行高維映射;最后經(jīng)Softmax分類器輸出為1*1*i大小的One-Hot矩陣。本部分網(wǎng)絡(luò)架構(gòu)如表2所示。

表2 激活分類卷積網(wǎng)絡(luò)架構(gòu)Tab.2 Architecture of the activation classification convolutional network
表2中,i代表目標(biāo)負(fù)荷種類總數(shù)。
為驗證算法有效性,在一臺CPU為Intel Xeon E5-2696 v3,GPU為NVIDIA Tesla T4的服務(wù)器上進行實驗,算法基于Python3實現(xiàn)。選取UK-DALE[20]為實驗數(shù)據(jù)集,為驗證算法的泛化能力,分別從住宅1與住宅5提取訓(xùn)練集和測試集:對兩房屋數(shù)據(jù)進行激活檢測,經(jīng)有效性篩選后,得到訓(xùn)練樣本10 352個、測試樣本3 863個。
訓(xùn)練文中模型時,為避免背景功率不同而導(dǎo)致同類負(fù)荷的激活功率水平不一,確保最大化模型的泛化能力,應(yīng)保證I2、I3、I4值域與ConvNet2輸出值域相同。因此,對激活樣本與三個輸入向量進行如下標(biāo)準(zhǔn)化處理:
(16)
式中X為單個激活樣本;X′為縮放后的樣本;min、max分別為求取樣本最小值、最大值函數(shù)。
按照2.2.1內(nèi)容從訓(xùn)練集中提取三個特征向量后,與激活樣本一同導(dǎo)入神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練。選取交叉熵為損失函數(shù),采用Adam[21]算法為梯度下降優(yōu)化器。
最后,為驗證算法性能差異,對比測試其他文獻中的負(fù)荷辨識算法。選取文獻[22-24]中算法,對激活識別準(zhǔn)確率等性能進行橫向測評。
表3展示了訓(xùn)練100 個epoch后的各模型在已知數(shù)據(jù)(訓(xùn)練集)上可達(dá)到的準(zhǔn)確率,并統(tǒng)計了單樣本計算時間的平均值。文中模型與文獻[24]中的RPROP-NN算法都可充分利用GPU并行運算,橫比節(jié)省多達(dá)99%的運算時間,滿足實時分解需求。但后者的網(wǎng)絡(luò)結(jié)構(gòu)較簡單,欠擬合嚴(yán)重,相比之下,文中模型取得了最高準(zhǔn)確率,反映出ConvNet1提取的特征及2.2.1中所述特征的代表性。

表3 訓(xùn)練集準(zhǔn)確率及計算速度Tab.3 Accuracy rate of training and speed of computing
表4展示了各算法在陌生數(shù)據(jù)(測試集)上的表現(xiàn),反映了算法對不同住宅數(shù)據(jù)的泛化能力。文中模型在除冰箱以外的負(fù)荷樣本中,皆取得最高準(zhǔn)確率;在冰箱類別獲得第一的文獻[22]中的RBF-SVM算法在其他類別上表現(xiàn)糟糕,表現(xiàn)出嚴(yán)重的過擬合現(xiàn)象;結(jié)合表 3可知,文中模型在擬合率最高的情況下仍有相對高的泛化能力。微波爐和洗碗機的激活曲線在穩(wěn)態(tài)功率抖動、功率階躍水平方面相近,結(jié)果顯示文中算法比同類算法可更好地辨別相似負(fù)荷。

表4 測試集分項準(zhǔn)確率Tab.4 Subitem accuracy on test set
分析ConvNet1從激活樣本中提取的各類負(fù)荷的特征圖譜,并將網(wǎng)絡(luò)的輸出重塑為一維向量,觀察特征圖譜的時間特性。
如圖3所示,CNN認(rèn)為激活曲線的功率階躍部分最具代表性,故在其可能發(fā)生功率突變的位置增大賦值以提取相關(guān)特征,并傳遞給分類器網(wǎng)絡(luò)ConvNet2;模型中各卷積層歸結(jié)了不同種類負(fù)荷的特征,通過滑動卷積核,模型提取目標(biāo)特征,由此可應(yīng)對激活長度、位置相異的問題;從灰度圖來看,特征圖譜描繪了激活圖譜的主要輪廓。

圖3 微波爐的激活曲線、特征圖譜示例及其對應(yīng)灰度圖Fig.3 Sample of microwave activation curve,feature map and respective greyscale maps
由于國內(nèi)外的監(jiān)管標(biāo)準(zhǔn)不一,同種負(fù)荷的諧波分量、電壓標(biāo)準(zhǔn)等規(guī)格存在不同[25]。為驗證文中模型在國產(chǎn)負(fù)荷上的泛化表現(xiàn),對幾件國產(chǎn)電器的電壓電流進行10次高頻采樣,分析其諧波成分,并進行識別測試, 如表5所示。

表5 諧波成分分析Tab.5 Harmonic component analysis
總諧波畸變越小越好,畸變功率因子越大越好。分析樣本發(fā)現(xiàn),總諧波畸變較大的負(fù)荷因整流濾波導(dǎo)致其電流曲線與正弦波相去甚遠(yuǎn),不同負(fù)荷的零休期也因此存在相似現(xiàn)象,對基于諧波分析的辨識算法造成干擾。然而,對采集樣本降采樣后,負(fù)荷的低頻功率曲線形狀與國外同類負(fù)荷相近,體現(xiàn)出負(fù)荷行為的一致性,文中模型也辨識出了包括諧波畸變程度較高的微波爐在內(nèi)的大多數(shù)樣本。值得注意的是,電腦具備完善的電源管理系統(tǒng),CPU和GPU可根據(jù)任務(wù)實時調(diào)頻以控制功耗,激活長度也比較靈活,因此對其行為的辨識造成了困難,而非因為諧波干擾。綜上,諧波干擾并未顯著影響文中辨識算法的準(zhǔn)確率。
NILM系統(tǒng)的實時性對計算節(jié)點與傳感器之間的連接穩(wěn)定性有較高要求,為驗證文中邊緣計算模型對數(shù)據(jù)傳輸量的優(yōu)化,結(jié)合幾類負(fù)荷的激活數(shù)據(jù)進行對比分析。
由表6可知,負(fù)荷激活存在稀疏性。傳統(tǒng)云計算模型需處理全部傳感數(shù)據(jù),造成計算和網(wǎng)絡(luò)資源的浪費。而文中模型將通過部署在邊緣網(wǎng)關(guān)內(nèi)的激活檢測器、低級別特征提取器和ConvNet1對生數(shù)據(jù)預(yù)處理,最終傳輸數(shù)據(jù)量僅為20個浮點;負(fù)荷激活愈久,傳輸數(shù)據(jù)量降低愈明顯。

表6 模型傳輸數(shù)據(jù)量Tab.6 Data transfer quantity of model
文章以泛在電力物聯(lián)網(wǎng)為研究背景,分析了基于CNN的NILM架構(gòu)及算法:(1)NILM系統(tǒng)能夠以“分布-集中”的邊緣計算架構(gòu)的形式部署。利用邊緣網(wǎng)關(guān)的通信優(yōu)勢和分布計算能力可以解決云架構(gòu)的通信穩(wěn)定性,并減少云端的計算壓力;(2)低頻采樣下,負(fù)荷狀態(tài)改變帶來的類階躍變化可表征為數(shù)據(jù)點離散度的突變,可通過變異系數(shù)和負(fù)荷運行規(guī)律來加以識別;(3)CNN能夠提取具有代表性的激活曲線特征,結(jié)合人工定義的特征,可更加準(zhǔn)確地描述激活曲線特點;(4)CNN卷積層的可視化方便了研究者歸納負(fù)荷激活曲線的特征,研究者也可通過特征圖譜驗證CNN模型的有效性;(5)GPU的并行運算優(yōu)勢可大幅降低卷積運算的計算成本,在實驗的橫測中,文中模型的計算耗時成績保持領(lǐng)先,證明了實用性。
文章提出的CNN模型兼容寬泛的采樣頻率。因此,在硬件、成本和模型準(zhǔn)確性的平衡下,尋找一個合理的采樣頻率也值得探索。