王毓琦,高 嵩,萬校宏,李元元,楊子江
(1.國網山東省電力公司電力科學研究院,山東 濟南 250003;2.山東中實易通集團有限公司,山東 濟南 250003;3.山東科技大學電氣與自動化工程學院,山東 青島 266590)
當今隨著電力技術不斷進步與發展,智能家居與智慧生活的概念相繼提出,企業更加注重用戶的日常生活用電體驗。其中,對用戶用電行為進行準確分析,是實現負荷精準預測和負荷調控的關鍵手段之一。而非侵入式電荷辨識算法以現有住宅電路為基礎,借助現有電能表等電氣設備,實現了對用戶家庭用電行為的分析。
近年來,非侵入式負荷辨識技術已經廣泛應用于建筑節能、智慧城市、智慧電網等領域。隨著人工智能的不斷發展與大數據分析技術的不斷成熟,非侵入式負荷辨識技術通過電能監控設備即可實現對用電行為的監測,在一定程度上保護了用戶的隱私。對于用戶,通過負荷監測獲取設備用電詳情可以及時得到反饋,有助于引導用戶合理用電。對于電力公司,非侵入式負荷監測在不明顯提高投入的前提下,可實現負荷各組成成分的細粒度感知,提升電力負荷辨識預測準確度,提高電網的安全性和經濟性,有助于更精準地對用戶行為進行建模,實現對用戶的差異化和精細化服務。但目前市場已有的非侵入式負荷監測產品因計算能力、功耗和成本限制,產品化設備算法單一固定,導致分類參數或匹配庫更新較慢,各型號電器識別率提高有限。
在現有非侵入式負荷辨識算法研究的基礎上,充分利用用戶評價數據信息,結合深度學算法對評價文本進行分類和情感分析,建立分類評價反饋模型,根據分析結果實現對電網負荷辨識進行反饋調整。
非侵入式負荷辨識是通過監測識別用電設備的電壓、功率、啟動電流等典型用電特征實現在總負荷中分解并識別每一個電器。
與傳統的監測方法相比,非侵入式負荷監測可以在不監測用戶電氣設備的情況下獲取所有電氣設備的運行狀態,解決了現有線路的改造、維護和設施購置問題,是一種方便、低成本的監測方法。目前,設備事件的檢測方法可分為三類:啟發式、匹配濾波和概率模型[1]。文獻[2]基于簡單的規則判斷進行時間監控,首先根據規則對歸一化功率進行分割,然后根據設置的閾值檢測事件。文獻[3]使用匹配濾波方法將輸入功率信號與已知信號模板進行匹配,以檢測目標事件。在文獻[4]中,負載通過時域變換得到家用設備的曲線,綜合運用概率模型對各參數調整的負荷進行分解。
但電氣設備類型的增加,分類匹配參數也需要不斷更新,而現有模型不能根據設備要求及時調整,導致了負荷識別的錯誤率增加、用電量行為分析不完全等問題。
近年來,隨著計算機計算能力的提升,機器學習和深度學習技術得到的快速發展。K?近鄰算法、貝葉斯、支持向量機、循環神經網絡(Recurrent Neural Network,RNN)算法逐漸被應用到分類評估中[5?9]。
例如,在參考文獻[10]中提出了一種基于長期和短期記憶(Long?Short Term Memory,LSTM)神經網絡和標簽嵌入的文本分類模型。該模型融合了重要信息和后續信息的文本表示,在聯合空間中學習標簽和單詞,最后利用標簽和單詞之間的兼容性得分來加權標簽和句子,有效地提高了文本分類的效果。參考文獻[11]提出了一種循環卷積注意模型。該模型將主題信息添加到注意層,提高了多標記情感傾向的提取準確率。該方法在多標記情感分類任務中具有較高的穩定性和較強的通用性。文獻[12]在原始的LSTM神經網絡中加入文本向量,從而得到句子和段落之間的關系,實現了電子政務文本相似度的評價。LSTM 雖然在文本處理方面有很好的效果,但在文本分類和情感分析方面缺乏在電力領域的應用,存在領域限制和專業障礙。
分類評價反饋算法包括語料庫處理、分類評價分析和評價反饋機制三個部分。算法整體架構設計如圖1所示。

圖1 算法設計架構
語料庫預處理部分對用戶評價數據中的整體評價數據進行預處理。該部分主要實現了刪除特殊符號、過濾常用詞、句子分句等步驟。將全文處理成單句形式的簡短的負荷評估文本,并去除了文中的冗余文本,降低了模型操作的噪聲。最后,將預處理后的數據發送到分類評價分析部分,進行文本分類分析。
分類評價分析部分是對語料庫數據進行建模和分析。首先,根據評價文本的句子長度特征,建立分類評價模型。然后對現有數據集進行劃分,手工標注一部分數據用于模型的訓練,其余部分作為待分類測試的文本。對模型進行訓練和測試,直到模型達到較高的分類效果。最后對負荷評價文本輸入模型進行分類,得到類型反饋結果,并發送給評價反饋機構部分進行處理。
根據語料庫分類反饋結果進行處理和分析。根據反饋機制算法,判斷得到的裝備類別向量屬于新的裝備類別,提出現有的非侵入式負荷識別算法,對現有的非侵入式負荷識別算法進行調整,或者更新裝備庫和訓練參數。
分類評價反饋模型通過對預處理后的語料庫建立算法模型,實現負荷裝備評價文本的分類,并構建評價反饋機制,實現按分類進行負荷識別調整。
對用戶的總體評價數據進行處理的步驟如圖2所示。

圖2 語料庫預處理步驟
由于用戶評價數據多為段落式句子,結構復雜,首先采用子句處理,拆分用戶的全部文本Xn為短文本(x1,x2,…,xn)。其次,根據常用詞字典刪除常用語氣詞和特殊符號等字符,以減少模型的計算負擔。同時,為了不影響模型的測試和訓練,對無效數據進行篩選和剔除,以保證數據的有效性。
3.2.1 LSTM神經網絡
LSTM 神經網絡是一種特殊的時間循環神經網絡,具有典型的復雜神經網絡模塊的鏈式形式,用來解決RNN 存在的長期依賴問題[13?16]。單向LSTM 能更好地捕獲句子中的上下文信息,因此經常用于文本分類等方向[17?18]。
用戶評價文本經過語料庫處理生成文本序列后,由于文本較短且分類結果高度依賴上下文,采用LSTM 神經網絡算法處理時間向量和長期依賴問題,以避免傳統RNN 在處理長期依賴上下文問題時信息丟失的弊端,可有效提高文本分類的準確率[19]。LSTM神經元的結構如圖3所示。

圖3 LSTM神經網絡結構
長期狀態c存儲了長期記憶的信息,特征向量作為長期狀態進行保存和傳輸。同時,遺忘門層決定輸入信息x和前一個單元輸出信息ht?1是否通過ft傳送到ct。其中,W為權重,b為偏置,其計算公式為

式中:ft為遺忘門輸出;Wf為遺忘門權重;bf為遺忘門 偏置;ht?1為前一個單元輸出信息;σ為激活函數。
更新層通過輸入門層的σ決定ht?1和xt的更新信息,并通過tanh激活函數計算新的候選狀態其中,激活函數公式為

式中:it為輸入門輸出;Wi為輸入門權重;bi為輸入門偏置。

然后更新長期狀態,即更新ct?1為ct。ft決定丟棄的信息內容,ct?1和ft相乘后添加新的狀態,完成狀態長期狀態更新為

式中:ct為細胞狀態輸出;ct?1為前一時刻細胞狀態。
最后,通過輸出層處理,輸出最終確定的類別結果向量為

式中:ot為輸出門輸出;Wo為輸出門權重;bo為輸出門偏置。

式中:ht為本單元輸出信息。
3.2.2 評價分類算法
評價分類算法流程如圖4 所示。首先,從序列文本xn中選擇部分數據集。根據評價文本的設備類別標記為dtrain最后得到模型訓練集(xtrain,xtes)t和測試集(ytrain,ytes)t。然后對訓練集和測試集的序列文本xn進行分割,得到詞向量x(s1,s2,…,sn),并作為模型訓練和測試的輸入。

圖4 評價分類算法流程
模型訓練完成后,對用戶數據的其余部分按照同樣的步驟進行分割,然后輸入到模型中,得到相應的用戶文本類別向量Y(y1,y2,…,yn),并作為評價反饋機制的輸入。
評價分類算法偽代碼為:

3.2.3 評價反饋機制
首先,根據用戶評價文本分類結果構建評價反饋機制。然后采用分類分析評價算法對輸出結果進行分析,確定是否有新設備,及時調整負荷識別算法,更新設備類型或參數數據庫。具體算法的實現過程為:
1)遍歷用戶的評估類別信息,以確定用戶Xi的文本類別yi是否滿足[20]

2)如果超過該值,則認為用戶設備已經更新,應及時調整用戶負荷識別模型,做出類別反饋響應。
根據上述算法設計步驟,本文在python3.7 的環境下,利用Pycharm 軟件在TensorFlow2.0 框架構建LSTM 神經網絡,并實現了分類評價反饋機制。本實驗共使用120 組用戶文本數據。通過子句拆分處理,總共得到800 套設備樣本,訓練集設置為70%,即560組。
利用LSTM 神經網絡對6 種設備的評價文本進行分類,分類效果如表1 所示表1 中,用于反映模型的穩健度。每種設備的平均分類準確率δ為0.87,召回率r為0.86,F1為0.87。訓練過程如圖5 所示,整體訓練效果相對穩定。實驗結果表明,該模型能有效地實現負荷識別與評價的文本分類。

圖5 文本分類訓練過程效果

表1 評價分級效果分析表
用電負荷分類評價與反饋的效果分析如表2 所示。實際負荷識別如圖6 所示。實驗對擴展數據集中隨機選取的包括新設備在內的6 種設備的實際運行結果進行了文本測試。實驗結果表明,通過對文本分類效果的判斷,評價反饋機制可對異常值進行有效反饋,從而對負載識別算法進行評價。

表2 評價與反饋實驗分析表

圖6 負荷識別效果
結合深度學習算法,建立了電網負荷的分類評價反饋模型,根據用戶評價文本和電氣設備類型進行分類,通過模型分析反饋負荷識別結果。實驗結果表明,該模型能夠準確地對評價文本進行分類,對非侵入式負荷識別算法的研究起到輔助反饋作用,實現了信息的實時交換,達到了非侵入式負荷識別的校正效果。但仍存在一些未考慮的問題,如人工標注的數據量少于總數據量、模型的分類效果不夠準確等。該模型主要根據文本內容進行分析,但不可能識別出惡意評論或遺漏信息,反饋中仍存在漏洞。綜上所述,該算法模型能夠及時實現負荷識別和調整,減少人工參與評估過程,提高問題發現效率,實現與用戶的實時溝通,對非侵入式負荷載識別算法的研究的應用具有積極推進作用。