王登峰,李英,楊琦,馬廣霞,樊博
(國網寧夏電力有限公司電力科學研究院,寧夏 銀川 750011)
智能電表是應用于智能電網和用戶之間雙向通信的重要設備,具有高時間分辨率數據采集(通常每秒鐘或幾分鐘)和長時間運行的優點,但隨著數據的累積從海量數據中檢索有用信息的難度日益增加,因此智能電表數據分析(MDA)已經成為智能電網研究領域的重要研究方向之一[1-3]。
基于智能電表大數據實現負荷預測是電網智能化的重要體現,電網運行單位可以根據負荷預測控制大功率熱負荷和冷負荷的交替運行以保證電網的可靠性。為解決負荷預測問題,自90 年代起就有許多學者進行了探索[4]。其中軟計算技術在負荷預測方面獲得了成功應用,例如人工神經網絡(Artificial Neural Network,ANN)[5-8]、神經模糊法[9]和模糊邏輯[10]、時間序列分析[11]、支持向量回歸(Support Vector Regression,SVR)[12]等等。然而由于設備的限制,早期的大多數研究工作無法獲取用電戶的高時間分辨率電力消耗數據,使得預測模型精度不佳,預測能力受到較大限制。
為此本文從用電住宅樓采集了大容量、高時間分辨率的智能電表數據用于負荷預測,基于自適應神經模糊推理系統(Adaptive Neural Fussy Interence System,ANFIS)混合軟計算技術建立了負荷預測模型,利用智能電表數據進行了預測模型構建、訓練和測試,最后對用電戶在24 h 內各個時間的電力功耗進行了預測,并利用實際數據集進行了對比驗證。研究結果可為高時間分辨率的電力負荷預測提供參考。
人工神經網絡和模糊系統是軟計算方法中的兩個重要組成部分[13-15],人工神經網絡和模糊系統是兩個互補的概念:人工神經網絡具有從數據中學習的能力,而模糊系統則是基于特定規則的數學模型。目前模糊邏輯已得到各種應用,并且在研究界受到廣泛關注,由于模糊系統本身不具備學習能力,因此必須從其他技術中借鑒這一能力。整合人工神經網絡和模糊系統的混合計算技術即自適應神經模糊推理系統[16]。ANFIS 具有學習和推理能力,從而提高了模型的預測準確性。本文基于ANFIS 系統建立數學模型,模型主要有以下幾個部分組成。
模糊邏輯的理論基礎是模糊集理論,其中變量由一個或多個集的成員組成,該變量集的關系通過隸屬函數進行定義[17]。與經典集合理論不同,模糊邏輯模型中允許使用的值是單詞而不是數字,因此人們可以用單詞進行計算。盡管單詞本質上不如數字精確,但是單詞計算可利用容差,該容差更接近于人類的推理過程。
模糊集是一類連續隸屬關系對象,這樣的集合通過隸屬度函數(MF)進行描述,隸屬度函數為每個對象分配介于0 到1 之間的隸屬度等級[18],通過隸屬度等級確定元素是在集合中(取值為1)、不在集合中(取值為0)、或者部分在集合中(取自位于0~1 之間)。從形式上看X范圍內的模糊集A定義為:

式中:μA(x)是x和其隸屬度函數A的函數名。
模糊系統的核心是一組隸屬度函數,這些函數定義了模糊語言變量的邊界,隸屬度函數定義的平滑邊界范圍位于0~1 之間,而不是清晰的邏輯邊界。目前有多種可選用的隸屬函數,可根據問題要求從中選擇,在可用的幾種隸屬函數類型中,最常用的隸屬函數是三角形隸屬函數和梯形隸屬函數,在ANFIS 網絡中通常使用高斯隸屬函數,其定義公式為:

式中:σ是標準差,c是均值;Gaussian 代表高斯函數名。
模糊推理系統的規則基礎是將一組輸入要素與輸出相關聯的if-then 規則。模糊推理規則的形式為:

式中:xi是Ai的前提條件;yi是Bi的結果或結論,本文將一組這樣的模糊if-then 規則用于構建稱為知識庫的模糊推理系統(FIS)。
使用模糊邏輯建立輸入-輸出映射的過程稱為模糊推理,模糊推理系統在稱為知識庫的模糊規則集合的基礎上工作。這些規則的制定對于模糊推理系統非常重要,在大多數情況下,推理系統需要有關具體問題的必要知識。因此通常采用將人類專家的經驗移植到模糊規則制定的辦法,經驗移植過程需要進行多次試驗才能最終得出一組具體的模糊規則,但是在沒有專家的情況下,如果使用一組觀察值(先驗知識),仍然可以對模糊系統進行建模。這些觀察結果(先驗知識)主要用于訓練ANFIS 網絡,ANFIS 從輸入系統的觀察結果中了解系統的行為,再制定模糊規則以及調整相關隸屬函數的參數,從而進一步構建出模糊推理系統。
本文提出的ANFIS 是如圖1 所示的多層神經網絡。系統由五層結構組成,第1 層具有適用于輸入數據的自適應節點;第2 層具有固定節點,其輸出確定了規則強度;第3 層中有固定的節點,用于計算歸一化的規則強度;第4 層具有自適應節點,可計算后續參數;第5 層僅有一個節點,該節點用于計算和預測輸入數據對應的輸出;其中第2 到第4 層稱為隱藏層,它們共同構建了隸屬函數和模糊規則。

圖1 ANFIS 網絡的體系結構
預測模型需要輸入數據完成學習過程,在負載預測問題中可使用安裝在家庭中的數據記錄設備來獲取用電讀數。每戶家庭的智能電表會收集電力功耗信息,并將其發送到服務器,本文則將服務器上收集和累積的數據用于構建ANFIS 模型。
智能電表數據的語料庫提供了該用電建筑中單個電路消耗的電力,其獨立讀數至少包含以下三個條目:
①測量讀數的時間,采用Unix 時間戳
②電路消耗的功率,千瓦(kW)
③電路的標識
如果智能電表測量時電路的功耗為零(即電路不工作),則在該時刻沒有功耗輸入,此時如果將原始數據用于信息處理,將導致數據長度各不相同,因此習慣上通過如下公式推導具有固定時間長度的特征數據:

式中:Pj是電路在時間j消耗的功率;Ni是測量次數,是式(3)計算了所有用電設備在3 600 s 內的測量次數;式(4)則計算了設備在1 h 內的平均功耗。最后將導出數據的信息串聯起來,形成數據長度固定的特征時間向量
將數字數據用于模式識別時,其動態范圍會影響分類器的性能,其中動態范圍是指功耗的最小值和最大值之間的差,如果動態范圍太大,則在訓練過程中較高的值會在數值上主導較低的值。因此為了利用所有特征值,通常將動態范圍標準化為[0,1]之間的數字,歸一化過程由式(5)實現:

式中:Xoriginal是數據數值;Xmin是數據中的最小值;Xmax是數據中的最大值;Xnormalized是歸一化數值。
ANFIS 模型的訓練和測試與數據同步完成,并建立模糊推理系統,其隸屬函數參數則可通過反向傳播算法,或結合最小二乘法進行調整。訓練數據一般分為實驗組和測試組,本文利用實驗數據中的80%對系統進行訓練,數據中剩余的20%作為未知的測試數據,來評估ANFIS 系統的性能。將歸一化后的訓練數據輸入ANFIS 系統,調整隸屬函數參數,生成ANFIS 模型的模糊if-then 規則,最后將測試集用于判斷ANFIS 模型的性能。
本文從三棟房屋獲得了耗電量測量值,分別為住宅A、B 和C[20]。測量值包括每秒鐘測量的平均值和視在功耗、每個電路的功耗、每2.5 s 測量的所有插頭負載的實際功耗等。同時在房屋內安裝跟蹤系統,跟蹤設備燈光、運動感應、觸發感應和恒溫器傳感器的開/關事件。除了能源消耗數據外,還提供發電數據,如太陽能電池板和微型風力渦輪機每5 s的平均發電量,以及通過室內外氣象傳感器每分鐘測量的環境數據。本文主要分析家庭A 每秒測量的實際功率。原始數據集包含了從2020 年4 月1日到2020 年6 月31 日三個月的用電讀數,其中用電讀數不完整的天數不用于實驗。
本文利用MATLAB 軟件平臺的模糊邏輯工具箱TM(MATLABR Fuzzy Logic Toolbox,TM)建立ANFIS 系統。由于MATLAB 將ANFIS 的輸出數量限制為一個,因此本文開發了一種適用于24 h 數據輸出的FIS 結構,其隸屬函數的數目固定為2,隸屬函數類型固定為高斯函數。在訓練過程中,利用混合ANFIS 學習算法對FIS 參數進行調整,用以建立輸入/輸出關系。訓練集則多次(迭代輸入或周期輸入)輸入ANFIS 模型,直到達到期望的預測精度。最后將測試數據集用于模型驗證,以查看ANFIS 模型預測相應數據集輸出值的效果。
測試數據集可檢查模糊推理系統的泛化能力,通過設置兩個不同的公差間隔來反映預測結果,對于低值負載,例如低于1 kW 時公差設置為±100 W,設置允許的預測偏差為實際值的±10%,最后計算預測模型的正確預測數,就可以得到所提出的模型的總體性能。圖2 所示是隨機選擇的天數的負荷預測值,表1所示是所有測試樣本的平均預測精度。由表1 可見,總體預測精度達到了84.02%。從表1 中還可以明顯看出,預測模型在一天中的某些小時內的預測性能相對較高,這是因為用電戶在白天的用電行為模式具有較大隨機性,導致了預測性能的變化。

表1 各個時間段的預測性能統計表

圖2 負荷預測與實際值的對比示意圖
表1 中的精度計算如式(6)所示:

式中:η是精度;XANFIS是模型計算值;Xreal是真實值。
本文從模糊推理和人工神經網絡理論出發,建立了針對智能電表大數據的分析方法和數學模型,基于智能電表實測數據進行了負荷預測研究。結果表明所構建的大數據預測模型能夠有效針對用電戶的負荷進行高時間分辨率的預測,其中夜晚時段預測精度均在90%以上,白天時段預測精度在70%左右,造成二者差異的來源是白天用戶用電行為的隨機性更強。