李雨軒,高 鵬,趙慶磊
(國網山東省電力公司檢修公司,山東 濟南 250118)
小波分析(Wavelets Analysis)是 20世紀 80年代后逐步興起和發展的一種新的數學分析方法。它作為數學學科的一個分支,汲取了現代分析學中泛函分析、數值分析、傅里葉分析、調和分析等眾多分支中的精華,具有深刻的理論意義[1],在信號處理、故障診斷、狀態監視、語音識別、刑事偵破等十幾個學科領域得到了廣泛應用[2]。
自1822年傅里葉(Fourier)發表“熱傳導解析理論”以來,傅里葉變換一直是數學分析領域中最完美、應用最廣泛、效果最好的一種分析手段。但傅里葉變換只是一種純頻域的分析方法,需要利用信號的全部時域信息,這是一種整體變換,缺少時域定位功能[3]。而小波變換是一種時間—尺度(時間—頻率)分析方法,它具有多分辨率分析的特點,而且在時頻兩域都具有表征信號局部特征的能力,很適合探測正常信號中夾帶的瞬變反常信號并能夠分析其成分,所以被稱為“數學顯微鏡”[4]。
電力負荷數據是電網公司采集的反映電力用戶用電情況的時間序列。將電力負荷數據看成是一種大時間粒度的數字信號,利用小波分析對其進行去噪和壓縮,極大地方便了電力負荷數據的處理工作,具有很高的應用價值。
函數 f(t)的連續小波變換為

式中:Ψ(x)∈L2(R)為小波函數;a 為尺度因子;b 為平移因子。

相應的重構公式為


小波變換在映射到計算域時存在信息冗余,計算量很大[5]。為此,基于多分辨率分析理論的Mallat塔式算法應運而生。
數學上可以證明:

逆運算為:

式(9)即 Mallat塔式分解算法,式(10)為 Mallat算法的重構算法,如圖1所示。

圖1 Mallat塔式算法分解和重構
圖1中,Cj和Dj為2j分辨率下的離散逼近和離散細節,分別對應信號的低頻成分和高頻成分。
小波函數不是唯一存在的,常見小波有Haar小波、Daubechies(dbN)小波系、雙正交小波系、Coiflet小波系等。處理電力負荷數據選擇的小波基至少要滿足條件:1)必須是緊支撐的,且支撐區間要小,這樣有利于奇異點的檢測。2)能夠靈活的調整分辨率,因為不同類型的負荷數據擁有不同的時間粒度。dbN小波系滿足這兩個條件,因此選用該小波系進行分析。
電力負荷數據作為一種特殊的數字信號,在采集和傳輸過程中會摻雜進各種噪聲,其噪聲來源主要有:1)負荷數據的壞點。由于人為失誤或系統故障,數據出現壞點和缺失,在負荷曲線上表現為奇異點。2)系數的放大效應。原始負荷數據通常需要乘以一個大的系數才是真實數據,因此任何細小的干擾都可能被放大形成較大的波動。3)負荷本身的不穩定性。這種不穩定性會在負荷曲線上形成無數小的毛刺。在一些強調宏觀性和整體性的應用場合,這些細節意義不大,也將其視為一種噪聲。
電力負荷數據中的噪聲如不濾除,會嚴重干擾電網公司的決策。采用傳統的office軟件篩選耗時耗力,因此利用小波分析濾除負噪聲意義重大。
去噪的基本目的就是減少噪聲部分的幅值,使去噪后的信號盡可能地逼近原始信號[6]。目前,小波去噪的主流方法主要有模極大值去噪法[7]和閾值去噪法[8-10]。其中,閾值去噪法計算簡單,速度快,且在最小均方誤差意義下可達到近似最優[11],因此選用閾值去噪法。
Mallat塔式算法可逐層將信號分解為逼近和細節成分,而噪聲主要隱藏在細節成分中。信號去噪就是有選擇性的濾除一些細節系數,則重構后的信號就會接近于原始信號。
細節系數中除包含噪聲外,還構成了信號重要的細節特征,因此不能將其全部濾除。噪聲強度σ估計為

式中:dj(n)為第j層小波系數;N為該層小波系數的個數;δ為經驗系數。
則通用閾值T可表示為

本文提出雙層閾值法,首先將大于T1的系數收縮進T1范圍內,然后重新估算噪聲形成T2,利用T2對上一步信號進行軟閾值處理,其取值函數為:
第一步

第二步

由于奇異點產生的小波系數往往遠大于通用閾值,而傳統的軟閾值法只是將大于閾值的系數收縮一次,因此并不能有效地去除奇異點。而通過設置雙層閾值,首先將奇異點系數進行多次收縮,使其回歸正常范圍內,再對全局信號進行軟閾值處理,可以較好地解決奇異點問題。
圖2為某大型商場2012—2016年的單日最大負荷曲線。單日最大負荷可以近似代表一個用戶的負荷水平,在電網規劃中占有重要地位。由圖可知,此曲線的噪聲由兩部分組成:1)數據壞點(奇異點);2)負荷不穩定而形成的毛刺。

圖2 某大型商場單日最大負荷曲線
將此曲線用db5小波做5層分解,得到細節系數分布如圖3所示。由圖3可知,前3層分解系數均含有較為明顯的奇異點和高頻噪聲。估算其噪聲強度,δ分別取0.5和1.5形成雙層閾值,按照雙層閾值策略處理細節系數,保留全部逼近系數,重構后如圖4所示。其中S1和S2分別為雙層系數處理的結果,S3為使用傳統軟閾值法的處理結果。

圖3 負荷曲線細節系數分布

圖4 負荷曲線去噪結果
由圖2、圖4可知:1)S1相較于S已經消除了數據奇異點,非奇異點處的數據與原數據有很高的相似度;2)S2變得更加平滑,更能反映負荷特性和一般趨勢;3)S3雖然較原始曲線更加平滑,但并未有效去除奇異點。綜上說明雙層閾值法可以有效地去除數據中的奇異點和噪聲,相較于傳統軟閾值法優勢明顯。
為評價此方法誤差水平,定義衡量指標:平均絕對誤差為β,平均相對誤差為η,賦范均方誤差為βnorm。
誤差統計如表1所示。由表1可知,S2、S1、S3曲線誤差逐漸減小且三者誤差都處于較低水平。考慮到S1和S2消除了奇異點造成的誤差增大,其真實誤差應低于此水平,說明此方法能夠較好地控制誤差。實際操作中,可根據不同的精確度要求靈活的調整通用閾值,閾值越小,則細節越少,去噪后曲線也越光滑,但誤差也越大。

表1 去噪結果誤差表
電網公司每時每刻都在生成各種負荷數據,這會占用大量的存儲空間,同時增加數據管理成本,因此有必要對負荷數據進行壓縮。
小波分解后逼近和細節系數的總個數與原信號的采樣點個數相同,而時間序列的能量和宏觀性質是由逼近系數和大幅值的細節系數決定,因此舍去部分小幅值的細節系數,再利用特殊的編碼方式記錄沒有被舍去的細節系數的位置,就可以到達只存儲少量小波系數而重構原始時間序列的目的,從而實現對數據的壓縮。
小波細節系數的取舍同樣需要用到閾值,但壓縮閾值沒有統一的估算方法。本文選用的閾值表示為
式中:j為當前分解層數;N為該層小波系數的個數;A∈(0,1)命名為壓縮系數,其取值由壓縮率決定。
則細節系數的取值函數為

如圖5所示為某商業街一周內的負荷曲線,采樣頻率為1 min,共10 080個采樣點。

圖5 某商業街周負荷曲線
將此負荷曲線用db5小波做3層分解,壓縮系數分別設為0.1、0.3、0.6,壓縮后結果如圖6所示。

圖6 壓縮后負荷曲線
由圖 6 可知,S′1、S′2、S′3 均與原負荷曲線有較高的相似度,說明重構效果較好,而它們參與重構的系數分別只有3 641、1 857、1 320個,相較于原始信號的10 080個,均有大幅度減少。
定義壓縮比為:

式中:N*為壓縮后小波系數的個數;N為原始信號的采樣點個數。
誤差衡量指標同前文所定義,則壓縮比和誤差如表2所示。由表2可知:1)壓縮比越小,壓縮效果越好,但誤差也越大;2)即使達到了13.1%的壓縮比,其誤差仍然處于較低的水平。所以此方法能僅損失較少的曲線細節,使負荷數據得到極大的壓縮,從而成倍的提高存儲介質的利用率。實際操作中可以通過調整壓縮系數和分解層數靈活的改變壓縮比。

表2 壓縮結果評價表
小波分析是數字信號處理的支柱理論之一,本文將其應用領域擴展到電力負荷數據的處理中,并提出了雙層閾值方法。實際案例分析表明,小波分析應用于負荷數據去噪時,能夠有效地去除奇異點和噪聲,極大節約了人力和時間成本;而應用于負荷數據壓縮時,可以在較小的誤差水平下,獲得很好的壓縮效果,從而成倍減少數據占用的存儲空間。因此小波分析在電力負荷數據處理方面具有很高的應用價值。