劉 燁,程 杉,王 瑞,左先旺,徐敬偉
(1.三峽大學(xué)電氣與新能源學(xué)院,宜昌 443002;2.電力系統(tǒng)智能運行與安全防御宜昌市重點實驗室(三峽大學(xué)),宜昌 443002;3.國網(wǎng)山東省電力公司東營供電公司,東營 257000)
電能質(zhì)量受到高滲透率可再生電源并網(wǎng)和電力系統(tǒng)的電力電子化的影響日益凸顯[1-3],而解決的基礎(chǔ)和關(guān)鍵之一是對電能質(zhì)量擾動PQD(power quality disturbance)信號的有效識別。檢驗識別方法的兩個重要指標是識別多種單一擾動和混合擾動的正確率及低信噪比環(huán)境下信號分類的準確率。
正確識別PQD信號的關(guān)鍵步驟之一是準確地提取擾動信號的特征。為此,文獻[4]采用快速傅里葉變換(fast Fourier transform)和S變換提取7種PQD信號特征,然后采用融合決策樹和支持向量機的分類器識別擾動,并借助簡單的判別樹對擾動信號進行正確分類。然而,由于傅里葉變換、小波變換、S變換等傳統(tǒng)方法在提取信號特征時需要先驗知識,十分耗時且難深度獲得擾動信號特征[5],逐漸被深度學(xué)習(xí)等機器學(xué)習(xí)方法替代;文獻[6]提出了利用卷積神經(jīng)網(wǎng)絡(luò)CNN(conventional neural network)從原始二維灰度圖中自適應(yīng)地提取特征后對PQD分類。而文獻[5]利用稀疏自動編碼器獲取擾動特征后應(yīng)用Softmax分類器對PQD信號進行分類;文獻[7]則利用循環(huán)神經(jīng)網(wǎng)絡(luò)提取PQD信號的深層次特征后連接到Softmax分類器輸出各信號的識別率;文獻[8]采用格拉姆角場(Gramian angular field)將PQD信號映射為二維圖像后將其作為CNN的輸入自動提取特征并加以分類。上述方法的不足之處在于圖形映射過程復(fù)雜,在噪聲影響下某些圖像特征不明顯,且構(gòu)造的網(wǎng)絡(luò)模型對PQD信號的針對性弱,導(dǎo)致識別準確率不夠高。
有效處理PQD信號中的噪聲有助于提高低信噪比環(huán)境下信號識別的準確率,而小波閾值去噪算法在實際中被廣泛應(yīng)用[9-10]。在Donoho等[11]提出的軟、硬閾值函數(shù)降噪方法基礎(chǔ)上,學(xué)者們提出了不同的閾值函數(shù)改進方法。文獻[12]提出的軟、硬閾值函數(shù)的折衷法仍然無法避免閾值函數(shù)不連續(xù)的缺點;文獻[13]提出的改進軟硬閾值折衷函數(shù)去噪法改善了連續(xù)性問題;文獻[14]提出的模乘方閾值函數(shù)通過將閾值分層從而避免了硬閾值函數(shù)不連續(xù)和軟閾值函數(shù)固定偏差的缺點;文獻[15]提出的改進閾值函數(shù)結(jié)合自適應(yīng)閾值的去噪算法對PQD信號有優(yōu)越的降噪效果。綜上,分層閾值和自適應(yīng)閾值方法能夠有效避免固定閾值函數(shù)過度降噪導(dǎo)致的信號特征值丟失問題。
通過采用小波閾值降噪和改進深度神經(jīng)網(wǎng)絡(luò)的方法對如何提高低信噪比環(huán)境下PQD信號的分類準確率問題進行了研究。研究時首先采用一維CNN直接對含噪PQD信號進行分類;接著針對CNN特征提取缺乏時間相關(guān)性的缺點,對其改進得到抗噪性能更好地改進卷積神經(jīng)網(wǎng)絡(luò)E-CNN(enhanced-conventional neural network)分類模型;最后采用分層自適應(yīng)閾值函數(shù)HATF(hierarchical adaptive threshold function)降噪法對含噪信號進行降噪處理[16],將降噪后的PQD信號再次輸入至CNN和E-CNN中得到結(jié)果,驗證本文所用方法的有效性。
CNN結(jié)構(gòu)如圖1所示,CNN由輸入層、卷積層、池化層、歸一化層、全連接層和輸出層組成。

圖1 CNN結(jié)構(gòu)Fig.1 CNN structure
卷積層可以很好地捕獲輸入信號f(m)|m=0,1,…,N中的簡單特征,并隨著層數(shù)的疊加,產(chǎn)生的特征映射會捕獲輸入信號中越來越多更復(fù)雜的全局屬性,即有

式中:N為輸入數(shù)據(jù)(fn)的長度;g(n)為卷積層的核函數(shù)序列,其長度與卷積核的長度一致;T[n]為f和g經(jīng)過卷積后提取到的第n個特征序列。
每層卷積層使用雙曲正切函數(shù)tanh作為激活函數(shù)來提高CNN的表達能力,表示為

在每兩層卷積層后添加一層池化層,用來保留主要特征,減少計算量。然后經(jīng)過歸一化層將池化后的特征向量變?yōu)橐痪S,最后進入全連接層使用softmax函數(shù)分類,計算過程為

式中:ai為softmax層第i個神經(jīng)元的輸入量;k為類別的數(shù)量;softmax(ai)為對應(yīng)標簽的概率。
采用反向傳播梯度下降法訓(xùn)練模型參數(shù),使用交叉熵損失函數(shù)作為訓(xùn)練的目標函數(shù),即

式中:L為預(yù)測結(jié)果與實際結(jié)果的偏差;n為樣本總數(shù);i表示第i個樣本;yi為真實標簽;si為經(jīng)過softmax激活后的實際輸出值。
各層卷積網(wǎng)絡(luò)卷積核中的權(quán)重w和偏置b更新公式為

式中:wi、bi和wi+1、bi+1分別為第i代和第i+1代的權(quán)重和偏置值;α為學(xué)習(xí)速率,當損失L隨著迭代次數(shù)的增加逐漸減小并趨于0時,表示CNN模型已經(jīng)訓(xùn)練好。
優(yōu)化器采用自適應(yīng)時刻估計方法ADAM(adaptive moment estimation)[17],評價指標metrics選用“accuracy”。
為CNN分類模型提供數(shù)據(jù),根據(jù)IEEE標準[7,16],搭建了如圖2所示的10種電能質(zhì)量擾動信號,其中6種單一類型的擾動信號為:電壓暫降、電壓暫升、電壓中斷、暫態(tài)振蕩、瞬時脈沖、諧波,分別記為C1~C6;4種復(fù)合類型的擾動信號為:暫降+振蕩、暫升+振蕩、暫降+脈沖、暫升+脈沖,分別記為C7~C10,并對每種信號進行歸一化處理。


圖2 10種電能質(zhì)量擾動信號示意Fig.2 Schematic of 10 kinds of PQD signal
對上述10類PQD信號每類各生成300個數(shù)據(jù)樣本,共3 000個樣本。設(shè)置訓(xùn)練集樣本數(shù)為2 100,測試集樣本數(shù)為900。訓(xùn)練集用來逼近真實類別訓(xùn)練網(wǎng)絡(luò),測試集用來測試效果。
分別在無噪環(huán)境、30 dB(弱噪聲)和20 dB(強噪聲)的高斯白噪聲環(huán)境下,利用CNN分類模型對PQD信號進行分類。不同信噪比環(huán)境下CNN模型的分類準確率如表1所示。

表1 不同信噪比下CNN的分類準確率Tab.1 Classification accuracy of CNN at different values of SNR
由表1可知,CNN分類模型本身具有一定抗噪性,在無噪環(huán)境和弱噪聲(30 dB)環(huán)境下的分類表現(xiàn)良好,與文獻[6]的仿真結(jié)果相契合。但強噪聲(20 dB)環(huán)境下的分類準確率發(fā)生了明顯的降低,C1(電壓暫降)、C4(暫態(tài)振蕩)、C7(暫降+振蕩)和C8(暫升+振蕩)的分類準確率出現(xiàn)了較大程度的下降。這是因為小幅度的暫降、暫升和振蕩故障在低信噪比環(huán)境下容易被噪聲覆蓋,導(dǎo)致錯誤分類。
對強噪聲環(huán)境下的分類問題進一步研究,在20 dB強度的高斯白噪聲下,CNN每次訓(xùn)練過程中的準確率和交叉熵損失如圖3所示。

圖3 CNN訓(xùn)練過程Fig.3 CNN training process
由圖3可知,隨著訓(xùn)練次數(shù)的增多,CNN模型的準確率不斷上升,損失逐漸下降,但模型的訓(xùn)練準確率和損失在訓(xùn)練后期仍有較大程度的波動,無法收斂。CNN的識別準確率最后穩(wěn)定在93%左右。這是由于卷積層中的卷積核提取到的特征缺乏時間依賴性,捕獲到的特征在數(shù)據(jù)片段中的位置不具有高度相關(guān)性,識別復(fù)雜含噪信號的分類準確率較低。
針對CNN的上述不足,在圖1網(wǎng)絡(luò)結(jié)構(gòu)的基礎(chǔ)之上引入長短期記憶LSTM(long short-term memory)神經(jīng)層。針對PQD信號具有時序性的特點,LSTM能夠?qū)W習(xí)其時間上的相關(guān)性。LSTM的細胞狀態(tài)包括遺忘門、輸入門和輸出門3種結(jié)構(gòu),如圖4所示。

圖4 細胞狀態(tài)結(jié)構(gòu)Fig.4 Structure of cell state
其中,遺忘門結(jié)合權(quán)重和激活函數(shù)有選擇地保留輸入xt和上一時刻的輸出ht-1,有

輸入門對上一時刻的ht-1和輸入xt進行輸入,有

輸出門選擇重要信息作為輸出,有

式中:σ為Sigmoid激活函數(shù);tanh(·)為雙曲正切激活函數(shù);wf和bf分別為遺忘門的權(quán)重和偏置量;wi和bi分別為輸入門的權(quán)重和偏置量;wc和bc分別為神經(jīng)元狀態(tài)的權(quán)重和偏置量;wo和bo分別為輸出門的權(quán)重和偏置量;ft為遺忘門限;it為輸入門限;Ct為當前神經(jīng)元的狀態(tài);ot為輸出門限;ht為t+1時刻對該神經(jīng)元本身的輸出值。
在圖1中的CNN模型上將最后2個一維卷積層和一個池化層替換為LSTM層,得到E-CNN分類模型。多次試驗后設(shè)置LSTM層的神經(jīng)元數(shù)量為64,激活函數(shù)仍用tanh,return_sequences設(shè)為“True”,具體結(jié)構(gòu)如圖5所示。

圖5 E-CNN結(jié)構(gòu)Fig.5 Structure of E-CNN
PQD信號輸入后,由卷積層和池化層提取其特征序列并進行簡化,隨后進入LSTM層,學(xué)習(xí)特征時間序列的相關(guān)性,最后進入歸一化層將LSTM篩選后的數(shù)據(jù)化為一維,用全連接層的Softmax函數(shù)分類。
網(wǎng)絡(luò)訓(xùn)練方法與CNN相同,訓(xùn)練過程中的準確率和交叉熵損失如圖6所示。

圖6 CNN和E-CNN訓(xùn)練過程Fig.6 CNN and E-CNN training processes
由圖6可見,相比CNN的訓(xùn)練過程,E-CNN的準確率更高,損失更低,曲線更加平滑,網(wǎng)絡(luò)的識別準確率最后穩(wěn)定在96%左右,說明E-CNN改進了CNN提取特征缺乏時間依賴性的缺點,擁有更強的抗噪性能。
為了進一步提升低信噪比環(huán)境下PQD信號的分類準確率,從信號降噪的角度出發(fā),采用HATF降噪法對信號進行處理。
HATF降噪流程如圖7所示。

圖7 HATF降噪流程Fig.7 Flow chart of HATF noise reduction
具體步驟如下。
步驟1選擇小波基函數(shù)。選擇具有良好的相似性與對稱性的Sym4小波。
步驟2確定最大分解層數(shù)M為

式中:Δt為采樣周期;f0為小波基函數(shù)的中心頻率;fmin為信號的最小頻率。
步驟3得出分解層的調(diào)節(jié)參數(shù)μj為

式中,Enj和Esj分別為第j層分解中噪聲信號和原含噪信號的能量。而En1≈Es1,其余則有Esj=2jEnj。
步驟4計算各分解層的閾值λ[18]。
步驟5由μj與λ得到各分解層的自適應(yīng)閾值函數(shù)為

由此處理小波分解后的細節(jié)系數(shù)。
步驟6由各分解層的近似系數(shù)與細節(jié)系數(shù)對信號進行小波重構(gòu),得到降噪后的信號。
以含有20 dB高斯白噪聲的C7(暫降+振蕩)復(fù)合擾動信號為例,HATF降噪法的實際降噪效果如圖8所示。

圖8 HATF降噪效果Fig.8 Noise reduction effect of HATF
由圖8可見,HATF降噪法在有效濾除噪聲的同時,基本完整地保留了故障處暫降和振蕩的局部特征。可以有效避免小幅度故障信號被強噪聲覆蓋的問題,提升深度學(xué)習(xí)模型的分類準確率。
在20 dB噪聲下對比分析PQD信號經(jīng)過HATF降噪后CNN和E-CNN兩種模型的分類效果。訓(xùn)練集和測試集的構(gòu)建在第1節(jié)已經(jīng)說明;使用Python編程語言,在anaconda的spyder平臺搭建神經(jīng)網(wǎng)絡(luò),訓(xùn)練過程如圖9所示。

圖9 降噪后CNN和E-CNN訓(xùn)練過程Fig.9 CNN and E-CNN training processes after noise reduction
由圖9可知,與降噪前相比,2種網(wǎng)絡(luò)處理降噪后PQD信號的識別準確率更高,損失更低,并且在訓(xùn)練后期兩曲線更加平穩(wěn)。CNN模型的準確率達到了95%左右,E-CNN模型的準確率達到了98%左右,兩者都有了一定程度的提高。
對比降噪前后4種情況的測試集分類準確率,如表2所示。

表2 10種擾動信號的分類準確率Tab.2 Classification accuracy of 10 kinds of disturbance signal
由表2分析可得如下結(jié)論。
(1)在未去噪時,CNN模型對擾動信號C1(電壓暫降)、C4(暫態(tài)振蕩)、C7(暫降+振蕩)、C8(暫升+振蕩)的識別準確率較差。造成這種現(xiàn)象的原因一方面是由于噪聲的干擾,使得C7、C8中小幅度的電壓暫降/暫升分辨出現(xiàn)錯誤;另一方面由于模型缺乏對擾動信號時序性的提取,容易產(chǎn)生C4和C7、C8這樣單一與復(fù)合信號的區(qū)分錯誤。
(2)E-CNN模型增加了信號時序性的分辨,提升了對單一擾動信號和復(fù)合擾動信號的區(qū)分能力,對C1(電壓暫降)、C4(暫態(tài)振蕩)的識別準確率有了較大程度的提升。若以未經(jīng)過降噪的CNN分類模型為基準(0),E-CNN分類模型的效果提升率為3.37%。
(3)對擾動信號進行降噪后再識別,顯著地提高了對C7(暫降+振蕩)、C8(暫升+振蕩)兩種復(fù)合信號的識別準確率。但由于HATF降噪算法在去噪的過程中,有時會導(dǎo)致信號的局部特征失真的現(xiàn)象,對C1(電壓暫降)、C4(暫態(tài)振蕩)的識別準確率反而有所下降。總體而言,降噪仍能提升PQD信號分類的準確率。類似地,以未經(jīng)過降噪的CNN分類模型為基準(0),經(jīng)HATF降噪的CNN和E-CNN分類模型的效果提升率分別為1.73%和5.49%。
為明顯體現(xiàn)低信噪比環(huán)境下本文方法的有效性,在20 dB的高斯白噪聲環(huán)境下,與文獻[3]和文獻[19]的綜合分類準確率進行對比,如表3所示,可以看出,本文方法在分類準確率上高于其他方法。

表3 不同方法的分類準確率Tab.3 Classification accuracy of different methods
本文提出了一種針對強噪聲環(huán)境下PQD信號的識別方法。首先采用HATF降噪法對信號降噪處理,使降噪后的信號曲線在正常運行時間段內(nèi)保持平滑,并在非正常運行時間段內(nèi)盡可能多地保留局部特征;接著對網(wǎng)絡(luò)的結(jié)構(gòu)進行改進,在CNN的結(jié)構(gòu)之上添加LSTM層得到E-CNN,使網(wǎng)絡(luò)模型擁有更強的抗噪能力,既可以提取識別擾動信號故障的波形特征,又可以識別故障發(fā)生的時序性。
由仿真分析可知,在強噪聲(信噪比為20 dB)環(huán)境下,結(jié)合HATF和E-CNN的PQD信號分類方法明顯提高了電能質(zhì)量擾動信號的識別準確率。后續(xù)將進一步研究:①嘗試對HATF改進,更好地保留PQD信號的故障處特征;②改進得到更適合PQD信號特點、抗噪性更強的神經(jīng)網(wǎng)絡(luò)分類模型;③推廣至微電網(wǎng)、智能電網(wǎng)的PQD信號分類。