趙晨, 李開成, 張浩毅, 林煒鑫, 曾子瑩
(1.福建農(nóng)林大學(xué)機(jī)電工程學(xué)院, 福州 350002; 2.華中科技大學(xué)電氣與電子工程學(xué)院, 武漢 430074)
電能質(zhì)量問題近幾年引起了科研人員以及工程師的關(guān)注,由于電能質(zhì)量問題增加了電網(wǎng)維護(hù)、操作和監(jiān)測的成本,愈發(fā)凸顯重要。電能質(zhì)量問題主要分為:①簡單的擾動問題如電壓暫降驟升、諧波;②復(fù)合擾動:暫降疊加其他擾動或者驟升疊加其他擾動。這些電能質(zhì)量擾動大大增加了電氣設(shè)備故障出現(xiàn)的頻率。電能質(zhì)量擾動的檢測和識別是一項復(fù)雜的工作,擾動波形中包含了有用信息,但不能直接反映擾動類型。正確檢測識別這些擾動類型有助于后續(xù)采取相應(yīng)措施,保證無污染的電力供應(yīng)以及保障設(shè)備和人力的安全[1]。
已有的電能質(zhì)量擾動檢測識別實(shí)現(xiàn)分成兩步,首先對擾動信號進(jìn)行特征選取,其次對提取的特征進(jìn)行分類模型的監(jiān)督學(xué)習(xí)。這其中特征的選取常用S變換[2]、小波變換[3]和希爾伯特黃變換[4]、經(jīng)驗(yàn)?zāi)B(tài)分解[5]等現(xiàn)代信號處理方法。文獻(xiàn)[6]提出了一種改進(jìn)的分段S變換和隨機(jī)森林結(jié)合的識別方法。文獻(xiàn)[7]將變分模態(tài)分解(variational mode decomposition, VMD)初始化并經(jīng)過S變換提取的特征通過多重聚類,實(shí)現(xiàn)擾動的識別。文獻(xiàn)[8]通過擾動在過完備字典上的稀疏表示對擾動進(jìn)行識別。決策樹[9]、支持向量機(jī)[10]、極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)[11]等方法則是較常用的擾動分類的機(jī)器學(xué)習(xí)模型。隨著深度學(xué)習(xí)在語音信號處理和圖像識別領(lǐng)域取得廣泛應(yīng)用[12],一些深度網(wǎng)絡(luò)模型也開始被用于電能質(zhì)量擾動的自動提取和分類識別。文獻(xiàn)[13]提出了一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的電能質(zhì)量擾動檢測和分類的全新閉環(huán)方法。文獻(xiàn)[14]通過訓(xùn)練一個三層深度前饋網(wǎng)絡(luò)提高擾動識別模型的泛化性和抗噪性。
已有研究工作中擾動分類方法大多采用監(jiān)督學(xué)習(xí)的分類模型,即利用已知擾動類型的訓(xùn)練數(shù)據(jù)訓(xùn)練一個分類器,進(jìn)而診斷未知的新擾動類型。而在實(shí)際應(yīng)用中,監(jiān)督學(xué)習(xí)模型無法將電力系統(tǒng)監(jiān)測設(shè)備保存的無類型標(biāo)簽的擾動波形數(shù)據(jù)加入模型訓(xùn)練過程中,從而導(dǎo)致過擬合現(xiàn)象。因此,如何有效利用這些未標(biāo)注樣本提升分類器性能成為電能質(zhì)量擾動識別的熱點(diǎn)。針對少量已標(biāo)注歷史數(shù)據(jù)背景下的擾動識別問題,從機(jī)器學(xué)習(xí)領(lǐng)域的半監(jiān)督學(xué)習(xí)出發(fā),提出一種基于混合流形正則化半監(jiān)督極限學(xué)習(xí)機(jī)的擾動識別方法。首先利用變分模態(tài)分解算法提取復(fù)合擾動經(jīng)過分解后的標(biāo)準(zhǔn)能量差作為特征,并將混合了圖拉普拉斯和海森正則化的流形學(xué)習(xí)框架引入極限學(xué)習(xí)機(jī)模型中,最終構(gòu)建半監(jiān)督極限學(xué)習(xí)機(jī)模型將已標(biāo)注擾動和未標(biāo)注擾動樣本一起訓(xùn)練。該方法通過流形正則化約束實(shí)現(xiàn)了在復(fù)合擾動分類的同時在模型輸出空間也保留了數(shù)據(jù)內(nèi)部的局部結(jié)構(gòu),更加有利于最終分類效果的提升。
變分模態(tài)分解(variational mode decomposition,VMD)是由Dragomeretskiy等[15]提出的一種新的信號分解方法。它將一個實(shí)值信號r(t)分解成k個窄帶子信號sk(t),同時獲得每個子信號的中心頻率ωk(k=1,2,…,K)。算法通過求解一個受約束的優(yōu)化問題來獲取這些窄帶信號及其中心頻率ωk,利用調(diào)制性質(zhì)對頻譜進(jìn)行搬移。信號的帶寬通過解調(diào)信號H高斯平滑度進(jìn)行估算。算法的約束優(yōu)化問題可表示為
(1)

通過拉格朗日乘子λ可以將約束問題轉(zhuǎn)化成無約束問題。擴(kuò)展的拉格朗日表達(dá)式L可表示為

(2)
式(2)中:α為一個懲罰因子;f(t)為原信號。
第n+1次迭代估算的窄帶子信號及其中心頻率的計算公式為
(3)
(4)

λ的更新可以通過式(5)實(shí)現(xiàn)。
(5)
復(fù)合擾動由于多個單一擾動的存在使得特征存在部分重疊, 提出以復(fù)合擾動VMD分解的子信號與標(biāo)準(zhǔn)正弦信號VMD分解的子信號之間的能量差作為特征向量。信號分解過程中兩個重要的參數(shù):數(shù)據(jù)保真約束參數(shù)α和模式數(shù)K對最終分解效果影響較大。考慮到復(fù)合擾動的頻帶范圍以及最高諧波次數(shù),將α設(shè)置為1 000,K設(shè)置為10。
(6)
(7)
式中:Fik為第i個信號的第k個特征值;EMPi(k)為第i個信號的第k層分量的能量;EPure(k)為純正弦信號進(jìn)行VMD分解后第k層分量的能量;E(·)(j)為第j個信號能量;Ns為采樣點(diǎn)數(shù);ν為計數(shù)單元;s(t)為窄帶子信號。

圖1 特征提取曲線Fig.1 The curve of the characteristic extraction
圖1給出6種類型的擾動信號(電壓暫降、瞬態(tài)脈沖、諧波、閃變、電壓暫升疊加瞬態(tài)脈沖、電壓中斷疊加諧波和瞬態(tài)脈沖)經(jīng)過VMD分解后計算的標(biāo)準(zhǔn)能量差的對比曲線圖。由圖1可知,標(biāo)準(zhǔn)能量差在6層之前都能較好地體現(xiàn)出不同擾動信號之間的差異性。
極限學(xué)習(xí)機(jī)作為一種新型的單隱層前饋神經(jīng)網(wǎng)絡(luò)因其簡單高效而在許多需要使用機(jī)器學(xué)習(xí)的問題上得到了廣泛的應(yīng)用[16]。Huang等[17]提出了一種圖拉普拉斯正則化的半監(jiān)督極限學(xué)習(xí)機(jī)網(wǎng)絡(luò)模型(semi-supervised extreme learning machine,SS-ELM)。給定一個包含n個訓(xùn)練樣本的數(shù)據(jù)集{X,Y},其中已標(biāo)注的樣本集為{Xl,Y}l={xi,yi},i=1,2,…,l,其中l(wèi)為已標(biāo)注樣本個數(shù);未標(biāo)注的樣本集表示為Xu={xu},未標(biāo)注樣本個數(shù)u=l+1,l+2,…,n-l,SS-ELM通過在ELM模型目標(biāo)函數(shù)中加入圖拉普拉斯正則化挖掘無標(biāo)簽樣本中的局部流形信息,從而將監(jiān)督學(xué)習(xí)的ELM擴(kuò)展到半監(jiān)督學(xué)習(xí)應(yīng)用上。其目標(biāo)函數(shù)可表示為
(8)

雖然圖拉普拉斯已經(jīng)在半監(jiān)督學(xué)習(xí)中證明有效性,然而它在少量已標(biāo)注樣本較少存在的情況下外推能力較差容易過擬合。由于圖拉普拉斯的零空間測地線函數(shù)為常數(shù)不能很好地保持?jǐn)?shù)據(jù)局部流形結(jié)構(gòu),Kim等[18]提出了在海森流形正則化,使用函數(shù)的二階導(dǎo)數(shù)來近似計算每個鄰域中的Eells能量。 海森正則化通過在兩個方向上近似函數(shù)的變化來解決圖拉普拉斯外推法的不足。這有助于輕松地識別未被圖拉普拉斯正則化懲罰的測地線偏離函數(shù)。因此,基于海森正則化的模型比基于圖拉普拉斯正則化的模型在訓(xùn)練和測試數(shù)據(jù)集上具有更好的標(biāo)簽預(yù)測能力。
海森正則化中的海森算子H的計算流程如下。
步驟1對于每個樣本xi,通過聚類算法K最鄰近(K-nearest neighbor,KNN)定義其鄰域Nk(xi),將鄰域內(nèi)每一個樣xj均與xi相減,形成最終的矩陣Xi。
步驟2對矩陣Xi做奇異值分解,記Xi=UDVT取左奇異矩陣U前d個特征值所對應(yīng)的特征向量構(gòu)成正切空間。


圖拉普拉斯正則化存在外推能力差的問題,海森正則化也存在流形快速變化情況下海森能量估計不穩(wěn)定的問題。為了克服兩種流形正則化的缺點(diǎn),提出了結(jié)合了圖拉普拉斯和海森兩種正則化的半監(jiān)督極限學(xué)習(xí)機(jī)模型圖拉普拉斯-海森半監(jiān)督極限學(xué)習(xí)機(jī)(Laplacian Hessian semi-supervised-extreme learning machine, LHSS-ELM)。LHSS-ELM算法的目標(biāo)函數(shù)參照SS-ELM的框架,通過修改SS-ELM的式(8)獲得最終目標(biāo)函數(shù)表達(dá)式為
(9)
式(9)中:λ1和λ2為正則化系數(shù)。
將約束條件代入目標(biāo)函數(shù)式中重寫目標(biāo)函數(shù)為

(10)
式(10)中:T=[t1,t2,…,tl]T為訓(xùn)練集真實(shí)輸出;C為訓(xùn)練誤差項對應(yīng)的懲罰因子。
對β求偏導(dǎo)置0,可得
β*=(Inh+ΦTCΦ+λ1ΦTLΦ+
λ2ΦTHΦ)-1ΦTCT
(11)
式(11)中:Inh為大小為nh的單位矩陣。
當(dāng)輸入樣本數(shù)少于模型隱層節(jié)點(diǎn)數(shù)時,有
β*=ΦT(Il+u+CΦΦT+λ1LΦΦT+
λ2HΦΦT)-1CT
(12)
LHSS-ELM算法的具體流程如下。
輸入已標(biāo)注的樣本集 {Xl,Yl}={xi,yi},i=1,2,…,l,未標(biāo)注樣本集Xu={xj},j=l+1,l+2,…,n-l;懲罰系數(shù)C、正則化系數(shù)λ1和λ2、隱層節(jié)點(diǎn)數(shù)。
輸出LHSS-ELM的映射函數(shù)f:Rd→Rq。
步驟1通過{Xl,Xu}計算圖拉普拉斯矩陣L和海森算子H。
步驟2建立一個包含了隱層節(jié)點(diǎn)數(shù)為nh的ELM網(wǎng)絡(luò)模型,隨機(jī)給定輸入層權(quán)重和偏置。
步驟3計算隱層輸出矩陣Φ∈R(l+u)×nh。
步驟4如果nh 步驟5求得模型映射函數(shù)為f(x)=Φ(x)β。 電能質(zhì)量復(fù)合擾動波形數(shù)據(jù)來源于MATLAB軟件數(shù)值模型仿真以及福祿克6105A三相功率源的實(shí)測數(shù)據(jù)。其中仿真數(shù)據(jù)依據(jù)參考文獻(xiàn)[19]通過MATLAB以6.4 kHz采樣頻率生成十個周期的波形數(shù)據(jù),一共生成47種擾動信號,其中復(fù)合擾動信號最多包含4種單一擾動。由于自身限制,標(biāo)準(zhǔn)功率源只能生成15種復(fù)合擾動,硬件采樣平臺如圖2所示。最終仿真數(shù)據(jù)加功率源采樣數(shù)據(jù)一共包含9 400個樣本,其中每個類型復(fù)合擾動200個樣本。實(shí)驗(yàn)過程采用四折交叉校驗(yàn),即四等分?jǐn)?shù)據(jù)集,一份用于測試,其余三份用于訓(xùn)練。訓(xùn)練集進(jìn)一步劃分為:已標(biāo)注集U、驗(yàn)證集V和未標(biāo)注集T。在20~50 dB的不同噪聲環(huán)境下,采用4種半監(jiān)督學(xué)習(xí)算法: 圖2 硬件采樣平臺Fig.2 Hardware sampling platform 半監(jiān)督拉普拉斯支持向量機(jī)(Laplacian support vector machine,LapSVM)[20]、直推式支持向量機(jī)(transductive SVM,TSVM)[21]、半監(jiān)督極限學(xué)習(xí)機(jī)(semi supervised extreme learning machine,SS-ELM)[18]、海森極限學(xué)習(xí)機(jī)(Hessian semi supervised extreme learning machine,HSS-ELM)[22]和監(jiān)督學(xué)習(xí)算法:極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)進(jìn)行性能對比。以上算法均在Intel I7-6800K 3.5 GHz CPU、32 G內(nèi)存、Win7系統(tǒng)下MATLAB2020a的環(huán)境中運(yùn)行。 表1給出不同噪聲條件下,6種算法在復(fù)合擾動數(shù)據(jù)集上性能表現(xiàn)結(jié)果。由表1可知,提出的混合流形的半監(jiān)督極限學(xué)習(xí)機(jī)LHSS-ELM在各項指標(biāo)上均優(yōu)于其他方法。與監(jiān)督學(xué)習(xí)算法ELM對比,3種流形正則化半監(jiān)督模型都有較明顯的精度提升。結(jié)果表明,流形正則化在挖掘未標(biāo)注數(shù)據(jù)的信息從而提升分類性能上的有效性。而這其中混合流形方式的半監(jiān)督極限學(xué)習(xí)機(jī)效果最佳。由表2給出的運(yùn)行時間結(jié)果可見,由于計算了兩個流形正則化算子,LHSS-ELM時間消耗最多。 圖3給出初始條件為不同數(shù)量已標(biāo)注樣本情況下,ELM、SS-ELM、HSS-ELM以及提出的LHSS-ELM在復(fù)合擾動數(shù)據(jù)集上的測試誤差趨勢。初始狀態(tài)假定已標(biāo)注擾動數(shù)量為470個,每次遞增數(shù)量為樣本總數(shù)的10%,增加過程保持校驗(yàn)集與已標(biāo)注集樣本數(shù)量相同。由圖3可見,隨著已標(biāo)注樣本數(shù)量增多4種方法的測試誤差均趨于減少,其中LHSS-ELM測試誤差最低。而比例增長到一定值后,4種方法誤差降低趨勢均有所放緩。圖4給出固定已標(biāo)注樣本數(shù)目情況下,以未標(biāo)注樣本總數(shù)10%的數(shù)量往訓(xùn)練集添加未標(biāo)注樣本時,4種算法的測試誤差趨勢變化曲線。分析可知,隨著未標(biāo)注樣本數(shù)量的增加,LHSS-ELM測試誤差呈明顯下降趨勢,且在4種 表1 不同信噪比下算法分類精度對比Table 1 Comparison of classification accuracy for algorithms under different SNR values 表2 不同信噪比下算法計算時間對比Table 2 Comparison of computational cost for algorithms under different SNR values 圖3 已標(biāo)注樣本數(shù)目不同時測試誤差對比Fig.3 Comparison of testing error with different number of labeled data 方法中最低。即使在初始階段訓(xùn)練集未添加任何未標(biāo)注樣本的情況下,LHSS-ELM測試誤差也在4個方法中最低。這其中主要原因是由于流形正則化在純監(jiān)督學(xué)習(xí)的情況下也具有有效性。 圖4 未標(biāo)注樣本數(shù)目不同時測試誤差對比Fig.4 Comparison of testing error with different number of unlabeled data 針對電網(wǎng)實(shí)測復(fù)合擾動樣本多數(shù)未標(biāo)注類別而無法加入監(jiān)督學(xué)習(xí)模型訓(xùn)練的情況,提出了一種新型的基于混合流形正則化的LHSS-ELM半監(jiān)督擾動識別模型。本文算法通過圖拉普拉斯和海森流形正則化的結(jié)合,利用未標(biāo)注樣本蘊(yùn)含的局部結(jié)構(gòu)信息來降低全部標(biāo)注未知樣本的代價。結(jié)果表明,混合流形正則化的引入有效提升了復(fù)合擾動半監(jiān)督學(xué)習(xí)精度,與單一的圖拉普拉斯和海森正則化對比具有更好的局部幾何結(jié)構(gòu)保持和外推能力。實(shí)驗(yàn)結(jié)果證明所提方法是一種有效的從半監(jiān)督學(xué)習(xí)角度識別復(fù)合擾動的新方法,具有廣闊的應(yīng)用前景。3 實(shí)驗(yàn)及結(jié)果
3.1 數(shù)據(jù)集及實(shí)驗(yàn)設(shè)置

3.2 算法對比結(jié)果與分析




4 結(jié)論