吳建章 梅 飛 鄭建勇,3 張宸宇 繆惠宇
基于改進經驗小波變換和XGBoost的電能質量復合擾動分類
吳建章1梅 飛2鄭建勇1,3張宸宇4繆惠宇4
(1. 東南大學電氣工程學院 南京 210096 2. 河海大學能源與電氣學院 南京 211100 3. 東南大學蘇州研究院 蘇州 215123 4. 國網江蘇省電力有限公司電力科學研究院 南京 211103)
針對電能質量復合擾動分類方法在分類數目和分類性能方面存在的不足,提出一種基于改進經驗小波變換(MEWT)和極限梯度提升(XGBoost)的電能質量復合擾動分類方法。首先,對傳統經驗小波變換進行改進,使之適用于復合擾動特征提??;然后,根據基本擾動MEWT分析結果,從時頻域多角度提取能夠有效刻畫不同擾動特性的特征序列;最后,基于問題轉換策略構造以XGBoost為子分類器的多標簽復合擾動分類模型,并通過特征選擇與超參數優化相結合的模型訓練方法進一步提升分類效果。實驗結果表明,所提方法可實現48類擾動的有效辨識,較之傳統多標簽擾動分類方法在分類精度和噪聲魯棒性方面表現更優,且運算速度更快,適用于工程實踐。
電能質量復合擾動 經驗小波變換 尺度空間表示 多標簽分類 極限梯度提升
近年來,隨著大量非線性負載和分布式電源的廣泛接入,電網中發生電能質量(Power Quality, PQ)擾動事件的概率大幅攀升,不同擾動間的交叉耦合也使得擾動類型日趨復雜,對電力系統的安全經濟運行構成嚴重威脅[1]。面對監測裝置所記錄的海量擾動數據,實現復雜電能質量擾動的實時準確分類存儲[2]是針對性分析和治理電能質量問題的關鍵前提,因而具有重要的研究意義。
經過多年研究積累,各種PQ擾動分類方法層出不窮,但大多數可歸納為特征提取和擾動分類兩個步驟。作為典型的時變信號,時頻分析方法被廣泛應用于PQ擾動特征提取。短時傅里葉變換(Short Time Fourier Transform, STFT)[3]可聯合時頻域信息刻畫信號特征,但其窗函數固定,僅適用于平穩信號分析;離散小波變換(Discrete Wavelet Transform, DWT)[4]雖然具有可變時頻分辨率,但其分析效果受分解層數和小波基選取影響較大;S變換(S- Transform, ST)[5]兼具良好的抗噪性和時頻分析性能,但其仍受制于海森堡測不準原理,且實時性差。
經驗小波變換(Empirical Wavelet Transform, EWT)[6]是一種建立在小波變換理論框架之上的信號時頻分析方法,其繼承了小波變換的多尺度特點和經驗模態分解的自適應性,在不依賴母小波選取的同時有效抑制了模態混疊現象,且運算量小,已被廣泛應用于工程信號分析。文獻[7]首次將EWT用于PQ信號分析,并基于橫-縱雙閾值頻帶劃分方法實現了PQ信號的指標估計;文獻[8-9]針對時變PQ擾動分析問題,分別提出了基于可變雙閾值的廣義EWT和基于分治策略的改進型EWT,但兩者均未考慮噪聲污染對特征頻點選取產生的干擾,其分解結果中仍存在虛假分量;文獻[10]對EWT的頻帶劃分規則進行了調整,以提高其噪聲污染下的諧波分析魯棒性;文獻[11]將文獻[9]所提改進型EWT與多尺度排列熵相結合,用于單一擾動的特征提取,為PQ擾動分類提供了新的思路。由此可見,EWT已成為PQ信號分析的有效途徑之一,但在處理復雜擾動信號時,其頻帶劃分準確性仍有待提高。
在擾動分類階段,現有研究大多采用直接多分類方法,但該策略僅適用于對單一擾動和少量復合擾動進行辨識。隨著所考慮擾動類型的增加,分類器將面臨維數災難,分類效率及精度也將大打折扣。為此,文獻[12]將多標簽分類思想引入PQ擾動分類問題,其實現方法具體又可以分為算法改造策略和問題轉換策略兩類。文獻[13-14]分別基于改造后的多標簽徑向基函數(Multi Label Radial Basis Function, MLRBF)神經網絡和三層貝葉斯網絡(Three-Layer Bayesian Network, TLBN)對PQ復合擾動進行辨識,該類算法可充分挖掘擾動標簽間的關聯性以提升分類效果,但通常需要付出巨大的運算成本代價;文獻[15]采用二元關聯(Binary Relevance, BR)方法將多標簽問題轉換為多個二分類子問題,算法的時間復雜度被明顯降低,其分類精度在很大程度上依賴各子分類器的泛化性能。極限梯度提升(eXtreme Gradient Boosting, XGBoost)是梯度提升理論的一種全新高效系統實現方式[16],采用解析法而非數值優化方法求取損失函數的最優解是其與傳統梯度提升樹(Gradient Boosting Decision Tree, GBDT)之間最顯著的差異,與決策樹(Decision Tree, DT)、支持向量機(Support Vector Machine, SVM)、隨機森林(Random Forest, RF)等傳統機器學習算法相比,具有不易過擬合、損失函數求解精度更高、支持稀疏數據處理等優勢[17]。因此,本文選用XGBoost作為BR方法的子分類器。
為實現復雜PQ擾動的快速準確辨識,本文提出一種基于改進經驗小波變換(Modified Empirical Wavelet Transform, MEWT)和XGBoost的PQ復合擾動分類方法。首先,充分考慮復合擾動時頻特征和現有EWT技術存在的不足,提出一種基于尺度空間表示(Scale-Space Representation, SSR)和動態測度的MEWT分析方法;其次,基于擾動MEWT分析結果,設計了12維擾動分類特征;最后,將前向序列特征選擇與貝葉斯超參數調優相結合,構造并訓練BR-XGBoost多標簽擾動分類模型對復合擾動進行分類。實驗結果表明,本文方法在不同噪聲背景和頻率偏移情況下均表現良好,較之其他方法分類精度更高且實時性更優,工程應用前景廣闊。
圖1a為信噪比(Signal-to-Noise Ratio, SNR)為30dB的中斷+諧波+振蕩復合擾動,采用文獻[7-9]方法對其進行分析,所得頻帶劃分結果如圖1所示。

圖1 復合擾動及其頻帶劃分結果
由圖1可知,電壓中斷在基波頻譜附近引起了明顯的頻譜泄露,噪聲污染則使得原本光滑的暫態振蕩頻譜曲線變得崎嶇,兩者都嚴重干擾了特征頻點的判斷,導致上述方法在基波和暫態振蕩頻譜附近均不同程度地出現了頻帶“過切分”問題。這是因為無論是雙閾值思想[7-8]還是分治策略[9],兩者都著眼于獲取較高的特征頻點頻域分辨率,適用于諧波、間諧波類的PQ擾動分析。雖然其也在一定程度上抑制了頻譜泄露對特征頻點選取產生的干擾,但在處理復合PQ擾動時,頻帶錯分現象依然嚴重。此外,上述方法在設計之初均未考慮噪聲對暫態振蕩頻譜的污染,這些都增加了基于現有EWT技術對擾動特征提取的難度。
考慮到上述方法均直接依據原始Fourier譜來劃分頻帶,且效果不太理想,因此,本文從譜線平滑角度出發對EWT的頻帶劃分規則進行改進,提出一種適用于復合PQ擾動分析的MEWT方法。對于包含個有限帶寬固有模態(Band-Limited Intrinsic Mode Functions, BLIMFs)分量的離散時間信號(),其MEWT變換主要包含以下三個步驟:
1)尺度空間表示:設()的離散Fourier變換為(),定義高斯核函數為

式中,為尺度因子。則()的尺度空間表示的離散形式可定義為





3)經驗小波分解:確定特征頻點序列{}=1后,取相鄰兩特征頻點間的中點頻率構造頻帶邊界序列{}=0(其中0=0、=p為頻譜自身邊界)。考慮到多數PQ擾動特征頻點分布于低頻區域,若依照現有的EWT頻譜分割規則劃分頻帶,那么特征頻點所對應的最高頻擾動分量將與大量高頻噪聲分量一同落入頻帶區間[-1,],此時EWT分解結果中的最高頻分量將不可避免地受到高頻噪聲污染。為此,本文在保留現有前個頻帶邊界{}-1=0的基礎上,依照式(4)對頻帶邊界進行平移增補

式中,為平移系數。考慮到PQ擾動分量在頻域關于譜峰具有對稱性,令=1可以在保留最高頻擾動分量頻譜信息的同時,使之完全落入帶通區間為[1,]的濾波器內,從而抑制高頻噪聲的干擾。此時,()將被分割成+1個連續區間{}+11,由此構造經驗小波并實施經驗小波變換,即可將各擾動分量及噪聲分量從原始信號中的分離出來,有關經驗小波變換的詳細原理及實施過程可參見文獻[6]。
由MEWT原理可知,尺度因子和判別閾值d是決定其頻帶劃分效果和后續擾動特征提取的關鍵參數。因此,本節就MEWT的參數整定展開討論。
1)尺度因子的設定。不同于文獻[18]在全尺度下對()實施SSR,本文僅計算某一固定尺度下的尺度空間曲線,因而的選取至關重要。經過大量隨機參數仿真實驗后,在30dB噪聲下,以電壓中斷擾動2()={1-0.95[(4.35)-(2.75)]}sin(),諧波擾動1()=sin()+0.3sin(3)+0.06sin(5)+ 0.2sin(7),以及暫態振蕩擾動3()=sin(t)+0.2e75(t-2T)[(4)-(2)]sin(9(-2))為例,其中=100p,為工頻周期,(×)為階躍函數。分別在尺度=0.09、=9和=900下求取上述擾動頻譜的SSR及其動態測度,結果如圖2所示。圖2的每幅子圖中,左圖為擾動頻譜的尺度空間曲線,右圖為SSR的極大值動態測度結果。

圖2 不同尺度因子n下擾動頻譜的SSR及其動態測度
由圖2a可知,當=900時,擾動頻譜SSR中的無效峰值均已被平滑;當降至9時,SSR中開始出現干擾頻點,且幅值最高可達0.1(pu),但其動態測度大小均低于0.01(pu),充分展現了動態測度良好的去趨勢評價效果;當=0.09時,SSR已與原始頻譜十分近似,此時干擾頻點的動態測度也有所升高,不利于特征頻點的準確判斷。由圖2b可知,當取0.09、9時,各諧波特征頻點的SSR幅值及其動態測度均與原始頻譜相近,但隨著增大,各特征頻點的SSR幅值雖幾乎不變,但其動態測度卻明顯減小,5次諧波的動態測度僅為0.016(pu),難以從中判定幅值較小的諧波分量所對應的特征頻點。由圖2c可知,隨著值增大,暫態振蕩所對應特征頻點的SSR幅值及其動態測度也隨之增大,這一特性將有助于判定幅值較小的暫態振蕩特征頻點。綜上所述,為了規避無效峰值的干擾,同時又能捕捉高頻分量的特征信息,本文取=9。
2)判別閾值d的設定。由于動態測度反映的是特征頻點的相對大小,因此設置固定判別閾值d為

式中,m為閾值因子;A0為正常信號幅值;fs為采樣頻率。恰當的m可使Td大于干擾頻點的動態測度且小于特征頻點的動態測度。為提高特征頻點的判別準確率,選取諧波、暫態振蕩兩類多頻擾動和頻譜泄漏最為嚴重的電壓中斷為研究對象,參照文獻[19-20]在Matlab中生成擾動信號各500組,信號時長0.2s,fs取6.4kHz,SNR為30dB,記錄n=9時電壓中斷、暫態振蕩擾動的SSR動態測度的次大值,以及諧波擾動特征頻點所對應的SSR動態測度的最小值,結果如圖3所示。由圖3可知,當n=9、m=5即Td=5時,MEWT的特征頻點捕捉能力可取得滿意效果。

表1 電能質量擾動基本信號模型

Tab.1 Basic signal models of power quality disturbances
由圖4可知,由于MEWT采用了頻帶平移增補策略,C0~C3和C6、C7單頻信號被分解為低頻分量BLIMF1和高頻分量BLIMF2,低頻分量幾乎完全保留了基波信號的時域特征,高頻分量中除噪聲污染外,暫態脈沖分量及暫升、中斷、暫降擾動的暫態過程也在其中得以體現。對于C4、C5多頻擾動,MEWT可準確判定其特征頻點,并將低頻分量BLIMF1和高頻分量BLIMF(≠1)從原始信號中依次分離出來,此處的低頻分量同樣為去噪后的近似基波信號,高頻分量中則包含各次諧波、暫態振蕩等擾動分量及噪聲污染。

2.2.1 低頻分量特征
鑒于MEWT所提取的低頻分量BLIMF1能夠有效保留PQ擾動中基頻信號的原始特征,本文從BLIMF1中提取特征1~7。
1)令()=|BLIMF1()|,為采樣點序號,=1, 2, …,(為PQ信號總采樣點數),基于雙閾值策略[7]在()中篩選極大值點,形成低頻分量極值點包絡序列Peak,其中橫閾值1=0,縱閾值2=s/4。以圖4d暫降擾動為例,其極值點包絡序列如圖5所示。由圖5可知,Peak能夠準確刻畫PQ擾動中基波信號的幅值變化情況,因此,本文從Peak中提取特征1~3。定義特征1、2分別為有效上穿越次數和有效下穿越次數。若Peak向上或向下穿越閾值1,且高于1的持續長度大于一個極值點,即為一次有效上穿越;同理,若Peak向上或向下穿越閾值2,且低于2的持續長度大于一個極值點,即為一次有效下穿越。本文取1=1.08、2=0.92。此外,將Peak中極值點(首、末兩元素也被視為極值點)所對應的序號從小到大依次記錄于序列中,計算Peak中相鄰兩極值點大小之差,可求得幅值波動序列為

式中,r=2,3,…,R(R為Peak中極值點總數);S(v)為第v次幅值波動大小,v=1,2,…,R-1。S(v)中大于閾值d3的元素數目即為特征F3,本文中d3=0.18。
2)采用長度為的滑窗可以求取低頻分量的有效值序列RMS,其計算過程為


結合各類基頻信號的時域特性可知,1~3可將基頻信號劃分為正常信號、暫升、暫降(含中斷)和其他擾動(閃變及含閃變的復合基頻擾動)四大類,4~7則可在此基礎上進一步對上述大類中的后兩個類別進行細分,從而完成所有基頻信號的準確劃分。
2.2.2 SSR動態測度特征
對于諧波、暫態振蕩等高頻擾動,其特征主要體現在頻域,且不受其他附加擾動影響,因此可從MEWT的SSR動態測度結果中提取特征8、9。
1)對于含諧波的PQ擾動,其諧波頻率所對應的SSR動態測度明顯大于其他不含諧波的擾動。考慮到實際電網可能存在頻率偏移,定義8為

式中,為所考慮諧波次數;l為基頻頻點所在位置,l=/(s)。
2)暫態振蕩也會使振蕩頻率所對應的SSR動態測度明顯升高,因此定義9為暫態振蕩所處高頻段400~1600Hz內SSR動態測度的最大值[20]。
2.2.3 高頻分量特征
MEWT的變換結果中除低頻分量外,還存在多條數量不等的高頻分量,從中可提取特征10~12。
1)定義特征10、11分別為最高頻分量BLIMF+1的最大值和峭度,當PQ擾動中存在暫態脈沖時,上述特征數值將明顯增大。
2)考慮到不同擾動在不同時頻面上的能量分布各不相同,定義高頻分量能量特征12如式(9)所示,用于輔助判別各類擾動。

與傳統基于Boosting思想的監督式樹模型算法類似,XGBoost通過多輪迭代與殘差擬合,將若干弱分類器集成為一個強分類器,具有良好的泛化性能和運算效率,其詳細原理可參見文獻[17]。需要指出的是,在XGBoost的梯度提升過程中,被選作分裂特征次數越多的特征重要度越高,因此,XGBoost可對所有輸入特征的重要度進行排序。


圖6 BR-XGBoost多標簽擾動分類模型訓練框架
針對不同的分類問題,特征選擇可有效去除特征集合中的冗余元素,從而起到提高模型泛化性能的效果。因此,本文基于前向序列選擇方法[17]對每個XGBoost進行特征選擇。對于標簽,首先基于XGBoost獲取全部特征的重要度排序,隨后依次將排序靠前的特征加入特征子集(初始為空集),并在每次添加后計算特征子集的交叉驗證分類準確率(Accuracy, ACC),若ACC提高則將該特征保留,反之剔除,遍歷所有特征即可獲取標簽的最優特征子集。
模型的表現除受到訓練集影響外,很大程度上還取決于其內置參數即超參數的選取。為避免人工調參的復雜與不確定性,本文在Pycharm平臺下調用分布式異步超參數優化模塊(hyperopt)[21],基于貝葉斯優化理論[17],采用交叉驗證方式,在確定各超參數范圍的基礎上對每個XGBoost進行調優,從而提升BR-XGBoost的模型精度。
綜上,結合特征選擇和超參數調優的XGBoost擾動標簽分類流程如圖7所示。
為驗證所提方法的有效性,本文依據IEEE 1159標準和文獻[19-20, 22],在Matlab中隨機生成正常信號、7類基本擾動、17類雙重擾動、17類三重擾動及6類四重擾動樣本各1 000條,從中隨機選取50%作為訓練集,剩余用作測試集。PQ信號基頻50Hz,采樣頻率6.4kHz,信號時長0.2s。XGBoost的學習目標選用“binary:logistic”,剩余參數均為默認值,BR-XGBoost及對比模型的構建與分析均在Python 3.8環境下實現。實驗計算機配置為Intel i5-8500 C(PU)和16GB RAM。

圖7 基于XGBoostj的擾動標簽分類流程
首先,在無噪訓練集下基于XGBoost獲取7類標簽各自的特征相對重要度如圖8所示。由圖8可知,1~6的重要度主要分布于C1~C3、C7等基頻擾動,而8~F10則分別對于擾動C4~C6,具有最高的重要度,這些均與擾動特征的設計初衷及其各自所蘊含的物理意義相符,驗證了所提特征的合理性。接著,基于不同標簽所對應的特征重要度排序結果,在5折交叉驗證下對不同標簽進行前向序列特征選擇。以標簽C1為例,其交叉驗證下的ACC指標隨特征子集中特征加入的變化情況如圖9所示。由圖9可知,除10、8、12和2由于導致準確率下滑而被剔除外,XGBoost的交叉驗證指標隨有效特征的不斷加入而逐漸提高。對不同標簽重復上述操作,求得無噪環境下各類擾動所對應的最優特征子集見表2。進一步地,分別采用最優特征子集和全部12維特征對BR-XGBoost進行訓練,求得各個XGBoost的平均交叉驗證準確率分別為99.52%和99.37%,充分反映了特征選擇對于分類器泛化性能的促進作用。

圖8 不同標簽所對應的擾動特征相對重要度

圖9 標簽C1的前向序列特征選擇結果
表2 不同標簽所對應的最優特征子集

Tab.2 Optimal feature subsets for different labels
基于貝葉斯優化理論,在經過特征選擇后的無噪訓練集下對每個XGBoost進行超參數調優,選取交叉驗證指標ACC最高的一組超參數作為最終參數,所涉及的超參數名稱、優化調整范圍及以XGBoost1為例的超參數優化結果見表3。
表3 超參數優化調整范圍

Tab.3 Optimal adjustment range of hyperparameters
圖10給出了無噪環境下超參數調優前后XGBoost的交叉驗證指標變化情況。從圖10中可知,除標簽C4、C6由于輸入特征維數較低而導致模型泛化效果提升空間不足外,剩余標簽的準確率指標均在參數調優后得到了進一步改善。

圖10 超參數調優前后XGBoostj性能對比
噪聲污染是PQ擾動分類在工程應用中所無法回避的重要問題。為驗證所提方法的噪聲魯棒性,分別向擾動樣本中添加信噪比為40dB、30dB和20dB的噪聲,在不同噪聲環境下均采用上述特征選擇與超參數調優相結合的方法訓練BR-XGBoost模型。最后基于測試集求得不同信噪比下PQ基本擾動、雙重擾動、三重擾動和四重擾動的分類準確率分別見表4~表6。
表4 基本擾動分類結果

Tab.4 Classification results of basic disturbances
由表4~表6可知,擾動分類精度總體隨擾動類型復雜度及背景噪聲強度的提高而逐漸降低。具體而言,當SNR≥30dB時,各類型擾動的平均準確率僅出現了輕微下降,即便對于20dB信噪比下的四重PQ擾動,本文模型的平均準確率依然可以達到94.1%,充分說明了所提方法良好的分類效果與抗噪能力。
表5 雙重擾動分類結果

Tab.5 Classification results of double disturbances
表6 多重擾動分類結果

Tab.6 Classification results of multiple disturbances
為驗證所設計模型訓練方法的有效性,分別采用不同模型訓練方法求得PQ復合擾動的平均測試準確率見表7。從中可知,在使用特征選擇與超參數調優相結合的模型訓練方法后,不同信噪比下的平均分類精度均有了不同程度的提高。
表7 擾動平均分類結果

Tab.7 Average classification results of disturbances
此外,考慮到實際電網中存在由基波頻率偏移現象,本文基于所設計的模型訓練方法,在30dB信噪比下對基波頻率偏移時(49.5~50.5Hz,步長0.1Hz)所提方法的準確性進行測試,結果如圖11所示。由圖11可知,隨著頻率偏移量的增大,不同擾動的平均分類準確率總體呈現輕微下滑趨勢,可見本文方法對于基波頻率偏移具有良好的耐受性能。

圖11 基波頻率偏移時的擾動分類結果
對于本文所采用的基于問題轉換策略的多標簽分類模型,其總體分類精度直接取決于各子分類器的性能。因此,分別選用C4.5決策樹、Adaboost、RF及GBDT等傳統樹模型作為子分類器,基于4.2節中所述模型訓練方法,在不同噪聲環境下對擾動樣本進行辨識,并將所得平均測試準確率與本文方法進行對比,結果如圖12所示。

圖12 不同分類器所得擾動分類結果
由圖12可知,DT在所有分類器中分類效果最差,剩余模型由于采用了集成學習策略,因而準確率良好,其中以XGBoost最為突出。此外,分類效率也是衡量分類器性能的另一重要因素,測得30dB信噪比下DT、Adaboost、RF、GBDT的耗時分別為0.053s、3.075s、1.216s、0.178s,而XGBoost的耗時則為0.127s,遜于分類效果較差的DT但優于其他集成樹模型,可見XGBoost在保證分類精度同時還兼具良好的分類效率。
為進一步說明所提方法的優越性,將本文方法與混合策略[23]、STFT-BRSVM[24]、DWT-MLRBF[25]、TQWT-BRRF[26]等現有復合擾動分類方法進行對比,結果見表8。從中可知,本文方法可依據少量特征對48類擾動進行辨識,且在30dB、40dB信噪比下均能取得最高準確率,僅在SNR=20dB時略低于文獻[26]??紤]到文獻[26]只計及了23類擾動,且不含閃變擾動,由此可見本文方法較之現有技術在可區分擾動種類及分類精度方面存在優勢。
表8 PQ復合擾動分類方法性能對比

Tab.8 Comparison of classification methods for multiple PQ disturbances
注:“—”表示對應文獻中無相應結果。
此外,以上述文獻共有的19類PQ擾動,總計19×500=9 500條測試信號為例,在30dB信噪比下對各類方法的分類處理時間進行分析,結果如圖13所示。就特征提取耗時而言,相較于集總經驗模態分解(混合策略)、STFT、DWT等傳統時頻分析方法,MEWT繼承了EWT在計算復雜度方面的優勢,與可調品質因子小波變換(Tunable Q-factor Wavelet Transform, TQWT)耗時相仿,但考慮到本文方法所需特征數目遠少于文獻[26],故耗時最短。在分類器耗時方面,XGBoost由于引入了正則項以限制模型復雜度,同時還支持多線程并行計算,因此相比于其他分類器耗時更短。由此可見,較之現有復合擾動分類技術,本文方法具有良好的實時性。

圖13 不同方法分類處理時間對比
以江蘇電網某110kV變電站電能質量監測裝置捕獲的125組單相PQ擾動實測信號為研究對象,對本文方法應用于工程實踐的可行性展開驗證。每組實測信號的采樣頻率均為12.8kHz,信號時長0.2s,且都已經過歸一化處理,其中兩組典型實測信號波形及其MEWT時頻譜如圖14所示。由圖14中可知,對于電壓閃變,MEWT能夠準確刻畫其時域幅值特征,對于電壓暫降+諧波復合擾動,MEWT則可對各模態進行有效分解,并從中提取暫降、諧波擾動的時頻域特征,可見其對于實測信號同樣具有良好的特征表達能力。
取相同規格的仿真信號對BR-XGBoost進行訓練,進而對實測信號的擾動類型進行辨識,測試結果見表9。進一步分析測試結果可知,由于對于凹陷幅值的定義相近,1組暫降擾動被標定為電壓中斷;1組閃變擾動由于幅值波動過大而被誤判為暫降+閃變;1組暫升+振蕩復合擾動由于振蕩分量能量過低而導致標簽丟失。由此可見,實測信號的不規則性導致本文方法的準確率較之仿真信號有所降低,但依然可以達到97.6%,表明了本文方法在工程實踐應用中的有效性與準確性。
表9 實測信號分類結果

Tab.9 Classification results of measured signals
本文提出了一種基于MEWT和BR-XGBoost的PQ復合擾動多標簽分類方法。首先,該方法針對傳統EWT存在的頻譜“過切分”現象,設計了一種結合SSR和動態測度的特征頻點篩選機制,以提升EWT對于復雜PQ擾動的特征表達能力。其次,充分考慮擾動疊加前后擾動特征的變化規律,在MEWT時頻分析結果基礎上構造能夠有效描述不同擾動特性的特征序列。此外,提出一種基于前向序列特征選擇和貝葉斯超參數調優的模型訓練方法,使BR-XGBoost的泛化性能得到進一步優化。實驗結果表明,較之現有多標簽擾動分類技術,本文方法在準確性、魯棒性及實時性方面優勢明顯,可滿足工程應用中海量PQ擾動事件的分類精度與效率需求。
現有研究暫未考慮高次諧波對擾動分類結果的影響,同時對所提方法在嵌入式系統中的應用討論較少,后續工作將重點對上述問題展開分析。
[1] 陶順, 羅超, 肖湘寧, 等. 電流物理分量理論改進方法及其在電能質量評估中的應用[J]. 電工技術學報, 2019, 34(9): 1960-1970.
Tao Shun, Luo Chao, Xiao Xiangning, et al. A modified current physical components theory and its application in power quality assessment[J]. Transactions of China Electrotechnical Society, 2019, 34(9): 1960-1970.
[2] 王鶴, 李石強, 于華楠, 等. 基于分布式壓縮感知和邊緣計算的配電網電能質量數據壓縮存儲方法[J]. 電工技術學報, 2020, 35(21): 4553-4564.
Wang He, Li Shiqiang, Yu Huanan, et al. Compression acquisition method for power quality data of distribution network based on distributed compressed sensing and edge computing[J]. Transactions of China Electrotechnical Society, 2020, 35(21): 4553-4564.
[3] 黃建明, 李曉明. 結合短時傅里葉變換和譜峭度的電力系統諧波檢測方法[J]. 電力系統保護與控制, 2017, 45(7): 43-50.
Huang Jianming, Li Xiaoming. Detection of harmonic in power system based on short-time Fourier transform and spectral kurtosis[J]. Power System Protection and Control, 2017, 45(7): 43-50.
[4] 肖賢貴, 李開成, 蔡得龍, 等. 一種電能質量擾動信號的聯合去噪算法[J]. 電工技術學報, 2021, 36(21): 4418-4428.
Xiao Xiangui, Li Kaicheng, Cai Delong, et al. A combined de-noising method for power quality disturbances events[J]. Transactions of China Electrotechnical Society, 2021, 36(21): 4418-4428.
[5] 李建閩, 林海軍, 梁成斌, 等. 基于雙分辨率S變換和學習向量量化神經網絡的電能質量擾動檢測方法[J]. 電工技術學報, 2019, 34(16): 3453-3463.
Li Jianmin, Lin Haijun, Liang Chengbin, et al. Detection method of power quality disturbances based on double resolution S transform and learning vector quantization neural network[J]. Transactions of China Electrotechnical Society, 2019, 34(16): 3453-3463.
[6] Gilles J. Empirical wavelet transform[J]. IEEE Transactions on Signal Processing, 2013, 61(16): 3999-4010.
[7] Thirumala K, Umarikar A C, Jain T. Estimation of single-phase and three-phase power-quality indices using empirical wavelet transform[J]. IEEE Transactions on Power Delivery, 2015, 30(1): 445-454.
[8] Thirumala K, Shantanu S, Jain T, et al. Visualizing time-varying power quality indices using generalized empirical wavelet transform[J]. Electric Power Systems Research, 2017, 143: 99-109.
[9] Thirumala K, Umarikar A C, Jain T. An improved adaptive filtering approach for power quality analysis of time-varying waveforms[J]. Measurement, 2019, 131: 677-685.
[10] 吳建章, 梅飛, 陳暢, 等. 基于經驗小波變換的電力系統諧波檢測方法[J]. 電力系統保護與控制, 2020, 48(6): 136-143.
Wu Jianzhang, Mei Fei, Chen Chang, et al. Harmonic detection method in power system based on empirical wavelet transform[J]. Power System Protection and Control, 2020, 48(6): 136-143.
[11] 徐艷春, 樊士榮, 譚超, 等. 基于改進EWT-CMPE的高滲透率主動配電網電能質量擾動檢測與分類[J]. 電網技術, 2020, 44(10): 3991-4000.
Xu Yanchun, Fan Shirong, Tan Chao, et al. Power quality disturbance detection and classification in high permeability active distribution network with improved EWT-CMPE[J]. Power System Technology, 2020, 44(10): 3991-4000.
[12] 周雒維, 管春, 盧偉國. 多標簽分類法在電能質量復合擾動分類中的應用[J]. 中國電機工程學報, 2011, 31(4): 45-50.
Zhou Luowei, Guan Chun, Lu Weiguo. Application of multi-label classification method to catagorization of multiple power quality disturbances[J]. Proceedings of the CSEE, 2011, 31(4): 45-50.
[13] 管春, 周雒維, 盧偉國. 基于多標簽RBF神經網絡的電能質量復合擾動分類方法[J].電工技術學報, 2011, 26(8): 198-204.
Guan Chun, Zhou Luowei, Lu Weiguo. Recognition of multiple power quality disturbances using multi-label RBF neural networks[J].Transactions of China ElectrotechnicalSociety, 2011, 26(8): 198-204.
[14] Luo Yi, Li Kaicheng, Li Yuanzheng, et al. Three layer bayesian network for classification of complex power quality disturbances[J]. IEEE Transactions on Industrial Informatics, 2018, 14(9): 3997-4006.
[15] Lin W M, Wu C H, Lin C H, et al. Detection and classification of multiple power-quality disturbances with wavelet multiclass SVM[J]. IEEE Transactions on Power Delivery, 2008, 23(4): 2575-2582.
[16] 劉翊楓, 周國鵬, 劉昕, 等. 基于智能相似日識別及偏差校正的短期負荷預測方法[J]. 電力系統保護與控制, 2019, 47(12): 138-145.
Liu Yifeng, Zhou Guopeng, Liu Xin, et al. A short- term load forecasting method based on intelligent similar day recognition and deviation correction[J]. Power System Protection and Control, 2019, 47(12): 138-145.
[17] Guo Junqi, Yang Lan, Bie Rongfang, et al. An XGBoost-based physical fitness evaluation model using advanced feature selection and Bayesian hyper-parameter optimization for wearable running monitoring[J]. Computer Networks, 2019, 151(14): 166-180.
[18] Gilles J, Heal K. A parameter less scale-space approach to find meaningful modes in histograms -application to image and spectrum segmentation[J]. International Journal of Wavelets, Multiresolution & Information Processing, 2014, 12(6): 1450044.
[19] 黃南天, 彭華, 蔡國偉, 等. 電能質量復合擾動特征選擇與最優決策樹構建[J]. 中國電機工程學報, 2017, 37(3): 776-786.
Huang Nantian, Peng Hua, Cai Guowei, et al. Feature selection and optimal decision tree construction of complex power quality disturbances[J]. Proceedings of the CSEE, 2017, 37(3): 776-786.
[20] Juan José González de la Rosa, Mu?oz A M, Gallego A, et al. Higher-order characterization of power quality transients and their classification using competitive layers[J]. Measurement, 2009, 42(3): 478-484.
[21] Bergstra J, Komer B, Eliasmith C, et al. Hyperopt: a Python library for model selection and hyperparameter optimization[J]. Computational Science & Discovery, 2015, 8: 1-24.
[22] Liu Zhigang, Cui Yan, Li Wenhui. A classification method for complex power quality disturbances using EEMD and rank wavelet SVM[J]. IEEE Transactions on Smart Grid, 2015, 6(4): 1678-1685.
[23] 張楊, 劉志剛. 一種基于時頻域多特征量的電能質量混合擾動分類新方法[J]. 中國電機工程學報, 2012, 32(34): 83-90, 13.
Zhang Yang, Liu Zhigang. A new method for power quality mixed disturbance classification based on time-frequency domain multiple features[J]. Proceedings of the CSEE, 2012, 32(34): 83-90, 13.
[24] 黃建明, 瞿合祚, 李曉明. 基于短時傅里葉變換及其譜峭度的電能質量混合擾動分類[J]. 電網技術, 2016, 40(10): 3184-3191.
Huang Jianming, Qu Hezuo, Li Xiaoming. Classification for hybrid power quality disturbance based on STFT and its spectral kurtosis[J]. Power System Technology, 2016, 40(10): 3184-3191.
[25] 瞿合祚, 劉恒, 李曉明, 等. 一種電能質量多擾動分類中特征組合優化方法[J]. 電力自動化設備, 2017, 37(3): 146-152.
Qu Hezuo, Liu Heng, Li Xiaoming, et al. Feature combination optimization for multi-disturbance classification[J]. Electric Power Automation Equipment, 2017, 37(3): 146-152.
[26] 楊曉梅, 郭林明, 肖先勇, 等. 基于可調品質因子小波變換和隨機森林特征選擇算法的電能質量復合擾動分類[J]. 電網技術, 2020, 44(8): 3014-3020.
Yang Xiaomei, Guo Linming, Xiao Xianyong, et al. Classification of multiple power quality disturbances based on TQWT and random forest feature selection algorithm[J]. Power System Technology, 2020, 44(8): 3014-3020.
Recognition of Multiple Power Quality Disturbances Based on Modified Empirical Wavelet Transform and XGBoost
Wu Jianzhang1Mei Fei2Zheng Jianyong1,3Zhang Chenyu4Miao Huiyu4
(1. School of Electrical Engineering Southeast University Nanjing 210096 China 2. College of Energy and Electrical Engineering Hohai University Nanjing 211100 China 3. Suzhou Research Institute of Southeast University Suzhou 215123 China 4. State Grid Jiangsu Electric Power Co. Ltd Research Institute Nanjing 211103 China)
Aiming at the shortcomings of multiple power quality disturbances classification method in terms of classification number and classification performance, a recognition method of multiple power quality disturbances based on modified empirical wavelet transform (MEWT) and extreme gradient boosting (XGBoost) was proposed. Firstly, the traditional empirical wavelet transform was improved to make it suitable for feature extraction of multiple disturbances. Then, according to the MEWT analysis results of basic disturbances, feature sequences which can effectively depict different disturbance characteristics were extracted from time and frequency domain. Finally, a multi label classification model for multiple disturbances with XGBoost as sub classifier was constructed based on the problem transformation strategy, and the model training method combining feature selection and hyperparameter optimization was used to further improve the effect of classification. The experimental results show that the proposed method can effectively identify 48 types of disturbances. Compared with the traditional multi label disturbance classification method, the proposed method performs better in classification accuracy and noise robustness, and has faster operation speed, which is suitable for engineering practice.
Multiple power quality disturbances, empirical wavelet transform, scale-space representation, multi label classification, XGBoost
10.19595/j.cnki.1000-6753.tces.201363
TM76
江蘇省重點研發計劃(BE2020027)、國家電網公司科技(52199918000C)和國家重點研發計劃(2018YFB0905000)資助項目。
2020-10-12
2021-03-21
吳建章 男,1996年生,博士研究生,研究方向為電能質量信號檢測與分析。E-mail:wujianzhang@seu.edu.cn(通信作者)
梅 飛 男,1982年生,講師,博士,研究方向為新能源發電技術、電氣設備在線監測與故障診斷。E-mail:meifei@hhu.edu.cn
(編輯 赫蕾)