劉建華,劉艷梅,馮純純,李錦程,張屹修
(中國礦業大學 電氣與動力工程學院, 江蘇 徐州 221008)
隨著我國智能電網產業結構的升級,無論配電還是發電環節都在向自動化方向發展,在自動化實現的過程中,電力系統應用到了大量的非線性電力電子元件,同時直流輸電技術和FACTS技術也廣泛應用于實際工程中,這些都會給電力系統帶來諧波和電壓波動等影響,降低了電網的電能質量[1]。這些也會對電能的生產、傳輸、分配和使用帶來影響,甚至引發嚴重的電力事故,造成巨大的經濟損失。因此對電能質量進行預警顯得尤為重要,對降低電力事故、提高電力企業的市場競爭力和滿足用戶的供電要求也具有重要的意義。
在電能質量研究方面,目前主要集中在電能質量監測系統,擾動源識別、分類,信號去噪,治理技術等方面[2-6],而電能質量預警閾值方面的研究很少,文獻[7]提出了基于模糊聚類算法的閾值設定方法,此方法在建立模糊相似矩陣的基礎上構造動態聚類圖對電能質量數據進行分類,雖然此方法可以達到閾值選取的目的,但模糊矩陣及動態聚類圖的的建立過程繁瑣,算法復雜,文獻[8]將圖像灰度分割領域的知識運用到電能質量預警閾值分割,應用Otsu算法,根據類間方差最大和類內方差最小的特性將電能質量數據進行二分化即分為正常和異常類,在此基礎上確定客觀閾值。雖然文獻[8]比文獻[7]算法更容易實現且能夠取得很好的效果,但文獻[8]涉及的電能質量數據過于理想化,實際數據的偏峰度值并不符合文獻[8]所述情況,這容易導致分類的誤差,當異常和正常類之間的偏峰度值差別不明顯時,使用文獻[8]的方法有可能導致錯誤的結果,同時文獻[8]的方法需要遍歷所有可能分類的均值和方差,計算量大,分類時間長。
文中提出將k中心聚類的方法應用到數據的二分化當中,只需要取k=2就可以把數據分為正常和異常類,該方法能夠有效地逼近真實的分類模型,基于此方法確定的客觀閾值與文獻[8]中所提方法相比較,該方法效果理想且能提高計算效率,算例結果表明所提方法的有效性。
從電能質量監測平臺所得數據需經預處理之后再運用k中心點聚類算法,此時得到的預警閾值較準確且能夠減少算法的復雜度,數據預處理的步驟包含以下幾步:
(1)穩態電能質量預警指標的選取參考文獻[10]進行,對得到的電能質量數據判斷其完整度,如果數據不完整,要填補缺失數據,一般以前后數據的平均值代替,數據完整的前提下利用小波變換法對數據去噪聲處理,最后對數據歸一化處理;
(2)計算一定窗口內電能質量數據集合的特征量,包含最大值、最小值、平均值、標準差、偏度,峰度、偏峰度乘積;
(3)利用公式(1)計算兩兩基本樣本之間的歐氏距離,設置一定的差異度限值,不超過限值的樣本歸為一類,將基本樣本集合分為L類,數據經預處理后的方便后續的分析計算。
(1)
式中pj、oij表示集合p、oi的第j個特征量;m是特征量個數。
k-medoids聚類算法是一種把實際數據集合中的k個對象作為中心點或中心對象進行劃分的k中心點聚類算法,其分類的方法是,給定數據集合V={p1,p2,…,pL},L是待分類的數據集合個數,pi={pi1,pi2,…,pim},m是數據集合pi的特征值個數,以任意的k個數據集合作為初始聚類中心,以其余對象到所選中心對象的距離作為聚類相異程度的度量[9],其定義為:
(2)
式中disp(p,oi)是對象p、oi之間的歐氏距離;ci是第i個分類集合;oi是ci的中心;k表示將所有數據分為k個集合,具體分類步驟為:
(1)從數據集合V中任k個對象作為初始聚類中心點(o1,o2,…,ok);
(2)計算剩余其余L-k個對象到各中心點的歐氏距離,計算公式為式(1),比較各歐氏距離的大小把剩余L-k個對象指派給離對象最近的中心點所代表的集合,所有對象分配完畢,計算Eabs;


(5)重復步驟(3)~步驟(4),直到所得相異程度值最小為止結束。
設置電能質量預警閾值的目標是將監測得到的電能質量數據進行分離,由于監測數據中正常和異常兩類數據間特征值差別較大,而同一類數據的特征值都在一定小范圍之內波動,電能質量監測數據的這種良好的聚類特性特別符合k-medoids聚類算法的要求,因此提出了基于k-medoids聚類的閾值算法。
k-medoids聚類算法中的k值選取是一個值得謹慎考慮的問題,在實際應用中k值的選取常常需要根據智能算法或專業知識確定,在電能質量預警閾值選取的問題上,k被取值為2正好達到分割的目的。
利用k中心點聚類算法,將通過電能質量監測平臺得到的N個數據分成兩類,即:正常和異常類。將分類的質量度量函數定義為:
F=min(Eabs)
(3)
(4)
式(4)是分類的絕對誤差,ci為正常類或異常類,oi是ci的中心點。歐氏距離的計算采用公式(1)。由定義可知,當Eabs越小時越符合實際分類模型。
基于k中心點聚類的閾值確定算法具體過程為:在數據預處理已經被分為L類的前提下,隨機選擇兩類數據作為分類的初始中心,對于其余的L-2類數據使用公式(1)分別計算其到兩個中心的距離,依據距離中心點的遠近,把L-2類數據分到離其最近的中心點所在的集合中,這樣所有數據被分為兩類,然后使用公式(4)計算本次劃分的絕對誤差Eabs。上述過程迭代進行,每次迭代總是選擇能使絕對誤差變小的聚類劃分結果,直到絕對誤差值不能再小為止[11-12]。
采用基于k中心點聚類的分類算法迭代結束后,都能夠找出數據分類的一個合理閾值點。該算法的迭代次數因初始中心點的選擇而不同,初始值選擇的與理想值接近,則較少的迭代次數就能獲得較理想的分割效果,但如果初始值與理想值相差較遠,則迭代次數比較大,最壞情況下需要遍歷所有的組合情況,文中的L類數據最多迭代L*L次才能找到最佳閾值分割點。為了能夠使數據分類效果達到最佳,可以增大算法的迭代次數,但這就會增加計算的時間。針對該算法本身固有的缺陷,將該算法進行優化改進,提出了更適合電能質量閾值確定的k中心點聚類快速閾值算法。
k-medoids聚類的快速閾值算法基于這樣一個假設:具有所有數據最大值的一類數據始終屬于異常類數據的中心。從實驗數據來看,該假設對于絕大部分的電能質量數據都是成立的。該算法考慮了數據分布密度,最多迭代L次就夠找出最佳閾值分割點,算法的效率和精度相比基于k-medoids聚類的算法得到了極大的提升,解決了算法時間運行時間長的問題。基于k-medoids聚類的快速閾值分割算法的具體過程為:首先在1~L類數據之間統計出所有數據最大值所在的那一類數據記為o1,然后依次遍歷1~L類之間的每一類數據記為oi,在迭代過程中,依據距離中心點o1和oi的遠近將其他數據分別聚類到o1和oi所代表的集合中,計算每次劃分的絕對誤差Eabs,最后選取具有最小絕對誤差的那次劃分結果作為最后的結果[13]。
從以上內容可以看出,基于k-medoids聚類的快速閾值分割算法確定最終客觀閾值時仍要計算各初始類之間的歐氏距離,數據預處理時各窗口已經根據特征值大致分類,數據的屬性在分類過程中已經固定,同時考慮到最終選取的客觀閾值是正常類數據的最大值,因此進行二分化聚類計算時只需要選擇最大值來計算各類數據的歐氏距離和分類的絕對誤差,該算法的步驟如下:
(1)將電能質量數據中最大值所在的類作為一個固定的中心點,令o1=max(pi);o2=0,此時絕對誤差為正無窮大記為E0;
(2)從 1~L類選擇一類作為正常類中心點,即:o2=pi;i=1,2,…,L;選擇好中心點之后,計算其余類pj到兩個中心點的距離,(j=1,2,…L)&(i≠j);
(3)若滿足 dist(pj,o1) (4)若滿足Eabs (5)選擇具有最小誤差的分類結果作為最終結果,同時選擇正常類的最大值作為電能質量的客觀閾值。 采用對某焦化廠連續六小時監測得到的負序電壓不平衡度為例,數據如圖1所示,簡述了穩態電能質量預警閾值算法的有效性,并與文獻[8]的分割效果進行對比。 圖1 電能質量原始數據Fig.1 Original data of power quality 預處理:本例中共有120個數據,數據連續完整,以每個窗口10個數據進行劃分得到12個窗口數據,計算每個窗口的特征值,采用公式(1)進行處理初始聚類分析,可得結果如表1所示。 表1 初始聚類結果Tab.1 Initial results of cluster 采用文中的快速閾值分割方法,以第8類數據的最大值作為異常類的中心o1,不同的o2時對應的絕對誤差為表2所示。 表2 不同分類中心對應的分類結果和絕對誤差Tab.2 Classification results and absolute errors corresponding to different classification centers 由表2可以看出,當以第8類數據作為異常類中心,以第5類作為正常類中心時分類的絕對誤差最小,選擇此分類作為最終數據二分化分類的結果,最終,選擇前五類中最大值作為客觀閾值,即t0=0.103 2 %。 采用文獻[8]方法,所得結果和文中分割結果相同,但采用基于Otsu的客觀閾值算法,需計算不同分類時的數據均值和方差,只要計算不同分類中心時最值之間的絕對誤差即可,提高了計算效率。把文中的方法和基于Otsu的客觀閾值算法進行比較,其結果如表3所示。 表3 2種方法的閾值和運行時間比較Tab.3 Comparison of threshold and running time of 2 methods 上述正常和異常數據之間偏峰度差別較大,有較好的分割效果,但當二者之間差別較小時,采用文獻[8]方法有可能出現誤差。僅取上例中部分數據(前110個)為例,采用文中方法和基于Otsu方法的閾值選取結果如表3所示。 實驗結果表明,基于Otsu的閾值分割算法對兩類偏峰度差別較大的數據來說有較好的分類結果,但如果異常數據的偏峰度值較小則基于Otsu的算法會使原有數據的有效信息喪失,基于k心點聚類的閾值分割算法不考慮正常和異常類的距離,其分割效果優于Otsu算法,但k中心點聚類算法在閾值分割時效率不盡人意,而改進的快速k中心點聚類算法則保證了分割效果,也將效率提高到比Otsu算法更高的水平。 在客觀閾值的基礎上,可綜合考慮專家意見給出的主觀閾值[8],結合客觀閾值,利用比例加權的方法得到更加合理的預警閾值,最終計算公式為式(5),以圖1數據為例,得到最終閾值為t=0.089 5 %。 t=a*t0+(1-a)*t1 (5) 式中t0是客觀閾值;t1是主觀閾值,本例中t1取0.08%。 通過k中心點聚類的快速閾值算法得到電能質量數據的客觀預警閾值,是閾值選取中最為重要的一步,最終通過綜合專家意見結合比例加權法得到最終閾值,所得閾值符合實際,克服了以往單一且存在一定主觀性的專家賦值的弊端,是電能質量預警平臺的建立的基礎,提出的是一種快速有效的閾值分割算法,以某一焦化廠的實測數據為例驗證了所提方法。最后,因電能質量異常數據形式多樣,在接下來的研究中考慮對該方法進行優化,使其更好的適用于電能質量預警平臺的建立。3 案例分析




4 結束語