(遼寧工程技術大學 電氣與控制工程學院,遼寧 葫蘆島 125105)
電氣設備中的線路在運行中如果存在絕緣碳化,外界引起的空氣電離、短路等情況,均有可能導致故障電弧,而故障電弧是引發電氣火災的主要原因。據統計,2016年我國共發生31.2萬起火災,其中由電氣原因引發的火災9.5萬起,占火災總數的30.40%[1]。由此可見,準確地識別故障電弧對用電安全、預防電氣火災具有非常重要的意義。
現階段故障電弧識別方法有:基于小波變換能量與神經網絡結合的方法,對采集的信號進行小波分解,將各層細節信號能量的平均值和標準差輸入BP神經網絡后構成小波神經網絡,實現不同負載的測試樣本識別[2];基于支持向量機(SVM)的故障電弧識別,將采集到的電流數據訓練基于支持向量機的故障電弧識別模型,對線性負載和非線性負載回路中的故障電弧的特征識別[3];基于遺傳算法優化BP神經網絡的故障電弧識別[4];基于電弧電磁信號的故障電弧識別方法,通過故障電弧時域信號的模最大值提取,得到故障電弧的電磁輻射信號特征值進行識別[5];采用離散小波變換來獲得線電流波形的時頻域特征,以反映串聯型故障電弧,然后用一些實測數據對徑向基函數神經網絡進行訓練識別[6];基于電設備放電與紫外線輻射的關系,提出了用紫外脈沖法檢測開關齒輪電弧故障的方法,這種新技術的開關柜保護系統通過分析電弧產生的紫外線,檢測出電弧故障[7]等。
本文的方法在故障電弧識別方面是第一次應用,將實驗數據提取特征后,訓練經過遺傳優化EM的高斯混合模型,得到故障特征模型和正常特征模型,然后,將要識別的數據輸入到已經得到的模型中,利用概率最大的分類方法,判斷數據的故障與否。實驗結果表明該方法在故障電弧識別方面有很大的應用價值。
為了得到故障電弧電流數據,按照UL1699搭建串聯型故障電弧實驗裝置,實驗裝置圖如圖1所示,其原理圖如圖2所示。兩個電極材質分別是銅和碳,通過步進電機來轉動控制兩個電極,實現靜止電極和固定電極的距離從相接觸到漸漸分離,從而產生串聯型故障電弧,在此過程中通過實時數據采集卡對電路中的實時電流進行采集。

圖2 實驗原理圖
實驗在實驗室環境下進行,負載采用RL負載柜,電壓為36 V,在不同電流數值下,通過調整負載柜的功率因數,獲得不同狀態下的故障電流和正常電流數據。實驗方案條件如表1所示。

表1 實驗條件
典型電流波形如圖3所示。負載回路中發生故障電弧時,電流幅值發生了明顯的波動,并出現了短暫的“零休”現象;在不同實驗條件和故障電弧的穩定性下,故障電流圖像會有所不同,但均出現了波峰幅值減小、波動等故障電弧的典型特征。
由于采用的是訓練模型的方法,以及故障電弧的隨機性和隱蔽性,所以要采集大量實驗數據。實驗中共采集總數據3231組,其中正常電流848組,故障電流2383組。

圖3 典型電流波形圖
由于發生故障電弧時電流信號夾雜了大量噪聲和諧波信號,難以準確地提取特征,所以必須對采集到的原始數據進行數據預處理。對于故障電流信號的特征提取的主要方法是小波變換和傅里葉變換。傅里葉變換忽略了信號的時域特性,而小波變換兼顧了信號的時域和頻域變化,故使用小波變換做數據預處理[8]。
利用MATLAB中的ddencmp函數指令對電流信號進行閾值降噪,再使用wdencmp函數指令對電流信號所選用的db4小波包進行3層分解,圖4為降噪前后的電流波形圖。經過降噪處理后的故障電流信號中明顯噪聲得到了有效的消除,并且其原有特征(比如“平肩部”)得到了完好的保留。

圖4 降噪前后電流波形圖
然后將db5分解為4層信號,從分解的多層信號中提取出既包含電流信號的主要趨勢又包含電流信號中干擾噪聲信號的分量來進行特征值提取,圖5為小波4層變換細節信號。取高頻信號A4和低頻信號D4、D3、D2、D1來進行特征提取[9]。
由于電流信號的變化是不規則的,所以引入了近似熵去量化其不規則程度。圖6為近似熵計算流程圖。其中:
① 向量之間的關聯程度Ci(m,r)為
(1)
式中,h為Heaviside函數;r為相似容限。
② 矢量序列{X(n)}的平均自相關程度Φ(m,r)為
(2)
③ 近似熵Sr為
Sr=Φ(m,r)-Φ(m+1,r)
(3)
通過上述操作,將提取到的各層電流細節信號的近似熵構造成故障電弧的特征向量,并輸入到遺傳優化EM的高斯混合模型。
高斯混合模型(Gaussian Mixture Model,GMM)是一種很常用的聚類分析方法,它認為樣本的概率密度是由幾個高斯模型加權之和組成的。每個高斯模型就代表了一個類,然后把樣本數據在各個高斯模型上分別進行投影,繼而得到樣本數據在各個類別上的概率情況。得到概率后可用各種不同的模型對觀察到的事

圖5 4層小波變換示意圖

圖6 近似熵計算流程圖
物和現象做判決選取概率最大的類所為判決結果[10]。GMM執行的運算過程就是訓練出幾個概率分布。GMM的定義為
(4)
式中,K為模型的個數;πk為第k個高斯的權重;P(x|k)為第k個高斯概率密度,其均值為μk,方差為σk。對此概率密度的估計就是要求出πk、μk、σk。當求出P(x)的表達式后,求和式的各項結果就分別代表樣本x屬于各個類的概率。
對于GMM,在k已知的情況下,EM(Expectation-Maximization,期望最大)算法是一種有效的估計參數方法[11],算法流程如下:
(1) 初始化。
協方差矩陣Cj0設為單位矩陣,每個模型比例的先驗概率αj0=1/M;均值μj0設為隨機數。
(2) 估計步驟(E-step)。
令αj的后驗概率為
(5)
(3) 最大化步驟(M-step) 更新權值、均值和方差矩陣。
(6)
(7)
(8)
(4) 收斂條件。
不斷地迭代步驟(2)、步驟(3),重復更新上面3個值,直到P(X|Ф)-P(X|Ф)′<ε,其中P(X|Φ)′為更新參數后計算的值,即前后兩次迭代得到的結果變化小于一定程度則終止迭代,通常ε=10-5。
然而,EM算法的最大缺點就是在很多情況下只能收斂到局部最優解,所以將遺傳算法引入到了EM算法中。
遺傳算法(Genetic Algorithm,GA)是一種參考生物界自然選擇和自然遺傳機制的隨機化全局搜索方法。GA主要包含遺傳變異、適者生存、進化概念3方面內容,其主要執行選擇、交叉和變異3個步驟[12]。理論研究表明,在進化過程中使用保留最佳個體策略的GA能收斂于最優解的概率是趨向于1。所以將GA中的復制變異應用在優化EM參數估計上。
算法的過程是將遺傳算法應用在GMM上,采用和諧函數作為適應度的度量,與此同時選用復制(保留沒有的高斯)和變異(將高斯執行過程)兩種遺傳算子。
其基本思想為:訓練所有樣本,從一個高斯分布開始,然后進行高斯,直到滿足達到設定好的k值終止。
主要有兩個步驟:一是通過一種全局搜索方法,找到現有GMM中的某個高斯分布進行,找到新分量合適的初始參數;二是用EM估計,重新定義新分量的參數并使其達到最大似然值[13-15]。參數優化過程為:
(1) 初始化,賦值K=1;對高斯模型隨機進行一次分裂,得到兩個新的初步的高斯分布;
(2) 在兩個高斯分布中隨機選取一個中心點,比較該類內每個點與新舊兩個中心點的歐氏距離,與距離近的形成一類,這就形成了兩個更加準確的高斯分布。樣本x歸為第j個高斯的條件是,當且僅當q(j|x)=maxiq(i|x),其中:
后驗概率為
(9)
樣本xi和xj之間的歐氏距離為
(10)
(3) 使用EM算法對新產生的高斯進行參數優化;判斷是否達到了迭代終止條件P(X|Ф)-P(X|Ф)′<10-5,如沒達到返回執行(2),依次循環下去。此為遺傳過程;
(4) 選擇具有最佳適應度的后代進行復制并加以保留,這樣,每次結束后K值加1。當然,新增高斯之后的模型適應度要大于之前的結果,否則取消[16],輸出參數。
整體算法流程圖如圖7所示。

圖7 整體算法流程圖
4.1.1 訓練過程
訓練模型的目的是在識別程序輸入運行時的電流數據(故障電流數據和正常電流數據),然后按照特征的不同形成分類,即故障模型和正常模型。訓練指的是利用收集的電流樣本數據讓計算機學習如何對電流值進行分類。
4.1.2 測試過程
測試是將要識別的數據輸入已經訓練過的模型,然后模型按照訓練時的分類特點對所要識別的數據進行概率最大分類,按照測試的順序輸出結果:正常,輸出為norm current,故障,輸出為fault current。
識別結果如表2所示。

表2 識別結果
由表2容易看出,遺傳優化的GMM算法對故障電弧的識別效果顯著,識別率在91%~99%之間,實現了算法高效的識別故障電弧的目的。采集的數據特征和訓練時采用的數據數量不同,都會影響到識別率。
① 數據特征:在穩定和不穩定時采集到的數據其特征相差較大,穩定時的特征具備故障電弧的大多數特征,而不穩定時的特征變異較大,所以會影響識別率。
② 訓練數據的數目:訓練數目越多,尤其是故障電流數據,會訓練更多電流特征,建立更完善的訓練模型,分類會更加準確,識別率會更高。
根據故障電弧的電流信號的特點使用小波變換和近似熵計算來提取特征向量,再把提取到的特征向量輸入遺傳優化EM后的GMM,對故障電弧進行識別。由結果可見,此方法對于特征明顯的故障電弧信號識別率可高達99.5%,而對特征特別不明顯的故障電弧信號也能達到91.1%,實現了故障電弧的有效識別。隨著樣本數據的增多,訓練數目增加,識別率還會進一步提高。所以,此方法能夠對故障電弧進行有效識別。