徐穎敏 姚林朋 錢勇 黃成軍 江秀臣
(上海交通大學 電氣工程系,上海 200240)
交聯聚乙烯(XLPE)電纜作為輸送電力的主要設備,其絕緣系統的好壞直接決定了整個城網送電系統能否安全運行。在XLPE電纜的某些薄弱部位,強電場作用極易引起局部放電。如果局部放電持續存在,一定條件下會導致絕緣劣化甚至擊穿。局部放電是電纜設備監測的重要參量,從局放信號中提取的特征參數能有效地反映XLPE電纜絕緣狀態。因此,對局部放電信號進行模式識別以及時發現電纜運行中存在的缺陷故障,對于XLPE電纜的可靠運行具有重要意義[1,2]。
在目前局放模式識別中,神經網絡[3],決策樹[4]等算法得到廣泛應用。但是傳統的分類方法僅使用特定的某種分類器進行分類,當先驗知識不足時,很難選擇最優的分類器。針對這一問題,本文采用多分類器融合的方法進行局放模式識別,有效地提高了整個系統的分類精度。
人工神經網絡作為人工智能技術的一個分支,具備非線性系統的自學習能力,在難以建模的復雜識別等方面具有不可替代的優勢。Rtunelhart等人提出了多層感知器神經網絡[5]的拓撲結構,為神經網絡的研究開創了新思路。多層感知器神經網絡由輸入層、隱含層和輸出層組成,其中隱含層可含有若干子層。
在本文中,結合特征參數的數量及訓練時間,采用多層感知器模型作為基本分類器。在該模型中,輸入層負責輸入信號的變換傳遞,隱含層完成數據處理,后由輸出層將輸出信號進行加權后聚合為神經網絡的輸出信號。本文采用反向傳播算法作為訓練算法。該算法結構簡單,且操作性強,能模擬任意的非線性輸入輸出關系,是一種較為成熟的學習算法。
多分類器融合算法通過綜合多個分類器得到的分類信息,得出最終的分類結果。這一分類算法避免了單一分類器可能存在的片面性,有效提高了系統的分類精度。Freund等人提出Boosting算法[6],通過改變訓練樣本的樣本分布和權重,將弱學習算法提升為強學習算法。Freund和Schapire提出了基于Boosting算法的AdaBoost算法[7],克服了Boosting算法在訓練前需獲得基本分類器的識別率下限的問題。由于基本分類器的識別率下限在實際應用中很難預測,AdaBoost算法的這一改進大大提高了其適用性。
本文采用的基于AdaBoost的多感知器神經網絡融合模式識別算法原理如圖1所示。其基本設計思想如下:將多個分類能力一般的多感知器神經網絡分類器作為基本分類器,采用AdaBoost算法針對不同的訓練集訓練同一個基本分類器(弱分類器),逐步修正分類器的分類錯誤率,然后把不同訓練集上得到的分類器集合后得到一個強分類器。該算法通過調整每個樣本的權重來獲取不同的訓練集,初始狀態時,樣本的權重值相同,基于此分布可訓練出基本分類器h1(x)。此時,對于h1(x)錯分的樣本,則增加對應樣本的權重,反之則降低其權重。同時,根據h1(x)識別率設定分類器的權重,錯分的越少則該基本分類器的權重越大,即重要程度越高。重復上述過程T次,可得到T個基本分類器

圖1 基于AdaBoost的神經網絡融合算法

根據權重進行累加后可得到強分類器。
該算法的設計流程描述如下
(1)權值初始化。設樣本均勻分布,則權值

Di(i)表示在i次迭代中賦給樣本(xi,yi)的權值。
(2)基本分類器訓練。將多感知器神經網絡作為基本分類器,記為hi(hi為第i次迭代時的神經網絡分類器)。
(3)確定迭代次數。可根據算法實際的分類錯誤率選擇合適的迭代次數,記為T。
(4)執行fort=1 to T
① 在訓練集(St為第t次迭代時基本分類器的訓練樣本)St上訓練分類器ht,用分類器ht對訓練集S中的所有樣本分類。
② 得到本次迭代的分類器ht,誤差

則分類器權重為

③ 更新樣本權值

其中Zt為一個正規因子,使得

(5)輸出結果。分類函數

即對T個神經網絡分類器輸出結果進行加權投票。
目前,XLPE電纜局部放電的測試和研究表明以下情況易產生局部放電現象:電纜內部氣隙在長期工作電壓下,由于壓力變化發生移動和形變,進而極易生成電樹,導致絕緣破壞和擊穿;由于電纜制造工藝和安裝質量等原因,容易在電纜頭中出現懸浮電極,出現電極放電現象;同時,在線路設計、電纜鋪設等情況下發生的電暈放電會直接導致電纜絕緣性能的下降;此外,電纜的表面放電和滑閃放電等也是造成絕緣事故頻發的缺陷類型。
為了驗證本文提出的模式識別方法的有效性,針對上述情況,設計出了導致XLPE電纜發生局放電的4種典型缺陷模型:內部氣隙放電,懸浮電極放電,表面放電以及電暈放電模型。
實驗中以10kV的XLPE電纜為研究對象,在電纜頭中人工制作這幾類絕緣缺陷。圖2為電纜頭的缺陷模型示意圖,具體制作過程如下:剝開電纜的金屬屏蔽層和外半導體層,針刺XLPE絕緣約1/2左右,作為內部氣隙放電模型;用長條銅片作高壓電極和地電極,固定在XLPE絕緣與硅橡膠之間,通過加壓來測試懸浮放電模型;從導線芯引出約15mm長條銅片作為滑閃通道并固定在XLPE絕緣與硅橡膠之間模擬表面放電。電暈放電則在連接電纜終端頭的高壓導體上懸掛針尖,模擬電暈放電模型。

圖2 電纜頭的絕緣缺陷模型
本文采用脈沖電流檢測方法采集局放信號,局放試驗回路及信號采集系統如圖3所示。

圖3 局放試驗系統結構示意圖
依照圖3所示的系統結構搭建試驗平臺,采用脈沖電流檢測方法采集局放信號。基于不同的起始電壓測試四種電纜缺陷,每次連續測量50個工頻周期,而后將多個工頻周期的放電信號疊加進行歸一化。基于工頻相位φ和放電量q統計q-φ平面上各區間內的放電次數n,得到Hn(q-φ)三維圖譜。
從三維圖譜Hn(q-φ)提取出最大放電量相位分布(Hqmax(φ)),平均放電量相位分布(Hqmean(φ)),放電次數相位分布(Hn(φ))以及放電量次數分布(Hqn(φ))四種二維圖譜。為了從二維圖譜中計算特征參數,將圖譜根據相位信息劃分為正負半周,φ代表隨機變量,q和n代表概率密度,根據概率密度分布函數計算相關的統計特征。
偏斜度Sk(Skewness)和陡峭度Ku(Kurtosis)表示了圖譜相對于正態分布的差異度,互相關因數cc(Cross-correlation factor)和放電量因數Q[8]則表示了放電正負半周的相似度。在二維圖譜中選取上述4種特征參數,共得到20個特征其中,下標對應于二維圖譜的下標,上標表示放電的正負半周。

為了盡可能全面地反映局放信號的特征信息,本文選取了20組特征參數作為模式識別的樣本數據。而當樣本特征維數過高時,會加大系統的計算量從而增加系統的識別時間,選取適當的降維方法可降低樣本數據的冗余度以提高識別速度。其中,主成分分析(Principle Component Analysis,PCA)[9]是最為常用的一種線性映射方法。
為了盡可能完整地表示數據特征,需借助協方差矩陣來判斷各特征參數之間的冗余度,協方差矩陣包含了所有特征變量之間的相關性度量,于是可對各特征參數的重要性進行排序,去除貢獻率小的特征變量,達到降維的目的。PCA方法即通過尋找一組正交基P,來表示原始數據集X,以對協方差矩陣進行優化,降低變量間的相關度,選取方差最大的方向作為判別矢量來實現數據的特征提取。具體步驟如下:
(1)設數據集為m×n的矩陣。對應n條絕緣缺陷記錄,每條記錄包含m個特征變量,即每條記錄可表示為一個m維的行向量。
(2)在矩陣行向量上減去該向量的平均值得到矩陣X,對XXT求特征值λ和特征向量v。X的主元即XXT的特征向量。
(3)前k個主元的累計貢獻率定義為

設定累計貢獻率的最小值,即可選取前k個主元代替原始數據集,達到降維的目的。
絕緣缺陷的記錄共有4種缺陷類型,每種類型各100條樣本,共計400條。其中,每個樣本包含20個特征參數。同時采取10折交叉驗證法檢驗識別率。
將多層感知神經網絡作為基本分類器,隱含層數目為3層,隱含層節點數為4,學習率為0.3,訓練次數為1000次。
(1)調整AdaBoost算法的迭代次數,識別率隨其變化的曲線如圖4所示。可以看出隨著算法迭代次數的增加,即神經網絡基本分類器數目的增加,算法識別率逐漸增加,當到達一定值后,識別率的變化趨向于平衡。根據這一變化曲線,將迭代次數選為6次,此時,識別率基本處于最高值。

圖4 識別率隨迭代次數的變化曲線
(2)采用主成分分析法降維,當累計貢獻率為99%,95%和80%時,維數分別降至6維,3維和2維。應用AdaBoost算法對降維后的缺陷數據進行識別,結果如表1所示:

表1 不同維數樣本的識別性能
由表中數據分析,當累積貢獻率在80%(2維)時,識別性能有明顯下降,而當累積貢獻率在95%和99%時,AdaBoost方法的識別率有所降低但仍接近最高值,而此時維數分別降至3維和6維,與原始缺陷數據相比,維數已經大大縮減。同時,當維數減少時,采用AdaBoost算法進行識別的時間也大大縮短。因此采用PCA方法對樣本集進行預處理的方法能有效降低樣本維數而不會對識別結果造成較大影響,并可有效地縮短訓練神經網絡基本分類器的時間。
從識別率對基于AdaBoost的神經網絡融合算法和多層感知器神經網絡單一分類器進行對比,采用經過主成分分析法的缺陷樣本。僅采用多層感知器模型進行識別,識別率為84.7%,分類時間為1.03s;采用AdaBoost算法進行識別,識別率明顯上升,當迭代次數為6次,識別率趨近最高值為94.7%,分類時間為2.56s。由此得出,在識別率方面,AdaBoost算法的識別率明顯高于單一的多層感知器神經網絡模型,說明該算法可有效地提高系統的精度;在分類時間方面,AdaBoost算法由于需對多個基本分類器進行訓練,所以分類時間比單一分類器長;但由于基本分類器本身訓練時間較短,所以分類時間的增加對識別過程影響不大。
本文介紹了基于AdaBoost的多感知器神經網絡融合分類模型。該方法提取相關的局放特征參數,采用主成分分析法進行降維,將多感知器神經網絡作為基本分類器,采用AdaBoost算法進行訓練,應用到XLPE電纜局部放電模式識別中。
理論分析和實驗仿真的結果表明,本文提出的基于多分類器融合的模式識別方法的識別率明顯優于單一分類器,采用主成分分析法降維后大大提高了分類效率,提供了一種用于局部放電模式識別新的可行性方案。
[1] 郭燦新,張麗,錢勇,等.XLPE電力電纜中局部放電檢測及定位技術的研究現狀[J].高壓電器,2009(03):56-60.
[2] 陳小林,成永紅,謝小軍,等.XLPE絕緣電老化中局放特性試驗研究[J].高電壓技術,2006,32(4).
[3] 楊孝華,廖瑞金,胡建林,等.基于BP人工神經網絡的XLPE電力電纜局部放電的模式識別[J].高壓電器,2003,(04).
[4] Abdel-Galil,T K,SHARKAWY R M,SALAMA M M A,et al.Partial discharge pulse pattern recognition using an inductive inference algorithm[J].IEEE Transactions on Dielectrics and Electrical Insulation,2005,12(2):320-327.
[5] Mazroua A A,M M A Salama,et al.PD pattern recognition with neural networks using the multilayer perceptron technique[J]. IEEE Transactions on Electrical Insulation,1993,28(6):1082-1089.
[6] Freund Y.Boosting a weak algorithm by majority [J].Machine Learning,1990,5(2):197-227.
[7] Freund Y.Schapire R.E.A Decision-theoretic generalization of on-line learning and an application to boosting[J].Journal of Computer and System Sciences,1997,55(1):119-139.
[8] SAHOO NC,SALAMA M M A,BARTNIKAS R.Trends in partial discharge pattern classification:A survey[J].IEEE Transactions on Dielectrics and Electrical Insulation,2005,12(2):248-264.
[9] 楊淑瑩.模式識別與智能計算:Matlab技術實現[M].北京:電子工業出版社,2008.