李云



摘 要:本文取操動機構開斷過程中電流波形的特征量,對比手動設置參數支持向量機(Support Vector Machine,SVM)與網格搜索法優化SVM的故障診斷結果,得到網格搜索法優化SVM的診斷結果準確率更高。并通過實驗對比傳統網格搜索法和改進網格搜索法,得到改進網格搜索法對比傳統網格搜索法,能兼顧效率和準確率。
關鍵詞:故障診斷;SVM;網格搜索法
1 導論
SVM是統計學習理論中實用且較新的部分,它是在1995年提出的,是一個較有發展前景的分類技術,在處理非線性、小樣本和高維模式識別中,具有很多優勢,由于高壓斷路器動作較少,要獲取大量的動作樣本很困難,所以選擇SVM用于斷路器故障診斷。
SVM思想是:輸入空間經非線性變換到高維空間,再求最優分類面,這里的非線性變換是由內積函數(核函數)得到。
在SVM中,懲罰因子c和核函數g對SVM性能有決定性作用。核函數g反應的是樣本轉變到高維空間后的維數即復雜度,維數和復雜度成正比;懲罰因子c的主要功能是調整置信范圍和經驗風險的比例,使其處于最好的狀態。
對這兩個參數,現有較常用的優化SVM方法有:粒子群算法、遺傳算法、網格搜索等[1]。本文探討的優化方法是網格搜索法。
2 實驗數據
SVM是二分類狀態識別方法,在本文中,有六種狀態,使用的分類思想是“一對其余”,即6種狀態采用六級分類訓練和識別。
用SVM對高壓斷路器操動線圈電流信號進行識別,診斷高壓斷路器是否正常。部分電流信號的樣本數據如表1所示[2]。實驗分兩種方式,一種是手動設置SVM參數故障診斷,另一種是網格搜索法優化SVM。
3 手動設置SVM參數故障診斷
從上面對SVM的介紹中可知,參數懲罰因子c和核函數g對診斷結果有較大影響,當隨機手動設置參數c和g時,斷路器的診斷結果差距較大。隨機設置二組參數值,測試故障診斷準確率。
(1)當c=0.8,g=63時,測試結果準確率為79.17%。
(2)當c=0.6,g=8時,測試結果準確率為91.67%。
從二組隨機參數診斷結果可知,參數對診斷結果影響較大,且無明顯規律可循,為提高診斷準確率,對SVM參數優化顯得十分必要。
4 傳統網格搜索法與改進網格搜索法優化SVM故障診斷
對于傳統網格搜索法和改進網格搜索法的區別在于:改進網格搜索法[3]針對傳統網絡計算量大,運行時間長提出。改進網格搜索法節省時間且計算量少,它的思想是先以較大步長搜索全局,得到相對最優c和g,再在此c、g附近做一個較小步長的搜索,這樣可使精度和計算量都能達到最好狀態。
傳統網格搜索法1:取步長為0.1的傳統網格搜索法,訓練時間長達73.96秒,準確率為96.67%;
傳統網格搜索法2:取步長為0.8的傳統網格搜索法,訓練時間是1.177秒,準確率為93.33%;
改進網格搜索法:先取步長為0.8進行全局搜索,得到最優c和g,再在此c、g附近做一個步長為0.1的搜索。
對上面三個參數選擇結果相關參數,做一個表格進行對比,如表2所示:
在表2中,第一組以0.1的步長進行全局搜索,準確度很高,但是運行時間較長;第二組以0.8的步長進行全局搜索,運行時間很短,但是準確度比第一組低3.329%;第三種情況是在第二組c、g的基礎上,再在其附近做一個小范圍的小步長搜索,準確度和第一組一樣,但是運行時間比第一組少很多。
由此可得結論:改進網格搜索法能在保證準確率的基礎上大大減少運行時間,明顯優于傳統網格。可推斷,當樣本足夠多且復雜時,這種優勢會表現的更加明顯。
用改進網格搜索法優化的SVM,測試基于電流信號的高壓斷路器工作狀態,檢測其是否處于正常狀態,若故障,是哪種故障。
用24組測試樣本,共有六種狀態,每種狀態4組數據,測試結果如圖2所示,其準確率達到95.83%。
由上述仿真結果可知,手動設置參數的SVM準確率最低,僅91.67%,傳統網格搜索法還是改進網格搜索法優化后的SVM,其準確率均比手動設置SVM參數故障診斷準確率高。
5 小結
比較隨機手動設置SVM參數的診斷準確率與網格搜索法優化后SVM參數的診斷準確率,后者比前者準確率高,且前者準確率隨參數變化較大;再對比傳統網格搜索法和改進網格搜索法,得到改進網格搜索法能在保證準確率的基礎上較大限度的提高運行時間,減少計算量。
參考文獻:
[1]徐曉明.SVM參數尋優及其分類中的應用[D].大連:大連海事大學,2014.
[2]白志艷.高壓斷路器故障診斷與狀態監測研究[D].武漢:華中科技大學,2013.
[3]王健峰,張磊,陳國興等.基于改進的網格搜索法的SVM參數優化[J].應用科技,2012,39(03):29-31.