摘 要:在系統分析變壓器油色譜在線監測數據的基礎上,通過與離線數據的深入比對,提出把在線數據擬合成離線數據。通過數據擬合模型可以為電力設備的狀態在線診斷系統提供決策支撐,大大提高狀態評估、缺陷診斷的準確性和可靠性。
關鍵詞:在線監測;在線數據;離線數據;擬合
中圖分類號:TM855 文獻標識碼:A 文章編號:1674-7712 (2014) 22-0000-01
在運行條件下獲得的在線監測數據與離線試驗數據之間有一定差異,以及運行條件、環境狀態和電磁干擾的影響,不能把在離線試驗診斷標準中的數據作為在線監測數據的診斷標準。本文在系統分析變壓器油色譜在線監測數據的基礎上,通過與離線數據的深入比對,提出在線、離線數據的擬合系數、公式、函數,把在線數據擬合成離線數據。從而可以把離線試驗診斷標準中的數據作為在線監測數據的診斷標準,解決油色譜在線數據缺少診斷標準的問題。通過數據擬合模型可以為電力設備的狀態在線診斷系統提供決策支撐,大大提高狀態評估、缺陷診斷的準確性和可靠性,對降低電力設備的維護成本、全面提高設備和電網運行可靠性,減少電網大面積停電事故給國民經濟和社會公共安全帶來的突發性災難,具有顯著的經濟效益和社會效益。
一、變壓器油色譜在線監測數據分析思路
從已有的數據出發,充分利用數據挖掘技術,構建離線參數和在線參數之間的數學模型,實現離線色譜參數的快速準確估計。
一般而言,基于數據的學習問題包括數據發生器、訓練器算子和學習機器三個部分。其中,訓練器算子可以被認為是需要擬合或辨識的實際過程模型;學習機器則需要利用觀測到的若干個樣本所構成的數據集{(x1,y1),…,(xn,yn)},來構造一個適當函數來逼近實際的訓練器算子。根據訓練器算子的構建方式和風險準則,模型估計算法一般可根據估計流程分為兩類:(1)參數估計類:在已知模型形式的前提下,利用采樣的數據對(同采樣時刻的離線檢測參數和在線檢測參數),通過最小二乘等經驗風險最小化準則求取參數。該方法計算相對簡單,但較為依賴先驗知識和模型準確度。一旦模型形式本身存在問題,擬合效果較差,難以取得滿意效果;(2)統計學習類。該類方法一般針對有限樣本建模問題,利用結構風險最小化準則來構建一個經驗風險和置信范圍都較為滿意的模型,如Vapnik等人提出的支持向量機(SVM)和Suykens等人提出的最小二乘支持向量機方法(LSSVM)等。相關經驗證明,該類方法在建模時所需樣本量相對較小,同時所依賴的先驗知識一般為“相似輸入產生相似輸出”,較易實現模型估計。
二、變壓器油色譜在線監測數據轉換分析算法和流程
設計的數據分析流程主要包括以下幾個方面:(1)原始數據讀取:將歷史檢測數據(包括在線和離線檢測數據)讀取;(2)在線/離線數據分離:將讀入的歷史數據依據檢測方式的不同,將在線檢測數據與離線數據分離,進行單獨預處理;(3)在線數據預處理:主要用于去除原始樣本集中可能存在的孤立點現象和參數缺失等問題。其中,孤立點(即與前后時刻采樣值明顯不符的采樣值),采用直接刪除的方式進行。具體的獨立點判斷準則如下:
其中,Vt表示t時刻的色譜采樣值(包括H2、CO2等),NAN表示缺失值,T為預設參數閾值(一般可取100或更大)。
另一方面,由于色譜數據一般呈現緩變趨勢,因此對一些缺失參數采用局部均值插值的方式進行估計,具體的插值準則如下:
在線數據時間序列估計:即根據觀測得到的時間序列數據,通過曲線擬合和參數估計來建立數學模型的理論和方法。利用多項式擬合的方式對在線時間序列數據進行擬合,即: 計算得到參數a,進而實現在線檢測數據的時間序列估計。
最小二乘支持向量機,是Suykens等在SVM的基礎上改進提出的。與SVM相比,LSSVM在秉承其結構風險最小化準則和有限樣本建模能力的同時,將SVM的不等式約束改為等式約束,從而將問題由原來的二次規劃轉化為線性方程組求解,簡化了求解過程,提高了算法效率,使算法更利于在線建模。但同時,LSSVM的求解形式決定了所有訓練樣本均為支持向量,損失了SVM算法的稀疏性,在面對較多訓練樣本時模型會十分復雜。
三、變壓器油色譜在線監測數據擬合案例
以下為某一變電站變壓器H2擬合案例:
參考文獻:
[1]李清勇.算法設計與問題求解[M].北京:電子工業出版社,2013.