曲曉峰 苗東旭 王樹新 王振羽 甄宏 劉爍



摘 要:蓄能設備是發電廠削峰填谷的重要手段之一。針對發電廠蓄能設備故障種類和原因復雜,提出一種基于運行數據和機器學習方法的蓄能設備故障預測方法。該方法以管理系統監控的歷史數據和實時數據為基礎,首先對數據集進行特征提取和充放電周期識別,然后建立隨機森林分類器,訓練分類器模型參數,以實現蓄能設備運行過程中是否存在故障以及故障類別的預測。在實際運行數據中驗證了所提方法能夠在故障發生的早期有效識別故障類型。
關鍵詞: 蓄能設備;故障預測;機器學習;支持向量機
【Abstract】 Energy storage equipment is one of the key devices for peak cutting in a power station. Aiming at the complex types and causes of energy storage device faults in power station, a fault assessment method based on profile data and machine learning method is proposed. In order to predict the faults and their types in the operation of energy storage equipment, based on profile historical data and real-time data, the feature extraction and charge-discharge cycle identification of profile data sets are carried out first. Then a support vector machine classifier is established and trained to obtain the model parameters. The results on the actual operation data of energy storage device verify that the proposed method can effectively identify the fault type in the early stage of fault occurrence.
【Key words】 ?energy storage device; fault prediction; machine learning; support vector machine
0 引 言
蓄能設備的管理與診斷是蓄能設備應用技術中的核心之一,及時、準確地診斷蓄能設備故障、保證蓄能設備容量的準確估計,可以延長蓄能設備使用壽命、提高蓄能設備一致性及可靠性[1]。在產生嚴重的故障之前,微小緩變故障往往提早發生,并一步一步演變為嚴重故障,因此,及時檢測出早期緩變故障對于能源管理與維護有著重要的現實意義。考慮到蓄能設備診斷的故障現象、故障原因及故障機理的復雜性和模糊性,難以借助確定的數學模型來描述,也難以借助確定性的特殊判據來診斷。在安全評估方法中,模糊理論、人工神經網絡、基因遺傳算法等方法被廣泛應用[2]。但是,由于微小緩變故障相比于嚴重故障信號特征不明顯,淺層的機器學習算法和一般的統計方法辨識這些故障十分困難[3]。
故障定義為系統由于出現至少一個或多個參數、特性低于正常指標,導致了系統喪失正常使用功能的行為[4]。故障診斷是通過各種能夠檢查和測試的方法,指對發生不正常狀態的部位進行診斷,查明其功能失調的原因,對系統出現的異常情況進行判斷,確定故障的原因、類型、大小、位置和發生時間[5]。利用蓄能設備管理系統的監測數據來及時對蓄能設備組的多種故障進行預測,達到目的檢測故障,提出設備事故預防措施是控制領域的研究熱點[6]。故障診斷技術的主要任務是能快速準確地對故障做出評價和決策,系統能及時判斷故障的大小、位置和發生的時間。一般而言,故障檢測容易且耗時少,而故障診斷由于要判斷出系統發生故障的位置、時間原因等,而耗費時間長[7]。
現有技術中,專家系統是一種通過現有知識來推理實際問題的程序,結合專家經驗和知識求解那些復雜問題。現有的方法建立在專家庫之上,根據輸入的故障信息結合相應計算機算法進行推理分類,完成故障診斷和決策,準確度依賴于專家庫的完善程度,即需要大量的工程經驗知識,存在專家系統中容錯率低,對于不確定信息的診斷準確率低、專家知識經驗獲取困難,以及維護難度大等問題[8]。
神經網絡主要是基于神經元而建立的一種數學模型,輸入和輸出信息之間通過這些神經元連接。神經網絡模型由于其本身特性,對處理不確定性信息的診斷優勢較大,但由于神經網絡的訓練需要大量的樣本,大量的故障信息樣本數據難以獲得,通過結合模糊集理論或區域分區來減少樣本數據獲取的難度的研究還不夠深入,不能很好地適用于蓄能設備故障診斷系統[8]。
貝葉斯網絡將概率論和圖形理論相結合,用來推理和解決不確定性知識,在電網故障診斷中處理不確定性信息診斷效果良好[9]。現有研究中電網故障診斷關于貝葉斯網絡診斷方法的研究多結合粗糙集相關理論。貝葉斯網絡節點賦值需要統計分析或實際觀察確定,如何解決貝葉斯網絡在處理復雜情況下的建模、網絡訓練等問題仍然存在困難[10]。
借助系統的數學模型,利用一定的技術方法,讓系統產生殘差信號,再利用生成的殘差信號應用相應的評價規則,或者直接讓其與給定閾值進行比較,從而達到故障分類的目的。其中包括參數辨識法、狀態估計法和等價空間法,主要缺點是依賴于系統的數學模型,數學模型的精確程度將影響故障診斷的效果。而等價空間法的缺點是大部分只能在線性系統中得以運用,因此在非線性系統中就難以發揮作用[10]。
有向圖法和故障樹法,實質上就是利用故障種類和故障原因之間的因果邏輯關系對系統故障進行分類。大型復雜系統的故障診斷時,由于系統的故障種類繁多、故障相關性復雜等客觀原因,導致其故障診斷準確性難以保證[11]。
本文針對早期緩變故障特征不明顯等特點,以多種機器學習技術為核心,以數據驅動方法為基礎,利用數據采集管理系統采集的大量動力蓄能設備運行和EV工況數據,通過逐層特征提取進行安全評估。
1 數據集
本文采用實際運行的數據采集管理系統采集的4組共3 470 191條有效數據為數據源,上述數據集具有如下特點:
(1)19個國家標準報警分類:溫度差異報警,高溫報警,蓄能設備類型過壓報警,蓄能設備類型欠壓報警,SOC低報警,單體蓄能設備過壓報警,單體蓄能設備欠壓報警,SOC過高報警,SOC跳變報警,可充電蓄能系統不匹配報警,蓄能設備單體一致性差報警,絕緣報警,DC-DC溫度報警,制動系統報警,DC-DC狀態報警,驅動電機控制器溫度報警,高壓互鎖報警,驅動電機溫度報警,蓄能設備類型過充。
(2)24個特征:設備狀態,充電狀態,運行模式,車速,累計里程,總電壓,總電流,SOC,DC-DC狀態,檔位,加速踏板行程值,制動踏板狀態,燃料蓄能設備電壓,最高電壓蓄能設備子系統號,最高電壓蓄能設備單體代號,蓄能設備單體電壓最高值,最低電壓蓄能設備子系統號,最低電壓蓄能設備單體代號,蓄能設備單體電壓最低值,最高溫度子系統號,最高溫度探針序號,最高溫度值,最低溫度子系統號,最低溫度探針序號。
2 分類器模型
2.1 支持向量機分類器
采用支持向量機實現單個分類器的故障分類功能,實現過程可表述如下。
3 基于機器學習分類器的故障預測方法
結合圖1所示,本項目給出一種蓄能設備故障的診斷方法,包括:以單分類器為基礎,構造集成分類器,建立蓄能設備故障分類預測模型;從蓄能設備數據采集管理系統中提取特征,并作為蓄能設備故障分類預測模型的輸入。
4 實驗結果與分析
目前蓄能設備開放性項目包括NASA的開源數據集,馬里蘭大學先進壽命周期工程中心的鋰電池數據集,上海市30萬輛新能源設備大數據平臺及服務能力建設項目等。本實驗環境采用Python 3.6版本,在NVIDIA GeForce GTX 1050 Ti上運行程序。
由于充電過程中,總電壓、單體電壓均處于上升狀態,無法準確辨別蓄能設備本身真實性能狀態,所以實驗截取出蓄能設備運行的每一個放電周期作為訓練集的一條樣本。根據模式識別分析,實驗選擇每個放電周期的最低總電壓、最低單體電壓最低值、最高單體最高最低電壓壓差值作為特征輸入,報警信息作為標簽。
由于實驗需要測試模型精度,需要預先對數據進行標注。實驗將標簽分為4類:0表示正常無任何報警;1表示單體欠壓與蓄能設備類型欠壓復合報警;2表示單體欠壓與單體一致性差復合報警;3表示其它報警。為排除數據采集管理系統傳輸數據丟失或誤報警情況對標簽的影響,實驗基于蓄能設備標準安全閾值對單體一致性差報警、蓄能設備欠壓復合報警進行了重新標注,保證訓練集與測試集的標簽都基于故障模式準確標注。
數據經處理后得到完整樣本集,共6 865個樣本。其中,正常無報警5 198條;單體欠壓與蓄能設備類型欠壓復合報警200條;單體欠壓與單體一致性差復合報警47條;其它報警1 420條。
考慮到其它報警情況對輸入特征的影響較為復雜,除掉其它報警得到樣本集1,共5 445個樣本。此時正負例比達到21:1,嚴重樣本失衡。
刪除正例樣本,直至與負例樣本平衡,得到樣本集2,共447條樣本。其中,正常無報警231條;單體欠壓與蓄能設備類型欠壓復合報警200條;單體欠壓與單體一致性差復合報警47條。
各機器學習分類器精度表現見表1。
分類器最主要的目的在于準確識別出故障蓄能設備,而不是識別正常蓄能設備模式。各機器學習分類器在樣本集1上表現出的高精度是基于大量正例樣本的條件,而對于負例樣本診斷的準確率很差。
在研究中的3個樣本集上,表現最好的為支持向量機,在完整樣本集上,SVM分類器預測1 373個樣本,其中44個負例樣本,預測錯誤29個;在樣本集1上,SVM分類器預測1 089個樣本,其中51個負例樣本,預測錯誤39個;而在樣本集2上,SVM分類器預測96個樣本,其中42個負例樣本,預測錯誤1個。其它2個分類器雖然性能弱于支持向量機,但在經過平衡化處理的樣本集1和樣本集2上,其對負例樣本的分類性能均有提高。
由此可見,在平衡樣本集上,分類器準確率雖然沒有達到0.9,但對于故障的評估是十分精確的。
5 結束語
本文探討了基于集成學習進行特征重要度排序的原理,并利用集成學習boosting算法XGBoost以及bagging算法隨機森林對蓄能設備的故障特征進行了重要度排序,得到對蓄能設備報警影響程度最高的幾個特征:蓄能設備單體電壓最高/低值、總電壓(總電流)、SOC、累計里程、設備狀態、充電狀態、DC-DC狀態,以及對蓄能設備類型欠壓報警影響程度最高的幾個特征:蓄能設備單體電壓最高/低值、總電壓、SOC、累計里程。未來工作中將進一步討論其它故障與數據采集管理系統數據的相關性。進而通過提高發電廠蓄能設備健康管理水平來保障發電廠削峰填谷能力。
參考文獻
[1]蘇偉,鐘國彬,沈佳妮,等. 鋰電子電池故障診斷技術進展[J]. 儲能科學與技術,2019,8(2):225-236.
[2]GAO Zuchang,CHENG S C,WOO W L,et al. Genetic algorithm based back-propagation neural network approach for fault diagnosis in lithium-ion battery system[C]//6th IEEE International Conference on Power Electronics Systems and Applications (PESA). Hong Kong: IEEE,2016:1-6.
[3]CHEN Wen,CHEN Weitian,SAIF M,et al. Simultaneous fault isolation and estimation of lithium-ion batteries via synthesized design of Luenberger and learning observes[J]. IEEE Transactions on Control Systems Technology,2014,22(1):290-298.
[4]徐佳寧,梁棟濱,魏國,等. 串聯電池組接觸電阻故障診斷分析[J]. 電工技術學報,2017,32(18):106-112.
[5]XU Jianing,LIANG Dongbin,WEI Guo,et al. Series battery packs contact resistance fault diagnosis analysis[J]. Transactions of China Electrotechnical Society,2017,32(18):106-112.
[6]YANG Ruixin,XIONG Rui,HE Hongwen,et al. A fractional-order model-based battery external short circuit fault diagnosis approach for all-climate electric vehicles application[J]. Journal of Cleaner Production,2018,187:950-959.
[7]GAO Wenkai,ZHENG Yuejiu,OUYANG Minggao,et al. Micro-short circuit diagnosis for series-connected lithium-ion battery packs using mean-difference model[J]. IEEE Transactions on Industrial Electronics,2019,66(3):2132-2142.
[8]劉文杰,齊國光. 基于模糊理論的電池故障診斷專家系統[J]. 吉林大學學報(信息科學版),2005,23(6):670-674.
[9]HONG Jichao,WANG Zhenpo,LIU Peng. Big-data-based thermal runaway prognosis of battery systems for electric vehicles[J]. Energies,2017,10(7):919.
[10]王一卉. 純電動汽車鋰電池故障診斷系統的研究[D]. 長春:長春工業大學,2015.
[11]應澤霖.鋰電池組充放電管理系統[D]. 杭州:杭州電子科技大學,2017.