陳霍興 張俊 海龍
摘 要:本文對輸電線路故障的影響因素進行分析,用相關性系數描述輸電故障和氣象數據之間關系。通過分析得出了氣象數據中的溫度、濕度、風速、氣壓和故障之間的相關性強度。通過對數據特征展開研究,以及對機器學習相關算法模型、關鍵算法組件的應用及驗證,為輸電線路故障分析提供有力的技術支撐。
關鍵詞:機器學習 線路故障 分析應用
中圖分類號:R196 文獻標識碼:A 文章編號:1672-3791(2018)12(a)-00-02
Abstract:In this paper, the influencing factors of transmission line faults are analyzed, and the correlation coefficient is used to describe the relationship between transmission faults and meteorological data. The correlation strength between temperature, humidity, wind speed, air pressure and fault is obtained through analysis. Through the research of data characteristics, and the application and verification of the machine learning algorithm model and key algorithm components, it provides a powerful technical support for the transmission line fault analysis.
Key words:machine learning; line fault; Analysis and Application
隨著電網規模的擴大,輸電線路運行安全對電網安全可靠運行的影響更為突出。本文分析了大量的輸電故障數據,通過對故障數據的統計發現由外部氣象環境造成的故障占了總故障約45%,包括大風、高溫、雷電、污穢等故障原因。這幾類故障會影響導地線、桿塔、金具、絕緣子等幾大類設備,同時,會引起如安全距離不足、劣化自爆、缺損、傘群裂紋或電蝕、松脫位移、銹蝕損傷等類型的缺陷。
通過對輸電線路的運行狀態進行監測、故障診斷、狀態評價,對提高輸變電設備的運行可靠性與利用率,實現設備的優化管理具有重要科學意義和應用價值。輸電線路狀態參數對進行故障分析有較大的影響,如何合理地選擇參數,保證線路故障評價的準確性,需要重點研究。
1 故障分析步驟
通過研究應用機器學習技術,挖掘電力數據中潛在的規律和價值,深入探索輸電線路故障分析的應用價值,促進電網向數字化、智能化、精益化方向發展。
1.1 業務理解(business understanding)
理解項目的業務目標和應用需求,以及把業務目標轉化為相對應的數據挖掘的問題,確定目標、明確分析需求。
1.2 數據探索(data understanding)
完成對源數據的收集,實現多源數據的融合,提取數據的特征,發現質量問題、從數據中發現隱藏的信息或探測臆想的數據子集,并進行數據清洗。
1.3 算法模型(modeling)
建立模型階段,主要進行算法的選擇和參數的調整。有些算法可以解決一類相同的數據挖掘問題,有些算法在數據類型上有特殊的要求,因此需要根據業務目標和數據情況選擇合適的算法進行訓練。
1.4 模型評估(evaluation)
為了建立一個高質量的模型,需要對訓練結果進行評估,檢查構造模型的步驟,確保模型可以完成業務目標。對模型進行較為全面的評價,并重審過程。
2 業務理解
2.1 業務調研
輸電線路故障分析:故障分析是電網運行中的一項重要工作。影響線路故障的因素較多,不僅受到線路臺賬、運行參數、廠家等因素影響,同時受到天氣狀況、季節性、地域等因素的影響,目前針對故障的分析涉及到多個維度、多個層次。
2.2 問題定位
輸電線路故障分析:目前線路的故障分析以南網導則為主,重點線路維護為輔開展,以人工方式進行統計和分析,沒有輸電線路故障的預測性。另外,電網中大量的監測數據未得到有效應用
3 數據探索
為了建立一個高質量的模型,需要充足的數據來支撐建模。本次數據分析涉及到的數據主要包括以下幾個方面。
(1)設備臺賬:設備名稱、設備類型、設備經緯度。
(2)故障數據:故障類型、故障緊急程度、故障部位、故障發生日期、故障描述。
(3)巡檢數據:巡檢異常數、巡檢異常率、巡檢異常占比。
(4)氣象數據:溫度、濕度、降雨量、氣壓。
4 算法模型
氣象環境與線路故障相關性分析:從氣象對電網影響的周期性特征出發,由于氣象環境相關的線路故障率在不同年份和月份有差異,首先按照時間維度,統計線路不同時段的故障情況,包括故障次數、故障率、跳閘次數、跳閘率等,采用歐幾里得距離、余弦相似度、Pearson相關系數、Spearman秩相關系數、Kendall's tau-b等級相關系數計算分析。
以某一線路故障分析為例,特征量關聯關系列表如表1所示。
通過對線路故障在不同環境溫度下的各種特征量的兩兩分析,找出線路故障與環境溫度和其他特征量的關聯關系,從而得到線路故障的分析標準,進而實現通過數據本身的狀態評價,這種通過大數據平臺不斷的對特征量進行兩兩分析、多項分析,找出彼此的關聯關系的方法可以靈活的對不同設備的數據進行分析評價,在不斷分析中不斷自我完善、自我校準,實現靈活、可靠、精細化的數據分析及評價。
5 故障分析結論
通過對數據進行清洗、探索、統計分析、建模等一系列分析的過程,得出故障和氣象的強關聯性的分析結論,并在此基礎上通過多遠回歸算法對確立的氣象因數進行綜合的模型診斷和對比分析,最終確定線路故障分析預測模型以及相關的氣象因數變量。
線性回歸模型:故障總量=-55.4310+1.6587×平均氣溫(年)-2.9155×平均濕度(年)+5.4750×濕度≤40%的天數(年)-2.4079×濕度≥80%的天數(年)-62.5923×風速> 17M/S的天數(年)+30.6300×降雨量為[10,50)天數(年)-552.1602×降雨量為[50,100)天數(年)。
為了確認模型的質量是否足夠準確,用已得到的自變量觀測數據帶入模型中,把得到的因變量預測數據與因變量觀測數據做畫圖對比,如圖1為故障總量多元線性回歸——最終模型的預測數據圖。
從圖1中可以看到,預測數據與觀測數據排列接近于一條45°的直線,可以判定預測是準確的。
6 結語
本文為了進一步對輸電線路故障的影響因素進行分析,用相關性系數描述輸電故障和氣象數據之間關系。通過分析得出了氣象數據中的溫度、濕度、風速、氣壓和故障之間的相關性強度。
通過對數據特征展開研究,以及對機器學習相關算法模型、關鍵算法組件的應用及驗證,為輸電線路故障分析提供有力的技術支撐。
參考文獻
[1] 張永強,劉琦,周經倫.基于Bayes性能退化模型的可靠性評定[J].電子產品可靠性與環境試驗,2006(4):46-49.
[2] 孫志征,侯戈,吳全初.輸電線路運行中常見故障及檢修方法[J].低碳世界,2016(22):99-100.
[3] 柳雅騰.架空輸電線路中的常見故障以及預防檢修方法[J].山東工業技術,2016(15):156.
[4] 嚴鳳,許海梅.基于神經網絡的配電線路綜合故障定位方法[J].電力系統及其自動化學報,2015(5):86-91.
[5] 葉浩明.高壓輸電線路故障類型與防范對策[J].企業技術開發,2014(21):81-82.