杜銳
【摘 要】隨著我國的經濟在快速的發展,社會在不斷的進步,我國配電網多采用小電流接地系統,發生單相接地短路的概率高,如何進行準確的接地選線是一項重要課題。考慮大數據機器學習方法,基于大數據平臺對配電網接地選線關鍵技術進行研究,首次提出了綜合考慮電氣量與非電氣量的故障選線算法;搭建了基于Hadoop技術的配電網接地選線大數據平臺,應用接地故障選線的人工神經網絡算法,實現了數據的分布式存儲與分布式處理等相關技術,大大提高配電網選線的準確性;最后使用故障數據進行驗證,證實了該方法的可行性。
【關鍵詞】大數據;接地選線;非電氣量;Hadoop平臺;人工神經網絡
引言
“小電流接地系統”屬于中性點非有效接地系統,也稱為中性點不直接接地系統,主要有中性點不接地系統、經消弧線圈接地系統(諧振接地系統)兩種。目前,配電網采用以中性點經消弧線圈接地為主的小電流接地系統。經消弧線圈接地方式能自動消除瞬時的單相接地故障,具有跳閘次數少、能降低故障電流的優點,但也存在一些缺點:如,經消弧線圈接地系統,單相故障時假如小電流接地選線裝置不跳閘,系統將長時間承受過電壓,對設備絕緣水平要求高。此外,目前各種原理的小電流選線裝置在實際運行中準確率并不高,特別是在高阻接地和弧光接地情況下,準確率更低。在消弧線圈補償故障電流的作用下,故障殘流小,配網智能終端難以檢測分辨接地故障電流,導致配網自動化系統因無法獲取接地故障信息而失效。
1大數據的定義與特征
關于大數據的定義,雖然業內存在一些共識,但是尚沒有統一的定義。麥肯錫將大數據定義為規模超出了現有數據工具的抓取、存儲、處理、計算能力的數據集合.認為大數據是指對海量異構數據實現高速的捕捉、分析與發現的技術體系與架構。本文認為,大數據不僅是傳統軟件難以處理的數據集,也不僅是先進的數據分析與處理技術,而是海量異構數據、高性能大數據處理架構、先進的數據挖掘算法及大數據思維方式的有機結合,并在互聯網云計算、大數據可視化等相關領域的延伸。不同行業的大數據千差萬別,但是它們都具有五個典型特點,這五個特點通常也被稱為,"5個V",分別是規模性(Volume),多樣性(Variety),高速性(Velocity),價值性(Value)和真實性(Veracity)。其中:規模性是指數據總量龐大,數據總量已經普遍從GB,TB級上升到PB,EB,ZB級;多樣性是指數據類型復雜,來源不同且同時包含結構化、半結構化和非結構化數據;高速性是指數據實時在以指數級別的速度在增長,同時也需要高速的數據處理速度;價值性是指數據是有價值的但是沒有得到充分利用,且其價值通常需要挖掘;真實性是指大數據來源于真實的社交網絡、企業等數據源,可以體現分析對象的真實特征。
2基于大數據平臺的機器學習配電網選線核心算法
2.1數據預處理和特征提取
數據預處理是指在數據挖掘前的數據處理,主要包括數據清理、數據集成、數據變換與數據規約等技術,將原始數據轉化為適合挖掘的數據。通過故障特征提取算法實現對大數據的預處理,進行降維操作,降低大數據的維度,保存有用數據,剔除無效數據,實現對數據的智能預處理功能,使數據更滿足挖掘需要。故障特征提取是指從原始數據中提取出具有重要物理意義或統計意義的特征數據,可以對原始數據進行有效降維。由于原始數據尤其是電氣數據維度太高,數據量太大,并且含有一些無用的信息,所以有必要進行特征提取,提取出有用的數據進行分析。故障特征提取有多種方法,為保證提取數據的有效性,一般根據傳統選線方法確定要提取的特征數據。本研究提取14種電氣量故障特征數據:故障類型(A相接地故障、B相接地故障、C相接地故障)、故障后各相電壓降落(故障后比故障前電壓有效值的降落),故障后零序電流幅值與相角,各出線零序電流的小波包能量,零序電流五次諧波幅值與相角,故障后首半波幅值與極性,故障后能量函數,暫態零模特征電流幅值與極性,FTU裝設處的零序電流幅值與相角。根據每一條出線獲得故障特征變量(體現故障測度),并歸一化。由于提取出的氣象數據已經為數字量形式,故直接作為特征向量即可。電氣量與非電氣量故障特征共有20種。
2.2小電流接地選線裝置提升選線正確率的管理
(1)加強并網管理嚴格按小電流接地選線裝置技術規范、檢驗規范開展可研、初設審核、投運前驗收工作,確保小電流接地選線裝置功能配置、二次回路完善,各線路間隔零序CT接線正確、零序CT安裝質量符合標準要求,遠動信號傳發正確。(2)加強日常管理持續開展小電流接地選線裝置選線情況統計。按月對各站小電流接地選裝置選線情況進行統計,對選線情況異常的開展排查,確保裝置運行正常、二次回路正確、遠動信號回傳正確。(3)開展專項整改對目前在運的小電流接地選線裝置開展全面梳理。對不具備跳閘功能的小電流選線裝置開展改造工作,增加跳閘箱、二次控制回路。對零序電流回路接線不正確、無零序CT的間隔,結合線路間隔停電,開展零序CT、回路整改工作。對于信號注入法原理的小電流接線選線裝置,出線未安裝信號探測器的,結合線路間隔停電,加裝信號探測器。
2.3數據預處理方法
實際配網系統中,常由于噪聲干擾或通訊等原因,導致原始數據存在錯誤值、空缺值、噪聲等,導致數據質量降低,影響挖掘的準確度。因此,通過預處理來降低錯誤值、空缺值與噪聲的干擾,確保數據質量。(1)空缺值空缺值是指數據中某一屬性值的缺失,數據的大范圍缺失是無法修復的,但是對于少數幾個值的空缺,通常可以用一個值來進行填補。在確定這一填補值時,通常有幾種方法:1)使用一個常量來填補空缺值。2)使用缺失屬性均值來填補。3)預鋇(一個可能值來填補,如通過回歸來預測缺失值。在基于大數據的故障選線問題中,面對的原始數據主要是各類波形數據,而波形通常是連續的,因此若出現空缺值情況,可以通過插值的方法來確定空缺值。(2)噪聲數據噪聲是指互感器在測量電壓、電流是產生的隨機錯誤或偏差,包括錯誤值或者孤立點值。通常使用以下數據平滑技術進行處理:分箱法:分箱法考察數據周圍的值并將其分到不同的箱中,然后根據箱中數據的特點來平滑箱中數據,起到數據平滑作用。回歸法:回歸法通過尋找合適的回歸函數來將不同的變量互相關聯,然后使用其他變量來預測一個變量,起到數據平滑的效果。聚類法:聚類是一種識別孤立點或離群點的常用方法,那些明顯偏離聚類中的數據很可能是錯誤數據,通過對其刪除或更正可以提高數據的質量。
結語
本文研究了利用大數據技術來解決配電網單相接地故障選線的難題。提出了利用多源電氣量與非電氣量數據,并且綜合考慮多種故障特征的一種新的配電網接地故障選線方法。在基于Hadoop技術的大數據平臺上,使用人工神經網絡的機器學習算法,對海量數據進行深度挖掘與精準擬合,從而大大提高了配電網選線的準確性。使用仿真數據與實際歷史故障數據進行了選線準確率驗證,證明了本方法的可行性。
參考文獻:
[1]李天友,金文龍,徐丙垠,等.配電技術[M].北京:中國電力出版社,2008:1-4.
[2]李燕妮,袁茂林.小電流接地選線裝置在配網中的應用[J].電子技術與軟件工程,2014(7):170.
(作者單位:國網山東省電力公司齊河縣供電公司)