張志友,陳德富
(1.南京信息職業技術學院電子信息學院,江蘇 南京 210023;2.浙江工業大學信息工程學院,浙江 杭州 310014)
隨著能源互聯網戰略的不斷推進,電力系統在其中發揮著主干作用。輸電線路作為連接發電側與用戶側的重要紐帶,是提升能源互聯網供電質量和用戶體驗的關鍵環節[1-2]。當前,能源互聯網的建設對信息感知的深度、廣度、密度、頻度和精度都提出了更高要求。能源互聯網利用智能感知技術對系統內各個環節的電氣量、狀態量、物理量、環境量、空間量、行為量進行全面監控,形成能源互聯網底層感知基礎設施[3]。伴隨著我國能源互聯網的發展,如何利用智能感知技術提高輸電線路的安全性成為亟待解決的問題。在天氣因素影響下輸電線路缺陷屬性中又有許多規律性的規則隱藏在其中,如果將溫度、濕度、風力等天氣因素,結合能源互聯網的狀態智能感知、微氣象在線監測、自動氣象站等監測數據進行科學分析,從中挖掘出其潛在的聯系,那么相關部門在改進電力系統安全、防范惡劣天氣災害現狀時做出的決策就有科學依據[4]。
目前,針對這一問題國內學者進行了研究。文獻[5]根據輸電線路易受惡劣天氣影響的特點,提出將防御框架覆蓋的時間段向兩端擴展,將防御功能在廣域信息、仿真分析、決策支持等方面進一步深化的具體任務。文獻[6-7]主要論述了停電防御系統應充分考慮外部天氣因素影響,更有效地處理天氣因素造成的突發事故。文獻[8]建立電力系統氣象監測及預警系統,提高電力系統應對極端天氣的能力。文獻[9-10]提出了預警系統多維度表征,將天氣因素作為影響因子,建立了天氣因素的電力事故影響模型,并證明了模型的有效性。傳統方法是根據電力系統長期的運行經驗進行判斷,在災害性天氣下,輸電線路可能發生某些缺陷,在日常巡檢時需要重點防范[11]。這種方法雖然能起到一定的預防作用,但是無法發現潛在的缺陷。
綜上所述,能源互聯網的發展已然成為一種必然的趨勢,但是能源互聯網智能感知技術的數據利用效率低,使得智能感知技術的巨大潛力無法發揮。因此,文中嘗試利用智能感知技術獲得的外部氣象檢測數據,并結合關聯規則方法應用在電網輸電線路安全分析中。首先,對歷史缺陷數據和氣象數據進行分析和處理,再進行數據指標的篩選和整合;然后,利用Apriori算法建立兩者之間的關聯規則挖掘,挖掘氣象因素和輸電線路的關聯關系,并在此基礎上做好輸電線路惡劣天氣預防措施,保障輸電線路的穩定運行。基于關聯規則的電網輸電線路安全分析研究,可有效提高輸電線路在極端惡劣天氣下的應對能力和電網的穩定性,保障能源互聯網的安全運行,具有重要的研究價值和意義。
能源互聯網屬于“新基建”融合基礎設施范疇,智能化、網絡化、信息化是其主要特點。能源互聯網中應用的智能感知技術,針對性地部署于互聯網的各個環節,對相關設備進行實時監測,為系統的安全穩定運行提供了可靠保障,為日常巡檢、檢修等工作提供了數據支撐。能源互聯網范疇如圖1所示。

圖1 能源互聯網范疇圖Fig.1 Energy Internet category
天氣預警應用針對溫度、濕度、風力等天氣因素,結合輸電線路的場景狀態智能感知、局部氣象在線監測等監測數據,實現多系統數據融合,可實現對重要輸電通道的全天候、全方位狀態監測與風險預警。如圖2所示。

圖2 多系統融合圖Fig.2 Multi-system integration
本文整理了智能感知系統采集的某省2019年~2020年歷史天氣數據,包含了各個探測位置的天氣數據,如圖3所示。

圖3 天氣數據圖Fig.3 Weather data
結合輸電線路的實際生產運行狀況,并考慮到了可能會受到災害性天氣的不良因素,進而給出了電網氣象災害的定義。本文為得出各氣象因素是否對輸電線路停運有很大影響,以及進一步確定其影響程度,進而引入了變異系數。
變異系數法是通過變異程度的大小,進而判斷賦值權重的范圍。其中,變異程度是由評價指標確定的。如果指標的變異程度大,說明它的重要程度高,則被賦予的權值應較大;反之,則應賦予較小的權值。此外,輸電線路的停運率表明,離散程度高、波動性大等特征是一些影響程度較高的氣象因素往往所具有的,又因在進行數理統計時,常常需要用到隨機變量的相對期望值,而它的偏離程度恰恰可以被用來表示方差的大小。因此,基于方差和變異系數的特殊性,本文結合兩者特點,進而確定各氣象因素的賦值權重。
從收集的氣象序列數據中表明最高溫度、最低溫度、最高濕度、最低濕度、降水量、風力、氣壓、云、降水和能見度。這10種氣象因素包含在每組氣象序列數據中。Aij表示第i組氣象序列的第j個氣象因素,i=1,2,···,m ;m=20;j=1,2,···,n;n=10。計算各氣象因素權值的步驟如下:
1)計算氣象因素的均值和均方差,即


2)由上一步計算所得的均方差進而計算第j個氣象因素的變異系數σj,即

3)歸一化處理各變異系數,進而得出第j個氣象因素的權重dj,即

選擇最高溫度、最低溫度、最高濕度、最低濕度、降水量、風力、氣壓作為主要因素。具體數據如表1所示。

表1 氣象因素取值Tab.1 Meteorological factors
天氣記錄中經常出現少雨、多雨、干燥等用來描述降雨量的詞匯。由于在天氣預報中,滿足該地區在24 h之內降水量不超過0.1 mm的被定義為少雨,因此采用替換法處理對此類型小于0.1 mm的數據進行替換。對于天氣記錄中的缺失值采用牛頓插值法,根據相似點的已知值進行缺失補全。另外,由于在輸電線路工作過程中會出現缺陷數據采集延遲的情況,所以分析時應考慮天氣引起的延后效果和累計效應。具體描述如表2所示。

表2 天氣指標描述Tab.2 Description of weather indicators
由于電力系統缺陷記錄中含有重復和無關的缺陷數據,因此結合實驗需要對數據進行清洗。下圖是某電網公司輸電線路缺陷記錄表如圖4所示。

圖4 輸電線路缺陷記錄圖Fig.4 Transmission line defect record sheet
從圖4的統計中可以看出,玻璃絕緣子自爆、鳥害、銹蝕、損傷和保護區安全隱患所占的比例排名靠前,在進行人工巡視時,需要重點關注這幾類缺陷的發生。輸電線路情況分布如圖5所示。

圖5 輸電線路情況分布圖Fig.5 Distribution of transmission lines
接地裝置損壞與氣象的分布情況對比。如圖6所示。它與強降水量的關系相似。主要可能原因為大量的強降水,造成水土流失,從而接地裝置損壞。

圖6 接地裝置損壞原因對比圖Fig.6 Comparison of grounding device damage causes
鳥害與氣象的分布情況對比如圖7所示。它與濕度、降水量的關系較為緊密。主要可能原因是濕度增強導致鳥類活動頻繁。

圖7 鳥害原因對比圖Fig.7 Comparison of causes of bird damage
最后,對隱患數據進行歸納操作,包括以下兩個步驟:1)信息提取,針對缺陷數據中存在的大量的、潛在的信息,需要進一步的分析和提取。2)信息合并,通過整合提取出的缺陷數據,將那些功能相似的屬性信息進行合并。歸納結果如表3所示。

表3 缺陷表格Tab.3 Defect form
首先對所要挖掘的所有數據都做了形式化的定義之后,就可以進行關聯規則挖掘。一個缺陷情況表含有n個維,每個維代表一個缺陷屬性,不同的屬性下都有一個或多個值與之對應。n個維中所屬的單元是用來記錄每條事故屬性值的。一般情況下,n維數據也可以被看做為n個獨立的數據表,每個表存儲的是n維屬性的值。由惡劣天氣引起的電力系統事故屬性有:線路屬性、時間屬性、電壓屬性、故障設施屬性、災害屬性。各屬性下的值如下:
1)線路屬性:CS線、GCJ線、JSJY線、BH線、NL線、TZ線、HYP線、PQ線、DDJ線、HC線、HC線、WD線、HX線、XHY線、WT線、SQ線、WZ線、XX線、ZD線、CJ線、BCY線。
2)時間屬性:Jan,Feb,Mar,Apr,May,Jun,Jul,Aug,Sep,Oct,Nov,Dec。
3)電壓屬性:110 kV,220 kV,500 kV。
4)故障設施屬性:導線及地線、絕緣子、金具、桿塔及基礎。
5)災害屬性:鳥害、部件發熱異常、接地裝置受損、保護區安全隱患及銹蝕部位損傷。
通過挖掘氣象條件與各缺陷部位之間的關系,進而能夠找出各數據間的數據關聯,以其為條件進行數據整合,如表4所示。

表4 數據整合Tab.4 Data integration
Apriori算法是用于挖掘出數據關聯規則的常用算法,它用于找出數據值中頻繁出現的數據集合,將這些數據集合稱為頻繁項集,找出各項集合間的關聯關系,有助于決策的制定。因此,Apriori算法分為兩步:第1步產生頻集,第2步產生關聯規則。算法的原理概括如圖8所示。

圖8 Apriori算法原理圖Fig.8 Algorithm principle
首先將缺陷記錄和氣象信息整理成關聯規則模型所需的數據結構,從中抽取相關信息作為事務數據集,為方便起見將天氣因素A{最高溫度、最低溫度、最高濕度、最低濕度、降水量、風力、氣壓}分別簡記為{a1,a2,a3,a4,a5,a6,a7},將缺陷B{鳥害、部件發熱異常、接地裝置受損、保護區安全隱患、銹蝕部位損傷}分別簡記為{b1,b2,b3,b4,b5}。
每個項的集合被稱之為項集,一個項集中所對應的支持度,定義為數據集中包含該項集的記錄所占的比例。頻繁項集就是支持度大于等于最小支持度閾值的項集,設定最小支持度為20%。首先產生候選集Ck,然后計算所有k項集的支持度,若支持度滿足大于最小支持度閾值要求,則成為頻繁k項集Lk,接著在Lk基礎上產生候選集Ck+1,然后通過判斷最小支持度來確定頻繁(k+1)項集Lk+1。在這個過程中連接步和剪枝步互相融合,最終得到最大頻繁項集。數據集中所包含的某項集的事務個數,被定義為該項集的支持度計數。關聯規則強度可以通過它的“支持度”和“置信度”來表示。支持度如下式:

在已知項集A發生的條件下,同時發生B的概率,這個事件也可以描述為發生A的同時發生B的置信度,它可由同時發生A,B事件的支持度計數與A的支持度計數相除得來:

在利用得到的最大頻繁項集與預先設定的最小置信度閾值生成關聯規則。
鑒于上述分析,輸電設備在傳輸過程中的某些缺陷與某些天氣因素在統計上有較強相關性,并且可以通過Apriori算法在長期的大規模缺陷數據中找到這些關聯性。因此,建立基于Apriori算法的傳輸線路安全分析模型對輸電線路的長期安全可靠運行具有非常積極的作用。
分析流程描述如下:
1)建立數據庫。分析、收集并處理該期間內所有先前的傳輸線缺陷記錄信息和天氣數據。
2)分析數據庫中的Apriori算法。挖掘隱患與天氣之間的關聯規則。
3)制定預案。針對挖掘出的所有關聯規則進行規劃。
4)實時接收信息。在輸電網的運行檢修中,及時的接收天氣預報信息。
5)比對信息。把預報中的信息與已知的關聯規則相比對,再按照之前制定的預案進行相應部署,具體流程如圖9所示。

圖9 輸電線路安全分析流程Fig.9 Transmission line safety analysis process
本文采用Matlab平臺設計與實現了基于關聯規則的能源互聯網輸電線路安全分析。主要是挖掘輸電線路故障與天氣因素之間的關聯,并且給出相應預防措施。
本文整理了某省2019年~2020年的輸電線路缺陷數據以及當時的氣象數據。如表5所示。

表5 輸電線路缺陷數據Tab.5 Transmission line defect data
對氣象因素和輸電線路缺陷進行分析,對數據進行篩選、合并。然后對整合后的數據,進行離散化處理,離散化結果如表6所示。

表6 數據離散化Tab.6 Data discretization diagram
在實驗中,針對離散后的氣象數據和缺陷數據,選用需要同時滿足置信度和支持度都最高的關聯規則去挖掘氣象條件和缺陷類別之間的關系,并使Apriori算法對其進行關聯分析。部分程序運行如圖10所示。

圖10 程序運行結果圖Fig.10 Program run result diagram
關聯分析結果如表7所示。

表7 關聯分析結果Tab.7 Association analysis results
從關聯分析結果中可得出以下幾點:1)即使在降水量很低的情況下,發生銹蝕部位損傷的概率最大(53.28%);2)由各因素的關聯度因素可知,鳥害、部件發熱異常、保護區安全隱患、銹蝕部位損傷的支持度相同,都為4%,接地裝置受損略低,為2%;3)在濕度較高的情況下,接地裝置受損的發生概率也最低(16.67%)。可以根據各地區不同的天氣情況,采取相應的預防措施。如表8所示。
文中提出了一種基于關聯規則的能源互聯網輸電線路安全分析方法,該方法的提出能在一定程度上提高輸電線路應對惡劣天氣的能力,同時提高了能源互聯網的智能化和安全水平。通過深入分析輸電線路易受天氣因素影響的問題,收集天氣數據和缺陷數據進行分析和處理,然后采用的Apriori算法對天氣因素下的輸電線路故障進行了關聯規則挖掘,最后針對關聯分析結果采取應對措施,保證輸電線路的穩定運行,滿足了電網在惡劣天氣下的高可靠性需求。