蔡 毅,廖紹成,楊 培,李 璟,郭 倩,趙立美
(1.國網浙江新昌縣供電有限公司,浙江 紹興 312500;2.中國計量大學 機電工程學院,杭州 310018;3.浙江華云信息科技有限公司,杭州 310008)
電力工業是關系國計民生的基礎性產業,現代電能計量是電力用戶與供電單位之間的結算依據,因此,對電能計量異常分析與處理就愈發重要[1-2]。計量異常報警是用電信息采集系統的一個重要功能模塊,異常報警功能對用電現場的異常情況設置報警標志,報警標志可以由系統實時查詢或由終端主動上報[3]。正確分析判斷用電信息采集平臺上所反映出來的異常事件和異常數據,就能夠實時監測和監控用電現場的運行狀況,有針對性地判斷用戶的用電情況是否有異常,降低由電能計量故障所帶來的損失[4]。針對單個計量異常告警事件,通過異常原因分類、處理流程、異常現象及處理步驟的研究總結,已經有較規范統一的處理流程和方法[5-10]。然而,日常運行中的計量異常種類繁多、情況復雜,用電信息采集系統發出的事件告警信息混雜在一起,僅對單個計量異常報警事件進行分析,常常造成誤報、漏報等問題,導致工作量大,難以進行有效地分析處理及應用。因此,對計量異常事件之間的關系進行研究,建立計量異常事件關聯度的計算模型,將存在關聯的異常事件組合視為并發異常事件處理,是提高計量異常事件分析效率和準確性的關鍵所在。
在電力系統中,常用的關聯分析方法主要有皮爾遜相關分析法和灰色關聯度分析法。皮爾遜相關分析法是一種計算線性相關性的方法,其基本原理是通過變量之間的協方差和標準差的商來計算皮爾遜相關系數;灰色關聯分析方法的基本思想是根據序列曲線幾何形狀間的相似程度來判斷其聯系是否緊密,曲線越接近,相應序列之間的關聯度就越大,反之就越小。文獻[11]在大數據應用原則和大數據思維的指導下,融合電力設備故障統計數據和電能質量監測數據,采用皮爾遜相關分析法對二者的關聯度進行了分析;文獻[12]針對電網安全運行評價的需要,采用灰色面積關聯分析法確定評價模型的分辨系數,提出了一種基于多層次灰色面積關聯分析法的電網安全綜合評價模型;文獻[13]采用灰色關聯規則分析方法對變壓器故障信息數據進行挖掘,對變壓器故障與特征量之間的可信度進行分析,揭示了變壓器故障與特征量的相關程度。這些關聯度分析方法均對分析數據有要求,需要具體采樣數據,并不適用基于異常事件發生時間的關聯度分析。
本文通過對用電信息采集系統中的歷史告警數據進行分析,提出一種基于異常事件發生日期間隔天數的兩兩計量異常事件關聯度計算方法,對現有數據進行分析,明確關聯分析方法,選取異常發生日期間隔天數對關聯度進行計算;構造關聯系數函數,確定關聯分析流程,設置閾值,實現對并發異常事件的甄別;對關聯分析結果進行分析。實例計算結果表明,該方法能夠準確計算出兩兩計量異常事件之間的關聯度,對存在關聯的計量異常事件組合進行有效篩選。
現有數據為某市2015—2016年專用變壓器(以下簡稱“專變”)用戶和低壓用戶同月同一用戶出現多種異常的歷史告警數據。每條告警記錄都包含了用戶編號、異常類型名稱、異常發生時間、異?;謴蜁r間和異常歸檔時間等信息,其具體記錄方式如表1所示。

表1 異常告警數據記錄
由表1可知,異?;謴蜁r間和異常歸檔時間相同,異?;謴蜁r間和異常發生時間有一定間隔,但間隔時間長短不一,原因是異?;謴蜁r間受人為因素影響。對于要納入考核的計量異常事件,一般會在一周內進行人工恢復;而對于不進行考核的異常事件,恢復時間視現場運行情況和工人工作安排而定。對于恢復時間與發生時間相差過大的異常,其恢復時間多為后期歸檔時填寫的歸檔時間,并非實際恢復時間。因此,在歷史告警數據中實際可用來進行關聯度分析的數據只有異常發生時間,而異?;謴蜁r間受人為因素影響較大,并不準確。本文在對現有數據進行充分剖析的基礎上,以異常事件發生時間為參考,構建了基于異常發生時間間隔天數的關聯度計算模型。
令A1為異常事件1,A2為異常事件2,通過對大量歷史數據進行分析發現,A1和A2總是同時或者前后緊接著發生,可以初步認為這2種異常事件可能有關聯;再根據異常發生日期間隔天數構造關聯系數函數,分別求出每一次的關聯系數r,如果關聯系數波動較小,集中分布在某一區間內,則認為A1與A2有關聯,對該區間的關聯系數取均值即可求出A1和A2的關聯度;反之,如果關聯系數分散分布,則認為A1和A2的關聯度為0。
2.2.1 關聯系數函數構造
對于同一用戶,2個異常事件之間的關聯系數r與異常發生日期間隔天數d成反比關系,即隨著間隔天數d的增大,關聯系數r逐漸減小。由理論上分析知,如果A1與A2為一組并發異常事件組合,則A1與A2應該由同一異常原因引發。通過對填寫了異常原因的檔案數據進行分析發現,當2個異常事件發生日期間隔超過15天時,由同一原因引起的概率小于5%。統計學上通常將發生概率小于5%(即1/20)的事件稱為小概率事件[14]。因此,排除小概率事件,將異常發生日期間隔天數d的閾值定為15:當d>15時,認為無關聯,不進行關聯系數計算;當d≤15時,一個異常恢復后另一個異常才發生,也認為無關聯,不進行關聯系數計算;當d≤15且一個異?;謴颓傲硪粋€異常發生,關聯系數計算式為:

2.2.2 確定可能存在關聯的兩兩異常事件組合
首先,對歷史告警數據進行分析處理,得到2年來所有出現過的計量異常事件種類共K類,分別求出每種異常事件在2年內出現的次數nk;其次,對所有的異常事件進行兩兩組合,分別求出第i種異常與第j種異常組合時,間隔天數d≤15,一個異?;謴颓傲硪粋€異常發生且為同一用戶的次數nij;最后,設置閾值η,當nij大于閾值η時,可初步判斷2種異常事件可能有關聯。該閾值應排除小概率事件,即當nij大于單異常事件在2年內出現的總數的1/20時,認為2種異常事件可能有關聯。閾值η的計算公式為:

式中:ni表示第i種異常在2年內出現的總次數;nj表示第j種異常在2年內出現的總次數。
2.2.3 對可能存在關聯的異常事件組合進行關聯分析
初步確定兩計量異常事件可能具有關聯后,根據式(1)分別計算出這nij次每次的關聯系數rs(s=1, 2, 3, …, nij), 令l=0,1, …,15)為關聯系數rs在區間[0,1]上所有可能取值,pl=l=0,1,…,15)為關聯系數在每個取值處的概率,其中nl為rs=xl的總數。對求得的pl按照從大到小的順序排列,記為pl′,對應的關聯系數取值為xl′。關聯度Rij計算公式為:

式中:k為分散程度系數,根據統計學經驗以及反復的數據分析發現,當隨機變量rs在某取值處的概率大于0.7時,可認為rs主要集中分布在該取值處,設a為使得≥0.7的最小取值,當0≤a≤10時 k=1-0.1a, 當 10<a≤15時 k=0; m 為關聯系數 rs所有取值為 x0′, …, xa′的總個數; rs′為關聯系數 rs中所有取值為 x0′,…,xa′的部分。
根據式(3)計算出關聯度 Rij的范圍為[0,1],即說明Rij越接近1,關聯性越強;越接近0,關聯性越弱。通過設定閾值ξ對存在關聯的并發異常事件組合進行篩選,當Rij>ξ時,認為2個異常事件存在關聯。相關系數與關聯性強弱的對應關系[11]如表2所示。

表2 相關系數與關聯性強弱的對應關系
根據相關系數與關聯性強弱關系將閾值ξ設定為0.4,即認為關聯強弱在中等程度及以上的2個異常事件組合有關聯。異常事件關聯分析流程如圖1所示。
根據第2節方法,基于某市2015年、2016年2年的歷史告警數據分別對專變用戶和低壓用戶的兩兩異常事件組合進行關聯分析。為了證明該方法的準確性和可靠性,選取電能表示值不平與電能表飛走、需量超容與反向電量2組異常組合進行關聯分析。
電能表示值不平和電能表飛走這2種異常既面向低壓用戶又面向專變用戶,因此,分別對低壓用戶和專變進行關聯分析。

圖1 關聯分析流程
3.1.1 低壓用戶電能表示值不平與電能表飛走關聯分析
低壓用戶2年來電能表示值不平與電能表飛走發生的次數如表3所示。

表3 低壓用戶發生次數統計
(1)初步判斷低壓用戶電能表示值不平與電能表飛走是否具有關聯,由式(2)求得:

由于η<7 388,因此認為低壓用戶電能表示值不平與電能表飛走可能存在關聯。
(2)關聯度計算。 根據式(1)計算出7 388組中每組的關聯系數rs(s=1,2,…,7 388),其分布結果如圖2所示。
p0′=p1=0.61<0.7, p0′+p1′=p1+p0=0.93>0.7, 所以a=1,k=0.9,rs′為關聯系數 rs中所有取值為 x15和x14的部分,最終關聯度由式(3)計算得到:

由于R>0.4,因此認為專變用戶電能表示值不平與電能表飛走有關聯,且屬于極強關聯。

圖2 低壓用戶關聯系數分布
3.1.2 專變用戶電能表示值不平與電能表飛走關聯分析
專變用戶2年來電能表示值不平與電能表飛走發生的次數如表4所示。

表4 專變用戶發生次數統計
(1)初步判斷專變用戶電能表示值不平與電能表飛走是否具有關聯,由式(2)求得:

由于η<606,因此認為專變用戶電能表示值不平與電能表飛走可能存在關聯。
(2)關聯度計算。根據式(1)計算出606組每組的關聯系數大小,關聯系數rs(s=1,2,…,606)分布結果如圖3所示。

圖3 專變用戶關聯系數分布
p0′=p1=0.73>0.7,所以 a=0, k=1,rs′為關聯系數rs中所有取值為x1=0.93的部分,最終關聯度由式(3)計算得到:

由于R>0.4,因此認為專變用戶電能表示值不平與電能表飛走具有關聯性,且屬于極強關聯。
3.1.3 結果分析
電能表示值不平是指電能表總電能示值與各費率電能示值之和不等。引起電能表示值不平的主要原因有采集數據錯誤、電能表故障和終端故障等;電能表飛走是指電能表日電量明顯超過正常值。引起電能表飛走的主要原因有超過合同約定容量用電、電能表故障、終端故障和采集數據錯誤等。電能表示值不平和電能表飛走都屬于電量異常,二者均可由采集數據錯誤、電能表故障和終端故障引發。因此,可以認為電能表示值不平和電能表飛走之間具有較高的關聯。由本文提出的關聯算法求出的低壓用戶關聯度為0.86、專變用戶關聯度為0.93,均大于0.80,屬于極強關聯,說明該關聯算法求出的關聯度值與實際結果相符合。
由于需量超容只面向專變用戶,此處對專變用戶進行關聯分析。2年來專變用戶需量超容與反向電量異常發生的次數如表5所示。

表5 專變用戶發生次數統計
(1)初步判斷需量超容與反向電量異常是否有關聯,由式(2)求得:

因為η>10,所以認為需量超容與反向電量異常無關聯。
(2)結果分析。需量超容是指按最大需量計算基本電費的專變用戶,電能表記錄的最大需量超出用戶合同。引起需量超容的主要原因為需量算費用戶用電負荷過大,超過用戶合同約定需量;反向電量異常是指非發電用戶電能表反向有功總示值大于0,且每日反向有功總示值有一定增量。引起反向電量異常的原因主要有:計量回路接線錯誤、電能表故障、用戶負荷特性和載波信號干擾等。需量超容屬于負荷異常;反向電量異常屬于接線異常。二者無論是異常屬性還是引發異常的原因都無相同之處,理論上可以認為需量超容與反向電量異常無關聯,與本文提出的關聯算法求出的結果一致。
經過實例分析證明,本文提出的基于異常發生日期間隔天數的關聯度算法,能夠簡捷準確地計算出兩兩異常事件之間的關聯度。設置適當的關聯度閾值能有效地甄別和篩選出具有關聯的并發計量異常事件組合,為后續有效地利用異常告警數據對異常原因和異常用電行為進行分析診斷奠定了基礎。