文/袁丹 黃繼明
隨著社會經濟發展對電力需求的日益增大,社會各界對供電可靠性的要求越來越高,用戶對故障停電的容忍程度不斷降低,配網搶修管理現狀與用戶日益增長的服務需求之間的矛盾日益突出。
傳統配電網搶修模式主要依賴于用戶電話報修,故障描述不清晰,故障報修不及時,同一故障點多個工單難以合并,影響搶修效率。隨著經濟社會發展,“被動式搶修”越來越難以適應技術進步和服務提升的需要,配電網搶修系統信息集成不足、模塊化技術支撐不足、統調能力不足等問題日益凸顯。
為此,從配電網專用和公用線路停電信號數量出發,運用大數據在線挖掘技術,能有效識別配電網線路的真實故障,建立一個能快速識別有效故障的研判模型,提升配電線路故障識別的及時性和準確性,為配網搶修指揮和故障報備提供實時數據支持,提高故障報備和用戶通知工作的效率。
以2016年1月1日至2017年12月31日用電信息采集系統中配電變壓器的停電信號數據為基礎,登錄用電信息采集系統,分別查詢并且導出2016年1月1日至2017年12月31日的專用和公用配電變壓器有效停電數據,所提取的字段信息包括:線路、戶號、戶名、終端停電時間、終端復電時間等。

表1:決策樹訓練結果表

表2:決策樹模型測試結果表
從電網用電信息采集系統中導出2016年以來的專用和公用配電變壓器有效停電數據,所提取的字段信息包括:線路、戶號、戶名、終端停電時間、終端復電時間等,對其中停電時長小于15分鐘的信號進行剔除,并以5分鐘為時間間隔分別整理出專、公配電停電信號數量作為自變量數據;
從PMS系統查中導出2016以來的配網檢修計劃信息,所提取的字段信息包括:工作日期、主線路名稱、實際工作開始時間、實際工作結束時間、執行情況描述、電壓等級等,根據PMS系統中相同時段的停電檢修計劃對自變量數據進行匹配和剔除;再次對95598工單中的故障和供電企業平時運行記錄中的故障進行信息整理和合并作為故障因變量數據。
以2016年的公、專變停電信號數及故障記錄作為訓練數據,以2017年數據作為測試數據。數據處理后,2016年共有26898條數據,其中關聯為故障的為1155條,而未關聯為故障記錄為25743條,從數據上看,樣本的兩類數據分布極為不平衡,這會導致類型分布的不平衡會嚴重影響模型的訓練效果,本文采用上采樣方法,復制稀有類的樣本,將故障記錄復制20次作為訓練數據,最終訓練數據中共有49998條記錄,其中故障記錄為24255,非故障記錄為25743。
我們借助SPSS Modeler數據挖掘軟件,運用決策樹與BP神經網絡分別對數據進行訓練及測試,以公變和專變的停電信號數量為輸入變量,是否故障為輸出變量。

表3:神經網絡模型訓練結果表

表4:神經網絡模型測試結果表
在SPSS Modeler軟件中選用C4.5算法建模,使用誤分類損失矩陣,其中把非故障識別成故障的懲罰系數為3,把故障識別成非故障懲罰系數為1,這是由于系統對識別為故障的事件會委派維修員去現場,如果判斷錯誤,成本較高。接著再對模型進行剪枝,剪掉小于170的節點,最后得到模型含有11個節點,21個枝。該模型的訓練和測試結果如表1所示。
Total表示總共識別出的總數據量,1表示故障,0表示非故障,i-j表示把i識別成j的數量(i=0,1,j=0,1),Correct rate 表示識別準確率,Hit Rate表示故障命中率。由于在主動搶修中,把非故障識別成故障成本較高,因此故障命中率是一個比較重要的指標,它指的是識別為故障的事件中,真實故障所占的比例。
從2017年數據中,隨機篩選10%數據,進行模型測試。如表2所示。
該模型的訓練故障命中率為90.99%,測試命中率為72.94%。
在SPSS Modeler軟件中選用神經網絡算法建模,設置最多訓練500次,選用三層網絡進行建模。該模型的訓練和測試結果如表3、4所示。
該模型的訓練故障命中率為76.66%,測試的故障命中率為72.94%。
比較兩個模型所得到的結果,決策樹得到的結果更精確,總共有498個真實故障,模型識別出321個故障,其中正確的有254個故障,準確率達到72.94%。 故障識別準確率得到了極大提升,為主動搶修的實施提供了數據支持。
本文通過數據挖掘中的決策樹與神經網絡模型,建立一種基于配電器停電信號的線路故障識別模型,準確度較高,使得在不增加硬件投入的前提下,利用已有的設備和數據資源大幅提高對配電線路的可靠感知能力。加快了局部性配電線路的停電故障的識別能力,使配網搶修指揮人員在收到故障、投訴工單或調控部門發出預警前感知配網的疑似故障信息,并開展主動搶修。