饒歡 陳鳳超 何毅鵬



摘 要:針對配電網配變不匹配的問題,本文提出基于分類決策樹對電網配變不匹配問題的故障診斷算法,通過獲取省海量平臺計量數(shù)據和營銷數(shù)據,從數(shù)據質量檢查、數(shù)據真實性校驗、數(shù)據修正和數(shù)據駁回四個步驟對數(shù)據進行分析,從而達到提高數(shù)據質量的目的,分類決策樹算法的應用可以輔助調度人員迅速識別故障,保證配電網的安全穩(wěn)定運行。
關鍵詞:配電變壓器;決策樹算法;數(shù)據質量;故障診斷
0 引言
配電變壓器數(shù)據中電壓或電流超限后報警,配網調度員從數(shù)據庫中核查報警位置處理數(shù)據,調取臺賬數(shù)據與原始報文,逐一排查配變匹配問題。這種利用手工排查故障過程十分繁瑣,需要大量人力而且容易出錯,自動化數(shù)據校驗水平較低。為提高故障診斷的準確性和快速性,一些學者提出了基于專家系統(tǒng)[1]、人工神經網絡[2]、遺傳算法[3]和Petri網絡[4]的等多種排查方法,上述方法均存在一定的局限性,基于分類決策樹對電網配變不匹配問題的算法應用適應各種不利情況的配電網故障診斷方法,輔助調度人員迅速識別故障,保證配電網的安全穩(wěn)定運行。
1 決策樹算法
1.1 決策樹算法原理
決策樹[5-7]是在已知情況發(fā)生概率的基礎上,通過構成決策樹來計算凈現(xiàn)值的期望值是否大于等于零的概率,判斷發(fā)生問題可行性的決策分析方法。在機器學習中,決策樹是一個預測計算模型,它代表的是對象屬性與對象值之間的相互映射關系。決策樹是一種樹形結構,其中決策樹每個內部節(jié)點表示一個屬性上的測試,決策樹每個分支代表一個測試輸出,決策樹每個葉節(jié)點表示一種類別。
1.2 分類決策樹算法原理
分類樹是一種比較常用的分類方法,屬于一種有監(jiān)督機器學習算法,從一堆待測試樣本中選取樣本,每個樣本都有一組相應的屬性和類別,屬性和類別是提前確定的,那么通過有監(jiān)督學習得到一個分類器,分類器可以新的樣本給出正確的分類。分類決策樹模型表示一種對實例進行樣本分類的樹形結構,決策樹通常由有向邊和結點兩部分組成,樣本中的每個結點由內部節(jié)點和葉子節(jié)點組成。內部節(jié)點通常表示的是特征或者屬性,葉子節(jié)點表示單個獨立的個體,屬于不能再細分的類別。當樣本的節(jié)點進行分類劃分時,從一個根節(jié)點開始,針對實例的某一特征向量進行測試,依據樣本的測試結果,將樣本實例分配到其子結點,每一個樣本子結點和特征的取值相對應。設置相應閾值,不斷遞歸向下移動,到達葉結點為止,這時將樣本實例分配到葉子結點的種類。
1.3 分類決策樹的建立
分類決策樹剪枝是針對決策樹過早擬合問題而提出來的。分類決策樹剪枝一般分先剪枝和后剪枝。通過提前停止樹的構造方法屬于先剪枝,假如決定在某個關鍵節(jié)點不再進行分裂,對樹節(jié)點進行剪枝,如果剪枝停止,那么該節(jié)點就變成樣本中的葉子節(jié)點。對該葉子節(jié)點選取包含樣本子集中類別最多的一個類,作為樣本節(jié)點的一個類別。后剪枝是針對完全成長的樹進行剪枝,通過去掉節(jié)點的分枝,用葉子節(jié)點代替,葉子節(jié)點用子集中類別中出現(xiàn)頻率最高的類別進行標記。本文基于分類決策樹對電網配變不匹配問題的故障診斷算法采用后剪枝的策略。
2 整體實現(xiàn)
本文從數(shù)據質量檢查、數(shù)據真實性校驗、數(shù)據修正和數(shù)據駁回四個步驟實現(xiàn)了解決電網配變不匹配問題,在同一個用戶同時擁有高供高計和高供低計兩個測量點,電壓數(shù)據經常在高壓側和低壓側切換,造成電壓越限。用戶側設備更新,而計量系統(tǒng)或營銷系統(tǒng)中的變比數(shù)據未及時同步或填寫不規(guī)范,或由于計費原因不能同步更新,直接影響PQIU等量測數(shù)據計算。本文數(shù)據來源于某省海量平臺計量數(shù)據和省海量平臺營銷數(shù)據,先匹配臺帳營銷數(shù)據,獲取導致錯誤異常報數(shù)據警,系統(tǒng)中對UI設定上下限的閾值。獲取某省海量平臺計量數(shù)據和省海量平臺營銷數(shù)據。檢查電壓電流,匹配臺帳營銷數(shù)據,提取異常報警數(shù)據,檢查異常數(shù)據確實、重復情況,如果沒有重復,提取異常超限數(shù)據,提取數(shù)據相關匹配、變比、電壓、電流信息,利用變比關系對比量測數(shù)據,高供高記變比計算和高供低記變比計算,利用變比關系對比量測數(shù)據,如果匹配,錄入缺失數(shù)據計量點位,如果不匹配。利用專家系統(tǒng)分析具體原因[8,9],建立數(shù)據規(guī)則,利用決策樹皮判別,訓練決策樹參數(shù),載入后續(xù)參數(shù),分析電壓電流報警原因,建立數(shù)據集規(guī)則,判斷是否誤報警,如果沒有報警輸出真實報警信息,并重新檢查線路功率,如果報警,恢復變比數(shù)據,包含匹配信息、變比信息、電壓計量數(shù)據和電流計量數(shù)據。
2.1 數(shù)據質量檢查
首先由計量系統(tǒng)得到越限警告,核查越限處數(shù)據是否有缺失、重復、格式錯誤,如果數(shù)據有問題,結束質量檢查;再判斷數(shù)據有問題的次數(shù),生成錯誤報告,結束質量檢查,如果數(shù)據多次沒有問題,從省海量平臺重新下載數(shù)據。提取報警數(shù)據,校驗警報信息的完整性,包括報警數(shù)據的時間、地點、設備編號、報警類型與嚴重程度,并且需要檢查報警時間是否缺失。報警地點與報警設備線路需要相匹配,報警設備編號與臺賬數(shù)據信息需要匹配等。等待報警類型提取確認,查看是否存在明顯誤報信息如圖1所示。
2.2 數(shù)據真實性校驗
使用基于決策樹的專家系統(tǒng)判別錯誤原因,判別規(guī)則流程如圖2所示,越線比例安裝大、中、小三個維度來劃分,持續(xù)時間按長、短兩個維度來劃分,其中規(guī)則中的“大”、“中”、“小”、“長”和“短”等詞語使用明確的閾值替代。排查工作集從越線比例大小、持續(xù)發(fā)生時間長短、是否斷續(xù)出現(xiàn)、是否有高供高計和高供低計混亂。
擬使用分類和回歸書(CART)模型來訓練閾值。CART描述如:用s表示閾值,t表示節(jié)點位置,則s的優(yōu)劣衡量為:其中tL,tR為t的左/右子節(jié)點,其中,PL代表左子節(jié)點的記錄數(shù)占訓練集的記錄數(shù)比例,PR代表右子節(jié)點的記錄數(shù)占訓練集的記錄數(shù)比例,P(j|tL)表示在tL處,j類的記錄數(shù)占節(jié)點的記錄數(shù)的比例,P(j|tR)表示在tR處,j類的記錄數(shù)占節(jié)點的記錄數(shù)的比例,使用Φ(s|t)取得最大值的劃分閾值作為本條規(guī)則的閾值。
2.3 數(shù)據修正
當配電變壓器重過載報警,負載超限60%,持續(xù)發(fā)生30分鐘閾值大于12h,時常出現(xiàn)斷續(xù),利用分類決策樹算法進行數(shù)據分析和過濾,如果沒有超限,將數(shù)據寫入修正工單如圖3所示。
2.4 數(shù)據駁回
當越限比例閾值大于130%,持續(xù)時間大于16h,采用分類決策樹算法,如果沒有斷續(xù)出現(xiàn),變比未及時更新,將數(shù)據駁回進行手工排查如圖4所示。
3 結語
本文提出基于分類決策樹對電網配變不匹配問題的故障診斷算法,從數(shù)據質量檢查、數(shù)據真實性校驗、數(shù)據修正和數(shù)據駁回四個步驟實現(xiàn)了電網配變不匹配問題的快速診斷和定位。該故障診斷流程包括分類決策樹的建立、剪枝與測試。與其他分類算法相比,分類決策樹不需要參數(shù)假設,且準確率較。
參考文獻
[1] 劉少宇,郭宗軍,董明,等.專家系統(tǒng)在變電站設備診斷中的應用[J].高電壓技術,2001(5):17-19.
[2] 陳長征,勾軼,王毅,等.基于遺傳神經網絡的汽輪發(fā)電機組故障診斷研究[J].高電壓技術,2003(8):1-2+25.
[3] 顏景斌,夏賽,王飛,等.基于改進遺傳算法的有源配電網故障定位分析[J].電力系統(tǒng)及其自動化學報,2019(6):107-112.
[4] 劉棟,陳允平,沈廣,等.基于UML和Petri網的電力系統(tǒng)恢復模型[J].高電壓技術,2006(6):90-93+121.
[5] 焦亞男,馬杰.一種改進的MEP決策樹剪枝算法[J].河北工業(yè)大學學報,2019(6):24-29.
[6] 王英英,羅毅,涂光瑜.基于粗糙集與決策樹的配電網故障診斷方法[J].高電壓技術,2008(4):794-798.
[7] 中國電力科學研究院,國家電網公司,國網遼寧省電力有限公司沈陽供電公司.基于復雜事件處理技術和決策樹的配電網態(tài)勢感知方法:CN201610237515.2[P].2016-09-07.
[8] 馬春雷,丁健,陳宣林,等.基于決策樹自標識的主動配電網狀態(tài)估計算法[J].電力大數(shù)據,2019(5):26-32.
[9] 陳思翰.試析智能配電網技術在配電網中的應用[J].大科技,2019(35):101.