袁 丹,黃繼明
(國(guó)網(wǎng)浙江寧波市鄞州區(qū)供電公司,浙江 寧波 315100)
以2016-01—2017-06-30用電信息采集系統(tǒng)中配電變壓器的停電信號(hào)數(shù)據(jù)為基礎(chǔ),登錄用電信息采集系統(tǒng),分別查詢并且導(dǎo)出2016—2017-06-30的專用和公用配電變壓器有效停電數(shù)據(jù),所提取的字段信息包括線路、戶號(hào)、戶名、終端停電時(shí)間、終端復(fù)電時(shí)間等。
由于調(diào)控部門臨時(shí)性運(yùn)行方式變更工作會(huì)產(chǎn)生短時(shí)間負(fù)荷轉(zhuǎn)移,所以用電信息采集系統(tǒng)中實(shí)時(shí)生成的配電變壓器停電信號(hào)的停電時(shí)長(zhǎng)不短于15 min,因此,該部分停電信號(hào)應(yīng)予以清洗,從調(diào)控部門臨時(shí)性運(yùn)行方式變更工作實(shí)際需求出發(fā),將停電時(shí)長(zhǎng)短于15 min的信號(hào)予以清洗,保留停電時(shí)長(zhǎng)大于等于15 min的停電信號(hào),再統(tǒng)計(jì)5 min內(nèi)專變和公變停電信號(hào)數(shù)量,將它們作為故障判別的兩個(gè)基礎(chǔ)自變量。
95598故障工單的處理結(jié)論以及供電企業(yè)平時(shí)運(yùn)行中的故障處理信息是判定配電線路故障是或者否的依據(jù)??紤]到配電線路計(jì)劃?rùn)z修或者故障停電后,其所供電的配電變壓器會(huì)發(fā)生停電,所安裝的專變、公變監(jiān)測(cè)終端將即時(shí)發(fā)送停電報(bào)文至用電信息采集系統(tǒng)主站,如果相關(guān)的專用和公用配電變壓器及其所屬線路并不屬于停電檢修設(shè)備范圍內(nèi),則判定為真實(shí)故障。
95598以“多戶停電”“臨時(shí)停電”“配合停電”為配電線路故障判定的依據(jù),充分考慮故障發(fā)生后用戶撥打電話以及95598坐席受理的時(shí)間預(yù)留120 min的余度,因此,停電信號(hào)與故障記錄進(jìn)行匹配時(shí),應(yīng)按照相同線路,且兩者發(fā)生時(shí)間間隔在120 min以內(nèi),則此時(shí)的停電信號(hào)標(biāo)記為真實(shí)故障事件,其余為非故障事件。
以2016年的信號(hào)故障記錄作為訓(xùn)練數(shù)據(jù),從2017年中隨機(jī)篩選500條故障記錄,以及500條非故障記錄作為測(cè)試數(shù)據(jù)。分析發(fā)現(xiàn),2016年共有26 897條數(shù)據(jù),其中關(guān)聯(lián)為故障的為1 155條,而未關(guān)聯(lián)為故障記錄為25 742條,樣本數(shù)據(jù)類型分布的不平衡會(huì)嚴(yán)重影響模型的訓(xùn)練效果。本文采用上采樣方法,復(fù)制稀有類的樣本,將故障記錄復(fù)制20次作為訓(xùn)練數(shù)據(jù),最終訓(xùn)練數(shù)據(jù)中共有49 997條記錄,其中,故障記錄為24 255,非故障記錄為25 742。
我們選取專變和公變的停電信號(hào)作為自變量,選用以下模型:

式(1)中:X1為專變停電信號(hào)數(shù)量;X2為公變停電信號(hào)數(shù)量;P為故障發(fā)生的概率。
運(yùn)用WEKA軟件調(diào)用Logistic模型,設(shè)置不同的臨界值P,得到的表格如表1所示。
其中,P為分類的臨界值,當(dāng)Logistic預(yù)測(cè)概率大于P,則判定為故障,否則判定為非故障,Total為總共識(shí)別出的故障數(shù)量,Hit為命中真實(shí)故障的數(shù)量,i-j為把i識(shí)別成j的數(shù)量(i=0,1,j=0,1),Correct rate為識(shí)別準(zhǔn)確率,Hit rate為故障命中率。經(jīng)過綜合平衡準(zhǔn)確率和命中率關(guān)系,選用P=0.5作為模型參數(shù),已達(dá)到既能識(shí)別故障,又能盡量減少對(duì)非故障的誤判的目的。具體如表2所示。
因此,訓(xùn)練得到的模型為:

其中,X1,X2的系數(shù)均大于0,說明隨著專變和公變停電信號(hào)數(shù)量的增加,故障概率也在提升,而專變停電信號(hào)數(shù)量的變化對(duì)故障概率影響更大。此模型的故障命中率為81.69%.利用該模型就能根據(jù)專變和公變的信號(hào)數(shù)量預(yù)測(cè)故障發(fā)生概率,如果預(yù)測(cè)概率大于0.5,則識(shí)別為故障,記為1;否則識(shí)別為非故障,記為0.同時(shí),我們還能得到自變量數(shù)量對(duì)應(yīng)的 OR 值(優(yōu)勢(shì)比),eβ1=1.001 947,eβ2=1.196 927,這表明1單位的專變停電信號(hào)數(shù)量,故障發(fā)生概率只會(huì)增加0.19%;而1單位的公變停電信號(hào)數(shù)量,故障發(fā)生概率會(huì)增加19%,公變停電信號(hào)導(dǎo)致故障的可能性比專變的大。
從2017年中隨機(jī)篩選1 000條記錄,對(duì)模型進(jìn)行了測(cè)試,測(cè)試結(jié)果如表3所示。

表1 不同概率P的訓(xùn)練結(jié)果明細(xì)表

表2 結(jié)果值

表3 測(cè)試結(jié)果明細(xì)表
模型的準(zhǔn)確性達(dá)68.1%,故障命中率達(dá)到了89.519 7%.
本文通過數(shù)據(jù)挖掘中的Logistic模型,建立基于配電器停電信號(hào)的故障識(shí)別模型,可有效過濾誤信號(hào)噪聲,在現(xiàn)有的硬件條件下,無需專業(yè)運(yùn)維人員的主觀介入,通過計(jì)算機(jī)自動(dòng)計(jì)算較為可靠地完成配電線路故障的自動(dòng)感知,有效提高配網(wǎng)搶修指揮工作效率。
參考文獻(xiàn):
[1]黃國(guó)良.快速查找在10 kV配電線路單相接地故障的應(yīng)用[J].科技資訊,2011,9(11):73-74.