張安勤, 吳 蕊, 張 挺
(上海電力大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院, 上海 200090)
隨著電力系統(tǒng)的信息化程度不斷提高,電網(wǎng)的數(shù)據(jù)規(guī)模飛速增長(zhǎng)[1]。如何對(duì)海量的電網(wǎng)數(shù)據(jù)進(jìn)行高效分析,快速準(zhǔn)確地檢測(cè)出異常的電力數(shù)據(jù),是電網(wǎng)安全有效運(yùn)行的重要保證。
異常檢測(cè)可以發(fā)現(xiàn)數(shù)據(jù)集中與一般數(shù)據(jù)有差異的數(shù)據(jù)對(duì)象,即一些與眾不同的數(shù)據(jù)[2]。在電力領(lǐng)域中,異常檢測(cè)可以作為數(shù)據(jù)研究的基礎(chǔ),如檢測(cè)出異常的電力負(fù)荷數(shù)據(jù)能有效提高負(fù)荷數(shù)據(jù)的質(zhì)量,對(duì)后續(xù)進(jìn)行負(fù)荷預(yù)測(cè)及合理規(guī)劃電網(wǎng)有著重要的作用[3-4]。異常檢測(cè)也可以直接用于數(shù)據(jù)分析,如異常用電檢測(cè)和設(shè)備故障檢測(cè)等。
異常檢測(cè)技術(shù)主要可以分為基于監(jiān)督、半監(jiān)督和無(wú)監(jiān)督3種類型。基于監(jiān)督的異常檢測(cè)方法的訓(xùn)練集由帶標(biāo)簽的正常和異常數(shù)據(jù)構(gòu)成,主要有概率統(tǒng)計(jì)方法[5]、神經(jīng)網(wǎng)絡(luò)方法[6]等;基于半監(jiān)督的異常檢測(cè)方法[7]能夠從大量無(wú)標(biāo)簽的數(shù)據(jù)及部分有標(biāo)簽的數(shù)據(jù)中挖掘出異常數(shù)據(jù)的信息;基于無(wú)監(jiān)督的異常檢測(cè)方法可以直接從無(wú)標(biāo)簽的數(shù)據(jù)集中檢測(cè)出異常數(shù)據(jù),主要有基于K-means算法的異常檢測(cè)[8]、基于AP聚類的異常檢測(cè)[9]和基于局部離群因子的異常檢測(cè)[10]等。基于監(jiān)督的異常檢測(cè)方法需要提前得到訓(xùn)練樣本的標(biāo)簽信息,一般可通過(guò)人工標(biāo)記來(lái)獲得足夠的訓(xùn)練樣本,成本及代價(jià)較高;而電力負(fù)荷數(shù)據(jù)集中大多數(shù)為無(wú)標(biāo)簽的數(shù)據(jù),采用無(wú)監(jiān)督的異常檢測(cè)方法具有代價(jià)小、簡(jiǎn)單、高效等優(yōu)點(diǎn)。……