楊 健,周亞同,劉 君
(1.河北工業(yè)大學(xué)電子信息工程學(xué)院,天津 300401;2.朗新科技集團(tuán)股份有限公司,天津 300041)
戶變關(guān)系是指用戶電表與變壓器(臺(tái)區(qū))的歸屬關(guān)系。低壓戶變關(guān)系識(shí)別是電力大數(shù)據(jù)處理領(lǐng)域里重要問題之一。準(zhǔn)確的低壓臺(tái)區(qū)戶變關(guān)系是線損得以精確分析調(diào)整的前提。有效計(jì)算低壓臺(tái)區(qū)線損并制定相應(yīng)的降損策略,對(duì)提高企業(yè)經(jīng)營(yíng)效益,提升電網(wǎng)運(yùn)行效率具有重要價(jià)值[1]。截至2014年底,全國(guó)網(wǎng)已完成智能電表的大范圍普及,可實(shí)時(shí)采集用戶負(fù)荷、電壓、電量等信息,為準(zhǔn)確進(jìn)行戶變關(guān)系異常識(shí)別提供了精準(zhǔn)的電力大數(shù)據(jù)支持。
現(xiàn)實(shí)中,由于低壓臺(tái)區(qū)用戶數(shù)量眾多,網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,以及頻繁的施工改造(如遷建、擴(kuò)容、割接、布點(diǎn)等),使得營(yíng)銷系統(tǒng)中用戶臺(tái)區(qū)歸屬?zèng)]有得到及時(shí)更新,造成部分終端用戶的真實(shí)戶變關(guān)系與臺(tái)區(qū)檔案記載不相符,而臺(tái)區(qū)戶變關(guān)系異常必然導(dǎo)致同期線損分析結(jié)果不準(zhǔn)確[2]。影響電網(wǎng)精益化管理。因此,戶變關(guān)系異常成為一個(gè)亟待解決的關(guān)鍵問題。
目前戶變關(guān)系識(shí)別方法主要有以下方式:
(1)臺(tái)區(qū)停電判別法。一線工作人員采用人工分臺(tái)區(qū)停電法,然后現(xiàn)場(chǎng)排查所有線路完成臺(tái)區(qū)用戶戶變關(guān)系的校驗(yàn)。該方法識(shí)別結(jié)果雖然準(zhǔn)確,但隨著用戶對(duì)供電要求的不斷提高,對(duì)臺(tái)區(qū)停電進(jìn)行低壓臺(tái)區(qū)戶變關(guān)系判定的方法已無(wú)法大范圍實(shí)施。
(2)高速電力線載波HPLC(high-speed power line carrier)通信技術(shù)判別法。通過變壓器側(cè)的載波通信終端和用戶側(cè)的接收端進(jìn)行載波通信,依據(jù)通信結(jié)果判定戶變關(guān)系異常。Xu等[3]提出了一種高速電力線載波辨識(shí)方法,變壓器端的拓?fù)鋯卧c用戶設(shè)備進(jìn)行信息交換并記錄,變壓器終端通過記錄匯總生成臺(tái)區(qū)拓?fù)鋵哟侮P(guān)系。采用載波通訊方式進(jìn)行戶變關(guān)系識(shí)別對(duì)采集器、集中器等硬件設(shè)備要求較高,且載波通信易受到噪聲干擾,若臺(tái)區(qū)用戶電壓波動(dòng)較大,則識(shí)別準(zhǔn)確率較低。
(3)我國(guó)智能電表已實(shí)現(xiàn)大范圍普及,用電信息采集系統(tǒng)可以自動(dòng)采集變壓器和臺(tái)區(qū)用戶用電數(shù)據(jù)。海量電力數(shù)據(jù)使得通過大數(shù)據(jù)分析判別低壓臺(tái)區(qū)用戶歸屬成為可能。利用采集到的96點(diǎn)/日采樣數(shù)據(jù)來實(shí)現(xiàn)拓?fù)渥R(shí)別則是一個(gè)最經(jīng)濟(jì)的方法。Tian等[4]針對(duì)徑向運(yùn)行的配電網(wǎng)絡(luò)提出了一種基于混合整數(shù)二次規(guī)劃MIQP(mixed integer quadratic programming)的拓?fù)渥R(shí)別模型;Babakemehr等[5]將壓縮感知和圖論相結(jié)合,提出了一種在線拓?fù)渥R(shí)別和監(jiān)控方案;Pappu[6]提出一種涉及主成分分析及圖論解釋的數(shù)據(jù)驅(qū)動(dòng)方法來識(shí)別低壓配電網(wǎng)的網(wǎng)絡(luò)拓?fù)洹?/p>
電壓日凍結(jié)曲線數(shù)據(jù)是典型的時(shí)間序列數(shù)據(jù),當(dāng)用戶電壓采樣時(shí)間節(jié)點(diǎn)不一致或臺(tái)區(qū)負(fù)荷較輕導(dǎo)致電壓日凍結(jié)曲線波動(dòng)性減小時(shí),僅采用用戶一天的電壓日凍結(jié)曲線進(jìn)行戶變關(guān)系識(shí)別極易造成誤判。為提高臺(tái)區(qū)歸屬判別的準(zhǔn)確度,應(yīng)將用戶多日電壓數(shù)據(jù)拼接成長(zhǎng)時(shí)間序列進(jìn)行戶變關(guān)系異常識(shí)別。
在低壓配電網(wǎng)中,電力用戶呈放射狀掛接在供電線路上。同一臺(tái)區(qū)內(nèi)的電表,由于掛接在同一變壓器下,電氣距離相對(duì)較近,電表采集的線路電壓波動(dòng)趨勢(shì)與變壓器端大致相同[7],如圖1所示。圖中,3條曲線分別為同一臺(tái)區(qū)下用戶電壓日凍結(jié)曲線,智能電表每隔15 min采集一次用戶電壓數(shù)據(jù),其中橫坐標(biāo)為一天96個(gè)采樣點(diǎn),縱坐標(biāo)表示電壓。

圖1 同一臺(tái)區(qū)用戶電壓曲線Fig.1 User voltage curves in the same station area
當(dāng)電表處于不同的變壓器區(qū)域時(shí),因?yàn)樽儔浩鞯慕K端輸出不同,電氣距離相對(duì)較長(zhǎng),電表采集的線路電壓波動(dòng)趨勢(shì)各不相同。不同臺(tái)區(qū)下用戶電壓日凍結(jié)曲線如圖2所示。

圖2 不同臺(tái)區(qū)用戶電壓曲線Fig.2 User voltage curves in different station areas
由于用電負(fù)荷存在不確定性,變壓器與用戶側(cè)電壓經(jīng)常產(chǎn)生波動(dòng)。由相同臺(tái)區(qū)及不同臺(tái)區(qū)下用戶電壓曲線波動(dòng)性對(duì)比可知,通過分析用戶電壓曲線波動(dòng)性可以進(jìn)行戶變關(guān)系識(shí)別。本文提出了一種基于臺(tái)區(qū)用戶用電負(fù)荷數(shù)據(jù)及電壓日凍結(jié)曲線數(shù)據(jù)的戶變關(guān)系異常識(shí)別方法,識(shí)別流程如圖3所示。

圖3 戶變關(guān)系異常識(shí)別流程Fig.3 Flow chart for anomaly recognition of users-transformer relationship
首先計(jì)算臺(tái)區(qū)線損率識(shí)別戶變關(guān)系異常臺(tái)區(qū)。然后確定異常臺(tái)區(qū)相鄰臺(tái)區(qū),將用戶一周的電壓曲線拼接成長(zhǎng)時(shí)間序列識(shí)別異常用戶,并在相鄰臺(tái)區(qū)間進(jìn)行戶變關(guān)系調(diào)整。最后通過調(diào)整前后臺(tái)區(qū)線損率對(duì)比驗(yàn)證識(shí)別結(jié)果是否準(zhǔn)確。
據(jù)統(tǒng)計(jì),我國(guó)線損多是由于中低壓臺(tái)區(qū)存在戶變關(guān)系異常引起的。通常戶變關(guān)系異常發(fā)生在相鄰臺(tái)區(qū)間,僅分析同一臺(tái)區(qū)用戶電力數(shù)據(jù)難以定位異常用戶。本文在臺(tái)區(qū)異常用戶識(shí)別時(shí),首先根據(jù)臺(tái)區(qū)線損波動(dòng)情況和平均線損率,區(qū)分臺(tái)區(qū)異常類型,定位存在戶變關(guān)系異常臺(tái)區(qū)。
當(dāng)某臺(tái)區(qū)線損率出現(xiàn)異常時(shí),首先考慮變壓器、集中器、互感器等臺(tái)區(qū)設(shè)備故障或線路狀況導(dǎo)致線損異常。經(jīng)排查,設(shè)備均正常運(yùn)行且線路狀況良好,供電半徑合格率指標(biāo)正常,初步排除設(shè)備故障或線路不合理因素。然后工作人員對(duì)該臺(tái)區(qū)下用戶進(jìn)行排查,無(wú)竊電行為發(fā)生。通過對(duì)臺(tái)區(qū)線損率波動(dòng)異常及采集成功率異常情況分析,懷疑該臺(tái)區(qū)因戶變關(guān)系異常導(dǎo)致線損率不合格。通常情況下,正常臺(tái)區(qū)線損率處于正常范圍內(nèi)且波動(dòng)較為平穩(wěn),存在用戶缺失的臺(tái)區(qū)線損率高且波動(dòng)較大,包含多余用戶的臺(tái)區(qū)線損率低于正常值或?yàn)樨?fù)值[8]。
為真實(shí)反映某臺(tái)區(qū)線損波動(dòng)情況,對(duì)臺(tái)區(qū)線損率數(shù)據(jù)進(jìn)行一階運(yùn)算。線損低于閾值的臺(tái)區(qū)內(nèi)通常存在較多其他臺(tái)區(qū)用戶,需要進(jìn)行優(yōu)先處理。線損率高于正常值且波動(dòng)較大的臺(tái)區(qū)通常存在用戶缺失情況,應(yīng)在其他臺(tái)區(qū)識(shí)別異常用戶后再行處理[9]。
根據(jù)異常臺(tái)區(qū)及其相鄰臺(tái)區(qū)下所有用戶的用電數(shù)據(jù),計(jì)算所有待識(shí)別臺(tái)區(qū)多日的線損率及線損波動(dòng)情況[10],計(jì)算公式為

式中:δ為臺(tái)區(qū)線損率波動(dòng);FM,i為第M個(gè)臺(tái)區(qū)在第i天的變壓器負(fù)荷;fM,i為M臺(tái)區(qū)下用戶第i天用電量總和;C為該臺(tái)區(qū)n天內(nèi)線損率波動(dòng)大小;δM,q為M臺(tái)區(qū)戶變關(guān)系調(diào)整前臺(tái)區(qū)原線損率波動(dòng);δM,p為M臺(tái)區(qū)戶變關(guān)系調(diào)整后新線損率波動(dòng);δN,q和δN,p為戶變關(guān)系調(diào)整前后N臺(tái)區(qū)線損率波動(dòng)。C表示用戶拓?fù)潢P(guān)系調(diào)整對(duì)線損率變化產(chǎn)生的影響。
計(jì)算各臺(tái)區(qū)線損率,確定可能存在戶變關(guān)系異常的臺(tái)區(qū)及其相鄰臺(tái)區(qū)。例如,某臺(tái)區(qū)2020年7月之前線損率一直保持正常,2020年7月臺(tái)區(qū)線損率突然增高,經(jīng)分析可能存在臺(tái)區(qū)用戶掛接錯(cuò)誤,需要定位相鄰臺(tái)區(qū)判定異常用戶所屬臺(tái)區(qū)。該臺(tái)區(qū)線損率統(tǒng)計(jì)如表1所示。

表1 某臺(tái)區(qū)線損率統(tǒng)計(jì)結(jié)果Tab.1 Statistics results of line loss rate in one station area
戶變關(guān)系異常通常產(chǎn)生于相鄰臺(tái)區(qū)間,根據(jù)臺(tái)區(qū)距離遠(yuǎn)近可以確定相鄰臺(tái)區(qū)。低壓臺(tái)區(qū)線路對(duì)供電范圍有明確要求:通常Ⅰ類臺(tái)區(qū)服務(wù)半徑為150 m,Ⅱ類臺(tái)區(qū)服務(wù)半徑為250 m,Ⅲ類臺(tái)區(qū)服務(wù)半徑為400 m,Ⅳ類臺(tái)區(qū)服務(wù)半徑為500 m,相鄰臺(tái)區(qū)關(guān)系示意如圖4所示。

圖4 物理位置相鄰臺(tái)區(qū)示意Fig.4 Schematic of station areas at adjacent physical locations
2個(gè)臺(tái)區(qū)距離遠(yuǎn)近的計(jì)算公式為

式中:(jA,ωA),(jB,ωB)分別為變壓器A、B的經(jīng)緯度;R為地球半徑。
通過供電臺(tái)區(qū)地理位置坐標(biāo)找到異常臺(tái)區(qū)周邊至少5個(gè)相鄰臺(tái)區(qū),獲取異常臺(tái)區(qū)及相鄰臺(tái)區(qū)內(nèi)所有用戶電壓日凍結(jié)曲線數(shù)據(jù)組建本文算法數(shù)據(jù)集。僅在相鄰臺(tái)區(qū)間進(jìn)行戶變關(guān)系調(diào)整,可以節(jié)約大量人力物力,避免全供電區(qū)域內(nèi)調(diào)整產(chǎn)生異常結(jié)果。
目前,國(guó)內(nèi)外采用電力數(shù)據(jù)研究臺(tái)區(qū)戶變關(guān)系通常采用以下3種方案。
(1)將電壓日凍結(jié)曲線數(shù)據(jù)進(jìn)行降維,然后采用邏輯回歸、SVM、K-means等傳統(tǒng)機(jī)器學(xué)習(xí)方法實(shí)現(xiàn)戶變關(guān)系識(shí)別。Liu Chen等[11]提出了一種改進(jìn)的K-means算法對(duì)用戶電壓數(shù)據(jù)聚類以識(shí)別用戶臺(tái)區(qū)歸屬;Zhao Guoai等[12]建立了多源數(shù)據(jù)挖掘的異常識(shí)別模型,應(yīng)用孤立森林、K-means、LSTM等算法并進(jìn)行特征融合識(shí)別拓?fù)洚惓S脩簦获T人海等[13]首先采用主成分分析法PCA(principal component analysis)對(duì)電力數(shù)據(jù)降維,然后將范數(shù)處理和凸松弛原理應(yīng)用于電力拓?fù)渥R(shí)別上,提高了識(shí)別準(zhǔn)確率。這類方法簡(jiǎn)單易于實(shí)現(xiàn),但缺點(diǎn)是物理原理不夠清晰,將電壓數(shù)據(jù)降至低維會(huì)降低臺(tái)區(qū)識(shí)別的精度,若兩個(gè)用戶電壓曲線波動(dòng)較為相似會(huì)導(dǎo)致誤判[14]。
(2)對(duì)用戶電壓曲線進(jìn)行動(dòng)態(tài)時(shí)間規(guī)整DTW(dynamic time warping)度量,或計(jì)算電壓曲線間的歐式距離,皮爾遜相關(guān)系數(shù)進(jìn)行判別。皮爾遜相關(guān)系數(shù)定義為


(3)基于“同臺(tái)區(qū)用戶電壓波形相似”的方法進(jìn)行戶變關(guān)系識(shí)別。電壓日凍結(jié)曲線由于用電負(fù)荷的不確定性造成扭曲變形,將電壓曲線劃分成多個(gè)子片段,利用滑動(dòng)時(shí)間窗口分析電壓曲線的極值點(diǎn)、曲線斜率、變化趨勢(shì)等信息,進(jìn)行戶變關(guān)系判別[16-17]。
采用傳統(tǒng)的機(jī)器學(xué)習(xí)方法如K近鄰算法KNN(K-nearest neighbor)、SVM、Logistic Regression等進(jìn)行分析需要大量的人工處理或者復(fù)雜的特征工程,在處理該任務(wù)時(shí)有一定的難度,而基于集成學(xué)習(xí)的方法由于計(jì)算復(fù)雜度極高并不適用[18]。
相比于一般的機(jī)器學(xué)習(xí)方法,深度學(xué)習(xí)在進(jìn)行時(shí)間序列分類時(shí)無(wú)需人工提取特征,且在面對(duì)大量數(shù)據(jù)樣本時(shí),性能往往更優(yōu)越。Karim等[19]提出了用于時(shí)間序列分類的LSTM-FCN網(wǎng)絡(luò),無(wú)需進(jìn)行復(fù)雜數(shù)據(jù)預(yù)處理且分類準(zhǔn)確度較高。Liu Chien-Liang等[20]將時(shí)間序列數(shù)據(jù)轉(zhuǎn)化為張量表示,提出了一種多元卷積神經(jīng)網(wǎng)絡(luò)MVCNN(multivariate convolutional neural network)用于處理時(shí)間序列數(shù)據(jù)。
神經(jīng)網(wǎng)絡(luò)無(wú)需對(duì)數(shù)據(jù)集進(jìn)行繁雜的特征工程即可提取時(shí)間序列不同特征。本文提出一種基于雙向長(zhǎng)短期記憶網(wǎng)絡(luò)和時(shí)間序列卷積BiLSTM-TCN(bidirectional long and short-term memory network and temporal convolutional network)的網(wǎng)絡(luò)模型解決單變量時(shí)間序列分類問題,相比于一般機(jī)器學(xué)習(xí)算法,識(shí)別準(zhǔn)確度進(jìn)一步提升。
為檢驗(yàn)所提出的BiLSTM-TCN模型對(duì)時(shí)間序列分類的效果,采用天津市某電力公司提供的多個(gè)臺(tái)區(qū)下變壓器和用戶電壓日凍結(jié)曲線數(shù)據(jù)。供電臺(tái)區(qū)數(shù)據(jù)以臺(tái)區(qū)和用戶為核心,以鏈表形式存儲(chǔ)在Oracle數(shù)據(jù)庫(kù)中。本文所用數(shù)據(jù)如表2所示。

表2 戶變關(guān)系識(shí)別數(shù)據(jù)Tab.2 Data of recognition of users-transformer relationship
在選取臺(tái)區(qū)下用戶電壓數(shù)據(jù)時(shí)應(yīng)注意以下3點(diǎn)。
(1)選取相同時(shí)間段的電壓數(shù)據(jù)。在進(jìn)行戶變關(guān)系判別時(shí),必須選取相同時(shí)間段的電力數(shù)據(jù)。隨著智能電表的普及,我國(guó)已基本實(shí)現(xiàn)電力數(shù)據(jù)的靜態(tài)采集,并針對(duì)電力數(shù)據(jù)中的漏點(diǎn)進(jìn)行補(bǔ)召。若補(bǔ)召后仍未采集到數(shù)據(jù),則用前一時(shí)刻的數(shù)值對(duì)漏點(diǎn)進(jìn)行補(bǔ)充,保證數(shù)據(jù)完整性。
(2)合適的電壓數(shù)據(jù)量。由于有些用戶電壓波動(dòng)差異較小,僅選取一天的電壓曲線數(shù)據(jù)無(wú)法精確判斷用戶臺(tái)區(qū)歸屬。目前對(duì)于采用多日電壓值進(jìn)行戶變關(guān)系判別的研究仍是空白。但如果選取電力數(shù)據(jù)周期太長(zhǎng),雖然可以提高識(shí)別精度,但樣本過于復(fù)雜,對(duì)算法要求較高且運(yùn)算速度會(huì)很慢。為兼顧識(shí)別準(zhǔn)確性與運(yùn)算速度,本實(shí)驗(yàn)將用戶一周的電壓數(shù)據(jù)拼接成一個(gè)長(zhǎng)時(shí)間序列,通過時(shí)間序列分類進(jìn)行用戶臺(tái)區(qū)歸屬判別。某用戶一周電壓波動(dòng)曲線如圖5所示。

圖5 臺(tái)區(qū)用戶一周電壓曲線示意Fig.5 Schematic of one-week voltage curve for user in station area
(3)電力數(shù)據(jù)異常值處理。智能電表通過網(wǎng)絡(luò)時(shí)間協(xié)議NTP(network time protocol)定點(diǎn)向采集系統(tǒng)上傳該時(shí)刻的凍結(jié)數(shù)據(jù)。由于數(shù)據(jù)傳輸過程中會(huì)受到干擾產(chǎn)生錯(cuò)誤數(shù)據(jù),這些錯(cuò)誤數(shù)據(jù)會(huì)導(dǎo)致數(shù)據(jù)分析結(jié)果不準(zhǔn)確,因此需要對(duì)用戶用電數(shù)據(jù)進(jìn)行預(yù)處理,對(duì)于異常值進(jìn)行數(shù)據(jù)清洗[21]。電力大數(shù)據(jù)中數(shù)據(jù)錯(cuò)誤一般分為重復(fù)數(shù)據(jù)和異常數(shù)據(jù)兩類。
由于電網(wǎng)狀態(tài)存在波動(dòng)性,智能電表采集數(shù)據(jù)經(jīng)常產(chǎn)生重復(fù)記錄。針對(duì)數(shù)據(jù)中存在的重復(fù)數(shù)據(jù)需要進(jìn)行檢查處理并剔除。異常數(shù)據(jù)可分為無(wú)效數(shù)據(jù)和不符合業(yè)務(wù)邏輯的數(shù)據(jù),無(wú)效數(shù)據(jù)主要是指所有或大部分實(shí)例為null或缺省的數(shù)據(jù),不符合邏輯的數(shù)據(jù)主要是指數(shù)據(jù)中存在的違反規(guī)則的實(shí)例,或者不在指定集合范圍內(nèi)的實(shí)例。數(shù)據(jù)不完整主要是指缺少本該存在的信息[22]。
對(duì)于采集系統(tǒng)中的缺失值、異常值及不符合業(yè)務(wù)邏輯的數(shù)據(jù)進(jìn)行分析并剔除。例如對(duì)于線損異常的數(shù)據(jù),需要根據(jù)臺(tái)區(qū)下用戶容量等信息進(jìn)行數(shù)據(jù)篩選。對(duì)于小于200 V及大于250 V的電壓數(shù)據(jù)進(jìn)行剔除。由于同一變壓器區(qū)域內(nèi)電表的電壓曲線相似度高,在戶變關(guān)系判別中,電壓數(shù)據(jù)為無(wú)效數(shù)據(jù),電壓曲線數(shù)據(jù)為有效數(shù)據(jù)。將已明確臺(tái)區(qū)歸屬的所有用戶一周內(nèi)的電壓日凍結(jié)曲線數(shù)據(jù)及其戶變關(guān)系作為正樣本,將臺(tái)區(qū)歸屬存在異常的用戶作為負(fù)樣本。對(duì)用戶數(shù)量較少的臺(tái)區(qū),可以對(duì)數(shù)據(jù)進(jìn)行增強(qiáng)擴(kuò)充訓(xùn)練集樣本,提升神經(jīng)網(wǎng)絡(luò)識(shí)別精確度。
3.1.1 雙向長(zhǎng)短期記憶網(wǎng)絡(luò)層
雙向長(zhǎng)短期記憶網(wǎng)絡(luò)BiLSTM由正、反兩個(gè)傳播方向的LSTM結(jié)合而成。由于拼接后的電壓曲線數(shù)據(jù)為長(zhǎng)時(shí)間序列,傳統(tǒng)遞歸神經(jīng)網(wǎng)絡(luò)RNN(recursive neural network)識(shí)別長(zhǎng)時(shí)間序列會(huì)產(chǎn)生梯度消失和梯度爆炸,為了能夠有效利用前后時(shí)間序列信息,故采用BiLSTM結(jié)構(gòu)。
BiLSTM由正向和反向LSTM拼接而成,LSTM包含輸入門、輸出門和遺忘門三部分。遺忘門選用sigmoid函數(shù)對(duì)前面時(shí)刻的記憶信息和新輸入信息進(jìn)行選擇。遺忘門的出現(xiàn)使得LSTM很難出現(xiàn)梯度消失問題。LSTM各個(gè)計(jì)算細(xì)節(jié)如下。


式中,ft為通過的信息量。輸入門可以描述為

細(xì)胞狀態(tài)(信息傳導(dǎo))Ct的計(jì)算公式為

輸出門的計(jì)算公式為

Ct通過門限結(jié)構(gòu)控制記憶單元中的輸入信息是否被記憶或者遺忘,從而實(shí)現(xiàn)傳遞有用信息,丟棄無(wú)用信息,彌補(bǔ)了RNN難以獲取到長(zhǎng)時(shí)間序列信息的不足。
為更好提取前后時(shí)間序列特征,本文引入BiLSTM網(wǎng)絡(luò)用于戶變關(guān)系異常識(shí)別,其網(wǎng)絡(luò)結(jié)構(gòu)如圖6所示。這類網(wǎng)絡(luò)在正向傳遞信息的同時(shí)還會(huì)進(jìn)行逆向傳遞,正向傳播層單元學(xué)習(xí)當(dāng)前時(shí)間序列之前的信息,反向傳播層學(xué)習(xí)當(dāng)前時(shí)間序列之后的信息,然后拼接兩個(gè)方向?qū)W習(xí)到的特征,進(jìn)而結(jié)合前后向時(shí)間序列信息。BiLSTM有效解決了LSTM只能保存前面信息這一問題,更有利于時(shí)間序列分類[23-24]。BiLSTM具有長(zhǎng)距離捕獲能力,被應(yīng)用于各種文本及時(shí)間序列分類任務(wù)中。Sharfuddin等[23]將BiLSTM深度遞歸網(wǎng)絡(luò)用于情感分類,Zeng等[25]提出Densenet-BiLSTM網(wǎng)絡(luò)用于關(guān)鍵字定位,通過BiLSTM提取時(shí)間序列特征,減少人機(jī)交互中時(shí)間消耗,在指令識(shí)別任務(wù)中取得了較高的準(zhǔn)確率。

圖6 BiLSTM網(wǎng)絡(luò)結(jié)構(gòu)示意Fig.6 Schematic of BiLSTM network structure
3.1.2 時(shí)序卷積網(wǎng)絡(luò)
由于時(shí)間序列數(shù)據(jù)具有次序性,傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)由于卷積核的大小限制不能很好的抓取長(zhǎng)時(shí)間序列的依賴特征,不適用于長(zhǎng)時(shí)間序列分類。時(shí)序卷積網(wǎng)絡(luò)TCN引入因果卷積,使得上下層之間具有因果關(guān)系,并使用殘差連接和擴(kuò)張卷積避免梯度消失問題,更好地控制模型記憶長(zhǎng)短,使其可以提取長(zhǎng)時(shí)間序列特征,提升時(shí)間序列分類準(zhǔn)確度[26]。
相比于普通一維卷積網(wǎng)絡(luò),TCN主要有兩點(diǎn)改進(jìn):
(1)因果卷積(causal convolution)。因果卷積通過某個(gè)時(shí)刻之前的時(shí)間序列信息得到這一時(shí)刻的值,具有嚴(yán)格的時(shí)間限制,可以充分利用之前時(shí)刻的時(shí)間序列信息。因果卷積示意如圖7所示。

圖7 因果卷積示意Fig.7 Schematic of causal convolution
本文中電壓數(shù)據(jù)為長(zhǎng)度672的長(zhǎng)時(shí)間序列數(shù)據(jù)。為了擴(kuò)大卷積的感受野,更好地提取長(zhǎng)時(shí)間序列特征,因果卷積必須增加網(wǎng)絡(luò)層數(shù)或選用更大的過濾器。但這會(huì)增加網(wǎng)絡(luò)模型復(fù)雜度,造成梯度消失、梯度爆炸、擬合效果差等問題。因此引入擴(kuò)張卷積。
(2)擴(kuò)張卷積(dilated convolution)。隨著卷積層數(shù)增加,擴(kuò)張卷積的擴(kuò)張系數(shù)成倍增加,通過在卷積窗口中引入更多的空洞,可以顯著增大感受野,降低計(jì)算量,簡(jiǎn)化網(wǎng)絡(luò)結(jié)構(gòu)。擴(kuò)張卷積示意如圖8所示。
在圖8中,擴(kuò)張卷積感受野擴(kuò)大了1、2、4、8倍,可以在網(wǎng)絡(luò)層數(shù)相同的情況下使得感受野得到明顯提升,提取到更長(zhǎng)時(shí)間序列特征。為避免神經(jīng)網(wǎng)絡(luò)層數(shù)增加產(chǎn)生梯度消失,TCN網(wǎng)絡(luò)使用殘差結(jié)構(gòu)將輸入與非線性輸出直接相連,提高了戶變關(guān)系識(shí)別的精度[27]。

圖8 擴(kuò)張卷積示意Fig.8 Schematic of dilated convolution
3.1.3 BiLSTM-TCN網(wǎng)絡(luò)模型
不同的神經(jīng)網(wǎng)絡(luò)可以提取時(shí)間序列不同特征。考慮到時(shí)間序列數(shù)據(jù)之間具有次序性,且單一的TCN對(duì)時(shí)間序列進(jìn)行建模存在無(wú)法編碼從后到前信息的問題[28],本文將雙向長(zhǎng)短期記憶網(wǎng)絡(luò)與時(shí)序卷積網(wǎng)絡(luò)并行拼接,提出了BiLSTM-TCN并行神經(jīng)網(wǎng)絡(luò)用于戶變關(guān)系識(shí)別。
基于BiLSTM-TCN的電壓時(shí)間序列分類模型由時(shí)序卷積網(wǎng)絡(luò)模塊和BiLSTM模塊兩部分組成。由于提取時(shí)間序列特征的質(zhì)量直接影響到識(shí)別結(jié)果的準(zhǔn)確性,與傳統(tǒng)方法相比,該方法無(wú)需對(duì)時(shí)間序列數(shù)據(jù)進(jìn)行復(fù)雜的特征工程即可實(shí)現(xiàn)從原始輸入到輸出的端到端映射。在分類過程中不僅能夠保留數(shù)據(jù)原始樣本,還通過融合兩個(gè)網(wǎng)絡(luò)提取到的不同時(shí)間序列特征,提高了分類的準(zhǔn)確率。BiLSTMTCN并行神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)框架如圖9所示。

圖9 BiLSTM-TCN網(wǎng)絡(luò)結(jié)構(gòu)模型Fig.9 Structural model of BiLSTM-TCN network
將長(zhǎng)時(shí)間序列分別輸入到BiLSTM模塊和TCN模塊,第1條支路中時(shí)間序列首先經(jīng)過維度混洗層,維度混洗層將時(shí)間序列維度轉(zhuǎn)換為具有單個(gè)時(shí)間步長(zhǎng)的多變量時(shí)間序列,從而提高模型訓(xùn)練的速度。然后經(jīng)過BiLSTM模塊后送入Dropout層。
第2條支路中每個(gè)時(shí)序卷積模塊包含擴(kuò)張因果卷積、WN層、Relu激活函數(shù)和Dropout層。
首先采用因果擴(kuò)張卷積提取具有多個(gè)時(shí)間步長(zhǎng)的單變量時(shí)間序列特征,然后將提取到的特征送入WN層進(jìn)行權(quán)值歸一化處理,最后通過Relu激活函數(shù)后送入Dropout層。由于卷積層數(shù)較多,在第2條支路中還引入殘差結(jié)構(gòu)避免梯度消失產(chǎn)生。2條支路將提取到的時(shí)間序列特征送入Concat模塊進(jìn)行特征融合。最后,經(jīng)過Dense層輸出分類結(jié)果。
3.2.1 可調(diào)參數(shù)設(shè)置
TCN卷積層中使用的過濾器數(shù)為64,卷積核大小設(shè)置為3;TCN網(wǎng)絡(luò)層中擴(kuò)張因果卷積層數(shù)設(shè)置為5,擴(kuò)張因子分別設(shè)置為1、2、4、8、16;激活函數(shù)選用Relu函數(shù),Resnet層數(shù)設(shè)置為1,配置訓(xùn)練方法使用Adam優(yōu)化器,學(xué)習(xí)率為0.01,使用均方誤差損失函數(shù)。
Keras的Bidirectional雙向?qū)觲rapper實(shí)質(zhì)上將具有前向處理能力和后向處理能力的并行LSTM進(jìn)行拼接。定義隱藏在一個(gè)Bidirectional層中的LSTM層,在正向LSTM隱藏層中使用128個(gè)存儲(chǔ)單元,平行于第1層的反向LSTM隱藏層也有128個(gè)存儲(chǔ)單元。
Concatenate層將兩個(gè)框架提取出的特征融合后,經(jīng)過一層Dense層輸出分類結(jié)果。由于需要將待識(shí)別用戶分成8類,所以全連接Dense設(shè)定為8。batch_size設(shè)置為64,在整個(gè)數(shù)據(jù)集上的迭代次數(shù)設(shè)定為15次。
3.2.2 對(duì)比實(shí)驗(yàn)
為驗(yàn)證BiLSTM-TCN算法在戶變關(guān)系異常識(shí)別中的有效性,本文引入6組對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)數(shù)據(jù)為多個(gè)臺(tái)區(qū)下用戶一周電壓曲線組成的單變量長(zhǎng)時(shí)間序列。使用識(shí)別準(zhǔn)確率,F(xiàn)1-score與損失函數(shù)作為評(píng)價(jià)標(biāo)準(zhǔn)。設(shè)置對(duì)比實(shí)驗(yàn)如下。
(1)LSTM:在一般RNN的基礎(chǔ)上添加了門限結(jié)構(gòu),選擇性提取信息。第1層LSTM神經(jīng)元個(gè)數(shù)設(shè)定為128,返回全部時(shí)刻輸出,Dropout層參數(shù)設(shè)定為0.2。第2層LSTM神經(jīng)元個(gè)數(shù)設(shè)定為128,僅返回最后時(shí)間步輸出,Dropout層參數(shù)設(shè)定為0.2,最后送入Dense層,輸出分類結(jié)果。
(2)BiLSTM:時(shí)間序列首先經(jīng)過embedding層進(jìn)行編碼,Bidirectional雙向?qū)訉⒄蚝头聪騆STM進(jìn)行堆疊,分別從正、反兩個(gè)方向?qū)r(shí)間序列特征進(jìn)行學(xué)習(xí),前向LSTM與后向LSTM均有128個(gè)神經(jīng)元,Dropout層參數(shù)設(shè)定為0.2,最后經(jīng)過Dense層輸出,進(jìn)行戶變關(guān)系識(shí)別。
(3)FCN將傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)CNN(convolutional neural network)網(wǎng)絡(luò)層中的全連接層替換為卷積層,在時(shí)間序列分類中取得了不錯(cuò)的效果。本文中全卷積網(wǎng)絡(luò)由濾波器大小分別為128、256、128的3個(gè)全卷積塊堆疊而成,全卷積模塊選用Relu激活函數(shù),時(shí)間序列經(jīng)過一維卷積后送入BN層進(jìn)行批量歸一化,經(jīng)全局平均池化后送入Dense層輸出分類結(jié)果。
(4)LSTM-FCN:將LSTM網(wǎng)絡(luò)與FCN網(wǎng)絡(luò)經(jīng)Concat層進(jìn)行并聯(lián)。
(5)Dense-FCN:將全連接層與FCN網(wǎng)絡(luò)經(jīng)過Concat層進(jìn)行并聯(lián),Dense層選用sigmoid激活函數(shù),Dropout層參數(shù)設(shè)定為0.2。
(6)GRU-FCN:門控循環(huán)單元GRU(gated recurrent unit)將LSTM中的遺忘門和輸入門融合為更新門,實(shí)現(xiàn)對(duì)LSTM網(wǎng)絡(luò)的簡(jiǎn)化。GRU參數(shù)與LSTM參數(shù)設(shè)置相同,將GRU網(wǎng)絡(luò)與FCN網(wǎng)絡(luò)經(jīng)Concat層進(jìn)行并聯(lián)。
(7)BiLSTM-TCN:本文提出模型,TCN可以提取長(zhǎng)時(shí)間序列特征,同時(shí)增加BiLSTM網(wǎng)絡(luò)層補(bǔ)足單向TCN無(wú)法連結(jié)前后時(shí)間序列的缺陷。
3.2.3 實(shí)驗(yàn)環(huán)境設(shè)置
所有實(shí)驗(yàn)均在華為云ModelArts上運(yùn)行,開發(fā)框架使用Tensorflow2.1.0,操作系統(tǒng)為L(zhǎng)inux運(yùn)行環(huán)境,使用python語(yǔ)言進(jìn)行編程,數(shù)據(jù)集為多個(gè)臺(tái)區(qū)下用戶一周的電壓曲線拼接成的長(zhǎng)時(shí)間序列。具體實(shí)驗(yàn)運(yùn)算環(huán)境如表3所示。

表3 實(shí)驗(yàn)運(yùn)算環(huán)境Tab.3 Experimental computing environment
3.2.4 識(shí)別性能評(píng)價(jià)指標(biāo)
為對(duì)比各算法優(yōu)劣,本文引入了準(zhǔn)確率以及F1-score作為算法評(píng)價(jià)指標(biāo)。準(zhǔn)確率Racc、精準(zhǔn)率Rpre、召回率Rrec及F1-score計(jì)算公式為

式中:TP為實(shí)際為某臺(tái)區(qū)用戶且算法分類正確的樣本數(shù);FP為不屬于某臺(tái)區(qū)但被算法劃分為該臺(tái)區(qū)的樣本數(shù);FN為屬于該臺(tái)區(qū)但被算法劃分到其他臺(tái)區(qū)的樣本數(shù);TN為不屬于某臺(tái)區(qū)且算法未劃分到該臺(tái)區(qū)的樣本數(shù);Racc為準(zhǔn)確率,表示所有用戶中算法正確識(shí)別臺(tái)區(qū)歸屬用戶所占比例;Rpre為精準(zhǔn)率,表示算法識(shí)別為某臺(tái)區(qū)用戶數(shù)中實(shí)際屬于該臺(tái)區(qū)用戶數(shù)所占比例;Rrec為召回率,表示正確識(shí)別臺(tái)區(qū)用戶數(shù)占該臺(tái)區(qū)實(shí)際用戶總數(shù)的比例。交叉熵其損失函數(shù)公式為

式中:m為臺(tái)區(qū)類別數(shù)量,如果預(yù)測(cè)類別與實(shí)際類別相同則為1,不同則為0;pic為樣本i第c類的概率;yic為指示變量;H(p,q)為目標(biāo)分布與預(yù)測(cè)分布的交叉熵;L(H)為多分類交叉熵?fù)p失函數(shù)。
本文在同一數(shù)據(jù)集上進(jìn)行了6組對(duì)比實(shí)驗(yàn),將準(zhǔn)確率、F1-score和交叉熵?fù)p失函數(shù)值作為評(píng)價(jià)標(biāo)準(zhǔn),對(duì)比本文提出的BiLSTM-TCN模型與其他網(wǎng)絡(luò)模型。各組模型識(shí)別準(zhǔn)確率如圖10所示。由各網(wǎng)絡(luò)模型準(zhǔn)確率對(duì)比圖可知,并行連接網(wǎng)絡(luò)對(duì)戶變關(guān)系識(shí)別準(zhǔn)確率顯著優(yōu)于單體神經(jīng)網(wǎng)絡(luò),識(shí)別精度均達(dá)到90%以上,說明采用兩種神經(jīng)網(wǎng)絡(luò)分別提取時(shí)間序列不同特征并進(jìn)行特征融合的方式能更好地提升戶變關(guān)系識(shí)別準(zhǔn)確率。其中BiLSTM-TCN與LSTM-FCN經(jīng)15輪迭代后識(shí)別準(zhǔn)確率均達(dá)到100%,GRU-FCN識(shí)別準(zhǔn)確率為95.74%,Dense-FCN識(shí)別準(zhǔn)確率為93.25%。

圖10 各組神經(jīng)網(wǎng)絡(luò)模型準(zhǔn)確度對(duì)比Fig.10 Comparison of accuracy among different neural network models
在單體神經(jīng)網(wǎng)絡(luò)中,F(xiàn)CN對(duì)于長(zhǎng)時(shí)間序列識(shí)別精度弱于另外兩種循環(huán)神經(jīng)網(wǎng)絡(luò),經(jīng)過15輪迭代后識(shí)別精度為72.37%。LSTM經(jīng)過15輪迭代后識(shí)別精度為78.31%。BiLSTM神經(jīng)網(wǎng)絡(luò)將正反向LSTM網(wǎng)絡(luò)進(jìn)行堆疊,對(duì)于長(zhǎng)時(shí)間序列建模能力明顯優(yōu)于單體LSTM網(wǎng)絡(luò),經(jīng)過15輪迭代后識(shí)別精度達(dá)到85.94%。各組神經(jīng)網(wǎng)絡(luò)模型交叉熵?fù)p失函數(shù)對(duì)比如圖11所示。

圖11 各組神經(jīng)網(wǎng)絡(luò)模型損失對(duì)比Fig.11 Comparison of loss among different neural network models
由實(shí)驗(yàn)結(jié)果可知,隨著訓(xùn)練輪次的增加,各組神經(jīng)網(wǎng)絡(luò)模型損失函數(shù)顯著下降。經(jīng)過15輪迭代后FCN損失函數(shù)最高,BiLSTM-TCN損失函數(shù)明顯低于其他神經(jīng)網(wǎng)絡(luò)模型。BiLSTM和LSTM網(wǎng)絡(luò)損失函數(shù)初始值較低,但趨于收斂速度較慢。FCN網(wǎng)絡(luò)與其他并行卷積網(wǎng)絡(luò)損失函數(shù)初始值較大,但下降到穩(wěn)定值的速度較快。
相比于單一LSTM,BiLSTM增加了反向傳播單元,能夠融合前后時(shí)間序列特征,效果更優(yōu)。TCN引入了擴(kuò)張卷積,可以在網(wǎng)絡(luò)層數(shù)相同的情況下提取到更多時(shí)間序列特征。將BiLSTM和TCN并行連接可獲得更優(yōu)的分類結(jié)果。各網(wǎng)絡(luò)模型準(zhǔn)確率、交叉熵?fù)p失值、F1-score、參數(shù)量的對(duì)比分析如表4所示。

表4 各網(wǎng)絡(luò)模型識(shí)別性能對(duì)比分析Tab.4 Comparative analysis for recognition performance of each network model
相比于其他神經(jīng)網(wǎng)絡(luò)模型,BiLSTM-TCN模型經(jīng)過較少的訓(xùn)練輪次就能達(dá)到較高的識(shí)別準(zhǔn)確率,在各臺(tái)區(qū)用戶電壓曲線數(shù)據(jù)集上的性能表現(xiàn)更優(yōu),具有較高實(shí)用價(jià)值。
模型輸出包括存在戶變關(guān)系異常的疑似用戶以及這些用戶應(yīng)屬臺(tái)區(qū)判定結(jié)果兩部分。為判定算法識(shí)別的準(zhǔn)確性,本文采用臺(tái)區(qū)線損率判定法進(jìn)行驗(yàn)證。通常10 kV電網(wǎng)線損率最高不超過6%。線損率超過9%的臺(tái)區(qū)劃為高損臺(tái)區(qū),會(huì)造成大量電能損失,這類臺(tái)區(qū)往往存在臺(tái)區(qū)用戶缺失,需要待其他臺(tái)區(qū)戶變關(guān)系調(diào)整后再行處理。而線損率太低甚至為負(fù)值的臺(tái)區(qū)往往存在較多其他臺(tái)區(qū)用戶,需要進(jìn)行優(yōu)先處理。將異常用戶加入到算法識(shí)別的臺(tái)區(qū)下,計(jì)算戶變關(guān)系調(diào)整前后各臺(tái)區(qū)線損波動(dòng)情況。某臺(tái)區(qū)調(diào)整前后線損率波動(dòng)如圖12所示。

圖12 某臺(tái)區(qū)戶變關(guān)系調(diào)整前后線損波動(dòng)曲線示意Fig.12 Schematic of line loss fluctuation curve before and after the adjustment of users-transformer relationship in one station area
調(diào)整前該臺(tái)區(qū)線損率為10%左右且線損波動(dòng)性較大,調(diào)整后臺(tái)區(qū)線損率達(dá)到正常范圍且線損率波動(dòng)顯著下降。由前后線損率對(duì)比可知,該臺(tái)區(qū)戶變關(guān)系調(diào)整正確,將該用戶戶變關(guān)系劃歸到該臺(tái)區(qū)下,否則該用戶不屬于該臺(tái)區(qū)。
準(zhǔn)確的戶變關(guān)系是營(yíng)配貫通深化應(yīng)用的前提,也是實(shí)現(xiàn)降損增效的根本途徑。頻繁的臺(tái)區(qū)改造使得大量用戶存在戶變關(guān)系異常,造成臺(tái)區(qū)線損計(jì)算出現(xiàn)較大偏差。本文首先根據(jù)各臺(tái)區(qū)變壓器及臺(tái)區(qū)下所有用戶不同時(shí)段的歷史負(fù)荷數(shù)據(jù),計(jì)算該臺(tái)區(qū)線損率及線損波動(dòng)情況,從而確定異常臺(tái)區(qū)。由于戶變關(guān)系異常通常發(fā)生在相鄰臺(tái)區(qū)間,根據(jù)臺(tái)區(qū)位置及變壓器供電范圍確定鄰近臺(tái)區(qū)關(guān)系,避免全局性戶變關(guān)系調(diào)整,可顯著提高戶變關(guān)系識(shí)別效率。對(duì)于異常臺(tái)區(qū)下異常用戶識(shí)別,傳統(tǒng)戶變關(guān)系識(shí)別僅采用一天的電壓曲線數(shù)據(jù)進(jìn)行降維或計(jì)算皮爾遜相關(guān)系數(shù),若曲線波動(dòng)性相似容易造成臺(tái)區(qū)歸屬誤判。本文根據(jù)同臺(tái)區(qū)下電壓曲線波動(dòng)相似性原理,將臺(tái)區(qū)用戶一周的電壓曲線拼接成長(zhǎng)時(shí)間序列,以提高識(shí)別準(zhǔn)確率。
傳統(tǒng)的機(jī)器學(xué)習(xí)方法處理長(zhǎng)時(shí)間序列需要進(jìn)行特征工程,而神經(jīng)網(wǎng)絡(luò)可以避免復(fù)雜的數(shù)據(jù)處理。由于傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)不能很好提取長(zhǎng)時(shí)間序列特征,因此本文提出基于BiLSTM-TCN的并行神經(jīng)網(wǎng)絡(luò)用于戶變關(guān)系識(shí)別。TCN通過引入擴(kuò)張卷積和殘差塊使得網(wǎng)絡(luò)層數(shù)相同時(shí)可以顯著增大感受野,從而提取更多時(shí)間序列特征。BiLSTM層由正向LSTM和反向LSTM拼接而成,從而結(jié)合提取到的前后向時(shí)間序列信息,具有對(duì)時(shí)間序列特征的長(zhǎng)距離捕獲能力。通過與其他傳統(tǒng)神經(jīng)網(wǎng)絡(luò)對(duì)比,本文提出的BiLSTM-TCN模型對(duì)戶變關(guān)系識(shí)別準(zhǔn)確度最高,且在訓(xùn)練輪次最少的情況下能較快達(dá)到收斂,具有較高的應(yīng)用價(jià)值。
為驗(yàn)證戶變關(guān)系識(shí)別的準(zhǔn)確性,分別計(jì)算戶變關(guān)系調(diào)整前后臺(tái)區(qū)線損率波動(dòng)性。若調(diào)整后異常臺(tái)區(qū)線損率達(dá)到正常閾值范圍內(nèi)則戶變關(guān)系判別正確,將該異常用戶加入該臺(tái)區(qū),否則戶變關(guān)系判別錯(cuò)誤。