白景濤,周照宇,王中一,孫黎霞
(河海大學 能源與電氣學院,江蘇 南京 211100)
電力生產中,工作人員必須安全規范地進行電氣設備操作及高空作業,否則容易發生事故。資料表明,電力系統事故的發生大部分與工作人員的違規操作行為有關。為了減少不必要事故的發生,電力企業一方面對工作人員進行學習教育,提高個人素質,另一方面,在電力生產過程中配置了視頻監控系統。但是,監控系統只能進行事后人工取證,不能發揮其主動性和實時性的作用,無法及時制止不安全行為的發生,減少電力事故出現的頻次。如何有效地利用視頻監控數據,在電氣違規操作發生前或者在發生過程中及時、有效地發出警示,降低電力事故的發生率,是建設堅強智能電網不可缺少的一部分[1-3]。
行為識別是人工智能研究領域的熱點之一,其目的是對檢測的行為進行識別,比如,判別哪些行為屬于異常,哪些行為屬于正常。19世紀的中后期,JOHANSSON教授使用點模型進行人體的描述開始,研究人員通過人工設計的人體特征進行行為識別[4],但是,該類方法泛化能力不強,實際應用受到局限。此后,隨著技術的發展,基于深度學習的行為識別方法得到了快速發展,該方法省略了特征設計過程,具有深度神經網絡自主學習數據的特征[5]。常用的深度神經網絡有卷積神經網絡[6-9]、循環神經網絡[10-15]等。但是,研究者發現,深度神經網絡的性能有時不會隨著網絡的寬度和深度的增加而提高,并且會出現網絡退化、計算速度下降及模型過擬合等問題。殘差網絡的出現緩解了深度學習模型隨網絡深度增加模型性能下降的問題,而且該網絡容易優化,使其得到了廣泛應用[16]。
基于深度學習網絡行為識別模型的建立需要高質量的數據集,它能使深度網絡更好地完成識別任務。但在實際電力生產中,正常行為發生頻次較高,但少有被記錄下來;違規行為發生的頻次相對較低,但多被記錄下來;這導致樣本數據中正樣本和負樣本不平衡。而且,數據采集設備質量參差不齊,高質量的數據很難獲得。如何在數據質量差的情況下選擇合適的深度學習方法,在電力生產過程中進行有效且準確的變電站工作人員違規行為識別是電力安全管控中值得研究的課題之一。
針對數據集的不均衡和樣本少,文中采用圖像增強的方法生成數據,實現數據的均衡;使用深度殘差網絡ResNet-18進行遷移學習,減弱數據質量對評估性能的影響;使用K最近鄰(K-nearest neighbor, KNN)分類器提升模型識別能力。文中以某電網實際數據為基礎,采用文中所提方法,能夠準確識別變電站工作人員的違規行為,評估準確率達到90.7%。
殘差網絡(residual network, ResNet)一經提出,就影響了深度學習在各個領域的發展。殘差網絡借助跳躍結構,減少了深度學習模型逐層特征提取過程中的信息損失,可以顯著解決深度網絡訓練過程中的梯度消失和梯度爆炸問題,從而保證良好的模型性能。它是由多個殘差塊連接一起而構成的,殘差塊由殘差部分和直接映射兩部分組成,其結構如圖1所示。
第i個殘差單元可表示為:
xi+1=f(F(xi,Wi)+h(xi))
(1)
式中:xi、xi+1和Wi分別表示第i個殘差單元的輸入、輸出和權重矩陣;f()是ReLU非線性激活函數;h(xi)是直接映射部分;F()為殘差映射部分。

圖1 殘差網絡塊結構示意圖
為了實現變電站人員電氣違規行為的識別,文中使用ResNet-18-KNN模型建立變電站工作人員的工作狀態圖像數據同其行為類別之間的非線性映射關系,圖2為電氣違規行為識別的模型設計框架。

圖2 電氣違規行為識別的模型框架
原始數據集來自某實際電網,該數據有兩個特點:第一,由于受到成像設備和環境以及成像對象本身特點等諸多因素的影響,大多數圖片都存在光照不均,圖像色彩偏暗,圖像質量不佳等特性;第二,圖像數據樣本有限,且不均衡,“行為正常”(正樣本)占比較少,行為異常與行為正常的樣本數量的比例達到9∶2。以上特點,均會導致訓練出來的模型預測性不佳。為了獲得較高的預測準確率,對圖像數據進行了增強與擴充。
文中使用圖像增強技術[17-18]對原始圖像進行增強,減少環境噪聲對評估模型性能的影響。在此基礎上,將去霧算法、對比度增強、降噪等方法進行耦合,對原始數據進行數據擴充,使得數據中的“行為正常”和“行為違規”樣本比例基本達到1∶1。
圖3(a)和圖3(b)分別是原始圖像以及數據增強后的圖像,可以明顯看出數據得到了增強。


圖3 圖像增強
從深度學習的角度來說,高質量的訓練數據有利于提高所建模型準確度。但是,在很多情況下,特別是針對某個特定的應用場景,都不可能找到絕對充分的數據樣本。為了解決這個問題,文中將殘差網絡和遷移學習相結合,大大緩解數據源不足的問題。遷移學習可以將某個領域中已經學習好的模式或者知識充分應用到不同但有一定關系度的領域或者問題中,實現目標領域的學習任務。文中使用ResNet-18網絡進行遷移學習,其結構和參數可參考文獻[16]。
文中使用KNN分類器對提取的特征進行分類并標簽。距離d用來衡量不同數據的特征值之間的相關程度:
(2)
式中 :Xi和Xo都為n維向量,且Xo為目標向量,Xi為第i個數據向量;di為數據i的距離。
文中采用混淆矩陣,以正確率和F1度量(F1-Measure)作為評價指標,綜合評估模型性能的優劣。混淆矩陣如表1所示,其中,TP和FN分別為真陽性和偽陽性,表示為行為違規樣本被正確或錯誤評估的數目;FP和TN分別為偽陰性和真陰性,表示行為正常樣本被錯誤或正確評估的數目。

表1 混淆矩陣
根據混淆矩陣,可以計算模型的準確率和F1度量,其數學表達分別為:

(3)
(4)
文中數據均來自實際現場,違規行為表現形態多樣,有未帶安全帽、未使用保險繩、未設置隔離柵欄等。總數據為165個,其中“行為違規”數據135個,“行為正常”數據30個。數據增強后,訓練驗證數據758個,其中“行為正常”數據為380個,“行為違規”數據379個。訓練驗證數據集80%數據進行訓練,20%數據進行驗證;測試數據322個,其中“行為正常”數據160個,“行為違規”數據162個。
采用文獻[16]所示的網絡結構和參數,對網絡進行訓練。圖4為訓練過程圖,訓練結果收斂且驗證準確率較高,達到88%,驗證了遷移學習的可行性和有效性。

圖4 訓練過程圖
文中使用擴充后的數據進行遷移學習,將ResNet-18網絡同其他預訓練模型AlexNet網絡、SqueezeNet和GoogleNet網絡的識別能力進行了比較,測試結果如表2所示。

表2 評估結果
測試結果表明,從準確率指標和F1度量指標上來看,ResNet-18網絡的性能要遠遠高于AlexNet網絡、SqueezeNet網絡和GoogleNet網絡,準確率指標分別高16.2%、4.4%和10.9%;F1度量指標分別高0.18、0.05和0.14。為更加直觀體現ResNet-18的性能,文中使用類激活可視化(class activation map, CAM)方法將表中性能最好的兩個神經網絡進行可視化,色標值越高意味該區域對識別結果影響越大,如圖5所示。



圖5 原圖和不同模型類激活圖
圖5(a)為一張設置隔離柵欄的照片,理想的關注區域應該為人和柵欄所在區域。由圖5(b)、圖5(c)可知,ResNet-18網絡的關注區域相比于GoogleNet,更接近人們理想的關注區域,說明該模型更接近人類智能,特征提取能力強。
為進一步提升模型的性能,本文使用ResNet-18網絡進行特征提取,然后使用KNN進行分類,建立ResNet-18-KNN模型。
原始數據由ResNet-18網絡特征提取的特征向量為512維,形成758512的訓練數據集;322512的測試驗證集。文中使用5折交叉驗證的方法訓練KNN分類器,并將它與支持向量機(support vector machine, SVM)和決策樹(decision tree, DT)分類器做了對比,評估結果如表3所示。

表3 評估結果
由表3可知,相比于ResNet-18、ResNet-18-SVM和ResNet-18-DT,ResNet-18-KNN的準確率指標和F1度量分別高0.9%、6.5%、28.6%和0.02、0.09、0.32。這說明ResNet-18-KNN模型擁有很好的性能,可以準確識別變電站人員行為是否違規。
本文研究基于深度學習的變電站人員電氣違規行為的識別方法。運用遷移學習和數據增強技術解決了數據樣本不足且數據樣本類別不均衡的問題。利用ResNet-18網絡進行遷移學習,完成原始數據特征提取;利用KNN分類器完成變電站人員電氣違規行為的識別。實驗結果表明,ResNet-18-KNN模型的準確性和F1較高,可以準確識別變電站人員是否有違規行為。該模型具有很強的應用價值,可以及時發出預警,減少違規事件的發生。本文后續研究工作將豐富更多電力行為相關場景,擴充更多的樣本信息,更好地實現電力系統變電站的安全智能管控。