黃文華,陳 茜,賈明俊
(貴州大學 大數據與信息工程學院,貴陽550025)
要構建電氣火災神經網絡模型,首先需要對采集到的特征值進行篩選,挑選出其中對電氣火災發生具有決定性因素的特征值。比較典型的能夠引發電氣火災的故障有三相負序不平衡故障、線纜溫度超限故障、剩余電流超限故障等[1]??梢允褂眠@些典型故障數據對神經網絡加以訓練,判定與分類正常電氣回路與故障回路。
本文首先給出了一般性的神經網絡的數學定義,為后續使用自組織神經網絡與SOM競爭網絡打下理論基礎;其次,使用數據分析工具SPSS對電氣回路特征值進行回歸分析,挑選出合適的特征值;最后通過自組織神經網絡對電氣回路故障進行判定,使用SOM競爭網絡對故障數據進行分類,完成了對待測試數據的分析。
神經元通過樹突接收其它神經元傳輸的一定數目的信息,并且做一些計算,然后將結果通過軸突傳送到其它節點。由此可以抽象出人工神經網絡的模型,結構如圖1所示。x1、x2、x3為輸入節點,x0與是偏度單元,在實際應用中偏度單元能夠增加函數的靈活性,提高了神經元的擬合能力,表示第j層的第i個神經元,如a1(2)表示第二層的第一個激勵,是由前面輸入節點計算得到的輸出結果,定義權重為第i層到第j層的作用,如表示的是第一層的第二個神經元x2到第二層的第一個神經元所起到的作用,Hw(x)表示的是人工神經網絡輸出的結果。

圖1 人工神經網絡模型Fig.1 Artificial neural network model
本文把第一層作為輸入層,x1、x2、x3也可以稱為特征值,其向量形式為X=[x0x1x2x3],最后一層為輸出層,中間一層為隱藏層,輸入層到隱藏層的權值矩陣為隱藏層到輸出層的權值矩陣為,選用sigmoid函數作為激活函數隱藏層單元的算數表達式(1)所示:

其向量表達式(2)為:

最終得到輸出神經元的表達式(3):

其向量表達式(4)為:

為了能夠較為準確的分析設備是否存在發生火災的隱患,需要選取合適的特征值作為神經網絡的輸入,同時分析采集數據之間的相關性,對數據進行簡化計算[2]。選用SPSS Statistics進行線性回歸分析,分析電氣火災監控系統采集的數據之間是否有關系,是怎樣的一種關系,以確定合適的神經網絡輸入節點[3]。
根據三相平衡原理,三相電壓源必須是正弦波,且頻率相同、幅度相同、相位互差120℃,但因為三相元件、線路參數或負荷不對稱可能存在三相電壓失衡的情況,需要具體分析三相電壓之間的關系[4]。對三相電各相電壓一定時間的采集值進行回歸分析,結果見表1。

表1 回歸R方表Tab.1 Regress R square table
可以看出不管是R方還是調整后的R方都是99%以上,說明回歸直線對觀測值的擬合程度很好。
表2的分析結果,方差分析的顯著性差異為0.00,說明Ua、Ub、Uc之間存在著顯著性的線性關系。

表2 回歸殘差表Tab.2 Table of regression residuals
殘差的直方圖如圖2所示,可以看出殘差服從正態分布,說明該模型具有統計學意義。本次回歸分析的回歸方程為式(5):


圖2 標準化殘差直方圖Fig.2 Standardized residual histogram
因為三相電壓之間具有較強的線性相關,可從三相電壓值中選取A相線電壓Ua作為其中的一個特征值。從諸多電氣火災產生的成因來看,電線短路產生的電火花和電弧點燃附近的可燃物進而造成火災,是火災的一大成因。除此之外,導體截面和設備選擇不合理,引起發熱并且超過設備長期允許溫度;電能消耗過多造成導體過熱,裝置上選擇不適當造成電流狀態混亂,進而造成電路過熱,這些情況都是造成電氣火災發生的可能原因。因此,可以確定適用于電氣火災的神經網絡的5個特征值分別為:A相線電壓Ua,剩余電流LeakCurrent,以及線纜溫度T-A、T-B、T-C。
通過對采集的5 W條數據進行分析,A相線電壓的幅度區間為[385,425],A相線纜溫度的幅度區間在[14,32]之間。剩余電流呈現出不規則的波峰,個別尖峰值能夠達到170 ma。對應的時間-剩余電流圖表如圖3所示。

圖3 剩余電流圖表Fig.3 Residual current diagram
根據國標中關于剩余電流式電氣火災監控探測器的規定,剩余電流的報警值不應該小于20 ma,不應該大于1 000 ma[5]。其中300 ma是在實驗室條件下剩余電流產生拉弧引燃脫脂棉的條件,故可以取300 ma作為報警閾值。從安全角度上考慮,油浸低絕緣電纜的最高導體允許溫度不宜超過65℃,故可以取65℃作為線纜溫度的報警閾值較為準確。
根據中華人民共和國國家標準電能質量標準,10 KV及以下的三相供電電壓允許偏差為標稱系統電壓的-10%~+10%之間,如果電氣設備經常處于高于標稱電壓10%時使用壽命只有保持額定值時的30%,電子設備各種電子管陰極電壓每增加5%,陰極壽命減少一半[6]。同時,過高電壓可能導致設備直接燒壞造成電氣火災,把420 V的單相電壓作為電壓的閾值為比較合適的選擇。
了解了對應的電氣標準后,便可以開始構建自組織競爭性神經網絡。自組織競爭網絡是一種無導師學習的網絡,主要對輸入向量進行區域分類,其基本思想便是網絡競爭層的各個神經元通過競爭來獲得對輸入模式的響應機會,最后僅有一個神經元成為勝利者,并將與獲勝神經元有關的各連接權值向著更加有利于競爭的方向調整,該神經元也代表著當前輸入樣本的分布模式[7]。
圖4所示,輸入層是經過篩選過后的特征值,一共有5個,分別為單相電壓U x,剩余電流LeakCurrent,以及線纜溫度T-A、T-B、T-C。選取這些特征值的原因是其影響程度最大,與電氣火災的關系最密切。每隔15 min電氣火災監控設備將這5個特征值上傳,競爭后的權值按照公式(6)更新:

圖4 電氣火災神經網絡Fig.4 Electrical fire neural network

其中,a為學習參數,取值在0~1之間;m是輸入層中輸出為1的神經元個數表示當xi活躍時,對應的第i個權值就增加,反之則減少。經過多次訓練后,自組織競爭網絡可以有效的將具有火災隱患的設備與正常運行的設備區分開來。
要實現自組織競爭網絡首先需要通過Matlab讀取5個特征值的數據信息,取一天的觀測值繪制曲線圖進行分析,正常運行設備的特征值曲線如圖5所示。

圖5 單日特征值曲線Fig.5 One-day eigenvalue curve
從圖5中可以得知,正常運行設備的各相特征值趨于平穩,在可控的范圍內有小幅度的波動,都在可以接受的范圍,且遠遠低于報警閾值。發出報警信號的設備與正常的設備的特征值比較圖如圖6所示,可以看出二者在線電壓和線纜溫度上差異并不明顯,但是在剩余電流處的幅度差異卻很大,二者峰值差距能夠達到將近400 mA,可以推斷出報警設備的故障情況應該為剩余電流超限。

圖6 特征值比較曲線Fig.6 Eigenvalue comparison curve
為使隱藏單元的輸入數據分布大致相同,也為了使網絡更好的擬合目標,加快收斂速度,需要對數據進行歸一化處理,歸納統一樣本的統計分布性。選取的歸一化函數是[y,ps]=mapmin max(x,ymin,ymax),x是想要歸一化的矩陣,ymin=-1,ymax=1,將數值落到區間[-1,1]之間,保證網絡處于激活神經與抑制神經元的共同作用下。將發出報警的故障數據與正常數據混合后進行數據歸一化處理,得到的結果見表3。

表3 標準故障數據歸一化表Tab.3 Standard fault data normalization
從圖7可以看出,發出報警信號的數據在歸一化的結果中呈現出臨近右邊界甚至等于右邊界值的情況,與正常數據呈現一正一負2種截然不同的情況,相當于神經元的激活與抑制的2種不同的情形,不同的歸一化數值也將使得神經網絡的訓練向著2種相反的結果靠攏,在電氣火災的模型中就是將設備分類為處于火災隱患的以及正常運行的兩種狀態。

圖7 特征值歸一化圖Fig.7 Normalized graph of eigenvalues
將神經網絡的輸出設定為兩種分布模式,同時設定好訓練速率以及訓練迭代的次數,Matlab會將訓練結果分類為1和2兩種不同的輸出,對應的是可能有火災隱患的情況以及正常運行設備2種情況[8]。不妨選取發出剩余電流超限報警設備當日的特征值進行訓練,再輸入正常運行設備單日特征值觀察二者輸出情況,如圖8所示。能夠看出正常設備與故障設備的訓練結果還是有很大程度的不同,能夠從大體上判斷出兩個設備之間具有明顯的差異,輸出結果也從側面證明了該模型具有一定的科學性,但是還需要改進,使得整體的結果更符合預期。

圖8 運行狀況圖Fig.8 Health chart
SOM全稱是自組織特征映射神經網絡(Selforganizing Feature Maps),由荷蘭神經網絡學者Teuvo Kohonen于1981年提出,該網絡是一個由全連接的神經元陣列組成的無教師、自組織、自學習網絡。SOM自組織網絡在接收外界輸入時,將會分類成不同的反應區域,各個區域對于輸入的響應不同。
類似于自組織競爭網絡,SOM同樣是一種無導師學習的網絡,主要用于對輸入向量進行區域分類,網絡結構上是由輸入層和競爭層構成的單層網絡[9]。SOM網絡模型如圖8所示,輸入和競爭層之間神經元實現雙向連接,競爭層神經元之間存在橫向連接,輸入層與競爭層的各個神經元之間實現全連接。SOM不同于自組織競爭性網絡,SOM自組織神經網絡還能夠研究輸入向量的分布特性和拓撲結構;在權值更新上不同于自組織競爭網絡,每次只更新獲勝神經元權值,SOM自組織競爭網絡不僅更新了獲勝神經元,近鄰神經元也會按照某個近鄰函數進行更新[10]。
自組織神經網絡的具體實現步驟:
(1)用隨機數設定輸入層和映射層之間權值的初始值,同時隨機取樣XI;
(2)輸入向量,計算輸入向量與隨機取樣XI的歐式距離,式(7)。計算節點與XI的相似度,選取距離最小的節點作為優勝節點;

(3)根據優勝神經元確定優勝鄰域σ;
(4)按照公式(8)修正優勝鄰域的權值競爭后的權值;

其中,W_v(s+1),W_v(s)分別是新權值與原權值;λ(u,v,s)是更新的約束;θ(s)為學習率。
(5)重復隨機取樣并且計算輸出,判斷是否達到了預期設定的要求;
(6)根據數據聚集的情形分類,對應到本課題中,可以分類為電壓超限故障、溫度超限故障、剩余電流超限故障等等。
應用SOM神經網絡診斷電氣火災隱患的步驟如下:
(1)選取不同報警情況的故障樣本;
(2)對每一種情況的故障樣本進行學習后,標記最大輸出神經元;
(3)將待檢測樣本輸入到SOM神經網絡中;
(4)若輸出神經元與某故障樣本位置相同,則說明兩者發生了同樣的故障;若輸出神經元介于很多故障位置之間,則說明各種故障都有可能發生,具體判斷還是得看輸出神經元與故障樣本的歐式距離。
首先選擇5項特征值發生報警故障的樣本,對故障樣本進行歸一化處理,見表4。
歸一化后需要建立網絡以進行訓練,競爭層為6×6=36個神經元,拓撲結構設定如圖9所示的六角型hex。神經元設定為3個維度:A相電壓、線纜溫度、剩余電流,距離函數采用歐式距離公式,分別對故障數據訓練10、30、50、100、200、500、1 000次后觀察分類情況,網絡經過1 000次訓練后的分類如圖10所示。

圖9 SOM網絡模型Fig.9 SOM network model

圖10 6×6網絡拓撲模型Fig.10 6×6 Network topology model

圖11 網絡分類情況圖Fig.11 Network classification diagram
圖10中,X軸代表著A相電壓;Y軸代表著剩余電流;Z軸代表著線纜溫度,訓練次數越多,對樣本的分類越細致,結果也會更加精確,不同特征值引發的故障會被劃分為不同的類別,聚類結果見表4。

表4 聚類結果表Tab.4 Clustering results table
當訓練步數為10的時候,故障樣本被籠統的劃分到一起;當訓練步數為30的時候,故障原因1、3分為一類,2、4分為一類,5單獨一類,說明網絡對于樣本有了初步的分類,但精確度不是很高;當訓練步數為50的時候,除了2、4以外,所有的故障原因都已經區分開來;當訓練步數達到100、200、500、1 000的時候,故障樣本已經完全區別開,分類的結果也更加精確與細化。這種聚類結果說明了SOM網絡完成學習訓練后,對于每一種不同的故障種類,輸出平面中都有特定的神經元對其敏感,具有清晰的映射關系,相比較自組織競爭網絡,SOM網絡的分類要更加具體清晰。
電氣火災的發生原因多種多樣,需要先確定好特征值,并且選取合適的模型進行訓練。在本課題使用SPSS軟件篩選特征值,篩選出主要的幾種影響火災發生與否的參數,使用Matlab進行神經網絡的模型搭建,構建了自組織競爭網絡以及SOM自組織網絡,分析電氣火災監控系統收集上來的數據,并且對兩種網絡進行分析與比較,完成了對待測試數據的判定與分類。