劉云鵬, 王博聞, 韓 帥, 高 飛, 王 康, 張興輝
(1. 華北電力大學(保定) 河北省輸變電設備安全防御重點實驗室, 河北 保定 071003;2. 中國電力科學研究院有限公司, 北京 100192;3. 國網福建省電力有限公司電力科學研究院, 福州 350007; 4. 國家電網公司, 北京 100031)
大型電力變壓器中的有載分接開關(on-load tap changer,OLTC)具有調節電壓的重要作用,其機械結構比較復雜因此極易發生機械類故障[1]。以某省110 kV及以上變壓器統計為例,其中由OLTC引起的故障比重占18.13%,六成以上都是機械類故障。為了監測OLTC機械狀態,及時發現OLTC的異常動作,目前已有許多研究將振動檢測方法應用于OLTC機械狀態監測方法[2-5]。近年來,聲紋監測技術也應用于OLTC機械狀態監測和診斷中[6-7]。振動與聲紋為機械波在不同介質中的表現形式,因此二者特征機理類似聲紋監測在成本低廉、布置方式簡單且空間敏感度低等方面具有獨特優勢[6],然而在聲信號監測過程中,判別系統易受到外界信號干擾發生誤動或漏動,給后續診斷帶來困擾。因此在邊緣計算端需要一種能夠快速區分OLTC動作信號與其他環境干擾信號的檢測方法。目前的聲信號檢測方法一般設計用于故障狀態識別,而沒有考慮對外界干擾的篩選,無法直接應用于OLTC動作聲信號的端點檢測。
對此,本文通過一種混合倒譜計算方法與輕量級卷積神經網絡結構對OLTC動作與干擾聲信號進行快速區分。首先通過現場采集與人工混音的方式形成了聲信號樣本庫,樣本庫包含1 320條OLTC動作聲信號樣本與600條變壓器運行環境下外界干擾聲信號樣本;其次,根據OLTC聲信號的頻率分布特性,分別采用梅爾倒譜系數(Mel frequency cepstral coefficient, MFCC)、伽馬通濾波倒譜系數(Gammatone filter cepstral coef-ficient, GFCC),冪律歸一化倒譜系數(power-normalized cepstral coefficient, PNCC)對原始信號進行降維與初步特征提取;最后,引入類視覺幾何組(visual geometry group,VGG)結構的卷積神經網絡(convolutional neural networks, CNN)將MFCC,GFCC,PNCC三重特征進行混合,構成OLTC聲信號與干擾信號二分類模型,并通過數據集驗證模型的有效性。
實現聲紋辨識模型的訓練,需要積累類型多樣、數量可觀的OLTC動作和外界干擾聲信號數據。為此本文從現場和實驗室兩方面構建了OLTC動作聲信號數據集、從現場和公開數據集兩方面構建外界干擾聲信號數據集。另外,為了還原變壓器本體聲紋的背景干擾,本文采集了1 800例變壓器本體聲紋數據,以提高聲紋辨識模型的泛用性。
OLTC聲信號數據集主要由現場采集與實驗室采集兩部分組成。
1.1.1 現場采集
在±800 kV金華換流站進行了OLTC動作聲信號現場采集。現場采集情況如圖1所示。

圖1 換流變壓器中的OLTC動作聲信號采集Fig.1 Acoustic signal acquisition of OLTC in converter transformer
現場采集于該站停電大修期間開展,檔位升降為手動控制,對每臺OLTC升檔與降檔分別采集15例,具體的數據樣本分布,如表1所示。

表1 OLTC現場聲數據樣本分布Tab.1 Distribution of OLTC acoustic data samples in actual scene
采集設備選用具有指向型的槍式電容麥克風在OLTC控制箱附近進行采集,指向型麥克風能夠減弱其他方向的噪音影響,提高樣本質量。由于OLTC信號大量分布在可聽聲頻段內,因此麥克風的頻率響應范圍為20 Hz~20 kHz,配合使用的錄機信號采集頻率設為48 kHz,后續采集聲紋的設備與參數配置相同,不再贅述。
1.1.2 實驗室采集
為了獲得更為豐富的OLTC聲信號樣本,增強后續端點檢測模型的泛用性,研究在數據樣本中加入OLTC傳動機構卡澀和內部組件松動兩種典型OLTC故障的模擬聲紋樣本。
實驗室聲紋樣本基于一套CM型110 kV分接開關模型,試驗平臺參數,如表2所示。

圖2 實驗室搭建的OLTC聲信號采集平臺Fig.2 OLTC acoustic signal acquisition platform built in laboratory

表2 OLTC試驗平臺參數Tab.2 OLTC experimental platform parameters
兩種典型機械故障布置,如圖3所示。試驗平臺分別使用在傳動齒輪處加入木屑和擰松緊固螺栓的方式模擬傳動機構卡澀和緊固件松動兩種故障。完成故障布置后,將不同狀態的OLTC進行換擋操作,并開展聲信號采集。OLTC實驗室聲音數據樣本分布,如表3所示。

(a) 傳動機構卡澀

(b) 內部組件松動圖3 OLTC試驗平臺故障布置Fig.3 Fault arrangement of OLTC experimental platform

表3 OLTC實驗室聲音數據樣本分布Tab.3 Distribution of acoustic data samples from OLTC experimental platform
本文使用ESC-50[8]公開數據集與自采集的變壓器處環境噪聲作為環境聲干擾數據集,數據集樣本分布如表4所示。其中,ESC-50數據集包括50類各種常見的日常聲音事件,聲音樣本與變壓器所處環境噪聲具有一定差異,因此研究額外采集并補充了10類變電站內的噪音數據集,包括刀閘開合、電暈放電、電鉆等噪聲用于提高后續檢測模型在變壓器場景下的適用性與泛化性。

表4 環境干擾聲音數據樣本分布Tab.4 Environmental interference acoustic data sample distribution
由于現場狀態下的OLTC動作聲信號一般存在變壓器本體聲信號背景噪聲,因此本文在河北省22個500 kV變電站進行了變壓器本體聲信號樣本采集,并以OLTC時域信號峰值為基準,對背景噪聲進行幅值調整后疊加于1.1節的OLTC動作聲與1.2節的干擾聲中,從而模擬現場聲紋環境。在疊加過程中,將從1 800例變壓器本體聲音數據中隨機抽取樣本作為背景噪聲,以增強與驗證后續檢測模型在現場應用的效果。變壓器本體聲音數據樣本分布,如表5所示。

表5 變壓器本體聲音數據樣本分布Tab.5 Sample distribution of transformer sound data
聲信號識別整體流程,如圖4所示。流程主要包括聲信號的預處理和模式識別兩部分,其中信號預處理的主要作用是對變壓器原始時域信號的特征提取和數據壓縮,從而減少后續識別模型的運算量、提升識別效果。

圖4 聲信號辨識流程Fig.4 Acoustic signal identification process
首先將疊加變壓器本體運行噪聲后的時域聲信號轉化為具有時域頻域兩個維度的時頻譜圖,然后通過計算MFCCs,GFCCs與PNCCs等3種倒譜對原始時頻譜進行特征提取和降維,后續作為卷積神經網絡的輸入層。
由于原始的聲信號的特征有限,因此一般需要通過將原始的時域聲信號進行頻譜分析,將不同時間內的頻譜信息組合呈現為特征更為直觀、信息更為豐富的時頻譜圖,用于后期機器學習等識別算法的訓練。該過程主要包含了分幀、加窗以及離散傅里葉變換。
首先,對5 s的原始時域聲信號進行交疊分段的分幀操作,考慮有載分接開關動作的暫態特性,本文選擇幀長為0.1 s,幀移為0.05 s。
其次,為削弱傅里葉變換帶來的頻譜泄漏影響,還需要將每幀時域數據進行加窗處理。本文選取的是具有較好的時間和頻率聚集特性的漢明窗(Hamming),即
w(n)=

(1)
式中,N為漢明窗的長度,由幀長和采樣率決定。
最后,對波形片段進行短時離散傅里葉變換,計算公式為式(2),即可得到能夠同時描述時間與頻率的時頻譜。時頻譜圖中的橫坐標為時間,縱坐標為頻率,條紋狀的圖形的顏色代表當前頻率在該時刻含量的大小,由功率譜密度(power spectral density,PSD)表示。

0≤n且k≤N-1
(2)
式中:k為頻點序號;x(m,n),X(m,k)分別為第m幀原始離散時域信號和第m幀的頻譜分布。由以上步驟可得到不同廠家的OLTC動作聲信號時頻譜圖對比,如圖5所示;外界干擾聲信號時頻譜圖,如圖6所示。由于數據庫樣本類型較多,限于篇幅此處僅展示部分時頻譜圖。

(a) 西電

(b) 華明

(c) MR

(d) 西門子圖5 不同廠家OLTC聲信號時頻譜圖對比Fig.5 Comparison of OLTC sound signal spectrum from different manufacturers

(a) 刀閘動作聲

(b) 汽笛聲

(c) 電鋸聲

(d) 鳥鳴聲圖6 不同環境干擾聲信號時頻譜圖對比Fig.6 Comparison of interference sound signal frequency spectrum in different environments
OLTC多數故障發生在切換指令發出后30 s以內,因此相關聲紋監測手段對實時性要求極高。本文中測得的OLTC動作聲信號單樣本的數據量可達近22萬個數據,為了快速準確對聲信號進行辨識,需在保留辨識特征的前提下對樣本數據進行壓縮處理。
各種倒譜系數都具備信號降維與特征提取功能,不同倒譜系數都具有各自優勢和局限性,因此許多研究[9-10]將多種倒譜進行混合使用,以獲得更好的特征提取效果。在各類倒譜系數中,MFCC的構建基礎是聽覺模型,GFCC的構建基礎是耳膜模型,而PNCC在噪聲背景下的聲音特征更具有優勢,以上倒譜在語音識別領域都已經得到了一定程度的應用[10-11],因此本研究選取MFCC,GFCC[12],PNCC[13]作為基礎倒譜特征,構成倒譜特征矩陣,用于后續的特征融合和聲信號識別,計算流程如圖7所示。

圖7 聲信號倒譜特征矩陣計算流程圖Fig.7 Calculation flow chart of acoustic signal cepstrum characteristic matrix
(1) MFCC計算
MFCC是基于人耳聽覺感知特性的一種倒譜參數,在頻域人耳聽到的聲音高低與頻率不成線性關系,而在Mel域,人耳感知與Mel頻率是成正比的。其關系可以用式(3)表達
Mel(f)=2 595lg(1+f/700)
(3)
梅爾頻率倒譜系數的計算是以幀為單位進行的,以下為梅爾頻率倒譜系數的具體計算步驟。
步驟1按式(1)計算得到每幀頻譜X(m,k),對X(m,k)取模后平方得到功率譜。將功率譜通過頻域為三角形的Mel尺度濾波器組得到新的參數R,濾波器組頻率下限為fmin,上限為fmax,G為Mel濾波器數量。
步驟2將R(m,k)取自然對數
(4)
步驟3通過離散余弦變換得到G維MFCC

0 (5) 步驟4需要進行均值歸一化。經上述步驟便可得到G維的MFCC。 (2) GFCC計算 GFCC的提取過程與MFCC提取過程幾乎相同,兩者區別在于功率譜通過的濾波器組是由G個不同尺度參數和形狀參數的伽馬濾波器組成的Gammatone濾波器組,而非Mel尺度濾波器,濾波器組頻率下限為fmin,上限為fmax,后續步驟也相同。最終得到GFCC特征矩陣CGFCC(m,j)。 (3) PNCC計算 PNCC的提取過程的前兩個步驟與GFCC相同,當功率譜通過Gammatone濾波器后得到Pg(m,g)。其中,Mw為平滑窗口的大小,一般將每一幀與前后兩幀做平滑處理,此時Mw=1計算中時平均功率 (6) (7) g1=max(g-gw,1) (8) g2=min(g+gw,G) (9) 式中,gw設為4。 (10) 利用平均功率估計值μ[m]可對Tg[m,g]進行平均功率歸一化 (11) (12) 式中,λμ為系數,可設置為任意常數。 為了更加接近人耳聽覺神經的壓縮感知特性,不同于MFCC所采用對數非線性,PNCC采用冪律非線性壓縮 Vg[m,g]=Ug[m,g]1/15,0 (13) 最終進行離散余弦變換和均值歸一化即可得到PNCC特征矩陣CPNCC(m,j)。 分別完成MFCC,GFCC,PNCC計算后,將三者合并為一個3維的倒譜特征矩陣。本文的聲原始時頻譜數據尺寸為498×24 000,經過信號降維與特征提取后的倒譜特征矩陣數據尺寸變為498×40×3,其中:498為時域分量;40為倒譜特征矩陣的頻域分量;3為聲信號的MFCC,GFCCs,PNCC 3層倒譜特征。倒譜特征矩陣的計算在保留聲紋特征的基礎上能夠提升了后續深度學習的運算效率。 卷積神經網絡(convolutional neural network,CNN)作為一種典型前饋型深度學習網絡,在非線性映射和局部特征提取方面都具有顯著優勢[14]。在圖像識別領域,CNN往往將彩色圖像拆分為紅綠藍(RGB)3個顏色層作為網絡的輸入層,從而對不同色彩變化的特征進行學習感知。相似地,本研究將聲信號的3種倒譜構成的倒譜特征矩陣作為輸入層,構建混合倒譜-卷積神經網絡(mixed cepstrum-convolutional neural network,MC-CNN)識別模型,從而進行聲音分類識別。相較于人工設計的倒譜混合方法,通過深度神經網絡的學習機制對3種倒譜進行融合能夠使混合倒譜的融合方式具有自適應性。 為保證深度學習的有效性,在進行模型訓練時需要對樣本數據進行數據集劃分:從1 320例OLTC動作案例中隨機抽取480例作為訓練集,120例作為測試集;外界干擾聲音案例共600例,隨機抽取480例作為訓練集,120例作為測試集。最終形成數據集樣本分布,如表6所示。所有數據首先按照1.3節方法隨機疊加變壓器背景噪聲,然后按照第2章中的方法算得各自的倒譜特征矩陣,最終將所有帶有標簽的倒譜特征矩陣樣本按隨機順序輸入到CNN網絡進行訓練。 表6 聲音數據庫樣本分布Tab.6 Sample distribution of acoustic database 經過結構參數優化后,本文研究構建了一個包含3層卷積-池化層的類VGG[15]小尺度CNN網絡,詳細結構如表7所示。在該網絡中,Dropout概率設置為0.5;為了加快收斂速度并防止梯度消失現象,進行了批規范化操作[16]。 表7 用于OLTC聲紋識別的CNN網絡結構Tab.7 CNN structure for the OLTC voiceprint recognition 為了提高模型性能,研究對MC-CNN識別模型進行學習率(learning rate,LR)和批尺寸(batch size,BS)進行了優化。 3.3.1 學習率參數調節 MC-CNN識別模型的訓練集損失率,如圖8所示。過高的學習率會在迭代次數增加后降低學習效率,過低的學習率則會減慢訓練速度。由測試結果可知,當學習率為0.000 1時,訓練集損失率下降較為穩定且訓練速度較快。 圖8 不同學習率對MC-CNN模型的損失率影響Fig.8 Loss of MC-CNN model with different learning rate 3.3.2 批尺寸參數調節 批尺寸越小則誤差越小。但批尺寸減小會導致訓練時間延長,因此需要平衡準確率、誤差和訓練時間等指標最終確定訓練參數。平均每次迭代的訓練時間、最終準確率和到達最終準確率所需迭代次數,如表8所示。可見當批尺寸為32和40時準確率下降,當批尺寸為8,16,24時準確率都達到了100%,綜合考慮迭代速度后,認為批尺寸為24時識別模型的性能最優。 表8 不同批尺寸訓練時間對比Tab.8 Comparison of iteration time of different batch size 通過對學習率和批尺寸的優化,得到最終的MC-CNN識別模型。為更加直觀地展示模型的識別效果,本文將深度學習模型進行了100次迭代,結果如圖9所示。MC-CNN模型在迭代了80次之后,測試集識別準確率在99%~100%小幅波動,迭代100次時損失率為0.001左右。 圖9 MC-CNN模型識別準確率與損失率Fig.9 Recognition accuracy rate and loss rate of MC-CNN model 為進一步驗證本文提出方法的有效性,對MC-CNN,MFCC-CNN,GFCC-CNN,PNCC-CNN以及常規CNN模型的辨識成功率和運算時間進行了對比。在類VGG模型框架下,經過參數調優后,結果如表9所示。可見MC-CNN模型在識別成功率上表現最佳,樣本運算時間相較于常規CNN方法具有明顯提升,證明了本文所提出MC-CNN聲識別模型的優越性。與使用單獨某種倒譜系數預處理方法的方法相比,MC-CNN使用更多類型的倒譜特征能夠適應種類繁雜的外界干擾聲信號與信噪比不同背景噪聲環境,犧牲了部分計算速度的但提高了準確率。 表9 OLTC與環境干擾聲音辨識方法對比Tab.9 Comparison of OLTC sound and environmental noise identification methods 與直接使用時頻譜圖輸入CNN網絡進行訓練和識別的方法相比,MC-CNN經過了混合倒譜計算的預處理后,數據量計算量大幅下降,樣本的數據減少也意味著降低了深度神經網絡的識別難度,因此能夠提升識別率和降低識別時間。 3.3.3 外界干擾信號對識別效果的影響 由于現場運行環境復雜,有可能出現OLTC動作信號與外界干擾信號同時出現的情況,因此,需要對此類情況進行識別效果驗證。 首先,從3.1節測試集中進行了隨機抽取與排列組合,并進行混疊,形成了500例樣本,如圖10所示為兩個樣例的時頻譜圖。 (a) 西電+鳥鳴 (b) 西門子+連續汽笛圖10 外界干擾信號與OLTC動作信號混合的時頻譜圖Fig.10 Spectrum diagram of mixing external interference signal and OLTC action signal 然后,利用已訓練好的識別模型進行測試,用來檢測在有外界干擾信號存在的情況下該模型對OLTC動作信號的識別能力。 測試結果表明,本文中的MC-CNN能夠對98.4%的樣本識別為OLTC動作,而對1.6%的樣本識別為環境干擾信號。其中,識別為環境干擾的樣本典型案例如圖10(b)所示,此類樣本具有以下特點:① 環境干擾信號強度較大,導致OLTC信號信噪比過低;② 環境干擾信號為持續時間較長,導致樣本的全部時段都被環境干擾信號覆蓋。針對此類持續性強干擾下OLTC動作聲信號的識別,目前有待后續研究,但在實際應用時,可通過將聲信號傳感器放置位置靠近OLTC本體的方式提高信噪比,從而改善識別準確率。 本文對OLTC聲信號快速辨識方法進行了研究。通過采集現場及實驗室的OLTC聲信號和環境干擾信號,構建數據集,建立MC-CNN模型對信號進行識別,得到的主要結論如下: (1) 不同廠家生產的OLTC聲音時頻譜特征各異,同時外界干擾信號種類繁多,直接使用幅值、峰峰值等人工設計的特征值提取手段進行區分比較困難。 (2) 采用混合倒譜的降維處理方式,可將計算數據量壓縮2 000倍,能夠提取特征的同時有效降低原始數據的維度,提升了后續算法模型的識別速度和準確率。 (3) 混合時頻譜圖結合CNN能夠對OLTC動作與外界干擾信號進行準確區分,在本文的數據樣本測試集中,混合時頻譜圖的成功率高于單個時頻譜預處理和無預處理的CNN模型,且有較快的識別速度,證明了本文所提出Mel-CNN聲音識別模型的有效性。通過本文的方法與OLTC故障聲紋診斷算法相結合,能夠實現在無電氣連接的情況下對OLTC進行機械狀態監控,對工程應用有一定借鑒價值。

3 基于卷積神經網絡的聲信號辨識
3.1 訓練數據集與測試數據集

3.2 網絡結構

3.3 訓練參數優化與識別模型結果






4 結 論