鄒宜金,連應華,黃新宇,劉培,王穎蕊
(福建華電可門發電有限公司 福州 350512)
當前,風力發電正以極快的速度發展,但由于風電機組大多安裝在高山、荒野、海灘、海島等相對惡劣的環境中,容易出現故障,維修起來耗費大量人力物力。
在風力發電機組中,葉片作為整個風電機組最前端的捕風機構,造價約占整機的20%左右。從葉片本身看其復合材料結構決定了其運行期間自身狀態的復雜性;從運行環境看,風機葉片是整個機組暴露在外部環境中長期運行的最大部件,風沙、鹽霧、紫外線、雷電等都會對葉片造成一定的損傷;從功能發揮上看,作為捕風機構的葉片在運行過程中要承受各種風況施加的多變震、彎曲、扭轉的交替應力變化[1]。在以上因素的影響下,隨著運行時間的推移將導致葉片發生破損、開裂乃至斷裂等質量問題,這些問題無論從影響程度還是維修成本上都居高不下。由于葉片的維修和更換,相對其他設備更為復雜,耗時更長,所以葉片故障引起的停機時長,在機組總故障中的比例高達34%[2],因此對風電機組葉片工作狀況進行異常檢測非常必要。有效的風機葉片異常檢測能提高生產率,減少運維成本支出,增強作業安全性。
在風機故障檢測領域,已發展基于聲發射[3-4]、振動分析[5-7]、光纖光柵[8]、紅外熱成像[9]等多種原理的檢測技術。考慮到實際情況,能符合檢測效率實時、非接觸式且便于安裝要求的有SCADA 數據分析和聲學檢測兩類方法。
SCADA 數據分析[10-11]是對SCADA 傳感器數據進行分析,采用聚類或者趨勢預測對風機葉片可能發生的異常進行分類判定。此類方法傳感器數據匯總屬性數據維度過高,采樣頻率較低,相關屬性分析模糊,工況對數據影響大,模型準確度受限。
聲學檢測方法主要實現手段有:
1)傳統數值統計分析,對波形進行時域頻域分析,依賴其均方根值、峰值水平、峭度、斜度、波峰因數和其他數值特點進行風機葉片是否異常的判定。該方法是比較早期的研究方案,在實際運用中難以得到滿意的結果。
2)非線性和非穩態的分析[12],采用小波變換或者希爾伯特?黃變換得到故障特征頻率變化的特征。不過,輸入信號復雜度高,采用小波變換也沒有從根本上解決任意變頻的問題,沒有切合風機是一個線性系統的非定常響應問題。
3)普通機器學習采用分類方法、回歸方法、神經網絡、支持向量機、決策樹、隨機森林等[13]。這需要大量故障風機葉片的信號樣本,但實際中風機葉片的故障類型、受損程度與部位不同都將導致葉片故障數據收集不全面,從而影響所建模型的準確度。此類方法,如果換個場景和風機,模型的準確度會存在問題。
實際應用中風場位置不同、風機類型各異、故障類型眾多、背景環境多變等因素復雜交錯。上述基于規則和特征的手段都面臨非線性表征能力弱,泛化能力不強,識別率不高的問題,所以無法滿足實際工程需要?;谏疃葘W習的方法,受限于數據采集的規模難以實現,和實現過程中易過擬合及調參難的通病,難以泛化,故障診斷的可遷移性存在問題。同時,信號復雜度高、數據不均衡、數據收集困難也是解決風機故障監測必須直面的問題。
通過項目研究,發現風機實際運行中,由于葉片旋轉具有周期性,采集葉片聲音傳感器位置在葉輪迎風側正下方,故葉片掃風的聲音信號也具有周期性。所以,可以利用受損葉片和正常葉片的周期性和差異性特點進行高效準確的異常檢測。
區別于目前基于大量數據樣本的智能診斷算法,不需要采集大量的數據信息,不需要建立診斷識別的模型,僅依靠單臺風機3 個葉片之間的參考和對比就可以診斷該臺風機是否故障,操作流程簡單,診斷精度也較高;從算法角度,減少了計算量,提出基于聚類和中值收斂的周期性音頻切割方法,對聲紋進行有效的切割,為增強聲紋變化的魯棒性問題提供基礎。
本文具體方法的設計如圖1 所示。

圖1 本方法實現示意圖
2.1.1 原始音頻預處理
聲音采集器工作在復雜的室外,采集到的音頻信號一般包含大量噪聲,如鳥叫、風聲、人聲和其他風機造成的噪聲等。目前,風機的啟動條件一般為平均風速不小于3.5m/s,聲音傳感器采集的信號必然包含風噪,且相比其他背景噪聲,風噪影響較大。風噪的頻譜能量集中在350Hz 以下的低頻區域,需要濾波器將低頻的風噪濾除。
2.1.2 計算音頻信號語譜圖
聲音信號的特征提取是核心步驟之一,提取到有效、可靠的特征能提高結果的準確性和有效性,降低處理的復雜度。經過實驗語譜圖能很好的表征風機葉片的音頻特征。
2.1.3 語譜圖切割
對語譜圖峰圖和峰圖之間的間隔進行識別,實現精準的音頻分割,得到分割的坐標。值得一提的是,雖然采用了聲紋分割聚類[14]這個名字,但是其含義不是傳統語音中的識別說話人數量和歸屬,是識別不同風機葉片掃風音頻和掃風間隔音頻。
不采用實時轉速情況下,葉片周期的聲紋切割算法有以下兩種:
1)波峰波谷峰值計算。正常純凈掃風音頻,可以使用該辦法,但是在實際風場中,經常有無規律間隔疊加能量的干擾,且風機3 個葉片的功率強度軸也可能不同,導致相鄰葉片的波峰波谷有較大的震蕩區間,對峰值檢測的精度和準度帶來挑戰。少識別的波峰,會導致錯周期切割,直接影響后續的疊加算法。
2)深度學習。采用一維卷積神經網絡或者其他模型,標注峰值區域進行特征學習,需要大量采集數據,還需要手工標注不少數據,模型也需要提前訓練,工程實現較為冗雜。
本文采用聚類方法對中高維語譜圖矩陣進行聚類,得到掃風聲和安靜聲的標簽序列,接著用中值收斂調整修正該標簽序列,能精確得到安靜音頻到掃風音頻階躍的坐標點。這種設計不僅能無參數動態分割,還有較強的魯棒性和泛化性。
具體實現如下:
2)對語譜圖的中高維度進行截取,將降維后的矩陣輸入K_means 兩類聚類算法。
3)得到聚類的0,1 標簽序列。K_means 聚類后的效果不錯,得到掃風聲和安靜聲的標簽序列,能大體劃分出掃風周期,不過由于信號復雜度高,K_means 聚類對異常值敏感,還是存在毛刺和缺失。需要對標簽序列的毛刺和尖峰進行過濾。
4)接著進入收斂修正聚類標簽操作,至此,可以得到分割點序列坐標。
2.1.4 葉片平均語譜圖和均衡增強
透明度疊加,生成風機每個葉片平均語譜圖。用分割的坐標將長矩陣切割成t個矩陣Ti(0

Tcol1,Tcol2,Tcol3為葉片音頻的平均語譜圖畫像的矩陣表示,其疊加效果的熱圖如圖2 所示。

圖2 透明度疊加前后音頻語譜圖熱圖對比
風力微弱情形下,語譜圖中有用數據的對比度會比較接近,采用直方圖均衡算法[15]進行處理,通過這種方法,亮度可以更好地在直方圖上分布。文獻[16]提出了灰度直方圖均衡化算法。由于彩色RGB 圖片,有3 個通道,不能簡單為每個通道應用灰度直方圖均衡化算法,然后組合起來。非線性直方圖均衡是非線性過程,均衡每個通道的做法會得到失真度非常大的結果。均衡涉及圖像的強度值,而不是顏色分量,因此,需要將RGB 格式轉為不干擾圖像顏色平衡,均衡亮度值的YCbCr 格式。在強度平面上執行灰度直方圖均衡化操作,然后再把YCbCr 格式轉回RGB 格式。
2.1.5 相似度計算
(4) 模塊配置.根據具體需求結合配置規則庫,檢索出符合設計要求的模塊,并對模塊進行組合、替換,完成設備模塊配置方案.配置規則庫的建立需要對企業長期積累的設計經驗進行歸納總計.
采用圖片化的SSIM(structural similarity)值來計算3 個特征矩陣熱圖圖片相似度。結構相似性作為結構相似性理論的實現,結構相似度指數從圖像組成的角度將結構信息定義為獨立于亮度、對比度的,反映場景中物體結構的屬性,并將失真建模為亮度、對比度和結構3 個不同因素的組合。采用均值作為亮度的估計,標準差作為對比度的估計,協方差作為結構相似程度的度量。
文獻[17]提出了SSIM 值計算方法。3 個特征矩陣熱圖圖片兩者之間比較得到3 個SSIM 值,接著采用這3 個結果值進行統計和判斷異常。
2.1.6 統計和告警
SSIM 值在連續6 分鐘內,如果相似度都一致,而且大于閾值k(0 以山風場和海風場采集的故障和正常風機葉片聲信號作為原始數據集,配置為單通道,44100 采樣率,采樣頻率區間為0~12kHz,選擇不同特性和背景風機的聲信號作為原始數據集,如表1所示。 表1 原始數據集來源 圖3 是不同音頻頻譜圖表征。 圖3 不同風機葉片掃風音頻頻譜圖 第一組是正常葉片純凈掃風音頻,第二組是疊加鳥鳴正常掃風音頻,第三組是掃風微弱音頻,第四組是疊加敲擊聲音頻,第五組是風噪比較大的音頻。 對原始音頻進行樣本重構得到數據集。重構方法主要有以下3 種: 1)由于風機是包含轉速(3~17r/min)所以,采用拉伸和收縮處理得到不同轉速下音頻。 2)采用語音合成,對周期進行中途變化或者疊加背景噪聲。 3)對音頻進行軟件數據增強處理。 通過樣本重構,共得到200 組2000min 的音頻樣本。其中,異常組占40 組,異常組占比20%。 樣本輸入模型后,輸出結果如下: 異常識別的Recall 為0.975,Precision 為0.929,具體值如圖4 所示,該結果與參數選擇密切相關。 圖4 模型識別結果 3.3.1 聲紋切割算法的表現 聲紋切割算法的前提是聚類成功,由于聚類算法對異常值敏感,在音頻受到嚴重干擾,轉速過慢(伴隨聚類中心點貼近問題)和轉速過快(異常值敏感度加大)的音頻切割準度下降。如圖5 所示,但在正常轉速情況下,切割算法的精度足夠。 圖5 切割算法在葉片不同轉速下的精度 3.3.2 相似度方法選擇 相似度方法有余弦相似度、均值哈希相似度、差值哈希相似度、感知哈希算法相似度、三直方圖相似度、單通道直方圖相似度及SSIM 結構相似度。設一組標簽為相似度高的語譜圖,與一組標簽為相似度低的語譜圖,輸入不同相似度計算方法,其結果如圖6 所示。差值明顯的方法為比較適合的相似度方法。 圖6 不同相似度算法效果 SSIM 相似度方法在相似度高和相似度低情況下,有比較大的差值,能比較好地表征葉片頻譜圖相似度。 本方法的獨特性在于解決了聲音異常檢測的可行性和可泛化性。 1)異常檢測的可行性:拋棄了主流的尋找異常聲音特性和正常聲音特性的方法。重新歸納定義了異常的概念:某個葉片只要和其他兩個葉片聲音特性不一致就標記異常。不依賴輸入的大數據樣本,不需要提前訓練,易于部署和工程實踐,從聲音到圖像的轉變也使得異常檢測有可靠和成熟的量化標準。 2)異常檢測的可泛化性:能遷移,具有時間上和空間上的可泛化性。 研究工作的不足之處總結為以下兩點: 1)只對風機葉片的異常檢測進行檢測和提示,沒有進行具體異常的分類,比如哨音明顯、葉片前緣異常、葉片后緣異常、葉片開裂等。 2)未進行合適的風機運行狀態識別,未識別導致變槳、偏航、關機過程、停機過程等風機操作控制期間,識別失效的問題。3 實驗與結果分析
3.1 輸入樣本構造集


3.2 模型結果分析

3.3 參數選擇


4 結束語