劉蘇程
(惠州市白盆珠水庫工程管理局,廣東 惠州 516341 )
水電是世界上最大的可再生能源,許多國家嚴重依賴水力渦輪機產(chǎn)生的能源,占發(fā)電量的一半以上。與泵、船舶和閥門等其他液壓機械一樣,由于渦輪機的液體會形成蒸汽氣泡并快速坍塌,水輪機也容易受到汽蝕造成的損壞[1-2]。蒸汽氣泡或汽蝕的形成是由于旋轉葉片、尖銳曲線或湍流引起局部壓降而形成的,是一種潛在的極具破壞性的復雜現(xiàn)象。當蒸汽腔坍塌時,會輻射高能聲壓波,導致機械表面形成凹坑和侵蝕渦輪機材料,從而縮短水輪機轉輪的壽命,需要昂貴的維修費用[3-4]。盡管當前水輪機的設計有所進步,但汽蝕造成的損壞仍然是水輪機故障的主要原因之一,國內(nèi)外當前對這一現(xiàn)象展開了大量研究,取得了較好成果。
馮超[5]為了解決機組汽蝕嚴重的問題,展開了對轉輪抗汽蝕方法的研究,提出了一種高分子材料和柔性聚氨酯復合噴涂的方法; 陳偉[6]提出了轉輪汽蝕及葉片出水邊修型的處理方案;陳漢輝等[7]采用表面粘結鋼板并應用自鎖錨桿錨固取代傳統(tǒng)的鋼板螺栓錨固的處理方法減緩轉輪室內(nèi)壁因汽蝕和水流沖刷嚴重磨損;李照等[8]闡述了中水頭混流式水輪機轉輪進水邊的汽蝕問題,并根據(jù)附面層吸附原理,對已投入運行的機器提出了幾種解決辦法;習愛龍[8]通過采用堆焊技術對楊凌水電職能軸流式水輪機轉輪汽蝕進行了處理,明顯提高了機組的出力,延長了轉輪使用壽命。此外還有部分學者通過現(xiàn)場分析和簡單的檢測技術對轉輪汽蝕現(xiàn)象進行了分析[9-12]。
從以上文獻分析可以得出,大多數(shù)研究都是通過改進表面涂層材料和改進構件對汽蝕現(xiàn)象進行研究,而少有研究對汽蝕產(chǎn)生的轉輪損傷進行提前監(jiān)測預警。為了發(fā)展更好的水輪機腐蝕空化的檢測方法,本研究結合了多種機器學習方法,先采用加速度計以及聲發(fā)射傳感器對轉輪進行監(jiān)測,之后利用均方根(RMS)和平方根(MD)振幅計算方法來提取輸入數(shù)據(jù)特征值,最后采用隨機森林方法(RF)、決策樹(DT)、人工神經(jīng)網(wǎng)絡(ANN)、支持向量機(SVM)和logistic回歸5種機器學習算法,對RMS和MD數(shù)據(jù)進行了對比分析,得到了最佳監(jiān)測精度,研究成果可為相關工程提供參考。
本文將汽蝕檢測分為3個部分:① 傳感器類型選取;② 傳感器布置;③ 基于機器學習信息分析處理。用于汽蝕診斷最常見傳感器是加速度計以及聲發(fā)射傳感器,前者會產(chǎn)生與加速度成比例的信號,后者產(chǎn)生與穿過材料的小應力波振幅成比例的信號。這兩種傳感器都基于壓電傳感元件,能夠記錄高頻事件,本文采用這兩種。用于汽蝕診斷的加速計通常具有3~40 000 Hz的線性頻率響應,而使用的聲發(fā)射傳感器在40~400 kHz之間響應良好。為了利用高頻傳感器,信號記錄設備必須能夠在1 MHz左右的高采樣率下記錄數(shù)據(jù)。汽蝕診斷不太常用的傳感器包括水聽器和高頻壓力傳感器,該裝置對2~180 000 Hz之間的壓力事件較為敏感。
在大多數(shù)情況下,接近式探頭用于檢測尾水管渦流或非汽蝕相關故障(如水輪機軸不平衡或錯位)的典型低頻事件,本文監(jiān)測的對象為軸流轉槳式水輪機(如圖1所示)。監(jiān)測水輪機汽蝕的傳感器位置包括:① 上下渦輪軸承;② 進口導葉(也稱為導葉)的閥桿;③ 尾水管壁。在實驗裝置中,傳感器有時連接到其他位置,包括水輪機殼體、試驗臺架或直接連接到水輪機主軸。

圖1 軸流轉槳式水輪機示意
在機器學習領域,特征選擇是從原始輸入數(shù)據(jù)中選擇或創(chuàng)建用作預測因子的變量子集的過程。在本文中,選擇的特征是用于預測水輪機何時發(fā)生汽蝕的頻率范圍。特征值的選擇有許多復雜的方法,在此采用了一種基于振動信號處理和水輪機汽蝕特性知識來創(chuàng)建和選擇特征的方法。
1) 收集緩降數(shù)據(jù)
因為水輪機在其最大和最小功率輸出運行條件之間是線性過渡的,當使用接近式探頭進行汽汽蝕檢測時,用于收集數(shù)據(jù)的最小采樣率應大致基于葉片通過頻率或導葉通過頻率中較高者,水輪機通過緩降所需的時間(以秒為單位)將影響收集的數(shù)據(jù)量、頻率分辨率以及創(chuàng)建訓練數(shù)據(jù)可用的總點數(shù)。本文在研究中觀察到,60~90 s的緩降可以產(chǎn)生足夠的數(shù)據(jù),通過對現(xiàn)有數(shù)據(jù)進行逐步抽取,可以估計出最小實際下降時間。
2) 計算每個頻率的方差
此步驟在緩降數(shù)據(jù)中搜索振幅隨時間顯著變化的振動頻率范圍,在水輪機減速期間,水輪機的轉速保持不變,唯一變化的變量是發(fā)電負荷和流經(jīng)水輪機的水流;可以進一步分析與水流有關的振動頻率,以確定是否與汽蝕有關。
3) 選擇頻率范圍
在汽蝕檢測方法中選擇的數(shù)據(jù)是根據(jù)1個或多個頻帶內(nèi)接近探頭振動的均方根(RMS)振幅計算的。基于RMS計算和頻率濾波器的數(shù)據(jù)已被證明對水輪機和水泵中的汽蝕檢測有效。用于RMS計算的頻帶基于步驟2中創(chuàng)建的方差頻譜。圖2給出了安裝在不同位置的兩個傳感器(見圖1)測量的水輪機通過斜坡下降時的均方根振幅。當在水輪機中使用接近探頭進行汽蝕檢測時,有3個頻率區(qū)域值得注意:① 低于運行速度的振動頻率受尾水管漩渦、馮·卡門漩渦脫落或其他水力不穩(wěn)定性的影響;② 在運行速度下增加的振動頻率也可能是水力不穩(wěn)定的指標(運行速度振動也可能受到其他類型故障的影響,包括不平衡、不對中和軸承磨損);③ 葉片和導葉處的高頻振動。

圖2 傳感器測量的水輪機通過斜坡下降時的均方根振幅
人工神經(jīng)網(wǎng)絡屬于一種廣泛使用的算法模型,該模型結合人腦神經(jīng)元特征進行設計,擁有自主學習和自適應的特點,通過神經(jīng)元之間的關系實現(xiàn)對信息的處理。各個神經(jīng)元以變量x作為輸入,然后對y-hat值進行計算。已知訓練集中的樣本數(shù)目為m,x代表某個樣本各個特征的取值,g代表非線性激活函數(shù)。另外,各個單元存在偏差(b)、權重向量(w)兩個需要進行學習的參數(shù)。在迭代過程中,需要基于當前的w對x的加權均值進行計算,然后將b加上,并將得到的結果代入到g中,具體的計算公式如下所示:

(1)
yk=g(sk)
(2)
在上述公式中,角標k表示第k個神經(jīng)元,x1,x2,…xn為輸入?yún)?shù)向量,表示未知量個數(shù);w1,w2,k,…,wn,k為各參數(shù)權重;bk為閾值;sk為第一次進行權重分配后的輸入值;g為非線性激活函數(shù);yk為輸出值。 圖3為神經(jīng)網(wǎng)絡模式示意。

圖3 神經(jīng)網(wǎng)絡模式示意
支持向量機是一種基于統(tǒng)計學的最先進的神經(jīng)網(wǎng)絡方法。背后的基本概念是超平面,支持向量機在高維空間中構造一個超平面或一組超平面,用于分類。支持向量機算法的基礎是最大間隔分類器,最大間隔分類器雖然很簡單,但不能應用于大部分數(shù)據(jù),因為大部分屬是非線性數(shù)據(jù),無法用線性分類器進行分類,解決方案是對特征空間進行核函數(shù)映射,然后再運行最大間隔分類器。 支持向量機的核函數(shù)映射是一種擴展特征空間的方法,核函數(shù)的核心思想是計算兩個數(shù)據(jù)點的相似度。核函數(shù)的度沒有限制,使用度大于1的內(nèi)核可以得到更靈活的決策邊界。圖4為支持向量機算法圖解。

圖4 支持向量機算法圖解示意
決策樹(Decision Trees,DT)是一種監(jiān)督機器學習算法,該算法根據(jù)數(shù)據(jù)的特征進行逐層劃分直到劃分完所有的特征,這一過程類似于樹葉生長過程。決策樹算法可用于解決分類和回歸問題,在實際數(shù)據(jù)分析中有著廣泛的應用,比較經(jīng)典的決策樹算法有CART、ID3等等。DT對數(shù)據(jù)采用自上而下的方法,在給定數(shù)據(jù)集的情況下,嘗試對數(shù)據(jù)之間相似性進行分組和標記,并尋找最佳規(guī)則來對它們之間對應的不同的標簽進行分類和回歸分析,直到達到最大的精度。
隨機森林由Leo Breiman(2001)提出的一種分類算法,它通過自助法(bootstrap)重采樣技術,從原始訓練樣本集N中有放回地重復隨機抽取n個樣本生成新的訓練樣本集合訓練決策樹,然后按以上步驟生成m棵決策樹組成隨機森林,新數(shù)據(jù)的分類結果按分類樹投票多少形成的分數(shù)而定。其實質(zhì)是對決策樹算法的一種改進,將多個決策樹合并在一起,每棵樹的建立依賴于獨立抽取的樣本。單棵樹的分類能力可能很小,但在隨機產(chǎn)生大量的決策樹后,一個測試樣本可以通過每一棵樹的分類結果經(jīng)統(tǒng)計后選擇最可能的分類。
logistic回歸模型的主要目標是基于訓練數(shù)據(jù)集上提取的知識預測新給定數(shù)據(jù)的標簽。邏輯回歸可以分為兩種類型:簡單邏輯回歸和多元邏輯回歸。簡單邏輯回歸用于預測類別值,因為它是分類的,并且只有兩種可能的結果,然而,多元邏輯回歸可以用來預測由3個或更多可能結果組成的類值。針對某一任務數(shù)據(jù)集,找一個合適的預測函數(shù),一般表示為h函數(shù),即分類函數(shù),用來預測輸入數(shù)據(jù)的判斷結果;其次構造一個損失函數(shù),該函數(shù)表示預測的輸出與訓練數(shù)據(jù)類別之間的偏差,可以是二者之間的差或者是其他形式,綜合考慮所有訓練數(shù)據(jù)的損失,將損失函數(shù)求和或求平均,記為J函數(shù),表示所有訓練數(shù)據(jù)預測值與實際類別的偏差。
圖5表示本次測試傳感器數(shù)據(jù)通過MD和RMS處理后的頻率范圍,表1為基于平方根(MD)振幅對水輪汽蝕的監(jiān)測精度,表2為基于均方根(RMS)振幅對水輪汽蝕的監(jiān)測精度。由表1、表2可知,對于MD振幅,決策樹方法相比其他算法監(jiān)測精度都好,平均準確率為76.87%,隨機森林方法次之,監(jiān)測準確率為72.67%。相比而言邏輯回歸方法監(jiān)測出來的結果精度最低,僅為65.73%。而對于RMS震幅,從表2可以明顯看出,在所有機器學習方法中,隨機森林(RF)的監(jiān)測性能最好,平均監(jiān)測精度達到了88.80%,其次是決策樹和支持向量機,監(jiān)測精度分別為83.63%和74.13%,ANN和LR回歸的準確性較低,但ANN在數(shù)據(jù)集D1上的性能優(yōu)于SVM。從上表還可看出,數(shù)值結果清楚地表明了基于均方根(RMS)振幅進行數(shù)據(jù)預處理的有效性要明顯高于平方根(MD)振幅,大大增大了水輪機故障監(jiān)測精度。

圖5 傳感器數(shù)據(jù)頻率范圍

表1 基于平方根(MD)振幅對水輪汽蝕的預測精度

表2 基于均方根(RMS)振幅對水輪汽蝕的預測精度
本研究結合了多種機器學習方法,先采用加速度計以及聲發(fā)射傳感器對轉輪進行監(jiān)測,之后利用均方根(RMS)和平方根(MD)振幅計算方法來提取輸入數(shù)據(jù)特征值,最后采用隨機森林方法(RF)、決策樹(DT)、人工神經(jīng)網(wǎng)絡(ANN)、支持向量機(SVM)和logistic回歸5種機器學習算法,對RMS和MD數(shù)據(jù)進行了對比分析。結果表明對于MD振幅,決策樹方法相比其他算法監(jiān)測精度都好,平均準確率為76.87%,而對于RMS震幅,隨機森林(RF)的監(jiān)測性能最好,平均監(jiān)測精度達到了88.80%。此外基于均方根(RMS)振幅進行數(shù)據(jù)預處理的有效性要明顯高于平方根(MD)振幅,大大增大了水輪機故障監(jiān)測精度。