席 慧,鄭 陽,安宇晨,游仕豪,陳 盛,陳啟卷
(武漢大學動力與機械學院,武漢430072)
水電機組在電網中負責調峰調頻任務,機組出力范圍朝著0~100%方向發展,由于水輪機自身水力特性的影響,不同型號水輪機普遍存在部分負荷區間運行時振動強烈的現象[1,2],機組長期處于振動強烈區域運行,會導致結構部件損壞,因此,研究機組運行振動區的需求十分迫切[3,4]。
傳統的振動區劃分方法是通過若干個特征水頭工況下的穩定性試驗,采用國家或行業標準中的限值作為振動區劃分的絕對閾值。翟曉陽等[5]通過樂灘水電站4 號機組穩定性試驗,分析試驗結果,實現機組運行振動區劃分。夏琳等[6]通過某水電廠機組的變負荷試驗,分析機組在不同水頭下不同部位的振動、擺度、壓力脈動,將機組的運行區劃分為低負荷區、強渦帶工況區、穩定運行區等3個區域。
近年來隨著信號分析方法的發展,國內外許多學者將時頻分析方法應用到振動區劃分,陳國青等[7]提出將振動信號灰度矩值作為表征振動信號強弱的特征值,并以實際數據對云南某電廠水電機組振動區劃分。樊玉林等[8]通過短時傅里葉變換對水輪機升負荷過程的水導擺度信號進行分析,根據渦帶頻率隨負荷的變化規律劃分運行工況區。隨著工業大數據時代來臨,機組在線狀態監測系統數據被應用到振動區劃分,婁強等[9]提出一種基于機組在線監測數據、輔以穩定性試驗分析的運行區精細劃分方法,較傳統的劃分方法在渦帶區邊界、識別渦帶區范圍等方面有優勢。嚴耀亮等[10]對水布埡電廠4臺機組狀態監測系統采集的海量數據進行挖掘、整理和分析,對機組運行區提出規劃建議。在線狀態監測系統數據具有種類豐富、數據量大的特點,而絕大多數穩定性參數測點峰峰值沒有超過國標限值,數據處理過程會浪費大量時間精力,如何快速有效獲取機組狀態數據信息顯得尤為重要。
本文針對在線狀態監測系統海量數據信息的快速有效挖掘問題,通過穩定性參數超標次數統計的方法篩選能夠反映機組穩定性狀態的關鍵測點,將在線狀態監測系統中各工況區間穩定運行數據作為樣本,構建基于極限學習機分類器的機組振動區劃分模型,研究基于數據挖掘和ELM 的水電機組振動區劃分方法。
基于數據驅動和ELM 的水電機組振動區劃分模型,首先通過數據庫獲取在線狀態監測系統的海量數據中全工況區間數據,廣泛統計各穩定性參數測點峰峰值超出國家或行業標準限值的次數,并根據各測點越限頻次選取能夠真實反映機組運行狀態的穩定性參數測點。進一步,以篩選的穩定性參數測點峰峰值和工況量為特征向量集,構建基于ELM 分類器的機組運行狀態判別模型,最終實現機組全工況區間振動區劃分。
水電機組是結構復雜、部件繁多的非線性系統,在線狀態監測系統實時對機組運行過程中各方面數據和信息進行采集和存儲,其數據種類豐富。傳統的水電機組振動區劃分以機組幾個特征水頭下的變負荷試驗數據為數據來源,本文考慮將在線狀態監測系統數據作為數據來源,不僅包括了變負荷試驗數據,而且還包括機組日常發電運行數據。但是在線狀態監測系統中穩定性參數測點較多,需要根據機組實際運行情況,篩選能夠明顯反映機組運行狀態的測點。
本文以浙江省某電廠混流式機組為研究對象,機組單機容量為55 MW,額定轉速200 r/min,設計水頭69.0 m,最大水頭85 m,最小水頭60.5 m。該水電廠搭建了振動區劃分數據庫,對在線狀態監測系統中穩定性參數測點峰峰值和工況量以數據表的形式進行存儲。數據庫自2018年12月投入運行以來,已經累計存儲機組穩定負荷運行數據1 821 730條,剔除其中由于數據庫安裝調試、傳感器損壞和通信中斷等原因導致的錯誤數據,最終可以用來振動區劃分的數據為1 568 902條。本文對各穩定性參數測點峰峰值超過國家或行業中規定限值的次數進行統計,各測點超標次數進行排序如表1 所示。從表1 可知,穩定性參數測點超標次數超過10 000 次的測點有水導X向擺度、定子機架垂直振動、頂蓋X向水平振動、頂蓋Y向水平振動等四個測點,其他測點超標次數與以上4 個測點超標次數相比數量明顯較少,可以忽略不計,因此,本文將以上4 個測點峰峰值作為表征機組運行穩定性狀態的特征和振動區劃分數據來源。

表1 測點超標次數排序表Tab.1 Ranking table of the number of outliers of test points
極限學習機(Extreme Learning Machine-ELM)是一種學習速率快且泛化性能強的高效預測智能算法[11]。ELM 是由輸入層、隱含層和輸出層組成的經典單隱層前饋神經網絡模型[12,13],極限學習機的網絡結構如圖1 所示,隨機選取輸入層權重和隱藏層偏置,輸出層權重通過最小化由訓練誤差項和輸出層權重范數的正則項構成的損失函數,依據Moore-Penrose(MP)廣義逆矩陣理論計算解析求出[14]。

圖1 極限學習機網絡結構圖Fig.1 Extreme learning machine network structure diagram
極限學習機算法具體原理如下:對于有N個訓練樣本(xi,yi),xi=[xi1,xi2,…,xin]T?Rn和yi=[yi1,yi2,…,yin]T?Rm分別為樣本輸入數據和輸出數據。對于一個有L個隱層神經節點數,激勵函數為g(x)的極限學習機表達式為[15]:

式中:βi為輸出權重;wi=[wi1,wi2,…,win]T為輸入權重;bi為第i層隱含節點閾值。
極限學習機的目的是使輸出誤差最小,即通過最小化近似平方差的方法對連接隱藏層和輸出層的權重(β)進行求解,目標函數如下:

式中:H是隱藏層的輸出矩陣;T是訓練數據的目標矩陣。

通過線代和矩陣論的知識可推導得公式(3)的最優解為:

式中:H+為矩陣H的Moore-Penrose廣義逆矩陣。
這時問題就轉化為求計算矩陣H的Moore-Penrose廣義逆矩陣,該問題主要的幾種方法有正交投影法、正交化法、迭代法和奇異值分解法(SVD)。當HTH為非奇異(可逆)時可使用正交投影法,這時可得計算結果是:

采用美國西儲大學軸承數據中心的數據驗證ELM 分類器的可靠性,實驗平臺中驅動端軸承型號為6205-2RSJEMSKF 深溝球軸承,采樣頻率為12 kHz,通過電火花加工技術設置軸承不同的單點故障,振動信號由放置在軸承座上方的加速度傳感器采集,驅動端軸承數據類型包括正常數據、內圈故障數據、外圈故障數據和滾動體故障數據[16]。
本文選取負荷為1 470 W、電機轉速為1 730 r/min、采樣頻率為12 kHz、故障直徑為0533 4 mm、故障深度為0.279 4 mm時,以上四種運行狀態驅動端軸承振動波形數據,將其振動峰峰值數據作為ELM 算法輸入數據,4 種運行狀態標簽作為ELM算法輸出數據。對ELM 算法中隱層神經元節點數設置為20個,4 種狀態分別隨機抽取100 組峰峰值數據作為樣本數據,將400組樣本數據,按照訓練集數目:測試集數目=6∶4比例隨機分配,模型訓練30次。以第15次訓練結果為例,本次ELM 算法訓練集準確率和測試集準確率分別為0.987 5和0.981 2,表2為每種狀態40個不同樣本的故障識別結果,從表中可知軸承正常狀態和內圈故障狀態的識別率達到了100%,外圈故障狀態有一個樣本沒有被正確識別,識別率為97.5%,滾動體故障狀態有兩個樣本沒有被正確識別,識別率為95%,整體平均識別率為98.12%。

表2 ELM算法故障識別結果Tab.2 ELM Algorithm fault identification results
ELM 分類器進行30 次獨立實驗,經數據統計后,測試集最大準確率為0.993 8,最小準確率為0.975 0,平均準確率為0.985 0。因此,將ELM 分類器應用到測點峰峰值故障數據分類識別中可信度較高。
水電機組是一個水機電耦合的系統,在不同水頭和不同負荷區間內運行時,機組穩定性表現不同,因此,極限學習機的特征向量集除了能夠反映機組穩定性的測點峰峰值數據以外,還應包括機組運行水頭和負荷。本文對23 個穩定性參數測點峰峰值數據清理、篩選和統計后,將水導X向擺度、定子機架Z向振動、頂蓋X向水平振動、頂蓋Y向水平振動峰峰值用來反映機組振動穩定性,將以上六種特征量作為ELM 分類器的輸入特征向量集,輸出標簽為機組穩定性狀態,模型示意圖如圖2所示。

圖2 基于數據驅動和ELM的水電機組振動區劃分模型示意圖Fig.2 Schematic diagram of data-driven and ELM-based vibration zoning model for hydropower units
機組穩定性狀態通過4 個穩定性參數超標測點數目反映,當沒有測點超標時,機組運行工況區間為“建議運行區”;當有一個測點超標時,機組運行工況區間為“限制運行區”;當有兩個及以上測點超標時,機組運行工況區間為“規避運行區”。樣本數據包括訓練集樣本數據和測試集樣本數據,其中訓練集樣本特征量為機組各個工況區間穩定運行時隨機選取相同數量數據,訓練集樣本標簽為訓練集樣本中穩定性參數測點超標數目,即機組穩定性狀態;測試集樣本特征量為數據庫中機組各個工況區間最近運行數據,測試集樣本期望輸出為測試集中穩定性參數測點超標數目。
采用ELM 分類器對訓練集樣本特征量和標簽進行分類訓練,當訓練集準確率達到90%以上時訓練完成,然后將測試集樣本特征量作為ELM 分類器輸入,對測試集樣本進行分類,輸出結果為各工況區間機組穩定性狀態,根據輸出結果劃出機組振動區基于數據挖掘和ELM 的水電機組振動區劃分模型流程圖,如圖3所示。

圖3 基于數據驅動和ELM的水電機組振動區劃分建模流程圖Fig.3 Flow chart of data-driven and ELM-based model for vibration zoning of hydropower units
2.2.1 樣本數據選取
通過數據庫隨機選取機組在不同工況區間內相同數量數據,ELM 分類器特征向量集包括水頭、負荷、水導X向擺度峰峰值、定子機架Z向振動峰峰值、頂蓋X向水平振動峰峰值和頂蓋Y向水平振動峰峰值共6 個向量,樣本覆蓋不同水頭和負荷的454 個工況區間,覆蓋工況區間如圖4 所示。訓練集樣本為每個工況區間隨機選取5 條數據,其中部分工況區間數據小于兩條則不考慮該工況區間,訓練集樣本數據共有2 022 條,訓練集標簽為機組穩定運行狀態。測試集樣本為每個工況區間內一條最近運行數據,所有測試集樣本數據共有454條數據。

圖4 樣本覆蓋工況區間Fig.4 Sample covering operating range
2.2.2 模型訓練
基于數據驅動和ELM 的水電機組振動區劃分模型,對訓練集樣本進行分類訓練時,需要設定ELM 分類器的隱含層神經元個數,構建了隱層神經元節點個數為1~100 的ELM 分類器,然后對每個分類器對訓練集樣本訓練50次,分別計算不同神經元數目的訓練模型準確率的平均值,訓練集和測試集平均準確率如圖5 所示。從圖5 中可知訓練集準確度隨隱層神經元節點數目的增加先增大后基本保持不變,當隱層神經元節點數目大于20 個時,訓練集準確率大于90%,符合模型搭建的需要,因此,本文將ELM算法的隱層神經元節點個數設置為20。

圖5 不同數目隱層神經元節點準確度Fig.5 Accuracy of hidden layer neurons with different number of nodes
對隱層神經元節點數目為20 個的ELM 分類器進行100 次獨立實驗,準確率如表3 所示。從圖表中可知,經過100 次獨立實驗后,訓練集平均準確度為93.71%,測試集平均準確度為90.63%。

表3 100次獨立實驗準確率 %Tab.3 100 independent experiments
2.2.3 振動區劃分
傳統的振動區劃分方法通過變負荷試驗,采用國家或行業標準規定的限制值劃分振動區,該電站機組在2017年完成增容改造后,在低、中、高3 個水頭區間分別選取一個特征水頭進行變負荷試驗,振動區劃分結果如圖6所示。圖中綠色區域為“建議運行區”,表示機組在該工況區間內運行穩定性狀態良好;黃色區域為“限制運行區”,表示機組在該工況區間內運行穩定性狀態一般;紅色區域為“規避運行區”,表示機組在該工況區間內運行穩定性狀態較差。從圖中可知傳統的振動區劃分結果較為粗糙,覆蓋工況區間有限,不能對機組全工況運行區進行劃分。

圖6 基于變負荷試驗的振動區劃分結果Fig.6 Results of vibration zoning based on variable load test
將在線狀態監測系統中機組所有穩定運行數據,按照國家或行業標準規定的限值劃分振動區結果,如圖7 所示,對比圖6可知,將在線監測系統數據應用到振動區劃分中,覆蓋工況區間更廣,劃分結果較為細致。

圖7 基于在線監測系統的振動區劃分結果Fig.7 Results of vibration zoning based on on-line monitoring system
將測試集樣本通過ELM 模型反復進行100 次實驗,選取測試集準確率最高的輸出作為機組各個工況區間穩定性狀態分類結果,如圖8 所示。對比圖6 和圖7 可知,該方法較傳統變負荷試驗的振動區劃分結果覆蓋工況區間更廣,與基于在線監測系統數據的振動區劃分結果基本一致。該方法對在線監測系統數據進行初步篩選后,最終應用于振動區劃分模型實現的數據量僅為在線監測系統數據量的0.2%,因此該方法具有較高的運算效率。

圖8 基于數據驅動和ELM的振動區劃分結果Fig.8 Results of vibration zoning based on data-driven and ELM
本文構建了基于數據驅動和ELM 的水電機組振動區劃分模型,對機組在線狀態監測系統數據,通過數據庫隨機篩選全工況區間數據,獲取用于表征機組穩定性狀態的測點有效數據,通過訓練集樣本對振動區劃分模型進行分類訓練,根據測試集樣本判別機組目前在各工況區間的穩定性狀態,實現機組振動區的精確劃分。實際應用表明,基于數據驅動和ELM 的水電機組振動區劃分方法可以高效快速利用海量在線監測系統數據,劃分結果可靠性高,對指導電廠安全穩定運行具有重要意義。 □