王博維, 劉愛蓮, 杜景琦
(1.昆明理工大學 信息工程與自動化學院, 云南 昆明 650500;2.云南電網有限責任公司電力科學研究院, 云南 昆明 650504)
水輪機作為水電站中最重要的發電設備,一直以來都是水電研究的重點。隨著狀態監測在電力系統中的廣泛應用,特別是近些年來狀態監測在水利發電系統中的快速發展,越來越多的研究者將目光投入到水力發電狀態監測[1~4]上來。文獻[5]中,李輝等人使用的集合經驗模態分解(Ensemble Empirical Mode Decomposition, EEMD)和 自組織特征映射網絡(Self-organizing Feature Map, SOM)神經網絡的水電機組故障診斷方法,該方法使用小波神經網絡和自適應差分進化法對振動信號進行識別分析,能在網絡運算中顧及全局并優化局部,可以準確地找到問題所在;但僅限于少量數據輸入的預測,無法將大量的數據有效地利用起來。
水電機組振動特征和故障類型之間具有復雜的非線性關系,神經網絡具有極強的非線性映射能力[6,7]。使用神經網絡能夠建立水電機組振動特征和故障類型之間的關系,很好地處理復雜系統中存在的問題。但神經網絡的復雜度與輸入數量有著緊密的關系,實際應用中往往是由于神經網絡的輸入太多而導致系統無法運行[8~12]。
針對上述問題,本文以水電機組的劣化速度和運行狀態作為主要研究內容,使用并行神經網絡來處理大數據,使系統的運行速度得到大幅度的提升,并在預測后給出檢修建議。最后使用歷史數據對模型進行驗證,確定其可以準確有效地反映設備的情況。
目前大多數關于水電振動故障診斷均傾向于故障類型和故障定位,而忽視了檢修的重要性,通過維護可以避免大多數故障[13~15]。針對水電設備所處的不同運行狀態,需要進行的維護也不同。當水電設備運行到一定年限時,由于其設備自身的原因發出預警需要進行維護檢修,此時需要一種快速、直觀的診斷方法對此作出反應,而不是等發生故障時給出定性的分析診斷。
基于以上問題,本文設計了一種基于并行神經網絡的狀態監測方法,流程如圖1所示。

圖1 狀態監測方法流程
傳感器采集到數據后,首先對數據送入原始數據處理,在此進行異常值分析、對比分析、缺失值分析;然后將處理完的數據送入狀態監測模型中進行預測,得到水電設備當前的運行狀態和劣化速度,并給出狀態檢修參考建議。
傳感器在使用的時候由于環境干擾、人為操作等經常出現數據不精確等問題,這些由于干擾產生的數據會使預測變的極為不準確。所以需要對數據進行篩選,再進行下一步的預測。首先對數據進行異常值分析,排除部分干擾造成的數據異常;其次進行缺失值分析,補充由于干擾造成的部分數據丟失;最后進行對比分析,減少數據量。
傳感器在受到干擾時可能會出現突然急速增大到最大值或減小到最小值,即出現跳變,針對這樣的數據需要進行刪除。
設水電站某設備上傳感器U在一段時間內采集到的數據為st1,st2,…,stn。
如果
|st2-st1|≤α|st3-st2|
(1)
|st3-st2|≤α|st4-st3|
(2)
…
|stn+1-stn|≤α|stn+2-stn+1|
(3)
不成立,則參照同組傳感器在同一時間的數據進行判斷,如果同組傳感器在這一時間均不成立,則保留該數據;如果僅該組數據不成立,則刪除不成立的那組數據并視情況決定是否補充數據,其中α為異常數據判斷因子,由歷史數據決定其取值。補充的數據為:
(4)

電廠在進行狀態監測時經常會在重要的設備上安裝多個傳感器進行監控,以防止單個傳感器出問題而導致監測異常。另外還有一些設備體積比較大,需要取多個點同時進行監測。如果將同一監測點的多個傳感器同時輸入到網絡中,網絡的復雜度將會呈指數增長,所以需要對這些數據進行對比分析,使用一組或幾組代替更多組數據進行預測[16~18]。
設水電站某重要設備上安裝有U組傳感器(u1,u2,u3,…,uk),ui表示U組傳感器中的一組。x(x1,x2,x3,…,xn)表示傳感器ui在某一時間點T采集到的數據。
方差
(5)
式中:x為平均值;a為經驗數據。如果這些數據的方差s2≤a,則用其平均值來代替這一組數據,否則根據具體設備決定使用幾組數據進行代替。將相關性高的幾組數據進行合并處理,刪除了部分無用數據,提高系統的運行速度。
隨著運行時間的增加,設備會逐步劣化,性能也會越來越差,直到產生故障損壞。設備的劣化遵循圖2曲線,該曲線也可反映出設備的運行狀態,根據不同的運行狀態和劣化速度采用的應對措施也不盡相同。

圖2 設備性能劣化曲線
針對設備的劣化,本文使用水電廠中各部位的傳感器作為故障預警的基本條件,通過并行神經網絡建立預測模型,為水電站提供更加可靠的預警方法。
神經網絡可以實現復雜的映射,一般的神經網絡包含有輸入層、隱含層、輸出層,這3層相互作用可以以任意精度來逼近連續函數,適用于非線性函數的擬合。神經網絡的關鍵在于其隱含層的相互作用,但在使用神經網絡的時候經常會出現輸入過多的情況,針對某只需要單一輸出問題的求解,其影響因素經常是十多條或者更多。而神經網絡的復雜度是隨著輸入的增加呈指數級增長的,這會造成神經網絡的建立變得極為復雜,具體表現為學習時間大大增加、網絡不穩定,甚至在一些多輸入上建立的網絡甚至無法正確地擬合原有曲線,這就是所謂的過擬合現象。
針對這種多輸入單一輸出的問題,提出并行神經網絡的方法[19~21]。并行神經網絡可以從結構和數據兩個方向來實現,由于數據量的龐大性,若要從結構上實現并行,所需運算量將會極為龐大,難以實現。當然,也可通過物理方法來實現結構上的并行神經網絡,但這種方法需要建立專用的設備,實現起來不僅麻煩而且實用性差,費用也很大。另一方面,數據并行的神經網絡可以通過算法來實現,其總體結構框架如圖3所示。圖中每組數據都有自己完整的神經網絡,在各自達到收斂條件后產生多個中間量,對這些運行出的中間量進行匯總分析,判斷是否再次進行分組重新訓練,最終得出結果。相比之下,數據并行的方式更加容易實現。針對具體的神經網絡而言,并行化處理之后,其泛化能力依然很好。

圖3 并行神經網絡結構圖
水輪機的振動故障分為機械振動故障、水力振動故障、和電磁振動故障3大類。機械振動故障包含轉動部分質量不平衡、軸線不對中、轉動部分與固定部件發生碰磨及其他;水力振動故障包含導葉和導輪開口不均、水封間隙不等、轉輪葉片斷裂、尾水管產生的低頻偏心渦帶、轉輪葉片出水邊后的卡門旋渦等;電磁振動故障包含發電機轉子不圓、繞組匝間短路、定子鐵心松動、分辨機座合縫處鐵心間隙大、定轉子間隙不均勻、不平衡負載等。對這些故障,需要逐一建立相應的狀態監測神經網絡;除此之外還需要對正常運行狀態和其沒有提出的故障建立一個專門的神經網絡來進行預測。
通常情況下大型水電站中所安置的監控測點有數千個,一些超大型的水電站其中監控測點更是有可能有上萬個,對一個運行狀態進行預測顯然并不需要全部的監控測點,但某些必須的監控測點必不可少;其中可能含有不能用傳感器直接進行測量的監控測點,這種重要的監測數據水電站一般會使用間接測量的方法進行監控。這些間接測量的測點數據必須放在同一組中進行學習。
并行神經網絡訓練步驟如下:
1)設某個故障狀態大訓練集為M,共有S(s1,s2,s3,…,sn)個關聯數據測點。其中sa,…,sb個數據測點為間接測點,需將sa,…,sb每個單獨分為一組。其他數據采用隨機分組,每個分組數據包含3~5個測點,具體分組數據個數根據總體確定。用這樣的方法將大訓練集M分成t個子集,每個子集都是并行神經網絡中的一個訓練樣本,子集的輸出為中間值y1,y2,y3,…,yt。
2)在每個子集都訓練完后,比較每個子集中的測點權值,若某個數據所占有的權值小于該子集其他任意數據權值的0.5%,即

(6)
則可認定該數據對應測點對該故障的影響因子可忽略,刪除該測點并標記該子集為失敗訓練子集,執行第三步。
3)比較各個子集的誤差值δ1,δ2,δ3,…,δt是否達到設定值。如果各個子集的訓練均比較合適,達到預期誤差標準且沒有出現失敗訓練子集,則執行第五步;若某個子集不能正常進行預測,訓練失敗或無法達到預期的誤差標準,則將該子集標記為失敗訓練子集,執行第四步。
4)檢查失敗訓練子集,若失敗訓練子集中含有間接測量的子集,拆分為兩個子集;然后將剩余失敗訓練子集分組進行合并,執行第一步。
5)子集的訓練完成后,需要將子集輸出的中間值進行合并,在此選用加權平均值的合并方式,按照
(7)
(8)
進行合并,其中fi為各子集所占權重,Y為最終的合并結果。
每個子集網絡同步進行,對于已經訓練好的子集將保持其原有的網絡結構不變,只重復訓練適應性不好的網絡。
由圖2可知,設備在使用中劣化程度隨時間不斷的增加,最終發生故障被替換。設備從使用到報廢之間總共可以劃分為4個階段,正常運行階段、輕微損傷運行階段、中度損傷運行階段、高損傷運行階段。與之相對應,在正常運行階段,設備可認定設備發生故障為極小概率事件;輕微損傷和中度損傷階段,設備發生故障為小概率事件;到高損傷運行階段,設備的使用壽命已經達到極限,繼續使用將隨時可能發生故障,需要馬上進行停機維修。
當然,設備的風險不能僅僅通過當前運行狀態來進行評估。假設設備在使用期間沒有進行嚴重的違規操作,那么從安裝開始,其在每一個運行狀態都有著固定的時間范圍。設備從前一個運行狀態到下一個運行狀態的時間也是作為風險評估的一個重要參考量,若設備從前一個狀態加速劣化到達了下一個狀態,則說明該設備一定存在問題,需要馬上對其進行分析檢查。
設備風險評估使用設備運行狀態和設備當前劣化速度進行評估,具體評估方法參照圖4進行。當處在無風險時,設備正常運行,無需進行檢修;在低風險時,由具體故障來決定檢修的緊急性;處于中風險和高風險時必須馬上進行檢修,查明原因,防止故障發生。

圖4 評估方法
本文基于多數據并行神經網絡,擬合劣化曲線進行預測診斷,結合水電站在運行過程中難以察覺的故障進行分析驗證,具有較好的適用性。如轉輪葉片斷裂這種故障,通常情況下應力過于集中是主要原因,可通過對水輪機葉片進行有限元分析來進行診斷。但也存在其他一些情況,如某水電站因轉輪葉片卡門渦共振,引起轉輪葉片出現裂紋的現象。該故障很難在設備運行的時候進行準確監測,當監控發出預警時故障往往已經發生。
本節使用本文方法對轉輪葉片斷裂這一具體故障進行分析說明。取水電站6個月內每10分鐘內收集到的溫度、油位、擺度、振動、脈動數據來建立模型。圖5(a),為發生轉輪葉片損傷事故前1周前的水導X向擺度數據,圖5(b)為按照異常值分析、缺失值分析、對比分析后的未歸一化處理數據。

圖5 傳感器數據圖
建立模型總共使用了43項數據,共30 000多組數據,表1給出模型構建中使用的部分數據集。建立的模型結構如圖6所示。

表1 并行神經網絡學習數據

續表1

圖6 并行神經網絡預測模型
基于本文所提出的預警模型對新采集到的數據進行預測,得到表2和圖7的預測結果,表2為設備當前的運行狀態預測,圖7為設備劣化速度預測。預測的數值越大表示設備的劣化程度越嚴重。

表2 水輪機葉片狀態預測

圖7 水輪機劣化速度預測
通過對設備運行狀態和劣化速度進行分析,現給出的檢修建議如下:
從運行狀態可以很明顯地看出設備從基本無風險階段轉變到了中故障風險階段;且劣化速度急劇增加,結合設備故障評估表來看,此時應馬上組織緊急檢修來查找故障的具體原因。檢修時可將重點放在轉輪葉片斷裂這一故障上,首先對轉輪相關設備進行查找故障出處。
本文選取水輪機正常運行時一周的1 000組數據和故障前一周的1 000組數據來進行預測,通過與真實的運行狀態和劣化速度進行對比分析來進行驗證。
取水電站正常運行時的1 000組數據進行預測,預測結果如圖8所示,可見預測結果始終在真實值之間波動,僅僅有20組數據出現在誤差范圍外,準確率高達98%。取故障前一周的1 000組數據進行預測,出現234組數據預測不準確,預測不準確的數據多出現在狀態轉換期間。其總體的預測準確率為87.5%。

圖8 劣化狀態預測結果
取準確度驗證中的數據,其劣化速度如圖9所示,再根據實際的檢修結果進行對比,預測的結果可較好地反映設備的劣化速度。

圖9 劣化速度預測結果
本文以設備運行狀態為重點研究對象,設計了一種通過并行神經網絡進行診斷預測的方法,通過對某水電站振動狀態的實際預測,可實現提前預警,再配合預測的結果給出設備檢修建議,減少故障發生。該方法主要有以下幾點優點:
1)通過有效的數據預處理,從輸入層面上提高了數據可靠性,更加有效地使用傳感器。
2)使用并行神經網絡進行預測,這樣水電站的大多數數據都可以使用到該方法中,從而提高了傳感器的利用率,也提高了預測的準確率。
3)通過劣化速度的引入,對檢修提出更好的建議,具有更加廣泛的實用性,對縮短檢修時間有著明顯作用。
該方法在使用中有著較好的結果,但需要大量的歷史數據來進行學習,而且針對某一具體故障需要一定量的故障歷史數據。該方法仍然可以在預測時進行改進。