(酒泉職業技術學院,甘肅酒泉市,735000)方占萍
為了改善風電場運維情況,就應通過大數據統計分析專業技術,來準確預測、評估機組設備的運行狀態,并明確機組零部件的實際運行劣化趨勢,再智能化預警風電機組后續可能的異?,F象,幫助風電場運維者做好預防性維護,有效避免機組出現故障。
在大數據時代下,各個行業均發展得越來越快。在迅速發展中,會產生大量的數據。為了充分發揮數據的作用,便應注意分析、計算數據。而通過大數據分析專業技術,便可以從各個行業內部收集并存儲下來的數據出發,按照各自的行業特征,以切實適合的方法,來科學地展開分析,并輔助提出正確決策。
大數據分析指的就是一個基于數據,來整理、轉換、建模的整個過程,主要旨在找出有助于業務決策的信息。通過數據分析專業技術的應用,可提取出海量數據內的有用信息,并基于數據分析結果正確做出決策。相較于傳統數據,大數據表現出很明顯的數據量大、迅速響應、種類豐富多樣、不易識別、價值高及密度低等方面的特點。而以上這些特點也屬于大數據分析發展中的挑戰,為了迎接這些挑戰,大型互聯網公司便陸續推出了類型各異的大數據分析處理技術系統。在進一步發展大數據行業之中,先進的大數據分析專業技術也獲得了飛快的發展。而在風電行業,面臨海量、復雜多變的機組設備數據監測,為了控制數據分析處理的速度及精度,也有應用大數據分析專業技術,來達到預測風電行業設備異常方面的要求。
為了滿足預測風電設備各種異常數據在處理速率及日常預測精度上的要求,文中建立了一個預測風電設備各種異常的模型。在模型當中,主要涉及分析層、應用層、采集層、存儲層這些組成部分。
作為前饋多層網絡之一,從反向傳播誤差的算法專業訓練具有神經網絡上的特征。因為神經網絡可顯示非線性整體映射關系,所以在各個領域均獲得了很廣泛的應用。在實際應用神經網絡中,不必提前了解映射關系的描述方程。在BP神經的拓撲網絡結構內,主要涉及輸入輸出層、隱層等,且學習算法就是最速下降法。為了最小化神經網絡上的誤差平方和,便應靈活調整好整個神經網絡上的閾值及權值。據有關研究顯示,如果在BP神經網絡上的隱含層內,幫助充足的神經元,并且只含有唯一隱含層之類的BP神經網絡,便可從任意精度,直接逼近一個連續不斷的非線性函數。為此,文中選擇的是只有一個隱含層類型的BP神經網絡。就BP神經網絡結構模型,為了縮短算法運行所耗時間,展開了并行運算?;诓⑿谢椒∕apReduce的大力支持,就各權值變化量,便可在Map環節順利運算并輸出來。針對權值各異的總變化量,便可在Reduce中完全統計,并科學地統一靈活調整配合權值,并可從批處理上展開訓練。
在季節性天氣變化及頻繁更改風速的作用下,風電場內機組也應積極切換自己的運行工況。在反復切換風電機組工況的情況下,監測設備狀態的數據也會經常大幅波動幅值。所以不能利用幅值大小,來準確判斷風電機組的實際運行安全水平。為了順應風電機組的這個運行特征,當前在風電行業一般都采用的是閾值報警法。也就是在判斷風電機組的實際運行狀態時,采用監測信號有沒有上升至報警閾值的判斷基礎。但是,該閾值報警法,在實際應用的過程當中,極易發生誤漏報等,所以預測風電設備的有關異常精確度較低。所以,文中通過殘差分析法,來判斷風電機組的實際運行狀態。大致的程序如下所示:“監測歷史數據→開始預處理→選出可用歷史數據→做好歸一化→搭建BP神經網絡專業訓練模型→設置網絡權值、形成閾值矩陣→建立BP神經網絡專業預測模型”“監測新數據→建立BP神經網絡專業預測模型→算出殘差→有沒有超過殘差閾值→有→算出RMSE→有沒有超過RMSE閾值→有→異常狀態”,倘若殘差或RMSE未超過設定閾值,就表示風電設備在正常狀態下。
實際預測風電設備出現異常的過程:①選出正常運行下風電機組內部的SCADA數據,并長期有針對性的預處理措施,以獲得后續分析所需的監測數據。根據一定的比例展開劃分環節,以才獲得的監測數據作為測試及訓練所需數據。②對訓練數據,采取歸一化處理,并選擇六個狀態參數當作模型輸入所需參數,依次就是振動機艙的值、發電機轉速值、風速大小、輪箱內部油溫、振動傳感器X與Y。從輸入參數出發,展開BP神經網絡專業模型訓練,按照訓練結束基礎依據,來控制輸出值誤差位于允許范圍。③從目標參數出發,通過預測模型展開預測,比較實際值和參數預測結果,并得到殘差。一旦沒有發現殘差超過設定閾值,則可斷定參數下的風機設備一切正常。④比較實際值和參數預測結果,一旦殘差超過設定閾值,便應通過下式,來算出均方根RMSE誤差:
其中,D—均方根誤差;m—樣本數;x—模型預測值;xi—實際值。以上的RMSE結果,還可用作衡量殘差改變的劇烈水平。為了準確體現殘差發展趨勢,還應按滑動窗口技術,根據每天計算,來獲得RMSE改變狀況。⑤從計算中獲得RMSE值,如果該值有超過設定閾值,便應判斷該風電設備位于異常狀態。
為了證實文中所提方法的正確實用性,建立起Hadoop平臺,并開始測試過程。其中使用的是兩從節點和一主節點形成的集群Hadoop。這些節點具有2G內存,是基于Hyper-V應用管理器,建立的虛擬機。而內含200G硬盤,通過Eclipse、Hive、HBase等專業技術來開發。從某風電場2019年1月~2020年1月具體的運行數據開始,這些數據源自SCADA體系33臺風電設備的數據。在測試中選出33臺機組設備中的15臺在2019年7月獲得的監測數據。從監測的15組數據出發,選出訓練樣本,并執行模型訓練。為了有效控制模型輸出中的誤差,設置各組訓練1 000次,獲得性能佳的BP神經網絡專業預測模型。選擇一臺機組對應的2019年7月監測產生的15組數據當作測試樣本,并預測下一時刻油溫均值,獲得比較模型預測值和監測值的結果。據比較顯示,真實值大致吻合預測值,很好地證實了模型的有效性與精確度。
總之,在風電場,大數據分析專業技術能夠用于準確預測設備異常。所以,文中提出了相應的預測模型,以預測異常運行流程等。為了利用好大數據分析這種技術,還應注意引進評價實時可靠性的公式,兼顧風速短時波動與監測數據信息的時序性,以確保預測的高可行性,進而有效促進風電行業的健康發展。