999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于LightGBM的風電機組齒輪箱油溫故障預警研究

2021-03-02 10:01:20趙娟娟劉廣臣王瑞桃徐曉宇張玫潔黃文廣
電力大數據 2021年11期
關鍵詞:特征故障模型

趙娟娟,劉廣臣*,王瑞桃,徐曉宇,張玫潔,黃文廣

(1.魯東大學 數學與統計科學學院,山東 煙臺 264000;2.華風數據(深圳)有限公司,廣東 深圳 518110)

風電機組設備龐大,地處偏遠、維修成本高,對風機過去和現在狀態進行分析,實現對未來運行狀態的估計和預判,進而可以在風機故障發生前對故障進行有效地識別并預警,大大降低經濟損失,提高工作效率,延長機組壽命。

溫度作為發生故障的重要標志,溫度過高或過低會影響機組的正常運行。文獻[1-2]依據發電機在故障中的運行特征,改進極端梯度提升(XGBoost)算法進行改進,建立故障監測模型。文獻[3]提出了一種隨機森林(BF)算法與LightGBM算法結合的模型來對風機葉片狀態進行分類預測。文獻[4-5]改進支持向量機(SVM)建立風電機組故障預測模型。文獻[6]提出一種將多元狀態估計技術(MSET)和集成學習結合的齒輪箱故障預警方法。文獻[7-13]建立不同神經網絡模型來對齒輪箱的運行狀態進行監測。文獻[14-17]應用深層網絡融合SCADA數據進行故障預警。文獻[18]提出基于多點最優調整的最小熵解卷積(MOMEDA)與1.5維能量譜相結合的故障診斷方法降低漏判誤判。文獻[19]提出了一種利用DFIG定子電流信號進行非平穩狀態下風電傳動齒輪箱故障診斷的新方法。文獻[20-22]基于PCA對最優變量選擇進行風電機組故障檢測與識別。

本文對齒輪箱油溫(gearbox_oil_temperature _gearbox)建模分析,研究內容包括:(1)在正常狀態的風電機歷史數據上進行方差排序、Pearson相關系數和遞歸特征消除(Recursive Feature Elimination,REF)方法篩選特征變量,生成不同特征組合的三個數據集;(2)在不同數據集上建立齒輪箱油溫的輕量級梯度提升機LightGBM模型,綜合模型擬合效果和訓練耗時選擇性能最優的數據集,并且選取時下流行的極限提升樹XGBoost和CatBoost算法模型作為對照算法;(3)根據LightGBM模型預測的齒輪箱油溫值與真實值的偏離程度[23-24],在偏差較大時啟動預警,工作人員檢修時可根據模型輸出特征重要性排序結合專業經驗對部件進行檢修。

1 風機齒輪箱油溫分析

風電機組[25]組成包括葉片、輪轂、齒輪箱、發電機、制動器、偏航系統、塔身等,該系統結構復雜,運行時各個部件緊密聯系,互相影響。風電機組的工作原理,簡單來說:在風力作用下,風電機組的葉片推動葉輪轉動,進而促使傳動系統驅動發電機工作,進而實現風力機械能向電能轉換。齒輪箱是傳動系統的關鍵部件,也是整個機組發生故障比例最高的部件,一旦齒輪箱發生故障,就必須更換整個傳動系統。因此,齒輪箱故障是造成機組停機時間較長的因素之一。

齒輪箱油冷系統既減少了機械器件之間的摩擦又起到散熱效果,保證了齒輪箱正常工作。油冷系統的散熱原理是通過控制溫控閥從而控制潤滑油通路及散熱片的冷卻作用來實現齒輪箱溫度調節的。潤滑油性質易受環境溫度影響,當潤滑油溫度較低時,其流動性差;當潤滑油溫度較高時,潤滑油品的黏度較低,內部機械部件表面的油膜很薄,可能導致邊界潤滑程度不足,摩擦力增大,磨損嚴重。另外,高溫容易造成齒輪油的氧化,油品品質難以保證。綜上,低溫或高溫齒輪箱潤滑油都難以為齒輪提供充分的潤滑。在通常情況下,當齒輪箱溫度超過極限值時,整個機組無法正常運作,風機將會自動停機。毋庸置疑,停機造成的供電量不足以及相關檢測維修,都會導致一筆巨大的經濟損失。

因而,齒輪箱油溫是否保持在一個合適的范圍內,直接影響到風機組的正常運行。研究發現,齒輪箱油溫過高時,風機組的自我保護機制使得它低功率運行,甚至可能停機,影響供電量;同時,齒輪油的潤滑冷卻能力被影響,使得油液老化變快,齒輪箱故障甚至報廢。齒輪箱油溫過低時,風力機組也會有相應的保護機制使得機組不能正常運行。影響油溫高的因素有很多[26],包括翅片結構選型不適、機艙密封不嚴、潤滑油問題,以及溫控閥失效、油溫傳感器失靈等。

利用傳統人工排查耗時費力,大數據背景下,采用大數據技術作為故障預警、設備診斷、運行優化、標準化提升的有效途徑,可以為風電場設計建設各個環節提供精準的數據支持,因此,本文利用建模分析油溫波動,進而進行故障預警勢在必行。

2 模型方法體系

2.1 LightGBM模型

輕量級梯度提升機LightGBM[27]是由微軟推出的基于決策樹模型的分布式Boosting集成算法,是對GBDT算法的改進,還可以稱之為帶有基于梯度的單邊采樣(GOSS)和互斥特征捆綁(EFB)新GBDT算法。隨著大數據的出現(無論是在特征數量上還是數據數量上),傳統的Boosting算法,如XGBoost、CatBoost、GBDT等集成學習算法面臨巨大挑戰。決策樹構造過程中,需要計算分裂點的信息增益,傳統算法需要根據所有數據樣本計算每個特征的信息增益,計算過程煩瑣,且樣本越大特征越多,面臨的計算負擔也越重。這使得這些算法在處理大數據時非常耗時并且在準確性和效率之間難以權衡,與之相比,LightGBM利用GOSS及EFB,不需要掃描所有的樣本點尋找最佳切分點,效率更高,減少內存使用,對硬件要求也有所降低,不損失精度同時縮短耗時。

2.1.1 LightGBM 算法原理

圖1 LightGBM算法原理圖Fig.1 Schematic diagram of LightgBM algorithm

2.1.2 LightGBM算法核心

1)基于Histogram的決策樹算法

輕量級梯度提升機LightGBM是基于Histogram的決策樹算法,它不是在排序后的特征值上尋找分割點,而是將連續的特征值放入離散的K個箱(bin)中,即將連續特征離散化成K個數, 訓練時只需要遍歷K個離散值而不用遍歷所有樣本數據。若需要進行特征選擇,構造K值特征直方圖,根據離散值遍歷尋找增益最高的分割點。Histogram方法由傳統的遍歷所有數據變為遍歷K個離散化數據,降低數據分隔復雜度,大大縮短時間,同時存儲時用8位整型,可以減少內存占用。

2)單邊梯度采樣GOSS

數據樣本梯度的不同直接影響信息增益的大小。根據信息增益的定義,梯度較大的實例(即訓練不足的實例)對信息增益的貢獻更大。因此,梯度較小的樣本對信息增益影響較小,在保證一定準確性的情況下,可以隨機去除低梯度樣本,保留高梯度樣本。基于以上分析,為了減少樣本量,GOSS算法保留大梯度樣本,對剩余小梯度樣本進行隨機采樣,并且,為了補償原始數據分布,小梯度樣本數據引入常數乘子。計算信息增益時使用方差增益進行計算。大大減少了樣本的數據量,提高了訓練速度并減少了內存消耗。

圖2 GOSS算法原理圖Fig.2 Schematic diagram of Goss algorithm

3)互斥特征綁定EFB

在實際應用中,雖然有大量的特征,但特征空間是稀疏的,也就是說,許多特征(幾乎)是互斥的,即它們很少同時取非零值,這就為減少特征維度提供了思路,在精度損失較小條件下,可以將多個互斥特征捆綁在一起,從而將特征維度變低,減少計算復雜度。以上就是互斥特征綁定EFB算法的思想,大大減少了特征數量。EFB算法將最優捆綁問題簡化為圖著色問題(特征作為頂點,如果它們不互斥,則兩個特征有公共邊),并采用常數近似比的貪心算法求解。

圖3 EFB算法原理圖Fig.3 Schematic diagram of EFB algorithm

2.1.3 LightGBM算法優點

(1)LightGBM是在Histogram算法的基礎之上,從遍歷樣本變為遍歷直方圖,縮短了時間消耗,所占內存空間減少。

(2)EFB算法捆綁互斥特征,將時間復雜度從所有特征降為捆綁后的少量特征,有效避免不必要值特征的計算。

(3)LightGBM在取樣時,GOSS算法選擇梯度大的樣本點,對于其他樣本點依據一定比例抽取,保證模型精度,減少計算量。

(4)LightGBM支持特征變量的并行和樣本數據并行計算。

(5)LightGBM選用帶有深度限制的Life-wise算法機制,在同等分裂次數時,可以降低誤差,提升精確度。

2.2 模型評價指標

本文通過對齒輪箱油溫預測溫度與實測溫度之間的均方誤差(Mean Squared Error,MSE)、均方根誤差(root mean square error, RMSE)、平均絕對誤差(mean absolute error,MAE)、平均相對誤差絕對值(mean absolute percent error,MAPE)、擬合優度(R squared)和建模耗費時長這五項指標的計算,進而判斷模型的可靠性。

(1)

(2)

(3)

(4)

3 齒輪箱油溫預警實現

3.1 數據來源及數據預處理

用于分析的數據來自深圳××數據公司某風場C33號風機的SCADA[28-29]數據庫2018年1月至2020年12月分鐘級歷史運行數據,共1519203行73列,占據存儲空間461200KB。

共提供71個特征用于研究。在整個數據集中ControllerState列表示風機運行狀態,包括待機狀態、故障狀態、維修狀態、檢查狀態等,可以以此對風機歷史數據進行清洗。研究目標齒輪箱油溫值波動,對數據進行如下處理:(1)根據控制狀態ControllerState列篩選風機正常運行數據行,刪除風機待機、維修及故障狀態數據行,為了減少波動的影響,根據風機故障記錄刪除故障發生前后一天內的數據。(2)對于缺失數據,考慮到數據量比較大,刪除個別樣本并不會影響模型的最終效果,對于缺失數據行,本文進行刪除處理。(3)不同特征由于其量方式以及量綱不同導致數值差別較大,比如發電機速度1058.9,發電機溫度9.7,直接用原始數據容易減弱數值小的變量的影響,用Z-score方法對數據進行標準化處理,通過處理,去除量綱影響,可使建模更可信。

3.2 特征工程

數據量過大,特征過多,往往會給機器學習的算法帶來維度災難,并且在現實應用中,時間消耗也是需要考慮的重要因素。選擇部分重要特征,在確保一定精度條件下降低學習任務的難度,提升模型的效率,減少算法學習時間,增加模型的可解釋性,使模型泛化能力更強。本文的特征工程主要聚焦特征變量貢獻大小及其與目標的相關性兩個方面。

(1)特征是否發散:如果一個特征是不發散的,那么對于辨別樣本而言,該特征并沒有起到影響。用低方差過濾進行特征選擇,篩選方差較高特征變量。

(2) 特征與目標的相關性:計算Pearson相關系數,Pearson相關系數可以直接明了地刻畫特征和響應變量之間關系,這一方法關注的重點是變量之間的線性相關關系,取值范圍是[-1,1],越靠近1或-1說明變量之間相關性越高,越靠近0表示變量之間相關性越低。

(3)考慮到Pearson相關系數反映的是與目標變量的線性相關關系,不能反映非線性的相關關系,進而采用遞歸特征消除(REF)進行特征排序,遞歸消除特征法去掉一些權值系數較低的特征,組成新的特征集合。

用以上方式進行特征變量篩選,產生三個數據集:①使用全部特征變量(70個特征變量),構成數據集1;②基于方差排序篩選排名前30的變量,構成數據集2;③在②的基礎上,使用Pearson相關系數和遞歸特征消除兩種方式篩選綜合排名前14的變量,構成數據集3。

表1 特征變量綜合排序(前14)Tab.1 Comprehensive ranking of characteristic variables (top 14)

3.3 模型訓練

3.3.1 劃分訓練集、測試集

表2 數據集劃分Tab.2 Data set partition

3.3.2 LightGBM參數調優及模型預測效果

(1)參數調優

1)隨機搜索(RandomizedSearchCV):

隨機搜索顧名思義就是隨機搜索進行超參數組合進行嘗試,同樣尋找在驗證集上精度最高的超參數組合,但搜索機理不通。若搜索范圍是連續的,則根據分布進行隨機采樣,若搜索范圍是離散數值,則等概率采樣,組合超參數。隨機參數搜索也會輸出超參數組合中最優的組合。由于是隨機采樣的,容易錯過一些重要的信息,也正因如此,搜索速度更快,適合大規模數據。

2)網格搜索(GridSearchCV):

網格搜索法,在指定范圍內尋找在驗證集上精度最高的超參數組合,網格搜索會遍歷給定范圍內所有超參數組合,由于沒有錯過任何超參數,搜索效果很好,但面臨大規模數據,時間代價較高,面臨著維度災難,數據較大時,通常不予選擇。

尋找最優超參數組合時先使用Randomized SearchCV大致確定超參數范圍,再經過GridSearchCV確定最優組合,不同規模數據超參數調優結果如表3所示。

表3 不同數據集的LightGBM的參數調優結果Tab.3 Parameter tuning results of LightGBM for different data sets

(2) 模型擬合效果

基于上述超參數訓練模型,并用測試集數據進行擬合,對比輕量級梯度提升機LightGBM模型在三個數據集參數調優后的評價指標(見表4),綜合誤差和模型訓練時長,LightGBM在數據集2的表現更好。

表4 LightGBM在不同數據集的表現Tab.4 Performance of LightGBM in different data set

圖4 數據集2—LightGBM齒輪箱油溫擬合曲線Fig.4 Dataset 2—Fitting curve of oil temperature based on Lightg BM gear box

圖5 不同數據集模型訓練時長Fig.5 Training duration of different dataset models

3.3.3 其他模型效果

選擇boosting另外兩個流行算法XGBoost和CatBoost作為對照,模型訓練時,選用輕量級梯度提升機LightGBM性能最佳的數據集2,同樣按8∶2劃分數據集,并使用同樣的調參方式(Randomized SearchCV和Grid SearchCV),表5是XGBoost和CatBoost模型參數調優結果。綜合比較LightGBM、XGBoost及CatBoost模型的評價指標測度值和模型訓練耗時,LightGBM算法在時效性較優的同時,準確率最高,具有更好的魯棒性。

表5 XGBoost、CatBoost的參數調優結果Tab.5 Parameter tuning results of XGBoost and CatBoost

圖6 不同模型評價指標Fig.6 Evaluation indexes of different models

圖7 不同模型訓練時長Fig.7 Training duration of different models

3.3.4 模型故障診斷

對于實時運行數據,調用訓練完成的LightGBM模型對齒輪箱油溫進行預測,若預測值偏離真實值較大,表示風機齒輪箱可能會發生故障,可以此作為提前預警的標志。預警信號發出,需要對風電機組檢修,檢查整個風電機組部件工程龐大,此時可以參照LightGBM模型訓練輸出的重要性排序結果優先檢查故障發生可能性較高的部件,盡量降低風機停機損耗。

表6 特征重要性排序(前10)Tab.6 Rank of feature importance(top 10)

3.4 實例分析

本文為了驗證模型LightGBM模型的實用性及可靠性,基于風場某臺風機為期三年的歷史數據,篩選此風機故障原因為齒輪箱油溫的故障記錄,共查到2個歷史故障,故障時段分別為2018年6月8日16時57分—23時00分;2019年6月9日9時38分—11時05分。對于齒輪箱油溫的兩個歷史故障調用訓練完成的LightGBM模型,輸入故障發生前的數據進行預測。觀察故障即將發生時齒輪箱油溫的變化趨勢,若基于模型的預測值與真實值偏離較大,方可啟動預警提醒。

縱觀圖8和圖9的2個故障的模型效果圖,2018年6月8日的故障事前擬合效果更好,2019年6月9日故障事前擬合稍微欠缺。分析齒輪箱油溫真實值與模型預測值波動趨勢,明顯兩個故障在發生前,預測溫度都有大幅度下降趨勢,齒輪箱油溫預測值與其真實值趨勢偏離較大,認為其即將發生故障。故以上2個故障基于LightGBM模型都可以識別出來,此模型效果較優,可以用此模型進行齒輪箱油溫的故障預警。

圖8 齒輪箱油溫6月8日故障預警圖Fig.8 Failure warning chartof gearbox oil temperature on June 8

圖9 齒輪箱油溫6月9日故障預警圖Fig.9 Failure warning chartof gearbox oil temperature on June 9

4 結論

本文在特征變量篩選時,使用方差排序、Pearson相關系數和遞歸特征消除淘汰低貢獻變量;選擇boosting當前三大流行算法(LightGBM、XGBoost、CatBoost)建立齒輪箱油溫模型。綜合比較不同模型的評價指標及訓練時長,LightGBM算法的監測模型性能最佳;在齒輪箱油溫預測值與真實值偏離較大時發出預警提示,維修人員在對大部件檢修時,結合LightGBM模型的特征重要性排序及專業經驗逐個預檢。

實現風機故障預警可在故障發生前提醒工作人員檢修關鍵部件,減少停機頻率。目前風電機組的運行和維護還處于發展階段。本文對于齒輪箱故障預警的研究極具實際意義。

猜你喜歡
特征故障模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
故障一點通
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
3D打印中的模型分割與打包
奔馳R320車ABS、ESP故障燈異常點亮
故障一點通
主站蜘蛛池模板: 夜夜操天天摸| 青草精品视频| 精品福利视频网| 26uuu国产精品视频| 国产精品午夜福利麻豆| 国产污视频在线观看| 亚洲日本在线免费观看| 久久综合丝袜长腿丝袜| 香蕉eeww99国产精选播放| 欧美日韩中文国产va另类| 久久综合伊人77777| 亚洲免费毛片| 久久久国产精品免费视频| 这里只有精品国产| 人妻丰满熟妇啪啪| 99久久婷婷国产综合精| 1769国产精品免费视频| 夜夜操国产| av在线无码浏览| 国产粉嫩粉嫩的18在线播放91| 日本精品影院| 全部免费特黄特色大片视频| 成人免费黄色小视频| 亚洲天堂免费在线视频| 一级毛片免费观看久| 国产成人一二三| 国产青青操| 日本一本在线视频| 无码啪啪精品天堂浪潮av| 久久国产精品电影| 在线一级毛片| 国产免费一级精品视频| 中国成人在线视频| 2020最新国产精品视频| 九九热视频在线免费观看| 久久女人网| 日本在线欧美在线| 欧日韩在线不卡视频| 中文字幕丝袜一区二区| 亚洲色欲色欲www在线观看| 99在线视频免费| 男人天堂伊人网| 五月婷婷综合在线视频| 亚洲国产精品日韩av专区| 亚洲欧美激情另类| 免费看a级毛片| 日韩欧美国产综合| 欧美一级在线| 国产在线观看成人91| 久久精品丝袜| 欧美亚洲另类在线观看| 日本午夜视频在线观看| 欧美国产精品不卡在线观看 | 日韩在线中文| 国产精品国产主播在线观看| 欧美精品H在线播放| 国产91特黄特色A级毛片| 精品久久蜜桃| 国产成人AV男人的天堂| www.91在线播放| 亚洲高清免费在线观看| 亚洲精品成人福利在线电影| 国产成人精品一区二区免费看京| 在线看AV天堂| 青青草一区二区免费精品| 欧美精品三级在线| 狼友视频国产精品首页| a天堂视频| 韩国v欧美v亚洲v日本v| 69综合网| a亚洲视频| 国产精女同一区二区三区久| 无码中文字幕精品推荐| a级毛片视频免费观看| 在线观看无码a∨| 成人一级黄色毛片| 伊人婷婷色香五月综合缴缴情| 最新亚洲av女人的天堂| 国产丝袜啪啪| 国产97区一区二区三区无码| 日本www在线视频| 凹凸精品免费精品视频|