孫俊佚雄 陳以



摘? 要:近年來隨著大數據技術的成熟,家用電器在線故障診斷也得到了普及。以洗衣機用的異步電機為對象,提出通過提取定子電流幅值作為特征向量與極端梯度提升算法結合的故障診斷方法。并將該方法與支持向量機、梯度提升決策樹算法在實驗采集數據和大數據支持下進行對比分析。其仿真結果表明,極端梯度提升算法在處理洗衣機用異步電機故障時,能有效地進行故障類型診斷,診斷精度和泛化能力較強,能夠適用于日常生活和商業需要。
關鍵詞:特征提取;梯度提升決策樹;XGBoost;異步電機;故障診斷
Abstract:In recent years,with the maturity of big data technology,home appliances online fault diagnosis has also been popular. Taking the asynchronous motor for washing machine as the object,a fault diagnosis method is proposed,which combines the extraction of stator current amplitude as the eigenvector and the XGBoost algorithm. The method is compared with support vector machine and gradient lifting decision tree under the support of experimental data and big data. The simulation results show that the extreme gradient lifting algorithm can effectively diagnose the type of fault when dealing with the fault of asynchronous motor for washing machine,with high accuracy and generalization ability,and can be applied to daily life and commercial needs.
Keywords:feature extraction;gradient lifting decision tree;XGBoost;asynchronous motor;fault diagnosis
0? 引? 言
洗衣機是一項典型的將電能轉換為機械能的工具,它對衣物的自動清洗,自動甩干和烘干等作用為人們的生活提供了巨大的便利。隨著電機結構的轉變,傳統的故障檢測手段已經難以滿足生活和商業需求。目前,三相異步電機由于其可提供功率高、經濟需求較低、便于接入負載等優點,已成為智能洗衣機電機的最佳選擇。目前,智能洗衣機的故障檢測基本仍是以人為檢測為基礎的先驗經驗檢測方法,這種方法十分耗時,嚴重影響人們的日常生活。近年來,XGBoost(極端梯度提升算法)這一方法的提出,高效地實現了并完善了GBDT(梯度提升決策樹)算法,給家用、商用電機的故障診斷帶來了新的方向。本文選取GBDT算法、XGBoost算法和支持向量機為對象,研究分析了各算法的性能,在實驗室條件下選取某型號的洗衣機用三相異步電機為對象收集故障數據,并結合UCI庫中數據對三種算法進行了訓練。三種算法對故障數據的診斷能力證明XGBoost算法在針對該型電機的故障診斷時最為實用,其分類效果優良、測試準確度高等優點,能夠滿足家用洗衣機的在線故障診斷需求。實驗原理基于大數據處理與檢測,實驗于桂林電子科技大學實驗室完成。
1? GBDT及XGBoost方法介紹
1.1? GBDT方法
GBDT是一種將實例分類的回歸樹形結構,是由Friedman等人于2001年提出的一種基于迭代所構成的決策樹算法。該回歸樹由節點和定向邊構成。節點分為內部節點和葉子節點。內部節點表示某指定特征,葉節點表示某指定類。樹模型從根節點向外生長,分別對已確認例子的指定特征進行測試,根據測試結果的不同,產生對應特征取值的子節點,并將例子調度到相應的子節點中。經過數次迭代,直到將例子調度到葉節點中為止。GBDT在迭代中需要擬合梯度值,由于樣本標簽是連續數值,采用的指標為平方差來判斷擬合程度。
為使增益達到最大,可以枚舉所有特征與分割點,將其有序排列,計算尋優。
除以上兩種方法外,本文采用較為經典的最小二乘向量機作為對照組。
2? 實驗分析與結果
2.1? 評價標準設置
機器學習的評價標準中用到四個參數,分別為TP:正確分類的正類樣本數量;TN:正確分類的負類樣本數量;FP:錯誤分類的正類樣本數量;FN:錯誤分類的負類樣本數量。
以準確率Accuracy=衡量總體精確度,越大越好。
以精確率Precision=表示正確分類的正例個數占實際正例個數的比例。
以召回率Recall=表示正確分類的正例個數占正例個數的比例。
并以F-value=作為精確率和召回率的綜合評價標準,β在實驗中一般取1。
2.2? 洗衣機電機故障簡介
三相異步電機故障主要可分為機械故障和電氣故障等。機械故障指電機內部拖動和傳動造成的故障,電氣故障指控制電路和線路故障等。由于該電機用于家用智能洗衣機,本文僅對繞組短路、繞組斷路、傳動不良和軸承磨損這四個常見故障進行取樣、訓練和分析。
2.3? 實驗數據采集
實驗選取專用于洗衣機的三相異步電動機與控制器一體機作為診斷對象,該電機能夠完全滿足家用智能洗衣機的動力需求如表1所示。實驗所采用數據由電流傳感器采集定子電流提供,由于實驗條件影響,僅提供200組數據作為訓練和測試樣本。機器學習數據庫UCI中選取5 000組數據對比實驗。
2.4? 故障特征向量選擇
對異步電機故障的檢測對象可以采用定子電流異常檢測法。這種檢測方法的工作量較小,對象變化較明顯。由于電機的多種故障都可以通過電流的異常變化反映,可以通過傅里葉變換處理定子的電流信號。
如圖3所示,定子電流的幅值在不同情況下(正常運行、過載等)變化較為明顯,其在某指定位置的幅值可以作為輸入向量。
2.5? 實驗結果
實驗首先采用某實驗室收集的共200組對應正常狀態和四種故障狀態下的數據,選取其中90組用來訓練模型,剩下110組用作測試,然后分別對支持向量機、GBDT、XGBoost三種算法的實驗數據進行F-value函數測試。作為樣本量對照,另使用UCI中選取的5 000組樣本作為數量對照組,同樣采用實驗室收集數據進行對比測試,同樣得F-value函數,各算法評價如表2所示。其中,由UCI數據訓練的XGBoost模型的具體性能評價結果如表3所示。
通過表2中各項數據的對比得出,XGBoost算法的F- value均略優于GBDT算法,明顯優于支持向量機SVM算法。同時,根據樣本量的提升,算法精確度越高。以準確度函數為例,在5 000組樣本的情況下,XGBoost算法的Accuracy值從75%左右提升至接近97%。同樣的變化趨勢也適用于支持向量機和GBDT算法。
通過表3可以得出,該XGBoost模型在大量數據訓練下,基本可實現對定子短路故障的無誤差識別;對繞組斷路故障、傳動不良故障和軸承磨損故障的識別還存在微小誤差。綜合Accuracy值在97.00%以上,可具備量化生產和應用的潛力。
3? 結? 論
通過選取針對家用智能洗衣機的三相異步電機中定子電流變化狀態為特征,分別采用SVM、GBDT、XGBoost三種算法作為分類器。實驗結果表明XGBoost效果最優,其模型訓練必須基于大數據準則,若訓練樣本過低會導致精度的嚴重降低。電機生產廠商可以通過生產和售后調查取得足夠的數據資料以應對不同的電機種類,可以實現智能洗衣機的自動故障診斷。故將XGBoost算法應用于智能洗衣機的電機故障診斷是可行的,能達到很好的效果。
參考文獻:
[1] 周東華,劉洋,何瀟.閉環系統故障診斷技術綜述 [J].自動化學報,2013,39(11):1933-1943.
[2] 文成林,呂菲亞,包哲靜,等.基于數據驅動的微小故障診斷方法綜述 [J].自動化學報,2016,42(9):1285-1299.
[3] 李航.統計學習方法 [M].北京:清華大學出版社,2012.
作者簡介:孫俊佚雄(1993—),男,漢族,湖北荊州人,碩士研究生,研究方向:信號處理與信號集成系統;通訊作者:陳以(1963—),男,漢族,廣西玉林人,教授,碩士研究生導師,主要研究方向:智能控制、計算機應用技術。