徐紅霞
摘要:數據挖掘技術可以從海量收集來的數據中找到有用的數據并進行有效分析,對日益復雜的各種機械設備故障診斷提供了技術支持。該文就數據挖掘技術在機械設備故障診斷中的應用進行詳細分析,給出了機械設備故障診斷的方法及實現過程,對提高經濟效益具有十分重要的意義。
關鍵詞:數據挖掘;機械設備;故障診斷
中圖分類號:TP393 文獻標識碼:A 文章編號:1009-3044(2018)30-0005-02
新時代經濟發展需要社會工業生產必須向規模化、集群化、智能化方向發展和提升,在工業生產實踐中,普遍使用到的機械設備發生故障的原因更加復雜,提高機械設備的故障診斷技術成為保證工業發展的重要手段之一。故障診斷需要通過收集相關數據并進行分析才能夠得出精確的結果。信息技術高速發展的今天,數據挖掘技術應運而生,它能夠幫助人們從海量的數據中找到一條正確的方案來實施。隨著電子計算機技術的飛速發展和提升,數據收集效率和質量顯著提升,人工智能識別技術、模態識別技術、統計學基本理論、人工智能等相關領域及技術的發展實現了機械設備故障的快速、精準識別及判定,且故障智能診斷技術已經被廣泛使用在工業化生產領域及金融服務行業中。
1 數據挖掘技術概念
數據分析及采集技術就是從廣泛、海量的信息中獲取真實、有效、可用的數據信息,在數據收集實踐中,部分未降噪、模糊的數據類型隱含在海量數據中,為了實現數據的精準提取和判定,必須將其從海量數據中剔除,以保證數據提取的高效性。
1.1 問題定義
海量的數據信息在總體較為細微的層面上出現極其微小的浮動和變化,數據信息專家在海量的數據信息中借助人工采集技術難以快速甄選鑒別,數據挖掘技術高效地解決了上述粗存在的問題,并提出了更加高效可用的數據挖掘技術。例如,設備操作人員及日常維修保養人樣對設備的性能及參數較為了解,但是,對系統中各個組件的性能及系統的集成問題的研究較為深入,可以敏銳、快速判定出不同零部件的變化及在具體運轉過程中出現的變動,但是上述問題難以被快速獲取,這同時表明實際理論經驗同具體知識細則之間的變化情況。
1.2 數據準備
檢測系統可以快速、高效地獲取數據信息,且采集到的信息類型具有顯著的復雜性、系統性、多樣性及集群性等特點,在具體的使用過程中控制難度較高。所以,為了徹底解決數據挖掘階段的挖掘目標定位精度,實現數據挖掘目標的快速定位,可以先對數據信息進行預處理和轉化分析。但是,數據信息挖掘的最終質量直接影響到數據挖掘的整體結果,因此,提升數據挖掘的精度及質量就顯得極其重要。
1.3 數據挖掘
可以使用規則學習或決策樹等多種方法來進行分析統計,不斷重復,從而不斷發現一些潛藏的信息。
1.4 結果分析和評估
在滿足持續檢測的要求下,獲取的數據信息也出現不同程度的變化和發展,海量的數據信息分析必須借助數據建模技術,只有通過反復建模論證,才可以保證新獲取的信息及設備在具體執行階段的可靠性分,保證在較短時間內可以獲取滿意的診斷結果。
2 數據挖掘的常用技術
選用的數據挖掘技術的質量直接影響到挖掘的信息的總體質量高低,當前,在具體的技術研究領域,絕大多數的研究資源集中在算法研究方面,常用的算法技術主要基于以下幾個基本理論:
2.1 粗糙集理論
粗糙度集是典型的應用在研究不確定性及模糊數學中的常用理論之一,是一款性價比較高的計算及分析工具。其中,粗糙度集的基本理論具有以下顯著優勢:可以不提供大量的精準信息,分析成本較低;分析流程及步驟得到顯著簡化;算法構成簡單,便于操作。粗糙集基本理論的研究方式與二維關系下的信息表較為相似。但是,基于粗糙集的研究方式及理論難以體現數據及信息處理的聯系性,但是,在具體的信息表中羅列的屬性均是連續且客觀的。所以,具有離散屬性的粗糙度集基本理論的實用化是后續繼續深入研究的重點問題。
2.2 決策樹技術
決策樹法是一種常用的預測模型算法,其可以實現大量數據的實時、快速分類,并快速從海量的信息中獲取可用信息類型,提升了信息處理的效率。決策樹分析法的優勢在于功能簡單、類型劃分速率快,滿足集群化數據處理的實際要求。
2.3 人工神經元網絡技術
基于神經網絡分析法是當前數據分析及挖掘的關鍵技術之一,也是當前使用最為廣泛的分析法之一,人工神經網絡分析技術的原理借助仿生學基本原理,模仿人工神經系統建立相應的數據信息庫,實行對數據信息庫的數據實時采集和遴選。同上述分析方式存在差異的是,神經網絡分析法在出現機械故障的情況下開可以實現精準預判,所以,在處理某些連續故障及變量的問題上適用性較好,但是,對于維度較高的數據分析及處理不適用。根本原因是內部結構不透明問題,神經網絡分析法比較適用于結構形式相對復雜的數據結構中,例如典型的聚類分析模式。圖1為常見的三層前端反饋神經網絡分析模型。
2.4 遺傳算法
遺傳分析法和神經網絡分析法存在某些相似性,遺傳分析法基于生物學基本理論,借鑒了自然選擇法則和遺傳學中的隨機搜尋基本理論。遺傳分析法具備顯著的隱藏性及并行特點,其分析模型可以較好地應用在數據挖掘及分析實踐中。
3 數據挖掘技術在工業優化中的應用
量化分析及預測分析技術主要應用在非線性分析實踐中,選用滿足數據要求的模式識別技術快速收集數據信息,建立相應的數據分析信息,根據數據反映出的數據特點,建立相應的數據結構形式,建立滿足非線性特點的回歸方程,并最終進行非線性回歸分析,但是上述分析存在顯著的缺陷,就是在具體非線性回歸分析過程中回歸方程是主觀確定的。非線性分析法滿足繼續推廣的特點及要求,滿足多種分析法的聯合分析使用,建立滿足實際需要的數據搜尋及獲取方式。
4 數據挖掘技術在機械設備故障診斷中的實現步驟
4.1 基本原理
數據挖掘方式主要是借助數據記錄值實現對機械設備故障及類型的實時診斷,并獲取對應的數據分析解決途徑,對于后期可能出現的多種故障及故障類型進行合理預判。機械設備故障類型的本質特點就是模態識別,涉及的具體診斷方式就是內部數據自我匹配的過程。
4.2 故障診斷的數據挖掘方法建模
涉及機械設備的故障及診斷分析,首先應該重視的是數據的采集及收集,設備在具體使用過程中涉及大量的數據信息,上述數據類型中,既要涵蓋正常運轉的參數還應該涵蓋故障數據值,保證設備在出現故障后可以通過采集到的數據信息實現準確分析及定位。目前,已經使用到的檢測系統及工具的精度較高,且可以實現對數據信息的實時定位和分析,提升數據采集及收集的便捷性和效率。
當前,較為成熟的數據分析及識別技術中常用的基本理論和方法主要有關聯關系法則,上述數據關系主要依靠內部數據的實時分類,實現數據快速采集及高效利用的目的,目前,數據相關關系中劃分出的主要類別可以實現數據及信息的重新定義及歸納,實現故障診斷的實時性,快速定位故障原因。數據挖掘體系及策略如圖2。
5 實現過程
機械設備故障診斷數據挖掘的開發平臺如下:
(1)數據庫技術 機械設備故障診斷的數據倉庫使用Microsoft SQL Server 2012 網絡數據庫進行組建;
(2)OLAP技術又稱為關聯分析技術,主要針對特點問題實現關聯分析和即時數據訪問的一種技術, 它可以根據要求進行快速、靈活的各種復雜查詢處理;
(3)使用 SQL Server 2012 Analysis Services 和SQL Server 2012 Integration Services 實現多維數據集和 ETL 過程;
(4)數據挖掘采用的相應的挖掘工具進行數據采集,并從中獲取必要的知識體系及模型;
(5)前臺開發軟件 常用的前臺開發軟件主要有PHP、ASP.NET、JSP、C# 等,本平臺采用 C# 進行開發。
6 結束語
文章著重分析和介紹了機械設備故障類型的通用分析及診斷技術——數據挖掘法。將數據挖掘技術遷移到機械設備故障診斷中,能夠提前預測問題,采取有效措施對設備進行維修或更新從而確保機械設備的正常運行,降低了經濟損失,提高了經濟效益。
參考文獻:
[1]李洪燕,陳步英,趙美枝. 數據挖掘技術在煤礦機械故障診斷中的應用[J]. 煤礦機械,2012.
[2]劉繼清,黃金花.基于改進決策樹算法的設備故障智能診斷模型[J]. 制造業自動化,2010,33(4):30-33.
[3]張天瑞,于天彪,趙海峰,王宛山.數據挖掘技術在全斷面掘進機故障診斷中的應用.東北大學學報,2015.
【通聯編輯:王力】