李新虎
(陜西能源馮家塔礦業運營有限責任公司,陜西榆林 719400)
當前,礦井旋轉機械的檢修維護多采用技術人員定期赴現場展開檢測的方式進行,依靠人工在現場發現缺陷或檢查故障,存在現場工作量大、故障發現概率低的缺點,并且因為缺乏對設備的實時監視預警能力,往往還會造成檢修預案不全面,由小故障惡化為大故障的后果。
一方面,隨著設備使用需求以及設備使用年限的增加,設備出故障的概率也越來越高,單純依靠縮短檢修周期將會給企業造成極大負擔。另一方面,互聯網技術迅速發展,電子設備越來越智能化,如何利用互聯網技術與人工智能技術,開展設備自動化運檢的相關研究,提高裝置運行控制與保障能力,已經成為企業亟待解決的課題。
依托大數據技術運用關聯規則算法,綜合礦井機械設備的現場數據、歷史運行數據(含故障分析)等信息,采用深度學習算法,建立設備的運行模型及故障預警知識庫,從而對包括使用信息、調度信息、計量點管理等的設備在線運行狀態給予全面評估,實現礦井旋轉機械的動態運行分析與故障診斷。
設備運行狀態的評估包括故障診斷和劣化趨勢預測2 部分。即不僅僅需要對當前的健康狀態進行診斷,還需要確定部件或系統的剩余壽命和正常工作時間[4]。振動分析是礦井故障診斷的常用方法之一。振動參數在很大程度上表征了旋轉機械的運行狀態,但僅有振動而忽略機組的其他運行參數,將難以全面準確把握機組的運行狀態和劣化趨勢,容易造成故障的漏診,無法滿足設備智能化診斷和預測檢修的需要。本文采用數據驅動的方法,通過對原始信號時域、頻域和時頻域特征提取,建立基于深度學習的故障診斷和劣化趨勢預測模型,以實現設備狀態的在線評估。
基于大數據分析的故障診斷可以在收集到復雜裝備運行特征數據的基礎上,應用聚類、決策樹等機器學習算法對大數據進行知識挖掘,獲得與故障有關的診斷規則,從而實現對復雜裝備的故障預測和診斷。

圖1 大數據挖掘與重構
不同類型的數據特征復雜度不同,數據流形結構不同,有效特征維度不同,對不同類型故障的敏感程度也不一樣,簡單的數據融合無法起到提高識別效率的目的,反而可能會因信息冗余和維數過高導致識別失效[6]。通過建立振動\溫度\壓力\開度\電量等狀態參數深度融合的多視角特征學習模型,利用不同類型特征對故障的敏感差異來優化融合效果,可以有效解決不同視角特征的差異性和關聯性互補融合問題,增強模型的魯棒性能,提高設備狀態評估及預測的準確性[7]。
通過對機組歷史運行數據,如風門開度、電機電流、軸承溫度、振動、轉速等的清洗和重構,在此基礎上進行了大數據分析和機器學習建模。該模型經過訓練和評價后,將在線運行,實時采集相應測點的數據,并利用訓練后的模型進行在線分析、評價和預測。
聚類分析是一種廣泛應用的無監督學習方法,在沒有類別標記的情況下,可以提取數據中潛在的規則。聚類分析將樣本分為幾個不相交的子集,每個子集稱為“簇”。K均值聚類算法在給定聚類數k之后,能夠將數據集分成k個“簇”C={C1,C2,…,Ck},算法優化的目標函數為樣本的平方誤差:

算法的具體流程如下:
先隨機選取K個對象作為初始的聚類中心。然后計算每個對象與各個種子聚類中心之間的距離,把每個對象分配給距離它最近的聚類中心。聚類中心以及分配給它們的對象就代表一個聚類。一旦全部對象都被分配了,每個聚類的聚類中心會根據聚類中現有的對象被重新計算。這個過程將不斷重復直到滿足某個終止條件。終止條件可以是以下任何一個:
(1)沒有(或最小數目)對象被重新分配給不同的聚類。
(2)沒有(或最小數目)聚類中心再發生變化。
(3)誤差平方和局部最小。
圖2 給出了某一次設備運行狀態K均值聚類分析后的散點圖,不同的顏色代表不同的狀態,共5種(分別為正常狀態,故障發展區1,故障發展區2,預警區,故障區)。圖2 中分析結果表明,聚類算法能有效的識別機組的運行狀態,為設備的維護和檢修提供幫助。

圖2 一次設備運行狀態聚類分析
樸素貝葉斯分類器是一系列以假設特征之間強(樸素)獨立下運用貝葉斯定理為基礎的簡單概率分類器。該分類器模型會給問題實例分配用特征值表示的類標簽,類標簽取自有限集合。它不是訓練這種分類器的單一算法,而是一系列基于相同原理的算法:所有樸素貝葉斯分類器都假定樣本每個特征與其他特征都不相關。
我們的算法分為3 步:
第1 步,用采集到的設備狀態信息集構建分類器。
第2 步,使用構建好的分類器分類未知實例。用來分類的未知實例稱作測試實例。一般在分類器被用來預測之前,需要對它的分類精度進行評估。只有分類準確率達到要求的分類器才可以用來對測試實例進行分類。

第3 步,根據當前狀態屬于不同類別的概率,綜合評估機組的當前運行狀態。
隨著技術的發展,目前已經有很多數據挖掘的算法,其中Apriori 算法影響最為深遠。
后來人們不斷對其進行改進。無論如何改進,都有共同的基礎定義,即設

是由m個不同的數據項目組成的集合,其中:元素稱為項,項的集合稱為項集。給定一個事務數據庫

式中:每一個事務T是項集I的一個子集,為D中的總事務數,X、Y都是T中的項或項集。如果事務T同時包含X和Y,那么就可以得到關聯規則:

式中:S%為滿足條件的事務T在事務數據庫D中所占比例,即支持度(Support),

C%為D中包含X的事務中又包含Y的比例,即可信度(Confidence),

I%為X和Y的相關程度,即興趣度(Interest),

同時大于可信度閾值和支持度閾值的關聯規則稱為強關聯規則。興趣度大于1 的強關聯規則是有意義的可信規則,便是挖掘的目標。
挖掘問題可分為2 個子問題:(1)找出所有滿足支持度條件的頻繁集;(2)使用頻繁集生成關聯規則。其中第1)步需多次掃描事務數據庫,時間和空間的消耗是制約挖掘效率的關鍵。頻繁模式(Frequent Pattern,FP)算法首先將數據庫壓縮成一棵頻繁模式樹,相當于將數據庫分組,能夠減少數據庫掃描的次數,而關聯信息仍然保存在樹的節點中。對于事務數據庫D,構造FP-樹的步驟如下:
(1)掃描D,計算頻繁項集F 及其支持度,并按支持度計數遞減排序,得到頻繁項列表L。
(2)創建FP-樹的根結點,對D 中每個事務T,選擇T 中的頻繁項,并按L 中的次序排序。設排序后的頻繁項表為,其中F 是第1 個元素,而P 是剩余元素的表,如果非空,調用insert_tree([F|P],T)之后如果P 還是非空的,則遞歸調用insert_tree(P,N)。
關聯規則的挖掘過程分為3 步:
(1)數據預處理;
(2)建立挖掘模型;
(3)規則抽取和檢驗。其流程如圖3 所示。

圖3 關聯規則挖掘算法流程圖
在本算法中,建立挖掘模型就是把預處理之后包含閾值信息的頻繁項集構建成FP-樹。該模型包含故障征兆與故障性質之間的關聯關系,離線運行時用于故障特征的自學習和故障規則的提取,在線運行時用于故障診斷。故障特征可以通過挖掘故障樣本獲得,也可以根據已有的運行經驗生成。在挖掘系統的運行初期,可以歸納一些故障特征,并在運行過程中不斷檢驗和調整,以適應實際需要。
規則抽取就是選用滿足條件的頻繁項集,按照與預處理編號過程相逆的步驟生成關聯規則。規則檢驗就是檢驗新規則是否與原規則庫重復或矛盾,以及利用實際的故障記錄檢驗挖掘獲得的規則的診斷效果,并與原有規則庫的診斷效果進行對比。
狀態預測技術根據機組的結構特點、環境條件和相關歷史數據,根據當前運行參數預測、分析和判斷機組未來的健康狀態,這是實現“診斷后維護”到“預測前維護”的重要手段。
本研究采用大數據分析方法,挖掘出與機組健康狀況密切相關的特征量,在此基礎上建立了機組振動變化趨勢預測模型,為現場設備的運行、維護和改造提供了一定的參考,具體的技術路線是:
(1)輸入變量:模型的輸入變量主要為轉速、電流、振動、軸承溫度等運行參數;
(2)模型訓練:首先通過對運行參數的相關性分析挖據出與振動相關性較大的特征參數,然后將特征量作為模型的輸入完成對預測模型訓練;
(3)振動預測:模型訓練完成后根據機組當前的運行參數預測未來一段時間內振動的變化趨勢。
圖4 給出了某一次設備預測結果。由圖中結果可知,模型預測與實測結果較接近,即本研究建立的預測模型有較高的預測精度,能為機組的健康狀態評估和劣化趨勢判斷提供一定的指導依據。

圖4 某一次礦井設備狀態預測
系統總體架構分為5 個層級,分別為設備層、廠級監控層、網絡層、集團平臺層和遠程監控層。
(1)設備層。主要包括傳感器、智能數據采集器、通信設備及附屬設施,通過分布式采集完成設備運行狀態的感知、采集與傳輸,以實現分布式、網絡化的機組運行狀態監測網絡的構建,是設備狀態評估系統的基礎。

圖5 系統總體架構圖
(2)廠級監控層。主要包括機組狀態數據服務器、監控分析工程師站、網絡通信設施,完成所有機組運行狀態數據的收集、計算、存貯與管理,實現對電廠分散機群的集中監控與分析;整合DCS、SIS 等系統的設備運行、管理和狀態信息,構建基于Oracle數據庫管理系統的廠級設備運行狀態大數據平臺;對振動、機組工況等歷史數據進行清洗、標注等預處理,為多源信息融合、大數據挖掘及機組運行狀態評估、劣化分析提供數據準備。
(3)網絡層。用于設備與集團之間的網絡通信。
(4)集團平臺層。指建設在集團層面的服務器、大型數據庫、存儲設備等,存貯集團各部門所有機組的連續過程狀態數據。通過集團數據中心的數據庫平臺,構建集團級的機組振動數據庫、故障診斷專家知識庫和健康評估系統數據庫,為集團層面的監測、診斷、大數據挖掘和智能運維決策提供實時和歷史數據服務。
(5)遠程監控層。指基于集團大數據平臺上的分析、診斷、預警、報表、統計、決策等各種應用功能模塊。在機組振動數據庫基礎上實現對集團所有機組的監測和分析,在運行狀態評估系統數據庫基礎上,實現多源大數據融合、特征提取、仿真計算、建模、機組狀態評估及劣化分析等功能;通過WEB 服務和Internet 技術,為網絡客戶端或遠程專家提供面向Internet 的數據信息服務和客戶端分析服務;在WEB 服務軟件基礎上,以多種WEB 客戶端頁面技術,提供信息發布、面向應用需求的數據瀏覽、圖表分析、數據查詢等應用功能。
該系統主要由分布式無線數據采集器、工程師站、廠級狀態數據服務器、鏡像服務器、網絡設備、分析軟件與遠程數據通信等組成,網絡結構如圖6 所示。
狀態監測網絡體現了分布式、網絡化、獨立性、易擴展等特點,為輔機故障診斷與振動治理提供分析技術手段和數據測試工具。后期可將主機及其他輔機方便地納入到監測網絡,從而構成網絡化的全廠設備故障分析、診斷和決策系統。
(1)分布式無線數據采集器
分布式無線數據采集器基于ARM 嵌入式系統,具備小型化、模塊化、網絡化、開放性和可擴展性等特點,既可安裝在機柜中用于主機監測,也能便捷地就地安裝監測輔機。采集器將機組狀態信號通過WiFi 接口發送至全廠狀態數據服務器,可自成一體獨立運行,也可方便組網,不需要敷設眾多的模擬信號電纜和網線,解決了分散機群的集中監控問題,為構建分布式網絡化全廠監測網奠定了基礎。
(2)狀態監測工程師站

圖6 狀態監測網絡
用于全廠所有數據采集器的數據收集、計算、存貯與管理,提供在線監測、振動分析及網絡數據服務功能。
(3)廠級狀態數據服務器
數據來源包括機組振動數據、轉速、軸位移、差脹、偏心、缸脹等機組狀態數據、來自于SIS 系統的瓦溫、油溫、油壓、負荷、電量等生產過程參數,以及和機組狀態相關的其他數據。基于大數據管理數據庫對上述數據進行重構后形成設備運行評估系統的統一數據平臺,為狀態監測、診斷、評估、預警等提供數據接口及網絡通信服務。
(4)鏡像服務器
振動數據采樣頻率高、數據量大,由于通信帶寬的限制,從設備端發送至集團大數據中心的振動數據是振動倍頻幅值與相位等特征值,而非實時振動信號。當遠程中心發現故障征兆時,可能還需要獲得詳細的實時數據以提供更準確的診斷信息。因此,在企業側配置全廠設備狀態數據鏡像服務器,通過網閘與外網建立通信服務,當出現振動故障征兆時,遠程專家可登錄廠內鏡像服務器瀏覽、查詢機組的振動實時圖譜和歷史數據,為準確診斷提供翔實信息,同時也可保證企業數據的安全。
以大數據驅動和人工智能算法為基礎,開發了礦井旋轉機械狀態評估成套系統,對礦井旋轉機械進行實時故障分析和劣化趨勢預測。利用企業系統,融合礦井旋轉機械振動\溫度\壓力\開度\電量等狀態參數,通過多源信息融合技術實現礦井旋轉機械的智能故障診斷,并對設備的劣化趨勢進行預測,為礦井旋轉機械的運行管理、維護和預測檢修提供決策依據。同時,構建單機-全廠-集團等多層次數據通信網絡架構,為形成涵蓋全集團的現場/遠程機組智慧運維體系預留空間。該狀態評估系統對于提高企業的運維水平和工作效率、探索基于大數據融合的設備診斷與評估方法、促進人工智能與機械行業的深度融合都具有重要意義。