李玲 ,趙嵩正
1.航空工業第一飛機設計研究院,陜西 西安 710089
2.西北工業大學,陜西 西安 710072
隨著科學技術的不斷發展,現代航空設備結構越來越復雜,自動化和智能化程度也不斷提升,可靠性要求也越來越高,一旦發生故障,將可能造成人身傷亡和巨大的經濟損失。因此,航空設備故障診斷系統的作用愈發重要。故障診斷系統又稱為專家診斷系統,是一種智能化應用系統,基于知識庫模擬人類思維方式來解決問題[1]。
故障診斷系統于20世紀90年代在國外興起,近年來,受到了國內學者的廣泛關注。王磊研究故障診斷的知識表示,采用拓撲知識表示,運用Petri進行知識推理,也證實了該方法在實際應用中可以提高診斷效率和精確度[2];宗群提出了基于故障樹的電梯故障診斷方法,建立了診斷系統模型和診斷知識庫,開發了基于故障樹的電梯故障診斷系統[3];李紅衛提出多種智能故障診斷技術,并對各種診斷技術進行分析和改進,并對各種診斷技術給出綜合評價[4]。雖然國內對診斷系統已經有了廣泛的研究,但是在航空設備故障管理領域的研究尚處于初級階段,仍存在著一些不足,主要表現為:首先,在現行航空設備故障管理模式中,較多以整臺設備為管理對象,沒有精確到部位,無法實現航空設備保養、維修、故障處理的精細化管理。其次,在航空設備故障診斷系統中,故障診斷知識獲取困難,亟待解決。最后,現有的航空設備故障診斷系統主要針對故障診斷,而缺乏基于故障診斷信息的故障預測、預防以及故障數據挖掘的研究,沒有提出一個專門面向設備故障全生命周期的故障診斷模型。針對現有研究的不足,本文引入了設備物料清單(Bill Of Material,BOM),構建了一個基于BOM的故障診斷系統模型,旨在能夠實現航空設備故障的全生命周期管理。
構建的基于BOM的故障診斷系統模型,如圖1所示。
基于BOM的故障診斷系統主要由知識庫、知識維護系統、推理機、數據挖掘系統,以及人機系統界面組成,其中,知識庫、推理機和數據挖掘系統是診斷系統的核心組成部分。知識庫主要用于儲存和管理領域專家的經驗與知識,知識庫建立的完善性、可靠性決定了整個診斷系統的性能。推理機采用一定的編碼程序,以知識庫為推理依據,由輸入的故障信息進行推理,最終獲得故障解決措施。數據挖掘主要用于分析知識庫的故障記錄,挖掘潛在價值。

圖1 故障診斷系統模型Fig.1 The fault diagnosis model
基于BOM的故障診斷系統的基本工作流程為:(1)基于故障樹分析來獲取知識,并將數據存入知識庫中;(2)用戶通過人機界面接口向診斷系統輸入故障數據,推理機根據正向推理機制,激活相應的規則,進而給出診斷結果,并提供故障解決措施;(3)基于診斷過程和診斷結果對知識庫進行定期更新和完善;(4)基于知識庫開展知識挖掘和分析。
因此,可以看出,基于BOM的故障診斷系統涉及到三個核心過程,即知識獲取、知識推理和知識挖掘。知識獲取主要是對相關領域專家知識的獲取和故障實例的收集;知識推理是根據用戶提供的信息或根據推理策略對知識庫中的知識進行選擇;知識挖掘是對知識庫中的故障信息進行分析,從而發現潛在的有用信息。
目前,故障診斷技術大致可以分為三類[5]:基于信號處理的故障診斷方法、基于解析模型方法,以及基于知識診斷方法。隨著人工智能技術等前沿學科的發展與突破,基于知識的診斷方法成為研究熱點。目前,基于知識診斷的方法大多采用故障樹分析法(Failure Tree Analysis,FTA)獲取故障知識。FTA是一種自上而下逐層分析展開的圖形表示方法,其將引起系統故障的所有因素從面到點逐級細化,以故障模式影響與后果分析為基礎,以系統的某個狀態為著眼點,尋找導致系統故障或者子系統失效的所有可能原因[6]。然而,目前故障樹的建立一般都是依據專家經驗,分析頂事件發生的原因,逐層分析,找出每層事件,直到找出底事件為止[7]。運用專家經驗構建故障樹,要求專家對設備非常熟悉,然而專家難以提供完整的故障信息,故障知識獲取較為困難,因此,具有一定的局限性。為了解決知識獲取困難的問題,本文基于BOM構建故障樹,從而完整地提供了整個航空設備的故障信息。一般來說,故障樹分析可以分為三個步驟:故障樹建立、故障樹定性分析和故障樹定量分析。
BOM是一種描述產品組成的結構,是指產品結構的技術性描述文件,描述了產品各個部件、組件、零件之間的結構關系和數量關系[8]。產品的結構、功能特性、加工工藝在設計階段已經確定,按照設計給出的加工工藝一步一步地進行生產,進而形成產品的層次結構。這一層一層的結構決定了故障傳達的路徑,為找出故障樹的因果關系提供了基礎。在進行故障診斷時,不僅需要了解設備的組成結構,由哪些組件組成,更重要的是獲取每個元件具有的故障模式以及故障之間的傳遞規則和邏輯關系,應采取的故障處理措施。因此,本文將設備結構和每個元件具有的故障信息結合起來,提出了基于設備BOM構建故障樹的思想,如圖2所示。
圖2表示了如何在設備BOM的基礎上構建故障樹,BOM和故障樹在層次結構關系上一一對應,基于BOM組織故障知識,將故障知識準確地映射到相應的部位上。圖2中左側為設備BOM,根據設備的維修要求和故障特點,以設備BOM為基礎,對診斷對象進行結構分解,直到不能再分解為止,對于不可拆卸的零件則不需要展開。故障樹中對于每個節點分別附有節點基本信息和節點故障信息。其中,節點基本信息具體包括節點名稱、型號、參數、功能等;故障信息具體包括該節點的故障模式、故障診斷規則以及相應的故障解決措施,而診斷規則的建立是知識庫的關鍵部分,診斷規則體現了故障的傳遞規則以及對其父節點的影響程度。
故障樹定性分析是確定割集和最小割集,割集是一些底事件的集合,它可以導致頂事件的發生[9]。求割集一般有下行法和上行法兩種方法,本文采用上行法。上行法是沿著故障樹,采用從下向上的方式,由最底層的底事件開始,向上逐層進行集合運算。如果遇到邏輯或門事件,則表示為事件的并運算。如果遇到邏輯與門事件,則表示為事件和交運算。按照這種方法,自下而上層層匯總,最終用布爾(Boole)函數的形式表示頂事件與底事件之間的關系。
以圖2為例,采用上行法來對故障樹進行定性分析,可以得到:

圖2 基于BOM構建故障樹Fig.2 Build a fault tree based on BOM
G1=X1∪G4∪X2
G2=G5∪X3
G3=X4∪X5∪X6
G4=X7∪X8
G5=X9∪X10∪X11
T1=X1∪X2∪X3∪X4∪X5∪X6∪X7∪X8∪X9∪X10∪X11
即 X1,X2,X3,X4,X5,X6,X7,X8,X9,X10,X11 構成故障樹的最小割集。
故障樹定量分析的目的是求出系統的性能指標和頂事件發生的概率[10]。根據底事件發生故障的頻率計算出底事件的故障發生概率,然后由底事件發生的概率求出最小割集發生的概率和頂事件發生的概率,得出各個最小割集的重要度,考慮到部件排查耗時因素,本文最終采用故障判明效時比來確定優先級,并作為故障排查順序,進而提高故障診斷效率。以圖2為例,具體分析如下:
(1)頂事件發生的概率
假設各個底事件故障發生的概率為:X1=0.1,X2=0.2,X3=0.3,X4=0.2,X5=0.3,X6=0.1,X7=0.25,X8=0.1,X9=0.2,X10=0.1,X11=0.4,則計算的T1發生的概率為:

(2)最小割集的重要度
最小割集重要度的計算即是最小割集發生的概率與頂事件發生概率的比值。最小割集的重要度見表1。

表1 最小割集的重要度Table1 The important degree of minimum cut set
(3)估算各個零部件平均故障檢測時間
零部件平均故障檢測時間是指該零部件發生故障時,從檢測開始到排除故障所用的平均時間[11]。在實際應用中,一般是根據專家經驗給出。
假設各個底事件平均故障檢測時間為:T1=0.2h,T2=0.1h,T3=0.3h,T4=0.15h,T5=0.3h,T6=0.2h,T7=0.1h,T8=0.1h,T9=0.3h,T10=0.3h,T11=0.1h。
(4)求各底事件對應的故障判明效時比
當系統發生故障時,借助故障樹進行診斷,首先根據底事件的概率計算出重要度,可以初步確定故障原因。按照重要度從大到小的順序逐個排查,但是如果排在前幾位的故障零部件平均檢查耗時較長,那么平均單位檢測時間確定故障概率則偏低,效率較低。因此,為了全面合理地進行故障排除,在考慮重要度時引入各個零部件平均檢查時間,即提出了故障判明效時比,判明效時比為零部件重要度與零部件對應的平均故障檢測時間的比值,見表2。因此,排查故障的順序應該按照故障判明效時比,由大到小按順序進行排查,這樣會很大程度地提高定位故障原因的效率。

表2 最小割集的判明效時比Table2 The ascertain effect of the minimum cut set
根據故障判明效時比從大到小的順序得出故障診斷的優先級,故障判明效時比值越大,則對應的優先級越高,則優先進行故障診斷。這樣可以高效地定位引起頂事件發生的故障原因,縮小故障診斷的時間。
系統知識庫是以故障樹的形式將設備維修過程中維修專家的大量故障解決措施和診斷經驗直觀形象地表達出來,然后進行整理和精簡,提取重要信息,采用計算機可以識別的語言存儲在計算機中,形成診斷知識庫。有結構化的知識庫為支撐,會大大提高信息系統的診斷效率。在實際應用中,首先需要收集資料。通過收集文件資料、書本知識或者與相關領域的專家溝通交流獲取其診斷經驗,并將這些知識進行整理,以故障樹的形式表示出來,然后對故障樹進行定性分析,得到最小割集,并得出相應的診斷序列,并對這些數據進行簡化,最終將優化的數據存入數據庫,完整的、標準的數據是故障管理信息系統進行診斷的基礎。知識庫中包括物料表、產品結構表、故障信息表、規則表、條件表、直接框架表、間接框架表及判斷條件表,見表3~表10。

表3 物料表Table3 The material table

表4 產品結構表Table4 The product structure table

表5 故障信息表Table5 The fault information table

表6 規則表Table6 The rule table

表7 條件表Table7 The condition table

表8 直接框架表Table8 The direct framework table

表9 間接框架表Table9 The indirect framework table

表10 判斷條件表Table10 The judge conditions table
故障診斷系統的知識庫主要由故障樹定性定量分析的結果構成,作為所有故障推理的依據。用戶在系統界面按照要求輸入故障信息,系統會根據一定的程序在知識庫中實現故障診斷、故障推理,以故障樹正向推理為主,實例推理為輔的推理策略,最終給出故障原因以及故障解決措施。
在故障診斷系統中,采用規則加框架的推理過程,具體實現算法如下:輸入:故障現象Fault;輸出:故障解決措施。步驟1:輸入故障信息,與故障信息表匹配,記錄相應的故障編號,記為Fault;步驟2:在框架表中查詢出Fault對應的框架號Frame;步驟3:在判斷條件表中查詢出該框架對應的規則號Rule;步驟4:按照Rule的優先級來查詢對應的條件事實號Condition;步驟5:條件事實號對應一個框架號,如果是直接框架則可以得到故障原因以及解決措施。如果是間接框架,則繼續進行步驟2。
推理過程如圖3所示。

圖3 故障診斷推理過程Fig.3 The inference procedure of fault diagnosis
故障診斷系統中的知識挖掘主要是針對大量的故障記錄,采用統計分析方法挖掘故障記錄間蘊藏的潛在信息,找出故障的瓶頸制約因素,并實現對未來可能故障的預測。BOM作為航空設備管理的核心數據,對基于BOM故障樹的知識庫進行數據挖掘,可以滿足不同部門的需要。其中,對于采購部門,往往需要了解航空設備的外購件清單,而基于航空設備BOM統計外購件能夠準確地發現當前部件的需求情況,從而為采購部門安排采購計劃提供依據;對于設計部門,需要確定航空設備由哪些部件構成,以及構件直接的結構關系,基于BOM故障樹的知識庫統計部件故障發生的頻率,發現薄弱部件,為設計部門對航空設備的結構設計及設備性能升級提供依據;對于維修部門,通常比較關注備品、備件清單,通過對故障記錄按照BOM進行分類統計,篩選出易損、易耗件明細表,發現故障規律和故障瓶頸制約因素,為備件管理以及維修大綱的制定提供決策支持[12],同時,對故障記錄的知識挖掘結果,采用圖表的方式清晰地顯示,能夠進一步充實和完善設備故障診斷規則表,同時為保養維護計劃的制訂提供依據。因此,BOM是企業信息化建設的核心數據,基于BOM進行數據挖掘具有深遠的意義[12]。
本文建立了基于設備BOM的故障診斷系統模型,重點研究了診斷系統中的知識獲取、知識推理、知識挖掘三部分內容?;贐OM構建故障樹,故障樹每個節點包含節點基本信息和故障信息,通過對故障樹進行定性、定量分析,將結果存入知識庫中,并基于知識庫進行故障診斷推理,最終得出故障原因及解決措施?;贐OM進行故障診斷,可以使故障管理更加精細化和科學化。通過對故障信息進行統計分析航空設備的故障模式、原因等規律,可以作為航空設備資產管理、航空設備維修管理、新設備選型設計的航空設備性能的升級提供依據,可以為進一步完善預防維修大綱以及備品備件的采購提供決策支持。