劉政 張華 廖育武 肖國宏
(1.湖北文理學院汽車與交通工程學院 湖北省襄陽市 441053 2.湖北歐安電氣股份有限公司信息裝備部 湖北省襄陽市 441030)
伴隨信息技術的發展和制造行業數字化改造的實施,國內制造行業積累與沉淀了大量的制造設備工作過程數據,逐漸形成了工業大數據。這些設備中各種機床設備占有較大的比例[1]。為了有效利用機床設備的大數據信息,研究人員提出將數據存儲于關系數據庫等當中的數據進行調用并應用于相關設備的健康狀態監測與故障診斷及預測等[2]。隨著2012年谷歌公司正式提出知識圖譜的概念并應用于提高搜索的能力以來,知識圖譜技術被廣泛關注并開始在各行業進行應用[3]。Hai[4]等提出了半自動構建知識圖譜并應用于電網設備的運行及維修。Feng Yun[5]等提出了基于知識圖譜的電氣信息采集系統故障診斷知識問答系統,實現采集和維護故障診斷的高效化、智能化。知識圖譜的應用大大提高了數據處理的效率,并能清晰直觀的表示知識間的深層關系,有利于采用神經網絡等機器學習算法對設備的健康狀態和故障隱患進行預測。本文針對制造設備中應用較多的鉆床設備建立知識圖譜并將其在設備故障診斷與預測方面的應用進行了探索,建立了相關知識圖譜框架及數據庫案例,并對其應用進行了分析。
百度百科中解釋知識圖譜為圖書情報界中的知識域可視化或知識領域映射地圖,是顯示知識發展進程與結構關系的一系列各種不同的圖形,用可視化技術描述知識資源及其載體,挖掘、分析、構建、繪制和顯示知識及它們之間的相互聯系[6]。而知識圖譜作為知識的結構化表示,是一種以圖的形式來描述知識和客觀世界萬物之間關聯關系的技術方法[7]。本質上,知識圖譜是一種描述實體、實體屬性與實體關系的大型語義網絡,其由節點與邊組成。節點可以代表一個概念、一個實體或一個屬性,邊可以代表實體、概念等相關屬性。
同時知識圖譜對于不同的領域可分為通用知識圖譜與領域知識圖譜。通用知識圖譜主要采用三元組的形式進行表示,實體構建的規模較大,精確度要求較低一般應用于搜索與問答。而領域知識圖譜側重于知識的質量,需要行業數據進行構建,一般應用于軍事、機械、醫療等特定領域進行輔助決策。
知識圖譜架構主要從邏輯結構與構建技術兩方面進行區分。
2.2.1 知識圖譜邏輯結構
知識圖譜的邏輯結構包括數據層與模式層,知識的表示形式是事實,故而數據層由大量的事實構成。而模式層由實體構成,是知識圖譜的核心,是保證知識質量的部分。其建立在數據層之上,利用本體與實體的相關公理、規則與約束條件對數據層的事實進行規范[8]。對于本體來說是概念的集合,是公認的概念事實,變化的概率較小,對于借助本體庫構建的知識圖譜不僅結構性強,知識質量高冗余較小。
2.2.2 知識圖譜構建技術
知識圖譜的技術架構如圖1 所示。
知識圖譜構建的基本方法分為自頂向下的構建方法、自底向上的構建方法兩種方法,自頂向下的構建方法指的是根據已有的結構化數據庫定義本體與模式層,再從其他數據源中抽取實體加入到知識庫。該方法需要根據結構化數據庫、專家知識及固定的知識體系進行實體與模式層的構建,保障知識的質量與準確性。自低向上的構建方法從開放的、半結構化、非結構化或結構化的數據庫、文本信息中抽取事實,選擇置信度較高的知識加入數據庫中構建數據層。然后再根據數據層構建相關實體與模式層[9]。目前通用知識圖譜大多數采用自底向上的構建方法,如微軟的Satori 知識庫。

圖1:知識圖譜技術架構

圖2:鉆床設備故障知識圖譜構建步驟
但對于一些領域知識圖譜數據的特殊性及不完善性,通常采用自頂向下和自低向上相結合的方式進行構建。一般首先建立模式層,設置實體、屬性及關系的相關規則;然后利用數據映射或知識抽取進行實體、屬性、關系的填充;最后再利用數據層知識的關系進行知識推理、知識更新擴展知識圖譜。
本文提出構建鉆床設備的知識圖譜并根據鉆床設備數據的復雜性提出了相關構建方法,提出利用自頂向下與自底向上結合的方式構建知識圖譜,首先通過人工建立實體模式層,然后隨著數據的積累從事實進行實體更新與填充。根據鉆床設備故障數據的復雜性進行實體、實體關系的定義,鉆床設備知識圖譜的構建過程主要包括知識表示即實體建模與存儲、知識映射、知識更新與可視化處理。其具體實現步驟如圖2 所示。
知識表示是對知識的一種描述,將知識表示稱為一種計算機可理解的數據結構,現如今知識表示可分為邏輯表示[10]、產生式表示、框架表示、面向對象的表示、本體表示、基于模型的知識表示等。對于鉆床設備的知識表示可分為數據的收集與本體的構建,鉆床設備數據來源于設備使用手冊、生產制造積累的關系數據庫、專家經驗、案例文本等結構化、非結構化數據,為本體模式層的構建提供了數據的支持。
本文以本體表示的方式進行知識表示,并將本體模型定義為P=<C、R、S、A>四元組形式,P 表示本體模型、C 表示本體概念即某實體類別的集合、R 表示概念之間的關系、S 表示子概念即實體元素、A 元素屬性,同時本文將概念的屬性與概念表示在一起,并未采用單獨表示的形式。根據定義的本體模型建立鉆床設備的網狀知識結構,為了便于查詢與分析,也可以將其轉化為RDF 語言三元組的形式。
知識映射是指建立兩個數據模型,利用相關語言或技術將模型之間的元素進行關系的鏈接形成網狀結構。鉆床設備故障事實一般存儲于關系數據庫中,屬于結構化數據,所以本文提出基于關系數據庫進行知識映射。將鉆床設備故障案例中的實體、關系、屬性等存儲于Mysql 關系數據庫中,形成相應的數據表格,利用R2RML[11]、D2RQ 映射語言進行直接映射或采用間接映射將本體與數據同時存在Neo4j 中進行數據映射等。根據解析工具將本體解析為如<主軸(實體)、故障原因(關系)、電機(實體)>的形式,然后與建立的關系數據庫進行相關映射,將數據庫中的如<主軸反轉、出現、電機電源接反>與本體中的主軸實體、故障關系、電機實體映射到解析的本體三元組中,建立本體與數據的相關關系。
本文中采用人工建立關系數據庫與本體的形式,將數據庫存儲與Mysql 關系型數據庫中,形成XML 或Excel 關系表格并就將其存入Neo4j 圖數據庫中,然后利用protégé[12]軟件建立本體與實體形成SQL 語言文件并進行解析形成三元組。通過知識映射能更好地表示實體間關系,同時為知識推理與知識更新做了相應的基礎,豐富了本體、實體間的關系。
知識推理是指對已建立的知識圖譜進行進一步的知識挖掘與預測,挖掘出實體間隱含的關系,并對未來的關系、屬性等進行預測,進而豐富擴充知識圖譜。Ni Lao·William W. Cohen[13]等提出了一種新的鄰近度度量方法用于路徑約束隨機行走,進行檢測實體間的關系。Lei[14]提出了改進的基于規則的推理方法來推理出微生物之間的相關性。
鉆床設備故障的知識推理可體現在如電機部件間的關系、使用時間與發生故障可能性的關系、主軸之間的位置關系等。其應用的對象可以是設備的實體、屬性、實體的關系等。從推理的方式上知識推理可分為基于演繹的知識圖譜推理和基于歸納的知識圖譜推理。知識更新一般分為模式層更新與數據層更新,模式層更新就是對本體的增加、刪減、變更等[15],但本體更改概率較小且會影響實體與其他概念,所以鉆床設備知識的更新一般采用數據層的更新。根據工業生產過程中產生的事實數據,篩選高質量的知識進行實體的增加、刪減、變更等,實現數據層的擴充。
鉆床設備知識圖譜數據可以采用三元組形式存儲,工作人員根據存儲的語言進行相關查詢,但并不能直觀清晰的查看實體間的關系,對于不具有工作經驗的人員不能直接進行設備故障的檢測與判斷。故而本文提出采用Neo4j[16]對三元組知識進行處理,利用neo4j-admin import 將部分鉆床設備的關系型數據導入Neo4j 中展示可視化圖譜。圖譜中包含了47 個實體事實、4 種關系。47 個實體分為三類屬性進行表示為18 個故障實體如絲杠、主軸、電機、數控裝置等并分別標簽鉆床部件、氣動系統、數控系統等屬性,16個發生現象如絲杠支撐松動、傳動精度減弱、主軸運動困難等標簽為故障現象、13 個故障原因如灰塵進入數控裝置、主軸與皮帶過松或過緊等標簽為故障原因。每個實體對應一個節點,每個邊表示4 種關系,第一層關系為子類及包含、第二層關系為發生、第三層關系為發生的原因。實體及邊共同構成了鉆床設備部分事實數據的知識圖譜,具有高性能、輕量級、嵌入式等優點同時還提供了相關的圖算法更加便捷、清晰,可視化如圖3 所示。

圖3:鉆床設備知識圖譜的可視化
知識圖譜已經在語義搜索、智能問答、輔助決策以及一些垂直行業有所發展及應用,并有了一些成熟的系統及平臺,比較著名的有蘋果的智能語音助手Siri,百度公司的小度APP 等。同時基于知識圖譜的輔助決策也被應用于軍事、機械等行業,李代祎[17]等構建了一種基于知識圖譜的軍事武器問答系統,喬驥[18]等提出了一種知識圖譜框架應用于電網調度故障處理的輔助決策。
鉆床設備是被廣泛應用的通用性機械設備,可對零件進行鉆孔、擴孔、絞孔等工藝,同時鉆床可分為立式、臺式、搖臂式、深孔等類型。而對于通用性廣泛、種類較多的鉆床,其設備故障作為復雜事件,將會受到機械部件、數控系統、使用周期等各方面的綜合影響。例如鉆床電機發生不轉動故障,可能是器件接觸不良、電源故障等方面問題;某鉆床出現發熱、電流變大現象,可歸咎于數控設備進入灰塵,引起元器件絕緣電阻下降損壞器件;某型號鉆床打孔深度、大小不精確、出現誤差,主軸升降、正反轉出現故障可能由平臺偏移、主軸過松、電機故障引起。
針對不同種類的鉆床設備出現的故障事實可能屬于同類故障現象,也可屬于不同故障現象,共同構成了復雜的事實知識網絡架構。對于扁平化的關系數據庫則不能清晰明了的表示鉆床知識與展示知識間的深層關系,而知識圖譜對知識進行直接的表示,并進一步分析故障事實間的關系。所以鉆床設備知識圖譜將可應用于故障案例的問答搜索,通過可視化界面進行相關部件的查詢并給出具有關聯性較大的實體及關系,同時建立的知識圖譜中包含解決方法幫助鉆床操作人員做出決策,起到輔助決策的作用。鉆床設備知識圖譜描述了鉆床實體、使用時間、實體關系等事件的復雜關系,在鉆床設備領域方面發揮了較大的技術作用,提升了設備故障診斷的智能化處理水平。應用于故障診斷與預測方面不僅提高了數據的利用率及故障處理的效率,對于無經驗的工作人員還具有重要的指導效果,能清晰直觀的展示故障對象、故障原因及解決方法,減少了處理不當的發生概率。
為了提高工業大數據的應用效率,本文提出一種鉆床設備知識圖譜的構建及其在設備故障診斷與預測中的應用方法。介紹了關于知識圖譜的定義及架構,并從知識表示、知識映射、知識推理與更新及可視化處理四個方面對鉆床設備故障案例知識圖譜的構建進行了相關介紹。同時提出將該知識圖譜應用與問答及輔助決策方面,分析了應用特點及優點。對于未來的工作將實現知識圖譜的具體建立并進行實際應用,建立的知識圖譜將包含不同類型鉆床的故障案例實體,擴大本體與關系的建立。同時選擇最優路徑選擇算法,實現最優路徑并提供概率最大發生的故障實體與原因。