馬 剛,李 楠,郭葉鵬
(中核控制系統工程有限公司,北京 102401)
產品質量是企業的生命線,全員質量是全面質量管理理念的核心,如何采用先進技術和新思維保證產品質量是企業員工都需關注的問題。企業在產品實現過程中會產生大量記錄信息,運用先進技術和新思維對這些數據進行組織,既可規避企業在產品實現過程中的質量風險,也可為企業積累提供寶貴的經驗反饋信息。
知識圖譜最初是由谷歌提出,它運用知識圖譜的結構來挖掘、分析、建立、描述和展示不同來源的知識資源之間的關聯,用簡單直觀的方法來展示復雜的關系,以便使計算機和人更好的理解。
知識圖譜是語義網絡技術更新所產生的成果,它用結構化的架構描述了客觀世界中的概念、實體及關系,用節點和連線表示。在知識圖譜中,這些節點代表現實世界中存在某個具體事物或者其屬性值,用這些線來連接所有有關系的實體,形成關系網,其中每個節點和關系都具有唯一性[1]。知識圖譜將關系作為知識表示的一種方式,它可通過關系將相差甚遠的不同種類事物進行關聯,為使用者提供了一種從“關系”角度對事物進行分析的新視野。知識圖譜可以根據使用者的需求回答出精準的答案以及一些有關聯的信息,并利用可視化技術直觀的展示其關系,以方便使用者更好的理解知識,同時能夠為行業內的應用決策提供精準化的依據。
根據知識圖譜的覆蓋面的不同來看,可以把知識圖譜劃分為通用知識圖譜和行業知識圖譜兩大類。
通用知識圖譜是面向通用領域,以日常生活中產生的知識為主,注重對知識廣度的描述,而行業知識圖譜則是面向某一領域,充分利用了本企業內產生的數據進行構建,更加注重知識的深度和準確性[2]。本文構建的基于企業質量問題知識圖譜是行業知識圖譜,清晰的展示了概念及關系模式。
在通用領域知識圖譜構建過程中,大量實體和屬性都會帶來許多冗余和錯誤信息,需進一步進行知識融合來消除歧義、剔除冗余和錯誤信息[3]。本文數據來源于本企業記錄的質量問題,是經人工篩選后去除冗余的數據。但仔細對這些記錄內容進行分析,發現這些數據對質量問題的語言描述,缺乏規范性和標準性。先將這些記錄進行統一化、標準化處理,規范質量問題描述內容。規范的描述是知識圖譜的構建前提條件。
1.3.1 質量問題本體的概念及關系的確定
質量問題知識圖譜是由其實體和實體之間的關系構成,用以描述整個質量問題的知識語義網絡[4]。
在對質量問題知識圖譜構建前,應結合用戶需求進行組織和規范,構建有效的、可擴展的知識模式。本體指“共享概念模型的形式化規范說明”[5]。故引入本體可實現對知識圖譜實體與實體間關系和屬性的統一規范和管理,有助于提高知識圖譜質量。
本文根據質量問題知識圖譜的概念抽取主問題、問題實體描述、從問題層次抽取概念后,又采用訪談法和觀察法,從安全質量管理部門對其控制的角度切入的。構建的質量問題知識圖譜面向的用戶為安全質量部門,根據其調研結果,結合其需求及檢索習慣確定了本體概念,同時結合其業務流程定義了概念間關系及實體間關系,如圖1 所示。

圖1 本企業質量問題本體概念及關系Fig.1 Quality problem ontology concept and relationship of the enterprise

圖2 本體與知識圖譜映射機制Fig.2 Mapping mechanism of ontology and knowledge map
在概念和關系確定后,采用“自頂向下”方式,從概念層開始,逐級細化,進行實體擴充。每個實體包含一個或多個實例,根據本體特性,實例將繼承其所屬概念的所有屬性和關系。
1.3.2 本體映射及知識存儲
知識圖譜是將概念層級作為樹,概念節點作為樹的節點,實體節點作為知識圖譜的實體關系圖節點,用線連接節點之間的關系[6]。

圖3 企業質量問題知識圖譜部分Fig.3 Knowledge map of enterprise quality problems
構建的質量問題知識圖譜首先要確定本體和知識圖譜間的映射機制,如圖2 所示。本體可看作是將概念層級結構,即為“樹的主干”,其中概念和實例等為“樹的枝節”,用關聯關系連接。
經過映射后的知識以三元組形式存在,將知識存儲在圖數據庫中,運用數據庫存儲知識可快速、直觀、靈活地處理大量復雜和相互連接的數據。
知識圖譜最大的優點就是可利用空間形態直觀地表示出知識間的相互關系。構建的質量問題知識圖譜,安全質量管理人員可根據其使用需求和檢索習慣,多維度的利用知識,同時利用實體間關系,可為實現質量問題精準定位、根本原因深度挖掘、為制定有效措施奠定基礎。
通過對構建完成的質量問題知識圖譜進行分析發現,企業內同類質量問題時有發生,根據此現象,引入語義相似度[7],將這些相似“問題描述”進行聚類,并借助標簽組織簇實體,如圖3 所示。如,人工將“生銹”作為兩個質量問題的共同標簽,通過語義相似度計算,便將描述中有關“機柜門板生銹”“機柜頂部及內部生銹”等質量問題,聚為一類。標簽的制定為后續的質量問題分析奠定基礎。
構建完成的質量問題知識圖譜將主要應用于以下幾方面:
本文構建的知識圖譜以圖結構的形式對產品實現過程中所發生的質量問題的概念、實體、屬性及關系進行組織和存儲,使知識間的關聯更加立體[8]。隨著知識的不斷積累,借助知識圖譜可挖掘質量問題產生的根本原因與問題發生的潛在關系,便于企業在產品實現過程中出現質量問題時,可實現智能化檢索和問題的邏輯推理,并能進一步快速精準定位問題原因。
從質量問題的實體描述,到解決方案等多步深入分析,便于用戶對該質量問題進行全程回顧和追溯,為合理制定改進措施提供物質基礎。
本文涉及如何運用新技術和新思維構建企業質量問題知識圖譜,實現企業質量問題高效檢索、問題原因精準定位、相關知識的有效積累和共享等,后續還將繼續開展對其研究和實踐,將最大限度地發揮知識圖譜的應用價值。