宋 敏,王社偉,2
(1.河南工業大學 信息科學與工程學院,河南 鄭州450001;2.西北工業大學 現代設計與集成制造技術教育部重點實驗室,陜西 西安710072)
隨著制造信息化的發展,各類制造系統運行中累積了越來越多的業務數據,數據和信息的利用率越來越低。分析數據中隱含的信息和規律,輔助業務處理和管理改善,成為信息化深入發展亟待解決的問題。數據倉庫以數據庫為基礎,能夠實現大量結構化數據的有效統計和分析,近年來已逐漸成為研究的熱點。文獻 [1-3]對數據倉庫的查詢優化機制進行了研究。文獻 [4]提出并設計了基于用戶的數據倉庫模型。文獻 [5-7]分別對票務、警務、車輛監控等領域的數據分析應用進行了研究;文獻 [8-9]分別對設備故障診斷、企業質量控制數據的數據倉庫分析進行了研究。目前數據倉庫技術的研究多集中在查詢優化機制或數據關系相對簡單的事務處理數據、故障及質量控制等特定主題數據的分析應用等方面,對離散制造過程的數據分析應用進行系統研究的還比較少。裝配是一種典型的離散制造過程,裝配過程也是企業多種數據的一個匯集中心,數據結構和關系復雜,為數據處理與分析帶來了新的挑戰。本文以ISA95制造運行系統模型為基礎,研究裝配過程數據的分類和內在邏輯,設計了裝配數據的數據分析模式和數據倉庫分析方法。
對于數據分析應用而言,應用數據倉庫的關鍵在于建立明確的數據分析主題。根據文獻 [4],確定數據分析主題,即建立數據分析參考模型,有基于數據、基于客戶目標和基于用戶需求3種思路。其中,基于數據的內在邏輯分析,明確了數據分析的方向,是從整體上進行數據分析的重要方法。裝配過程數據是一類復雜的制造數據,要實現裝配過程數據整體分析,首先要建立合理完善的裝配數據模型。
ISA95數據模型是一種系統的制造過程數據模型。它是美國儀器、系統和自動化協會 (ISA)為了規范制造企業信息系統集成,而在ISA95系列標準中對制造運行系統功能結構和數據流進行的建模。按照ISA95標準,制造過程中的主要活動可以平行地分成生產、質檢、庫存、設備維護4種類型。每種制造活動中的數據都可以分成物料、設備、人員和過程段4種資源數據與活動能力信息、活動定義信息、活動計劃信息、活動響應信息4種信息流數據。依據不同的數據類型,定義了人力資源,設備資源,物料資源,過程段資源,過程段能力,活動能力,活動定義,活動計劃,活動績效等9種不同的數據模型。ISA95數據模型描述了制造過程中數據分類和關系,為建立制造過程數據分析模型提供了參考依據。
定義1 裝配過程:是按照產品和質量的定義規范,根據生產預測和訂單生產要求,結合生產產能,制定詳細生產計劃;調度根據生產資源狀態,進行動態生產任務派發;各執行單元根據產品和質量的定義規范,響應生產計劃,形成信息的閉環。
定義2 裝配數據:是裝配過程中各種生產要求、生產狀態、生產性能的描述和記錄。
裝配數據具有面向過程的特點。從制造執行的角度而言,裝配過程是生產活動、質檢活動、設備維護活動、庫存管理活動的一個綜合作用過程,裝配數據反映了制造活動中各類信息的采集、傳遞和處理狀態。裝配過程數據是一種時序或邏輯上相關的一種數據,過程中各環節之間的數據關系是數據分析的重點。
裝配數據具有異構性特點。裝配工藝、質檢和任務執行過程數據包括幾何尺寸、拓撲形狀、位置、時間、人員、物理化學特性等多種類型。裝配過程的數據維度,除了傳統數據描述中的時間維和空間維之外,還具有很強的產品結構相關性,產品BOM也是數據分析的重要維度。
結合裝配數據的特點,參考ISA95的數據模型,可以將裝配數據分成:定義數據、能力數據、生產數據,其中生產數據又包括計劃數據和性能數據。
定義數據給出產品和質量的定義信息,描述制造活動的內容和規范。定義數據是裝配過程的基礎數據,為生產計劃和裝配活動執行提供規范,如產品設計系統的BOM信息、工藝設計系統的裝配工藝、質量系統的質檢工藝等。能力數據是描述制造活動涉及的各種資源的可用性信息。能力數據是進行生產計劃、調度、制造活動執行的重要依據,如物料、工裝、設施設備、人員等。計劃數據描述了制造活動指令。計劃數據是制造活動的預期執行狀態,在裝配過程中,計劃以裝配任務進行派發,由調度進行統一協調,控制裝配進度。性能數據反映了裝配活動的實際執行狀態,是執行單元根據定義數據,在生產計劃的約束下進行裝配而產生的各種結果。性能數據與定義數據和計劃數據的符合狀況,揭示了裝配系統運行中的問題,是改善裝配系統的重要依據。
數據分析主題確定了分析的角度,是海量數據分析的基礎。裝配過程數據的分類關系體現了裝配活動的潛在執行邏輯:從產品生命周期來看,裝配過程是在工藝定義的活動規范下完成產品的執行過程;從企業經營活動來看,裝配過程是在現有產能條件下,按照生產計劃完成裝配任務,形成產品的執行過程。可以通過圖1中的兩種模型來表示裝配數據之間的這種內在的邏輯關系。

圖1 裝配過程數據邏輯模型
圖1中的質量數據模型描述了定義數據和性能數據之間的邏輯關系。定義數據給出了裝配操作規范,性能數據可以看作是實際操作過程是否符合裝配操作規范的記錄。性能數據的分析和挖掘能夠促進定義數據的優化和改善。定義數據和性能數據之間的關系形成一個完整的信息閉環。計劃數據模型描述了計劃數據和性能數據之間的邏輯關系。計劃數據給出了裝配進度和資源分配,性能數據可以看作是實際操作過程是否符合計劃的記錄。性能數據的分析為優化調度和計劃提供有效的支持。能力數據描述的制造資源可用狀態是計劃和調度的重要依據,也是性能分析中的一個重要因素。
根據裝配數據邏輯模型,可以建立質量數據主題模型和計劃數據主題模型。在數據倉庫的多維數據模型中,各個主題數據模型由事實數據和維度數據組成。①質量數據主題模型。以復雜產品裝配為例,質量數據的事實數據由裝配工序的質量等級描述。影響工序質量的主要屬性有工藝、工裝、物料、產品結構、裝配員、時間、檢驗員,可以從這些屬性維度來分析裝配工序質量。因此,確定質量主題數據的維度為工藝、物料、產品結構、裝配員、檢驗員、時間。②計劃數據主題模型。以復雜產品裝配為例,計劃數據的事實數據由裝配任務的計劃開始時間、計劃完成時間、實際開始時間、實際完成時間描述。影響裝配任務按計劃完成的主要因素有工藝、零部件、工裝、產品結構、班組、調度、時間。由此確定計劃主題數據的維度為:工藝、零部件、工裝、產品結構、班組、調度、時間。
根據ISA95的功能和數據模型,制造執行過程還包括庫存管理與設備維護活動,也存在對應的數據分析主題。本文主要以質量數據和計劃數據為研究對象。
2.4.1 事實數據模型
事實數據是對主題數據的度量。在質量主題數據中,質量用裝配實際狀態和工藝要求狀態的偏差來描述。在裝配過程精細化模型中,每道工序的質量由多個質量特性進行度量。不同工序的質量特性、同一工序的不同質量特性,其質量度量標準是不同的,為了進行數據的分析統計,需要建立一致的質量度量標準[10]。一般通過質量等級劃分,實現質量數據的一致度量。數據分析挖掘方法本質上是一種統計方法,過細的質量等級劃分會加大數據宏觀分析的難度。可以根據實際應用需求確定質量等級劃分,本文將質量等級用 (好,較好,一般,差)4個指標表示。
在裝配計劃主題數據中,任務完成情況用計劃開始時間、計劃完成時間、實際開始時間、實際完成時間描述。在裝配執行系統中,裝配進度控制一般以工序為粒度,可以實時獲取每道工序的實際執行時間。建立以工序為粒度的計劃數據模型,通過工序時間定額、計劃時間、實際完成時間描述裝配計劃。
2.4.2 維度數據模型
維度數據表示影響主題數據的主要因素,從不同的角度對主題數據進行分析和統計,顯示數據之間的邏輯關系,挖掘維度數據和主題數據之間的作用規律。建立質量主題數據的維度數據模型:
質量維度∶∶= (工序維,物料維,部件維,檢驗項維,裝配員維,檢驗員維,時間維)
工序維∶∶= (工序,工藝,版本)
BOM維∶∶= (部件名稱,圖號,產品號,型號)
檢驗項維∶∶= (檢驗項,檢驗表)
裝配員維∶∶= (裝配員,班組)
檢驗員維∶∶= (檢驗員,檢驗室)
時間維∶∶= (日,周,月,季度,年)
物料維∶∶= (零件名稱,圖號,批次,供貨商)
建立以工序為粒度的計劃數據模型:
計劃維度∶∶= (工序維,部件維,裝配員維,調度員維,時間維)
工序維∶∶= (工序,工藝,版本)
SpringMVC它是一個典型的教科書式的MVC構架,框架高度可配置,且包含多種視圖技術,目的是無需使用JSP技術,在源碼中實現功能視圖。
BOM維∶∶= (部件名稱,圖號,型號,產品編號)
裝配員維∶∶= (裝配員,班組)
調度員維∶∶= (調度員)
時間維∶∶= (日,周,月,季度,年)
2.4.3 數據倉庫分析方法
以主題數據模型為基礎,可以進行數據倉庫分析。分析方法主要有宏觀分析和微觀分析兩種。宏觀分析以宏觀視圖和整體視圖的形式來展示數據。常用的宏觀分析是上卷操作,沿著維度數據的概念分層向上進行數據規約,以較大粒度的坐標尺度對事實數據進行度量,展現數據的宏觀規律。
微觀分析以微觀視圖和局部視圖的形式來展示數據。常用的微觀分析方法有下鉆和切片操作。下鉆操作是沿維度數據的概念分層向下展示數據細節,以較小粒度的坐標尺度對事實數據進行度量,展現數據的微觀規律。切片是針對維度數據的具體取值,從橫向選擇數據方的一個斷面進行考查。一般對宏觀分析中發現的問題,采用下鉆和切片進行深入分析。
某航空發動機生產企業裝配車間實施了裝配執行系統,減少了裝試次數,提高了裝配質量。但對裝配系統日常產生的大量數據卻缺乏有效的分析手段,造成了信息資源的浪費,同時也制約了裝配過程的進一步改善。應用數據倉庫分析技術對航空發動機數據進行了組織和分析,本文僅以質量數據的分析為例。
對航空發動機裝配過程質量數據進行建模,建立星型架構的數據倉庫。質量數據倉庫由一個中心表和7個維度表組成,分別是質量數據事實表和工序維表、物料維表、BOM維表、檢驗項維表、裝配員維表、檢驗員維表、時間維表。質量數據倉庫模型如圖2所示。

圖2 質量數據倉庫模型
航空發動機裝配質量體現為與工序對應的多個檢驗項的實際值與規定值的差異。規定值是對某一工序多種質量特性的度量,不同質量特性其質量度量描述有幾何、物理、化學等多種形式,為了實現數據的一致分析,需要對裝配質量特性進行規范化。分析航空發動機工序質量檢驗記錄,主要存在幾種形式的質量評價方式:①以質量特性的雙向變化范圍的形式表示,如間隙值大于0.1mm,小于0.2mm;②以質量特性的單向變化范圍的形式表示,如表面缺陷個數不大于3個,葉片質量差不大于0.1g等等;③以自然語言描述,如在航空發動機滑油泵裝配過程中的某工序的檢查:用手檢查齒輪旋轉的勻滑性,不允許有滯住現象。對于方式①,以變化范圍中心作為參考,從中間值到最大值和最小值的變化范圍三等分,分別對應好、較好和一般3個質量等級。對于方式②,將質量特性變化范圍三等分,分別對應好、較好和一般3個質量等級。情況①和②,質量等級和度量值的大小之間的關系可能是不確定的,如在同樣的間隙要求下,有時候可能間隙越小質量越好,有時候可能相反。具體應用時可結合專家經驗確定范圍劃分和質量等級的對應關系。對于方式③,根據質量特性一般描述為是否合格。如果合格,質量等級為較好。對于上述幾種情況,質量特性在規定范圍之外或者不合格,定義相應的質量等級為差。但航空發動機的裝配采用手工小批量生產和全工序檢驗的方式,要求不合格的工序要返工,直至滿足要求為止。返工的工序對整體質量和進度會產生不良影響,因此不論其返工后的質量等級,都將其最終質量標識為差。質量數據的規范化描述示例見表1。表中工序的質量特性對應具體的檢驗項。

表1 質量數據的規范化
3.3.1 宏觀分析
通過上卷操作對質量數據進行宏觀分析,發現數據之間的潛在聯系。可以對裝配操作進行質量統計,如統計每一臺發動機工序檢驗質量為差的數目,對每臺發動機的裝配質量進行綜合比較;統計不同批次物料對應的裝配工序質量為差的數目,比較不同批次物料對裝配的影響;統計每一年度、每個班組裝配工序質量為差的數目,對裝配班組的年度工作質量進行比較;等等。其中,班組的年度裝配工序質量可以用SQL語言進行描述:
select年,班組,count(*)as問題數量from 質量事實表as q,裝配員維表as a,時間維表as t where q.裝配員ID=a.裝配員ID and q.時間ID=t.時間ID and q.實際值=’差’
group by年,班組
產生的結果集見表2。表中顯示了裝配各班組年度裝配工序返工數目。從年度維度來看,2009年和2010年,數據基本持平;2011年開始實施裝配數字化項目,裝配質量有較大改善。從班組維來看,附件班組與壓氣機班組、燃燒室班組相比,在數字化項目實施之前,裝配質量年度有小幅改善,項目實施之后,改善非常明顯。而壓氣機班組的質量改善結果不是很顯著。

表2 班組年度質量比較
3.3.2 微觀分析
通過下鉆和切片對宏觀分析中發現的問題進一步分析。如對壓氣機班組裝配質量情況進行下鉆,顯示每個成員的質量裝配情況,進行分析;對壓氣機BOM進行下鉆和切片,顯示2009、2010、2011年壓氣機轉子、壓氣機靜子、壓氣機部件質量裝配情況,進行對比,等等。壓氣機BOM下鉆和切片結果見表3。
由壓氣機組件裝配數據情況可以看出,壓氣機部件裝配中存在較大問題,應作為進一步分析和改善的重點環節。基于數據倉庫技術對一種主題數據的建模和數據分析方法有很多,如對裝配質量數據的處理方法、處理結果等都可以進行分析。在具體的應用中,可以根據領域專家的意見對主題數據的建模和分析方法進行擴展。

表3 壓氣機各組件裝配數據分析
信息化是制造業發展的大勢所趨。在兩化融合的大環境下,組織分析制造系統的數據已經成為制約制造信息化深入發展的瓶頸。在研究ISA95對象模型的基礎上,提出了基于數據倉庫的復雜產品的裝配過程數據的建模分析方法并對航空發動機裝配數據進行了分析。裝配數據分析技術為整體上對裝配過程數據分析提供了合理的思路;為裝配數據分析提供了有效的方法;促進了制造系統數據的有效利用和裝配過程的改善。
[1]YAN Qiuling,SUN Li,WANG Mei,et al.Heuristic mechanism for query optimization in column-store data warehouse[J].Chinese Journal of Computers,2011,34 (10):2018-2026(in Chinese).[嚴秋玲,孫莉,王梅,等.列存儲數據倉庫中啟發式查詢優化機制 [J].計算機學報,2011,34(10):2018-2026.]
[2]MA Yingying,DAI Muhong.Coupling method of indexes and materialized views about data warehouse performance optimization [J].Application Research of Computers,2013,30 (3):835-837 (in Chinese). [馬瑩瑩,戴牡紅.數據倉庫性能優化之索引和物化視圖耦合方法 [J].計算機應用研究,2013,30(3):835-837.]
[3]ZHAO Peng,WANG Shoujun,GONG Yun.Multi-join query optimization of data warehouse based on improved ant colony algorithm [J].Computer Engineering,2012,38 (1):168-173(in Chinese).[趙鵬,王守軍,龔云.基于改進蟻群算法的數據倉庫多連接查詢優化 [J].計算機工程,2012,38 (1):168-173.]
[4]LI Yuanbang,WANG Liming.Research on user-driven reference model for data warehouse [J].Computer Engineering and Design,2012,33 (9):3447-3450 (in Chinese). [栗元邦,王黎明.基于用戶的數據倉庫參考模型研究 [J].計算機工程與設計,2012,33 (9):3447-3450.]
[5]SHAO Xianli.Design and implementation of data warehouse for railway tickets [D].Shanghai:Shanghai Jiaotong University,2012(in Chinese).[邵顯麗.鐵路客票數據倉庫的設計與實現 [D].上海:上海交通大學,2012.]
[6]YUAN Lina.Construction and practice of the data warehouse in the police comprehensive information system [J].Computer Science,2012,39 (6):291-308 (in Chinese). [袁麗娜.警務綜合信息系統數據倉庫的建設與實踐 [J].計算機科學,2012,39 (6):291-308.]
[7]HU Jihua,CHENG Zhifeng,ZHAN Chengzhi,et al.A Gridtime-indexed cube model for spatiotemporal data warehouse of vehicle supervision [J].Geomatics and Information Science of Wuhan University,2013,38 (1):78-81 (in Chinese). [胡繼華,程智鋒,詹承志,等.車輛監控數據倉庫中時空立方體數據模型的設計與實現 [J].武漢大學學報 (信息科學版),2013,38 (1):78-81.]
[8]QU Juan.Application of data warehouse technology and data mining method on failure diagnosis of hydraulic press [D].Dalian:Dalian Jiaotong University,2007 (in Chinese). [屈娟.數據倉庫技術及挖掘方法在液壓機故障診斷上的應用[D].大連:大連交通大學,2007.]
[9]XUE Dongjuan,GAO Tianyi,PAN Ying,et al.Construction of ship enterprises quality control model and data warehouse[J].Computer Engineering and Applications,2012,48 (6):229-232 (in Chinese). [薛冬娟,高天一,潘穎,等.船舶企業質量控制模型及數據倉庫的構建 [J].計算機工程與應用,2012,48 (6):229-232.]
[10]Srinivas S,Harding J A.A data mining integrated architecture for shop floor control [J].Journal of Engineering Manufacture,2008,222 (5):605-624.