徐河杭



摘 要:為了系統(tǒng)化地挖掘和利用PLM產(chǎn)生的大量數(shù)據(jù),支持企業(yè)產(chǎn)品設計、制造、銷售服務等各階段的協(xié)調(diào)和面向PLM的決策,對面向PLM的數(shù)據(jù)挖掘技術進行研究。首先建立了一個面向產(chǎn)品生命周期的數(shù)據(jù)挖掘體系結構;其次研究了各層次的編碼模型和字典設計;然后研究了如何快速選擇數(shù)據(jù)源和數(shù)據(jù)挖掘方法模型;最后進行了面向PLM的數(shù)據(jù)挖掘系統(tǒng)實現(xiàn)和實例應用。
關鍵詞:PLM;數(shù)據(jù)挖掘;編碼模型;挖掘需求
1 引言
隨著PLM(product lifecycle management,產(chǎn)品生命周期管理)在制造企業(yè)中的應用,對數(shù)據(jù)挖掘在制造企業(yè)的應用也提出了新的需求。郭國印進行了數(shù)據(jù)挖掘技術及其在PLM中的應用研究,主要研究了PLM系統(tǒng)的理論和發(fā)展,數(shù)據(jù)挖掘過程中的數(shù)據(jù)預處理方法,根據(jù)業(yè)務數(shù)據(jù)闡述了某些算法應用于PLM系統(tǒng)的具體思路,最后簡單設計實現(xiàn)了PLM數(shù)據(jù)挖掘系統(tǒng)。其他多數(shù)數(shù)據(jù)挖掘的研究主要是從企業(yè)的某個角度或是某個層面上對一些問題進行分散和孤立的研究與應用,并沒有涉及企業(yè)PLM。
如何從產(chǎn)品生命周期的角度,對企業(yè)各個環(huán)節(jié)的數(shù)據(jù)進行分析和挖掘,發(fā)現(xiàn)隱含在大量數(shù)據(jù)背后的信息和知識,將基礎數(shù)據(jù)轉化為滿足各部門和企業(yè)領導需要的信息和知識。另一方面,面對很多不同的挖掘需求和挖掘方法,如何快速找到合適的挖掘方法和源數(shù)據(jù),得到想要的挖掘結果。這是制造企業(yè)數(shù)據(jù)挖掘的一個重要研究方向。
2 面向PLM的數(shù)據(jù)挖掘體系結構
面向PLM的數(shù)據(jù)挖掘過程是:首先從應用需求出發(fā),提出對挖掘結果(指標)的需求;其次是根據(jù)需求查找合適的挖掘方法和獲取相關的數(shù)據(jù);然后針對挖掘需求和經(jīng)過預處理得到的數(shù)據(jù),進行數(shù)據(jù)挖掘,得到相應的挖掘結果,滿足應用需求。因此,面向PLM的數(shù)據(jù)挖掘是一個從應用需求出發(fā),最終滿足應用需求的一個閉環(huán)結構。其體系結構主要包括四層:
2.1 數(shù)據(jù)層
數(shù)據(jù)很多,主要包括產(chǎn)品生命周期過程中各個階段的各種數(shù)據(jù),如:市場數(shù)據(jù)、專利數(shù)據(jù)、設計數(shù)據(jù)、供應商數(shù)據(jù)、生產(chǎn)過程數(shù)據(jù)、銷售數(shù)據(jù)、維修服務數(shù)據(jù)和成本數(shù)據(jù)等。
2.2 方法層
挖掘方法很多,主要包括聚類、關聯(lián)規(guī)則發(fā)現(xiàn)、分類、多維分析、異常點分析、預測、維修預警、評價分析等各種不同的挖掘方法模型。針對不同的挖掘目標和應用,從中選擇不同的方法。
2.3 結果層
數(shù)據(jù)挖掘結果很多,可以通過時間維、空間維和參數(shù)維進行分類。
2.4 應用層
應用層又可看作是需求層。數(shù)據(jù)挖掘的目的是應用其挖掘得到的結果,幫助實現(xiàn)企業(yè)的各種目標。應用層中的各種應用不一定來自于獨立的一個階段的挖掘結果,可能來自于不同階段挖掘結果的集成與共享。
3 面向產(chǎn)品生命周期的數(shù)據(jù)挖掘編碼模型
建立面向產(chǎn)品生命周期的數(shù)據(jù)挖掘編碼模型的目的是,用較少的編碼描述盡可能多的產(chǎn)品生命周期中的數(shù)據(jù)、數(shù)據(jù)挖掘方法、數(shù)據(jù)挖掘結果和需求的信息,并建立它們之間的聯(lián)系,便于從挖掘需求出發(fā),尋找相關的數(shù)據(jù)挖掘方法和數(shù)據(jù)源,得到相應的數(shù)據(jù)挖掘結果。主要包括數(shù)據(jù)編碼模、數(shù)據(jù)挖掘方法編碼模型、數(shù)據(jù)挖掘結果編碼模型和數(shù)據(jù)挖掘需求編碼模型。
數(shù)據(jù)的基本屬性是存儲在產(chǎn)品生命周期的不同數(shù)據(jù)庫的各個數(shù)據(jù)表中的字段,對由這些基本屬性組成的表或視圖統(tǒng)一利用編碼模型中的標簽屬性來構建源數(shù)據(jù)字典,以方便檢索源數(shù)據(jù)。采用具有分類特性的助記碼和唯一特性的順序碼組合的混合編碼方式來對源數(shù)據(jù)進行編碼。
數(shù)據(jù)挖掘方法編碼模型包含模型編號、模型名稱、模型類型、功能、基本方法和應用領域等等,基本方法中有相應的幾種算法、相應的控制參數(shù)、輸入和輸出。根據(jù)數(shù)據(jù)挖掘模型(方法)的編碼模型,設計數(shù)據(jù)挖掘模型字典來存儲數(shù)據(jù)挖掘模型,同時把這些不同類型的模型算法編譯成對應的DLL文件,供模型使用時動態(tài)加載,實現(xiàn)模型的共享和模型與程序的分離。
數(shù)據(jù)挖掘結果是由不同的源數(shù)據(jù)通過不同的數(shù)據(jù)挖掘方法模型得到的。因此數(shù)據(jù)挖掘結果編碼模型包含數(shù)據(jù)來源、數(shù)據(jù)挖掘方法模型、應用領域、結果評價以及結果分類。
數(shù)據(jù)挖掘需求編碼模型一般包含需求編號、需求名稱、功能需求、數(shù)據(jù)需求、結果需求、應用領域和需求所屬類別等等。
4 面向PLM的數(shù)據(jù)挖掘系統(tǒng)及實例應用
面向產(chǎn)品生命周期的數(shù)據(jù)挖掘系統(tǒng)結構如圖1所示。首先在用戶界面中輸入數(shù)據(jù)挖掘需求,然后通過控制中心對數(shù)據(jù)挖掘需求中所涉及到的數(shù)據(jù)源參數(shù)和模型需求參數(shù)進行收集,然后向數(shù)據(jù)預處理模塊發(fā)出數(shù)據(jù)請求,向挖掘模型模塊發(fā)出模型請求,向可視化模塊發(fā)出挖掘結果可視化請求,最后將數(shù)據(jù)挖掘結果以可視化的方式返回給用戶。數(shù)據(jù)預處理模塊根據(jù)挖掘需求,尋找所對應的數(shù)據(jù)源和相關的屬性列表,對屬性進行一系列操作,為數(shù)據(jù)挖掘模型提供完整、高質量的數(shù)據(jù)。挖掘方法模型模塊根據(jù)挖掘需求中對模型需求的描述,根據(jù)模型字典檢索數(shù)據(jù)挖掘模型庫中相匹配的挖掘模型,提供合適的挖掘模型供控制中心使用。另外根據(jù)需求中對結果分類的描述將挖掘推送給有相同需求的決策者。
圖1 面向產(chǎn)品生命周期的數(shù)據(jù)挖掘系統(tǒng)
以產(chǎn)品生命周期中的生產(chǎn)過程中的質量因素分析為例,首先輸入數(shù)據(jù)挖掘需求。根據(jù)數(shù)據(jù)需求描述的生產(chǎn)過程質量數(shù)據(jù)查找數(shù)據(jù)字典中含相關屬性標簽的數(shù)據(jù)源,選擇與質量相關的一些基本屬性,并對其做進一步處理,如刪除空值項或離散化等。然后根據(jù)功能需求等選擇關聯(lián)通用模型及其算法做質量屬性的關聯(lián)分析。最終得到質量相關因素的關聯(lián)挖掘結果。并對所挖掘得到的結果進行評價。同時可以將此結果發(fā)送給制造部門和設計部門的員工和領導,以便制造部門更好地進行質量控制,設計部門在設計過程中考慮零件的結構和工藝問題。
5 結語
本文在企業(yè)PLM需求和應用的基礎上,首先提出了一個面向PLM的數(shù)據(jù)挖掘體系結構。其次根據(jù)體系結構中的數(shù)據(jù)層、方法層、結果層和需求層各構建設計了其相應的編碼模型和字典。然后根據(jù)各層次字典間的聯(lián)系和其關鍵字的相關匹配度,快速查找數(shù)據(jù)源和選擇挖掘方法模型。最后開發(fā)了一個面向PLM的數(shù)據(jù)挖掘系統(tǒng)并進行了實例應用,可以將挖掘結果直接推送給有需要的決策者,提高產(chǎn)品生命周期中知識的共享和集成,幫助不同部門的領導集成其它部門的挖掘知識進行決策,加大產(chǎn)品生命周期內(nèi)各階段的協(xié)調(diào)和優(yōu)化。
參考文獻:
[1] 景旭文,易紅,趙良才.基于數(shù)據(jù)挖掘的產(chǎn)品概念設計建模研究[J].計算機集成制造系統(tǒng)-CIMS.2003(11):950-954.
[2] 景旭文,趙良才,易紅.產(chǎn)品動態(tài)全息概念設計模型的研究[J].華東船舶工業(yè)學院學報: 自然科學版.2002(05):61-66.
[3] 李飛,黃亞樓,劉麗君.數(shù)據(jù)挖掘中知識管理與表達系統(tǒng)的設計與實現(xiàn)[J].計算機工程與應用.2001(14):25-28.
[4] 嚴雋琪,蔣祖華,馬登哲.基于全息產(chǎn)品建模的虛擬加工[J].計算機集成制造系統(tǒng)-CIMS.2000(05):18-22.
[5] 烏蘭木其,鄧家褆.現(xiàn)代產(chǎn)品設計方法及其演進[J].機械工程學報.
2000(05):1-6.
[6] 趙良才,景旭文,魯泳.基于智能體技術的計算機輔助概念設計研究[J].華東船舶工業(yè)學院學報.2000(02):51-56.