[摘要] 數(shù)據(jù)挖掘是指采用人工智能的方法對數(shù)據(jù)庫和數(shù)據(jù)倉庫中的數(shù)據(jù)進(jìn)行分析、獲取知識的過程。現(xiàn)代企業(yè)的發(fā)展離不開信息技術(shù)的融合運用,本文主要論述數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)在ERP中的應(yīng)用。
[關(guān)鍵詞] 數(shù)據(jù)倉庫; 數(shù)據(jù)挖掘; ERP
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2011 . 23. 031
[中圖分類號]TP391 [文獻(xiàn)標(biāo)識碼]A [文章編號]1673 - 0194(2011)23- 0062- 02
數(shù)據(jù)挖掘是指采用人工智能的方法對數(shù)據(jù)庫和數(shù)據(jù)倉庫中的數(shù)據(jù)進(jìn)行分析、獲取知識的過程。本文探討將數(shù)據(jù)倉庫、數(shù)據(jù)挖掘技術(shù)運用于ERP系統(tǒng)。以數(shù)據(jù)倉庫作為企業(yè)底層的數(shù)據(jù)源,再配合各種數(shù)據(jù)挖掘技術(shù),結(jié)合ERP的管理思想,發(fā)揮數(shù)據(jù)倉庫與數(shù)據(jù)挖擁技術(shù)在決策支持方面的長處。
1數(shù)據(jù)倉庫技術(shù)概述
1.1數(shù)據(jù)倉庫的特點
(1) 面向主題。主題是在較高層次上對數(shù)據(jù)的抽象,面向主題的數(shù)據(jù)組織方式,就是在較高層次上對分析對象數(shù)據(jù)的一個完整、一致的描述,能完整統(tǒng)一地刻畫各個分析對象所涉及的企業(yè)的數(shù)據(jù)項,以及數(shù)據(jù)之間的聯(lián)系。
(2) 集成。對多個異種數(shù)據(jù)源需先統(tǒng)一,然后進(jìn)行數(shù)據(jù)的綜合和計算。
(3) 時變。數(shù)據(jù)倉庫隨時間變化不斷增加新的、刪除舊的數(shù)據(jù)內(nèi)容。
(4) 非易失。數(shù)據(jù)倉庫總是物理地分離存放數(shù)據(jù),由操作環(huán)境下的應(yīng)用數(shù)據(jù)轉(zhuǎn)換而來。
1.2操作數(shù)據(jù)庫與數(shù)據(jù)倉庫
數(shù)據(jù)庫系統(tǒng)作為數(shù)據(jù)管理手段,主要用于事務(wù)處理,在數(shù)據(jù)庫中保存了大量的日常業(yè)務(wù)數(shù)據(jù)。
(1) 用戶和系統(tǒng)的面向性不同:OLTP面向操作人員和低層管理人員;OLAP面向決策人員和高層管理人員。
(2) 數(shù)據(jù)內(nèi)容不同:OLTP是管理當(dāng)前的數(shù)據(jù),對基本數(shù)據(jù)進(jìn)行查詢和增、刪、改操作處理,是以數(shù)據(jù)庫為基礎(chǔ);OLAP是管理歷史的、導(dǎo)出的及綜合提煉的數(shù)據(jù),比OLTP要多一步數(shù)據(jù)多維化或預(yù)綜合處理的操作。
(3) 數(shù)據(jù)庫設(shè)計模型不同:OLTP采用E-R模型;OLAP采用星型或雪花模型。
1.3OLAP操作技術(shù)
OLAP的操作主要是對多維數(shù)據(jù)進(jìn)行的,主要有上卷、下鉆、切片、切塊和轉(zhuǎn)動。
(1) 上卷(也稱上鉆):通過維層次向上攀升或通過維化簡,在數(shù)據(jù)上進(jìn)行聚集。
(2) 下鉆:是上卷的逆操作。如當(dāng)前位置是區(qū)維,下鉆則是街道維、門牌維。
(3) 切片:是在給定的一個數(shù)據(jù)方的一個維上進(jìn)行選擇,形成一個子方。
(4) 切塊:對兩個或多個維進(jìn)行選擇。
(5) 轉(zhuǎn)動:數(shù)據(jù)沒有發(fā)生改變,只是改變一個報告和頁面顯示維的方向。
2數(shù)據(jù)挖掘技術(shù)概述
2.1數(shù)據(jù)挖掘環(huán)境
數(shù)據(jù)挖掘是指一個完整的過程,該過程從大型數(shù)據(jù)庫中挖掘先前未知的、有效的、實用的信息,并使用這些信息做出決策或豐富知識。
在數(shù)據(jù)挖掘中被研究的業(yè)務(wù)對象是整個過程的基礎(chǔ),它驅(qū)動了整個數(shù)據(jù)挖掘過程,也是檢驗最后結(jié)果和指引分析人員完成數(shù)據(jù)挖掘的依據(jù)和顧問。
2.2數(shù)據(jù)挖掘過程簡介
(1) 確定業(yè)務(wù)對象。清晰地定義出業(yè)務(wù)問題,認(rèn)清數(shù)據(jù)挖掘的目的是數(shù)據(jù)挖掘的重要一步。
(2) 數(shù)據(jù)準(zhǔn)備。數(shù)據(jù)的選擇:搜索所有與業(yè)務(wù)對象有關(guān)的內(nèi)部和外部數(shù)據(jù)信息,并從中選擇出適用于數(shù)據(jù)挖掘應(yīng)用的數(shù)據(jù)。數(shù)據(jù)的預(yù)處理——提高研究數(shù)據(jù)的質(zhì)量,為進(jìn)一步的分析作準(zhǔn)備,并確定將要進(jìn)行的挖掘操作的類型。數(shù)據(jù)的轉(zhuǎn)換——將數(shù)據(jù)轉(zhuǎn)換成一個分析模型,這個分析模型是針對挖掘算法建立的。
3ERP概述
3.1ERP的由來
企業(yè)資源計劃(ERP)這一概念是由Gartner公司于20世紀(jì)90年代初提出的。它的發(fā)展一般來說是經(jīng)過:訂貨點法、MRP萌芽期、MRP、閉環(huán)MRP、MRPⅡ、MRPⅡ/JIT、ERP這樣幾個階段而逐步完善形成的。
3.2ERP實質(zhì)
ERP是一個融合了多種先進(jìn)管理思想的信息系統(tǒng),其核心管理思想就是實現(xiàn)對整個供應(yīng)鏈的有效管理。ERP的基本思想是把企業(yè)的業(yè)務(wù)流程看作是一個緊密聯(lián)系的供應(yīng)鏈,并將企業(yè)內(nèi)部劃分成幾個相互協(xié)同作業(yè)的支持子系統(tǒng),可對企業(yè)內(nèi)部供應(yīng)鏈上的所有環(huán)節(jié)有效地進(jìn)行管理,從管理的范圍和深度方面為企業(yè)提供了更豐富的功能和工具。
4基于ERP的數(shù)據(jù)倉庫
4.1數(shù)據(jù)倉庫在ERP中的應(yīng)用
建立基于ERP的數(shù)據(jù)倉庫,首先是分析ERP的數(shù)據(jù)模型,在其基礎(chǔ)上建立相應(yīng)的數(shù)據(jù)倉庫數(shù)據(jù)模型,這時對關(guān)鍵數(shù)據(jù)的識別、整理、清洗、轉(zhuǎn)化和對主題域的確定非常重要,之后的數(shù)據(jù)抽取程序建立等工作也不容忽視。
建立基于ERP的數(shù)據(jù)倉庫面臨的問題總的來說集中在兩個方面:一是如何將事務(wù)處理邏輯模型和數(shù)據(jù)倉庫模型對應(yīng)起來,并將ERP事務(wù)處理和外部數(shù)據(jù)導(dǎo)入數(shù)據(jù)倉庫中;二是在數(shù)據(jù)倉庫基礎(chǔ)上如何構(gòu)建企業(yè)的商業(yè)智能系統(tǒng)來支持企業(yè)的管理決策活動,即數(shù)據(jù)倉庫的應(yīng)用。
4.2實施ERP項目注意事項
數(shù)據(jù)挖掘應(yīng)從以下兩個方面加以考慮:一是為進(jìn)行數(shù)據(jù)挖掘所做的數(shù)據(jù)準(zhǔn)備;二是數(shù)據(jù)挖掘的各種分析算法。
數(shù)據(jù)準(zhǔn)備包括兩個方面:一是從多種數(shù)據(jù)源中綜合數(shù)據(jù)挖掘所需要的數(shù)據(jù),保證數(shù)據(jù)的綜合性、易用性、數(shù)據(jù)的質(zhì)量和數(shù)據(jù)的時效性;二是從現(xiàn)有數(shù)據(jù)中衍生出所需要的指標(biāo)。
隨著信息技術(shù)的不斷發(fā)展,各行各業(yè)的人們掌握了大量的數(shù)據(jù),將數(shù)據(jù)倉庫、數(shù)據(jù)挖掘技術(shù)與ERP有效的結(jié)合能夠最大限度地提高數(shù)據(jù)處理效率,并發(fā)現(xiàn)隱藏在數(shù)據(jù)之后的有用的知識和信息。這是未來企業(yè)信息技術(shù)應(yīng)用發(fā)展的一個很重要的方向,有著廣闊的發(fā)展前景和應(yīng)用價值。
主要參考文獻(xiàn)
[1] 劉進(jìn). 數(shù)據(jù)挖掘在學(xué)生信息管理系統(tǒng)中的應(yīng)用[D]. 重慶:重慶大學(xué),2008.
[2] [加]Jiawei Han,Micheline Kamber. 數(shù)據(jù)挖掘:概念與技術(shù)[M]. 北京:機(jī)械工業(yè)出版社,2007.
[3] 劉偉. 信息管理與數(shù)據(jù)庫技術(shù)[M]. 北京:機(jī)械工業(yè)出版社,2005.
[4] 梅姝娥,陳偉達(dá). 管理信息系統(tǒng)[M]. 北京:石油工業(yè)出版社,2003.