摘要:在ERP采購(gòu)管理系統(tǒng)中采用DM與DB/DW緊耦合方式設(shè)計(jì)了一個(gè)開(kāi)放集成的數(shù)據(jù)挖掘系統(tǒng)DMSPM。使用基于約束的交互式數(shù)據(jù)挖掘技術(shù),以提高挖掘效率和靈活性;將計(jì)算模型和工具分離,形成一個(gè)模型求解的工具箱,便于使用和維護(hù);通過(guò)人機(jī)界面和知識(shí)推理接受用戶決策需求并輸出決策結(jié)果,提供良好的交互性,從而形成一個(gè)擁有強(qiáng)大決策功能的ERP采購(gòu)系統(tǒng)。
關(guān)鍵詞:數(shù)據(jù)挖掘;ERP;決策支持;采購(gòu)管理
O引言
管理決策中所面臨的問(wèn)題,往往目標(biāo)含糊不清,多目標(biāo)相互沖突,方案的比較和選擇沒(méi)有固定的規(guī)則或程序可循,所需的信息不全或比較模糊,同時(shí)不同的決策者的領(lǐng)導(dǎo)風(fēng)格也不完全一樣。為了把握企業(yè)運(yùn)作的整體特征和決策企業(yè)的發(fā)展戰(zhàn)略,需要建立可靠的決策支持系統(tǒng)。當(dāng)前利用企業(yè)已建ERP中大量的基礎(chǔ)信息數(shù)據(jù),實(shí)現(xiàn)決策支持已成為ERP的發(fā)展趨勢(shì)。數(shù)據(jù)挖掘DM(Data Mining)是實(shí)現(xiàn)決策支持系統(tǒng)的最佳途徑。將DM系統(tǒng)平滑集成到DB/DW系統(tǒng)中,成為信息系統(tǒng)中的一個(gè)子系統(tǒng);事務(wù)管理、查詢處理、聯(lián)機(jī)分析處理和聯(lián)機(jī)分析挖掘集成在一個(gè)統(tǒng)一框架中。這將保證數(shù)據(jù)的可獲得性,數(shù)據(jù)挖掘的可移植性、可伸縮性、并為多維數(shù)據(jù)創(chuàng)立了集成處理的環(huán)境。本文正是根據(jù)上述設(shè)想,構(gòu)建了一個(gè)可以集成在ERP系統(tǒng)中并與數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)緊耦合的數(shù)據(jù)挖掘系統(tǒng),可以進(jìn)行自動(dòng)和交互探查的挖掘方式,以多種方式將挖掘結(jié)果智能地提供給決策者,使ERP系統(tǒng)具有完善的決策支持功能。
1應(yīng)用在采購(gòu)管理中的數(shù)據(jù)挖掘系統(tǒng)
我們所構(gòu)建的采購(gòu)管理中的數(shù)據(jù)挖掘系統(tǒng)DMSPM(Data Mining System for Purchase Management),實(shí)現(xiàn)了采購(gòu)過(guò)程的決策支持功能,主要包括:
(1)聯(lián)機(jī)分析處理(0LAP)。采用多層次多維度多種操作方式對(duì)采購(gòu)訂單、供應(yīng)商、物料等數(shù)據(jù)進(jìn)行分析,得到不同的匯總信息,進(jìn)而定性歸納出事物的特征描述或?qū)Ρ让枋觥?/p>
(2)自動(dòng)選擇合適的供應(yīng)商,對(duì)供應(yīng)商進(jìn)行合理的評(píng)估。
(3)根據(jù)不同的要求制定采購(gòu)計(jì)劃。
(4)物料價(jià)格預(yù)測(cè)、采購(gòu)風(fēng)險(xiǎn)評(píng)估以及采購(gòu)屬性關(guān)聯(lián)等。
DMSPM的組成結(jié)構(gòu)如圖1所示。
DMSPM嵌入到ERP系統(tǒng)中,ERP系統(tǒng)通過(guò)ERP接口調(diào)用DMSPM中各模塊,智能顯示相關(guān)決策信息。例如可以根據(jù)預(yù)先設(shè)定參數(shù)自動(dòng)生成采購(gòu)計(jì)劃或引導(dǎo)決策者根據(jù)要求生成采購(gòu)計(jì)劃,并提供相關(guān)信息,如供應(yīng)商信譽(yù)度、價(jià)格信息等。利用DMSPM的OLAP服務(wù),可以對(duì)多維數(shù)據(jù)集進(jìn)行上卷、下鉆等操作。DMSPM中的決策管理采用任務(wù)驅(qū)動(dòng),若要生成決策信息則可通過(guò)挖掘向?qū)Фx任務(wù),存儲(chǔ)在任務(wù)模型庫(kù)中,任務(wù)模型庫(kù)中預(yù)先已經(jīng)定義部分任務(wù)。任務(wù)由任務(wù)引擎分配給挖掘引擎,選擇合適的挖掘算法(如分類(lèi)、關(guān)聯(lián)等)在數(shù)據(jù)集市中運(yùn)行,并將結(jié)果存儲(chǔ)在知識(shí)庫(kù),將該挖掘模型存儲(chǔ)于PMML模型庫(kù)。知識(shí)庫(kù)中的結(jié)果由推理評(píng)估模塊評(píng)估解釋后展示出來(lái)。知識(shí)庫(kù)存放數(shù)據(jù)挖掘所需要的領(lǐng)域知識(shí)以及挖掘結(jié)果等,用戶可以通過(guò)知識(shí)管理模塊對(duì)知識(shí)庫(kù)進(jìn)行管理。

2數(shù)據(jù)倉(cāng)庫(kù)和聯(lián)機(jī)分析處理OI.AP的設(shè)計(jì)
在DMSPM中,數(shù)據(jù)倉(cāng)庫(kù)的構(gòu)建過(guò)程如下:
(1)概念模型設(shè)計(jì):界定系統(tǒng)邊界,包括供應(yīng)商選擇和評(píng)估、采購(gòu)計(jì)劃制定等;涉及數(shù)據(jù)有供應(yīng)商和物料目錄、價(jià)格和反饋記錄等。描述采購(gòu)主題域,以訂單編號(hào)為公共碼鍵,屬性組包括物料編號(hào)、供應(yīng)商編號(hào)、發(fā)出日期、收貨日期、合格率、數(shù)量等。
(2)邏輯模型設(shè)計(jì):采用單一粒度,直接存儲(chǔ)細(xì)節(jié)數(shù)據(jù);用時(shí)間屬性和物料性質(zhì)屬性來(lái)分割數(shù)據(jù),以方便實(shí)施,且與粒度劃分層次相適應(yīng)。維表和事實(shí)表主要部分設(shè)計(jì)如圖2所示。

(3)物理模型設(shè)計(jì):采用供應(yīng)商編號(hào)和物料號(hào)作為索引字段;采購(gòu)數(shù)據(jù)存放于磁盤(pán);最優(yōu)塊大小取為4K,自動(dòng)設(shè)置高速緩沖區(qū)大小,緩沖區(qū)個(gè)數(shù)可以靈活設(shè)置。
(4)數(shù)據(jù)倉(cāng)庫(kù)的生成:采用Sql server2000的Analysis Services來(lái)建立采購(gòu)數(shù)據(jù)集市,利用數(shù)據(jù)集成轉(zhuǎn)換工具DTS作為數(shù)據(jù)集成開(kāi)發(fā)工具。從ERP數(shù)據(jù)庫(kù)中讀取數(shù)據(jù),進(jìn)行數(shù)據(jù)轉(zhuǎn)換操作,以屬性平均值填充空缺值;對(duì)噪聲數(shù)據(jù),使用分箱方法按箱中值平滑。通過(guò)腳本處理語(yǔ)言和存儲(chǔ)過(guò)程實(shí)現(xiàn)一些較復(fù)雜的數(shù)據(jù)有效性檢查等操作。
OLAP從不同角度和層次查詢滿足分析需求的數(shù)據(jù),其基本操作包括:上卷、下鉆等。本文是在ERP系統(tǒng)中調(diào)用ADO對(duì)象來(lái)操作多維數(shù)據(jù)集,直接在ERP系統(tǒng)中分析采購(gòu)數(shù)據(jù)。
3任務(wù)引擎和挖掘引擎的設(shè)計(jì)
DMSPM采用任務(wù)驅(qū)動(dòng)機(jī)制,由挖掘向?qū)傻娜蝿?wù)交給任務(wù)引擎,一部分任務(wù)是通過(guò)知識(shí)庫(kù)和推理評(píng)估模塊完成,另一部分是由挖掘引擎執(zhí)行,例如物料價(jià)格預(yù)測(cè)以及采購(gòu)風(fēng)險(xiǎn)評(píng)估等。任務(wù)采用類(lèi)sQL語(yǔ)言MDL描述,其語(yǔ)法如下:
挖掘引擎根據(jù)MDL所描述任務(wù),選擇不同挖掘算法。因?yàn)橛?jì)算模型和算法非組件化開(kāi)發(fā),工作流程比較固定,缺乏靈活性,所以通過(guò)研究挖掘模型和算法,DMSPM實(shí)現(xiàn)事務(wù)和流程的分離、計(jì)算模型和工具的分離,形成一個(gè)模型求解的工具箱。將改進(jìn)過(guò)的Apdod算法、ID3算法以及k-means算法等封裝到不同類(lèi)中,根據(jù)任務(wù)引擎的要求選擇不同的類(lèi)來(lái)完成挖掘任務(wù)。主要挖掘任務(wù)包括物料價(jià)格預(yù)測(cè)以及采購(gòu)風(fēng)險(xiǎn)評(píng)估等。挖掘工具類(lèi)的輸入?yún)?shù)由任務(wù)指定,包括候選屬性集等,輸出結(jié)果存放在知識(shí)庫(kù)中。為了實(shí)現(xiàn)數(shù)據(jù)挖掘模型的描述、管理標(biāo)準(zhǔn)化和可移植性,系統(tǒng)采用PMML定義挖掘模型,并存放在PMML模型庫(kù)中,使DMSPM的挖掘模型可以被別的挖掘系統(tǒng)所共享,實(shí)現(xiàn)模型交換。
4知識(shí)庫(kù)和推理評(píng)估模塊的設(shè)計(jì)
知識(shí)庫(kù)是推理評(píng)估模塊運(yùn)行的基礎(chǔ),它包括數(shù)據(jù)倉(cāng)庫(kù)定義子庫(kù)、主題說(shuō)明子庫(kù)、物料清單子庫(kù)、隸屬函數(shù)子庫(kù)、結(jié)論子庫(kù)等。其中結(jié)論子庫(kù)主要內(nèi)容是與供應(yīng)商相關(guān)的指標(biāo):一部分是挖掘任務(wù)的結(jié)果,如供應(yīng)商等級(jí)、物料價(jià)格預(yù)測(cè)等,另一部分是訂單反饋中對(duì)供應(yīng)商滿意度、交貨準(zhǔn)時(shí)性、質(zhì)量合格率等,這樣就形成了客觀挖掘和主觀評(píng)價(jià)共同形成評(píng)估供應(yīng)商的要素。結(jié)論子庫(kù)還包括通過(guò)人機(jī)界面輸入的采購(gòu)要求,如價(jià)格、質(zhì)量等,這些指標(biāo)都將決定采購(gòu)計(jì)劃的生成。隸屬函數(shù)子庫(kù)定義了各種模糊屬性對(duì)應(yīng)數(shù)值表示的隸屬函數(shù),將模糊的定性信息量化,以供推理評(píng)估模塊處理。推理評(píng)估模塊根據(jù)用戶的采購(gòu)要求,結(jié)合局部數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)和知識(shí)庫(kù)中的知識(shí),選擇合適算法,對(duì)供應(yīng)商進(jìn)行評(píng)估以及制定采購(gòu)計(jì)劃。以下算法l是對(duì)供應(yīng)商進(jìn)行評(píng)估的一種算法,算法2是制定采購(gòu)計(jì)劃的一種算法。算法l(Evaluate_provider):
供應(yīng)商評(píng)估
從結(jié)論子庫(kù)提取與供應(yīng)商相關(guān)指標(biāo),將指標(biāo)按照隸屬函數(shù)定義轉(zhuǎn)換
為參數(shù)值(Pi);
提取事先設(shè)定的不同指標(biāo)所對(duì)應(yīng)的權(quán)值(wi):
將參數(shù)值和權(quán)值進(jìn)行加權(quán)相加,即評(píng)估值
記錄每個(gè)供應(yīng)商的評(píng)估值,在人機(jī)界面中顯示出來(lái)//算法1結(jié)束算法2(Purchase_plan):
//制定采購(gòu)計(jì)劃
提取主生產(chǎn)計(jì)劃,根據(jù)物料清單,將產(chǎn)品分解,獲得采購(gòu)物料需求量:
去除庫(kù)存中存貨量,得到物料訂貨量且按時(shí)區(qū)匯總:
將任務(wù)向?qū)Ю镏付ǖ牟少?gòu)要求,通過(guò)隸屬函數(shù)轉(zhuǎn)換為相應(yīng)采購(gòu)影響因子:
For(各時(shí)區(qū)內(nèi)的各種物料){
選擇可以供應(yīng)該物料、采購(gòu)提前期待舍要求并且評(píng)估值達(dá)到一定
標(biāo)準(zhǔn)的供應(yīng)商:
根據(jù)采購(gòu)影響因子,計(jì)算供應(yīng)商權(quán)值:
While(物料需求量>0){
根據(jù)權(quán)值,選擇最合適的供應(yīng)商:
根據(jù)物料需求日期和該供應(yīng)商的提前期。計(jì)算出訂單發(fā)出日期:
lf(物料需求量>該供應(yīng)商最大供應(yīng)量){
物料需求量=物料需求量.該供應(yīng)商最大供應(yīng)量;
從該物料供應(yīng)商中刪除該供應(yīng)商:
}
}
}
生成采購(gòu)計(jì)劃//算法2結(jié)束
5人機(jī)界面
DMSPM的人機(jī)界面是與ERP原有系統(tǒng)結(jié)合的重要接口,主要包括了以下幾個(gè)部分:
(1)決策管理:包括了采購(gòu)管理中的決策信息,如供應(yīng)商評(píng)估、采購(gòu)計(jì)劃、價(jià)格預(yù)測(cè)等,用戶可以看到系統(tǒng)中已定義好的決策信息,也可以生成新的決策。有的新的決策可以從推理評(píng)估模塊中獲得,有的需要利用挖掘向?qū)Ы⑿碌耐诰蚰P蛠?lái)得到。
(2)挖掘向?qū)В河捎跀?shù)據(jù)量總是在不斷激增,而用戶所需信息又有一定的限制范圍,因此在增加用戶交互的同時(shí)如何改進(jìn)挖掘處理效率是一個(gè)重要問(wèn)題,解決這個(gè)問(wèn)題的方法就是基于約束的數(shù)據(jù)挖掘,它提供了額外的控制方法,允許用戶說(shuō)明和使用約束,引導(dǎo)數(shù)據(jù)挖掘系統(tǒng)進(jìn)行搜索。在挖掘向?qū)е校试S用戶自己選擇屬性集,定義領(lǐng)域知識(shí),運(yùn)用不同挖掘算法等。由此生成任務(wù)模型,可以由任務(wù)管理保存或調(diào)出,再交給任務(wù)引擎來(lái)完成。
(3)知識(shí)管理:包括接受采購(gòu)要求、修改隸屬函數(shù)、實(shí)現(xiàn)物料清單添加修改等。
(4)OLAP服務(wù)和ERP接口:OLAP服務(wù)提供接口函數(shù)操作OLAP服務(wù)器中的多維數(shù)據(jù)集,可以直接在ERP系統(tǒng)中分析采購(gòu)數(shù)據(jù);ERP接口提供了一系列API函數(shù),使ERP系統(tǒng)可以通過(guò)調(diào)用這些函數(shù)將決策信息結(jié)合到ERP系統(tǒng)流程中。例如在制定采購(gòu)計(jì)劃過(guò)程中,系統(tǒng)智能顯示相關(guān)決策信息,包括供應(yīng)商選擇、物料價(jià)格走勢(shì)、自動(dòng)生成采購(gòu)計(jì)劃等。
6結(jié)束語(yǔ)
數(shù)據(jù)挖掘與信息系統(tǒng)的緊密結(jié)合,增強(qiáng)了ERP的決策功能,充分滿足了用戶需求。系統(tǒng)采用基于約束的交互式數(shù)據(jù)挖掘技術(shù),提高了挖掘效率和靈活性;將計(jì)算模型和工具的分離,形成一個(gè)模型求解的工具箱,便于使用和維護(hù)。當(dāng)然,DMSPM僅僅是滿足了采購(gòu)中的決策要求,如果擴(kuò)展到銷(xiāo)售、生產(chǎn)、人力資源等其它ERP模塊上,就可以形成一個(gè)真正完整的ERP系統(tǒng)。
(注:本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文。)