耿占佳王 南付玉霞吳 慧張 靜耿占雄
(1-5石家莊信息工程職業學院 河北 石家莊 050035)
(6石家莊市欒城區人民檢察院 河北 石家莊 050000)
基于OLAP的煉鋼生產物流數據分析
耿占佳1王 南2付玉霞3吳 慧4張 靜5耿占雄6
(1-5石家莊信息工程職業學院 河北 石家莊 050035)
(6石家莊市欒城區人民檢察院 河北 石家莊 050000)
鋼廠在煉鋼生產過程會產生龐大的物流數據,如何有效的進行數據分析,以幫助決策者提高決策力成為亟待解決的問題。本文在數據倉庫技術(DW)和數據挖掘技術(DM)的基礎上,基于聯機分析處理技術(OLAP)創建煉鋼生產物流信息數據倉庫、物流信息多維數據集,進行數據挖掘,最終實現科學分析數據,幫助管理者進行決策。
數據倉庫;聯機分析處理;物流數據;數據挖掘
1.1 數據倉庫中的數據的構建是多維視圖架構,目的是用于決策支持。數據倉庫技術具有以下三方面的主要功能。一數據倉庫具有對物流信息歷史數據進行查詢的功能,并能夠以企業級的標準報表和視圖形式為用戶提供前端顯示。二數據倉庫用來構建多維視圖數據集,并在此基礎上進行多維分析。三數據挖掘的實現以數據倉庫的成功建立為基礎。
1.2 數據挖掘(Data Mining),就是從已經存放在數據倉庫或其他數據載體的大量的數據中抽取并得到準確的、隱晦的、有意義的、直觀的數據信息描述的過程。
典型的數據挖掘系統的結構如圖1所示。

圖1 數據挖掘系統結構Fig. 1 The structure of Data Mining
1.3 OLAP是用來針對特定分析目的(主題)設計多維數據集,并對多維數據集進行選擇、分類、查詢、修改等操作。而當前各類數據庫系統的實際應用的情況說明,單一的關系型數據庫系統(OLTP數據庫)不能滿足企業用戶對數據庫查詢的深層次要求,單靠SQL語句對數據庫進行簡單查詢也不能滿足企業分析人員的多角度分析要求。在這一背景下多維數據集和多維分析的概念被提上了發展的前臺。
OLAP通過多維方式對企業生產過程實時和歷史數據進行分析、查詢和前端顯示。OLAP的特點或者說優勢,便是仿照數據庫查詢用戶的多角度思考模式,預先為用戶建立多維的數據庫模型,使其便可以方便快速地從各個分析角度獲取生產過程數據,具有極大的分析靈活性。
2.1 煉鋼生產物流信息系統總體設計方案
一以某鋼廠煉鋼生產過程中的物流信息現狀進行分析,發現主要需求集中在天車調度管理與成本控制兩方面;二以數據倉庫技術為基礎,采用OLAP技術實現數據分析,煉鋼物流信息系統架構主要分為四層,聯機分析層、DW層、用戶接口層、OLTP層。其中聯機分析層的實現平臺為SQL數據庫系統中的Analysis Manager功能模塊,關系數據庫層以源歷史數據庫作為數據源;三煉鋼生產物流信息系統設計的目的是為了進行成本分析。成本分析的主題可分為3個子主題:原料主題、作業點主題、應商主題。四通過對煉鋼物流數據進行分析研究,發現影響原料成本的主要因素是原料的消耗情況。原料消耗情況又受時間、作業點、供應商等多方因素影響。根據鋼廠現狀,本文設計以下維度:日期維的粒度、原料消耗信息維的粒度、供應商維的粒度。五建立物理數據庫。在SQL Server 2000數據庫系統的Enterprise Manager(企業管理器)模塊中,分別建立關系數據庫、維度表與事實表。
2.2 物流信息數據倉庫的ETL實現
ETL(Extraction Transformation and Loading),指的是對異構目的數據源中數據的抽取、轉換和裝載。其過程是由前端ETL工具把源數據從分散無序的各種數據源中提取出來,在進行了有效性檢驗和數據格式統一化轉換后根據多維數據集的設計模式對這些處理過的基本數據進行OLAP聚合操作,最終導入至物流信息數據倉庫中。最終決策的分析與制定者可通過前端查詢工具分析數據倉庫內容,進而為企業制定合理的成本控制計劃與安全生產方案。
2.3 煉鋼生產物流信息數據倉庫的構建
(1)數據倉庫的建立以本機上的Windows Server 2003 Enterprise Editioin Servise Pack 2操作系統與Microsoft SQL Server 2000 Servise Pack 4企業版數據庫系統為平臺,聯機分析(OLAP)服務器的建立與功能實現的平臺為SQL數據庫系統的Analysis Manager模塊中的Analysis Services服務。
(2)在已經構建的數據倉庫的“多維數據集”節點,新建多維數據集,將“原料消耗成本”作為事實數據表,將“日期編號”、“原料編號”、“原料消耗點編號”作為多維數據集度量值,將維度設置為日期、原料消耗信息、原料信息、供應商信息,組織結構設置為星型模型,每一維度又下設不同的成員屬性。如時間維下設有日期編號、日期、年、月、日、周6個成員屬性等。
(3)元數據為分析人員對已構建的多維數據集提供了一個完整、全面、直觀的審視工具,整個多維數據集的所有關系、維度、數據源信息一目了然。作為數據倉庫的核心功能之一,元數據中的信息不僅描述了數據倉庫中數據分析主題的維度劃分形式,各個分析主題的屬性度量值在數據倉庫中的具體存儲位置也有描述,與數據倉庫分析主題有關的其它內容也有說明。從這個方面來說,一個準確實用的數據倉庫都建立在一個準確、清晰的元數據基礎上。本文構建好物流信息數據倉庫后的元數據顯示如圖2所示。

圖2 物流信息數據倉庫元數據Fig.2 The metadata in logistic data warehouse
本文從某鋼廠的現狀出發,通過創建物流信息數據倉庫與多維數據集,應用OLAP技術舉例說明了數據挖掘分析的應用,最終為管理者提供主題明確、挖掘適度、高效準確的分析結果,幫助決策者更好的管理企業。
[1] 丁琳琳,信俊昌,王國仁,黃山.基于Map-Reduce的海量數據高效Skyline查詢處理[J]. 計算機學報. 2011(10).
[2]王斌,徐照興.數據挖掘技術研究.電腦知識與技術,2009,27:6-9.
[3] 王爍生.煉鋼生產過程物流調度與優化項目研究. 河北科技大學碩士論文,2010,3:25-45.
[4] A.A.VAISMAN,M.M.ESPIL,M.PARADELA.P2P OLAP: Data model, implementation and case study Information Systems,2009,04:231-257.
Data analysis of steel making production logistics based on OLAP
GENG Zhan-jia, WANG Nan, FU Yu-xia, WU Hui, ZHANG Jing. (Shijiazhuang Information Engineering Vocational College, Hebei Province, Shijiazhuang 050035, China;) GENG Zhan-xiong.(The People's Procuratorate of Luancheng District, Shijiazhuang City, Hebei Province, Shijiazhuang 50000 China)
Steel in steel-making process will produce a large logistics data, how to effectively analyze data, to help decision makers to improve decisions become the problems to be solved. In this paper, the technology of data warehouse (DW) and data mining (DM) technology based on, on-line analytical processing (OLAP) create steelmaking production logistics information data warehouse and logistics information data cubes, data mining based on, and ultimately scientific analysis of the data, help managers to make decisions.
Data warehouse; On-line analytical processing; Logistics data; Data mining
TF345
A
1009-5624-(2016)02-0029-02