
摘要:文章闡述了企業在兩化融合發展進程中數據開發利用的需求,給出了以實際操作層、信息系統層和數據分析層為組成部分的數據開發利用體系框架,并結合CRISP-DM模型提出了企業進行數據開發利用的實施過程,最后提出具體實施過程中的關鍵點。
關鍵詞:兩化融合;CRISP-DM模型;數據開發利用 文獻標識碼:A
中圖分類號:F427 文章編號:1009-2374(2015)21-0029-02 DOI:10.13535/j.cnki.11-4406/n.2015.21.015
信息化和工業化融合(以下簡稱“兩化融合”)是當今國家乃至世界發展的大趨勢,對于企業而言,兩化融合是將信息化作為手段,夯實工業化基礎,推進企業數據、技術、業務流程、組織結構的互動創新和持續優化,從而打造信息化環境下新型能力的過程。近年來,隨著企業單項應用的增加及集成度的提升,計算機對數據的處理能力顯著提高,隨之而來的數據量與日俱增。市場競爭的加劇、企業規模的增大、數據復雜度的提升都要求企業實現數據的開發利用,為領導決策提供相應的依據。為進一步規范企業數據的開發利用,《信息化與工業化融合管理體系要求》中也著重提出了“有效地開發利用數據”的要求。故本文提出在兩化融合過程中,企業利用CRISP-DM(cross-industry standard process for data mining)模型規范數據開發利用的過程。
1 數據開發利用體系框架
數據開發利用體系框架如圖1所示,可分為三個
部分:
1.1 實際操作層
涵蓋研發、制造、銷售等環節,是企業數據的最初來源和最終落腳點,各部門負責采集其中的數據,將其作為信息系統的輸入,并利用決策的結果對實際業務進行調整。
1.2 信息系統層
涵蓋企業ERP、OA、PLM等已有信息系統,對其進行集成應用,實現數據、接口的標準化和規范化,確保為數據分析層提供有效的數據。
1.3 數據分析層
涵蓋了數據倉庫、數據挖掘和決策支持/商業智能三部分,用于將信息系統中的數據提取出來,并根據需要進行轉換和存儲,然后按照特定目的進行挖掘、統計和分析,從而產生供管理者參考的決策,可包括:研發方向調整、銷售市場細分、職能部門優化等,最終將決策反饋至實際操作層,并對信息系統作相應變更。
2 利用CRISP-DM模型實現企業數據開發利用
CRISP-DM由歐盟機構于1999年聯合起草,為全工業界提供數據挖掘利用的全生命周期管理標準。CRISP-DM模型定義了六個過程,按照此模型,企業可按如下步驟實施數據開發利用:
2.1 商業理解
從企業戰略出發,確定可持續競爭優勢和需要打造的信息化環境下新型能力,再細化到需要實現的兩化融合目標,從待實現的目標中提出需解決的數據開發利用問題,進行數據開發利用策劃,需涵蓋開發目標、涉及部門、數據來源、開發過程等。
2.2 數據理解
根據數據開發利用策劃,從各部門、各流程、各崗位、各系統中收集相關數據,并對數據質量加以鑒別,以確保數據的準確性、全面性、有效性,此外,還需初步探索數據自身的特征及數據間的相互聯系,形成對潛在信息的假設。
2.3 數據準備
根據與數據開發利用目標的相關性、數據質量及開發利用技術,進行建模前的數據準備。首先進行數據表制作,將數據統一格式后進行記錄,然后為適應建模工具進行數據清理,這一過程一般需反復實施多次,直至篩選出最終數據集。
2.4 建立模型
根據待數據開發利用的問題類型,選擇對應的建模技術。與以往類似的可對原技術加以修改沿用,與以往不相同的則需要重新建模。在此過程中,當涉及到數據不匹配時,可能會重新進行數據準備過程,實現對數據參數的精準校對。
2.5 模型評估
在數據模型最終部署之前,需對修改和新增的模型進行再評估,回顧其中每個步驟、每個數據、每個邏輯,尤其要考慮和兩化融合目標的關聯性,確定是否可解決提出的數據開發利用問題,為模型部署成功提供
保障。
2.6 部署實施
由信息部門和相關業務部門共同完成相關信息系統的搭建、改造和完善,明確各部門、各崗位參與數據開發利用的主體和具體職責,以制度文件的形式規范下來,共同參與數據開發利用過程。
3 數據開發利用的關鍵點
根據對應的規范要求和過程指導,為確保有效開發和利用數據,在具體實施過程中應重點關注以下幾點:
3.1 重視商業理解,統籌管理全局
商業理解是數據開發利用的第一步,它關注數據開發利用過程中的方向性問題。應由領導層深入參與,正確把握兩化融合目標,明確待解決問題對達成目標的關聯度和貢獻性,在各部門提出需求的基礎上,重點關注最迫切的數據開發利用方向。只有始終抓住這個重點,才能對后續的實施全局起決定性的指導作用。
3.2 嚴把數據來源,推進數據標準
數據的可靠性、真實性、完整性是數據開發利用的基礎,也是達成兩化融合目標的保障。如果數據質量不好,即使模型很完美,也不可避免產生一個偏差或者錯誤的結果。應嚴格篩選和過濾各部門、流程、崗位及系統提供的數據,推進數據處理環節的標準化,并建立相應的數據校對機制,逐步提高數據的質量。
3.3 落實責任主體,明確具體職責
職責分配落實是確保數據開發利用有序進行的關鍵,也是長期進行數據治理的必要措施。如果不能從制度上落實職責,很容易造成數據的遺漏和丟失。應制定相關制度,規定數據采集和維護的周期,指定專門崗位按制度要求負責數據的采集、匯總、校驗、錄入等,并由上級領導對數據的真實性進行審核,對數據的準確性負責。
3.4 定期回顧總結,提升決策質量
對數據的定期回顧和總結是不斷提升決策質量的必要環節,它關注于數據開發利用中的方向修正問題。如果無法通過回顧總結發現其中的疏漏和不完善,會對決策準確性造成影響。應周期性地對數據的質量及數據對達成目標的貢獻性進行回顧總結,調整優化相應業務流程和崗位職責,對應地更新信息系統,確保數據開發利用的高效和準確。
4 結語
隨著工業4.0時代的到來,IT技術的發展為企業帶來了新的思路,數據作為企業各生產環節的核心,對其進行開發利用是企業必須持續推進、不斷提升的系統性、全局性工作。必須圍繞數據對企業的經營發展做長遠布局,梳理當前已有的管理、生產、銷售、人員等數據,調整優化信息系統、管理制度、崗位職責,實現企業從傳統制造向智能制造的轉型。
參考文獻
[1] 中華人民共和國工業和信息化部.信息化和工業化融合管理體系要求(試行)[S].2014.
[2] 野村綜合研究所.圖解CIO工作指南[M].北京:人民郵電出版社,2014.
[3] 郭亮.用CRISP-DM模型來規范企業數據中心建設
[J].華北科技學院學報,2008,4(5).
作者簡介:華苗苗(1987-),女,浙江人,浙江省電子信息產品檢驗所助理工程師,碩士,研究方向:兩化融合。
(責任編輯:周 瓊)