陳亞杰,董 俊,鄭芳霖,王 洋
(中國船舶重工集團第七〇四研究所,上海 200031)
隨著信息科技建設的深入發展,越來越多的應用系統在企業中得到了應用實施。但由于先期缺乏對數據標準、信息共享問題的統籌考慮,企業數據資源通常存在于多個異構或同構的系統中,造成相關聯業務系統數據不同步、數據不一致和數據冗余問題,以及數據標準不統一、共享過程中不知以誰為“主”等問題日益凸顯,產生所謂的“信息孤島”。這種局面對業務部門來說,不能準確測算分析各項目的成本利潤數據;對于決策管理方面,可能由于無法獲取經營管理方面的一致性信息,進而影響領導層的最終決策。由此可見,實現對企業主數據的統一管理,不僅僅是一個局部專業的信息化本身的問題,它往往影響到企業生產經營過程的全局。因此,全面解決單位信息數據唯一性、精確性和完整性的問題是企業信息化之路的重要課題。
如何理解和定義主數據?主數據可以簡單通俗地描述為各應用系統間共享的數據,是企業內部核心業務實體對象的數據。主數據是表示業務實體對象的基準數據,及其被引用的關聯屬性數據,包括員工信息、客戶信息、供應商信息和物料信息等[1]。
主數據之所以稱為主數據,是由于其在企業中具有較高業務價值。作為能夠在企業單位內跨部門共享的,并被重復利用的數據對象,主數據可以在多個異構應用系統中同時存在。因為主數據在企業數據信息系統的重要性、對各應用系統影響的廣泛性,所以必須嚴格控制主數據的時效性和準確性,對主數據的實時動態更新維護尤為必要。
總的說來,主要數據有比較明顯的特征,表現為:
1)在業務活動中相對“靜止”、變化緩慢的數據;
2)在企業各業務系統中的交互共享數據;3)業務交易數據的派生源頭。
主數據管理是指通過一組規則、一些技術手段和一系列解決方案的實施,確保主數據的統一,保證業務數據在整個企業范圍內的唯一性、完整性、關聯性和準確性。主數據管理可以通過科學的整理和整合手段,實現企業范圍內的主數據協同統一。主數據管理幫助企業對既有數據進行梳理、分類,并歸并冗余,從分散的業務系統中將最重要的、共享頻率高的業務主數據,集中進行數據清洗整理、轉換,并加以豐富,然后再將這些標準、準確、完整的主數據反饋分發到各應用系統。
主數據管理的實現,關鍵在于“管理”。主數據管理提供了一種提煉、共享主數據的方法,使企業能夠對分散存儲在各應用系統中的數據進行有效管理。通過有效的主數據管理,可以建立一個企業級數據標準,通過加強對各業務系統中比較共性的數據實體和模型進行管理,避免因業務概念出現較大偏差造成的數據信息謬誤,從而降低企業內信息孤島出現的幾率,確保各應用系統之間能實現數據的邏輯關聯和共享。進而更有效的加強各系統在企業層面的互動,在提高數據質量、信息集成的同時,提高企業的運營效益。
實現主數據管理的重要意義在于:
1)從企業業務層面來看,企業搭建了一個擁有統一訪問接口的主數據規則庫;擁有集中統一的、準確干凈的集成數據中心;為企業各業務部門提供一致完整的、可信賴的共享數據信息交互平臺;廣義上講,也為業務管理和經營決策層提供了可靠的支撐載體。
2)從IT建設層面來看,實現主數據管理,構建覆蓋全企業的數據管理基礎和相應的數據管理規范,增強了IT架構的靈活性,有助于實時應對企業業務需求的變化,同時在一定程度上降低數據接口成本和管理維護成本。

圖1 主數據信息流交換原理
以某企業系統架構中主數據管理為例,主數據和各應用系統之間信息流交換流向及原理見圖1,主要包括以下四個過程:
1)業務系統數據信息的變更觸發對企業主數據的變更;
2)主數據管理系統將整合后統一、完整、精確的主數據反饋給所有關聯應用系統(不僅是業務數據改變的系統);
3)主數據管理系統通過創建數據字典實現對企業數據集成的要素定義;
4)主數據管理系統為整個企業數據倉庫系統提供準確有效的信息依據。
目前,業界市場已經涌現出一些成熟的主數據管理軟件產品,如Oracle MDM、SAP MDM主數據管理組件、IBM WebSphere的數據整合平臺等,這些產品提供從咨詢、建設、實施到培訓等一系列服務,一定程度上為某些企業提供了主數據管理解決方案[2]。但是這些成熟的企業軟件或組件并不能完全滿足國內各類企業的具體業務需求,而且這些組件的實施需要很多其他軟件的支撐,價格昂貴、實現周期長。
因此,如何根據自身企業的業務需求和當前業務數據的存儲現狀,研究一套符合企業特色的主數據管理解決方案顯得尤為重要。
通過研究國內外主數據管理產品,不難發現當前的主數據管理(MDM)產品主要功能大同小異,基本上都是進行數據分析、清理、整合、再進行發布利用。這也是本文探索適合自身企業的主數據管理解決方案時,可以沿用的一個思路。
1)數據信息不完整:例如,工號位數不標準,部分姓名前后有空格,歷時數據保留期限不一致等;
2)關聯業務系統數據不同步:某員工工號在一個系統已刪除,另一個系統還保留;
3)數據冗余:例如一個員工在系統中以拼音和工號為員工ID分別進入了系統,產生同一員工的重復記錄。
由于數據源存于異構應用系統中,沒有建立數據的統一服務機制,數據更新沒有實時聯動,也沒有數據的清洗、去重機制,造成越來越多的數據錯誤。
1)分析企業業務主數據來源,初步整理:了解分析主數據的來源和現狀,產生不同數據源和應用環境下的數據集成的方案,獲取業務主數據源;分析探究數據內容、結構的合理性,分析關聯數據的沖突和問題,對各應用系統的相同數據條目進行識別、去重、整合,形成初步的主數據。
2)建立企業主數據編碼規范和數據字典:數據集成是企業應用系統集成的基礎,對信息實統一標識是數據集成的前提。依據穩定性和完備性、繼承性和擴展性的原則構造信息編碼結構[3],通過信息編碼來消除數據冗余。通過比對數據項的幾個關鍵屬性是否已經存在于主數據中,沒有則視為全新數據,并為全新的數據項賦予按照預定義規則產生的唯一標識。建立統一的數據字典,建立標準的數據編碼體系,構建企業編碼數據庫,從而形成企業的基礎數據平臺,為應用系統數據集成提供更有效的前提。
3)建立企業業務主數據模型:建立適合本企業應用管理模式的MDM業務及數據模型,可以更方便有效地適應各種需求變化的挑戰,數據建模也是大多數成熟的企業信息化管理的必經之路。
4)數據一致性比對整理:對于各系統的數據出現不一致的定義及使用方式時,需要解決錯誤和矛盾之處,形成映射關系表,創建正確、完整的主數據系統。
5)主數據的發布和使用:通過歸納整理,對企業各業務管理的主數據形成唯一的數據庫,數據來源唯一,通過企業SOA架構將之發布為WebService服務,以供企業其他需要使用這些數據的業務系統調用。數據使用者對主數據中的元數據部分只能進行讀取查看操作,對其擴展屬性可增加和修改,但所有數據的來源必須保證是唯一的。
以上五個步驟是一個循環往復的過程,主數據管理對數據治理的過程貫穿于整個生命周期,不斷地識別、整理、整合形成準確、統一、完備的主數據共享給每個應用系統。
本文主要闡述了主數據和主數據管理的定義及分析,并對其解決方案提出了探索思路。主數據管理不是一次性工程,而是一個持續性項目,需要分階段、分步驟開展工作。而科研院所的主數據管理更是處于一個探索的初級階段,有待于各方面包括業務數據的整合、提煉和工具軟件的引進相結合等等,這些工作循序漸進地開展,建立完善的主數據管理是一個任重道遠的長期項目,需要持續地探索前進。
[1]王波, 陳德焜, 史亞貝.通過標準化主數據實現高校數據交換[J].管理技術,2008.
[2]李檬, 王其昊, 王璐.國家電網公司物資主數據實施的方法論[J].企業技術開發,2012(32).
[3]黃云華.企業編碼主數據模型研究[J].制造技術與機床,2007(3).