宋 瑞
(沈陽理工大學經濟管理學院 湖北 武漢 430000)
信息資源共享是實現大數據的前提,大數據是現代企業競爭力的利器,是企業獲得內外部情報以及商機挖掘的重要途徑[1-2]。但信息系統種類繁多,信息標準化又不統一,面對海量數據的大量來襲企業反而像陷入信息孤島中一般被桎梏住[3-4]。因此,處于數字化轉型階段的企業,需要找到一套應對信息孤島問題的方式方法,通過數據共享實現管理的智能決策。企業為了實現內部系統間的信息資源互通所使用的方式方法即為企業數據共享[5-7]。國內外研究現狀可知,國外學者提出企業主數據管理的方式可分為知識庫系統、主數據標準、領導系統和集中主數據系統等,這些概念非常具有參考價值[8]。數據共享在企業數字化轉型中占據著核心地位,因此必須要重視。Oracle、SAP與IBM針對數據共享提出了主數據管理這個重要概念,由此引申出現代企業數據共享可以主要通過主數據管理、部分數據集成和總體標準制定三種方式來實現[9]。其中主數據管理的應用最為廣泛。
企業管理中,傳統數據共享主要分為局部數據共享和全局數據共享,與這兩種模型相呼應的是部分數據集成方式和總體制定標準的共享數據方式。
為了達到獲取異構系統中部分數據的目的,企業通過語義轉換的方式將部分系統中的部分數據統一集中到一個平臺上,綜合分析處理和共享這部分數據的方式,即為部分數據集成,具體如圖1所示。

圖1 傳統數據共享實現方式1部分數據集成
如圖1可知,存在于企業中的各系統沒有進行統一規劃,各部門從自身需求出發獨立發起指令,數據的共享和綜合分析都是由不同集成目的觸發的。圖中集成平臺1和集成平臺2分別實現了應用系統1—3和應用系統4—6的數據標準化,轉化后對應的數據屬性分別為S和S',兩者間的數據標準沒有真正實現完全統一。異構系統間的部分數據通過集成后成了信息孤島。
從企業頂層開始設計出一套數據標準,并將其作為企業全部系統的數據執行準則,要求系統內原有異構應用系統都嚴格遵守,最終實現數據共享的方式即為總體制定標準。領導系統標準和總體制定最優標準是總體定制標準的兩種方法。由信息標準化委員會牽頭完成企業信息系統的調研工作,先從元數據、數據元、分類編碼等分類入手,制定出一套適用于本企業的最優標準,再下發給元數據、數據元和分類編碼,就是圖2中演示的執行步驟,最后應用系統1—4的數據屬性均會變成S,信息孤島不復存在,數據的綜合處理及共享便得以實現,這就是總體定制最優標準。此過程中信息分類編碼必須與最優標準統一,如果執行遭到拒絕則需要推倒原系統進行重建。

圖2 傳統數據共享實現方式 1總體制定最優標準
在領導系統標準方式中,企業則無須費力找到一套最優數據標準,只需制定一個系統作為領導系統,其他系統中嚴格執行領導系統中的數據標準即可,如圖3所示。

圖3 傳統數據共享實現方式2領導系統標準
部分數據集成和總體制定標準各有利弊,是企業實現數據共享的兩種傳統方式,在信息數據不大的情況下能夠幫助企業解決部分數據共享需求。
企業在進行數據共享方式的選擇時需要將數據共享的可實現性,以及選擇此方式需要付出的成本、速度、可拓展性等因素考慮在內。速度可以簡單理解為時間成本;可拓展性則是基于大數據不斷發展前提下,數據標準的范圍和數量是否具有足夠的延展性??蓪崿F性最強、速度最快、成本最低、可拓展性最大的數據共享方式最應該被選擇,可用公式表示為:
S=f(R,C,V,E)
其中,R為可實現性,C為成本,V為速度,E為可拓展性。
在企業數字化轉型的大條件下,利用S公式分析部分數據集成和總體制定標準的變化和指標性,為企業選擇提供參考。
2.1.1 部分數據集成
圖4是通過部分數據集成方式實現的企業數據共享,由多個不同的信息系統集成一個大的異構平臺。

圖4 大數據條件下部分數據集成方式的變化
在大數據條件下,對這種集成方式的變化進行分析,
①數據共享的可實現性。部分數據集成方式是可針對局部信息共享的,能夠很好地處理部分系統中的局部數據,但由于數據標準不統一,會造成信息孤島的產生,無法解決整個企業系統的數據共享問題。
②成本。需要成本投入的地方有接口調試費和系統調研費。其中,系統調研費的支出最多。
③速度。需要投入時間成本的環節有集成平臺開發、數據集成、系統設計和調研。此處,平臺集成的時間與系統開發的時間基本對等。
④可拓展性。如果按照海量數據的變化需求更改集成的數據與系統、調整平臺的功能、整理和清理系統中的數據,就必須對集成平臺進行新的設計和開發,需要付出的時間和經濟成本會引起很多爭議,因此可拓展性無法與總體制定的標準方式相比。
將上述兩種數據共享方式的四個性能指標列表對比后發現,其各項指標的表現都有所欠缺,企業需要盡快尋得一條更適合數字化轉型的數據共享實現方式,以提高企業的競爭力。
2.1.2 總體制定標準
觀察圖5再對比圖2,相較于之前傳統的數據標準,在原有的元數據、數據元和信息分類編碼的基礎上又增加了數據安全、數據分析、非結構化數據表達和數據質量等與海量數據相對應的新數據標準。另外,多且復雜的系統已經基本能夠滿足企業對于系統功能的所有業務需求,新建系統可有可無,因此將多種數據標準嚴格落實到企業全部異構系統中則更為實用。但無論選擇聯系開發商對系統中的數據標準進行修改還是推倒原系統重建,都會造成成本的浪費。

圖5 大數據條件下總體制定標準方式的變化
在大數據條件下,基于上述兩種變化對總體制定標準方式的個性指標進行分析如下。
①數據共享的可實現性:企業標準的制定離不開一個強大的組織,強大的組織需要專業的大數據人才。想要推倒企業原來的系統,在龐大的海量數據標準面前重新構建系統無疑是事半功倍,因此通過總體制定標準來解決企業數據共享的問題是基本上不具備可行性。
②成本。需要成本投入的地方有系統修改、系統重建、標準宣貫、標準制定、招聘專家和系統調研等,其中系統修改和重建屬于重復性支出。
③速度。需要投入時間成本的環節有修改或者重建系統、數據標準宣貫、標準的制定與更新、系統調研等。單個系統的修改或重建時長在2~3個月之間,需要改動或者重建的系統越多需要的時間也越長,總體制定標準方式的速度可減少一半。
④可拓展性。數據標準的制定和實施決定著制定標準方式的可拓展性;根據大數據需求制定而得的數據標準是可以滿足企業數據共享需求的,這部分可拓展性較強;將多種數據標準強行套用到海量數據中,是非常有難度的,因此這部分可拓展性較弱。
在企業數字化轉型的道路中,在大數據條件下,主數據管理的誕生為解決數據共享問題提供了一條嶄新的思路。在企業中具有極高業務價值的,能夠實現整個系統共享的數據,即為主數據。主數據管理就是將能夠代表企業核心業務實體的數據作為主數據從企業全部數據中抽離出來,并統一管理主數據的數據質量、數據元和信息分類編碼,然后通過單一用戶視圖的方式分發給各個應用系統。圖6則是對這一方式的具體圖解。企業中使用頻繁的且具有高業務價值的數據可被確定為主數據,例如生產、供應、銷售、財務、績效、人事等。負責對主數據進行管理的是主數據管理系統,經過一致性檢測后,系統會標準化管理主數據的信息分類編碼、元數據和數據元,并主動修復、匹配和清晰這些數據,保證了主數據的質量與標準化程度。為了確保發布到各應用系統中的主數據的同源性,采用MDM數據庫存儲標準化后的主數據,使企業異構系統中數據共享功能的延展性發揮到最大。

圖6 大數據條件下企業數據共享實現方式——主數據管理
大數據側重數據的類型和數量,而主數據卻是以質量為核心,主數據主要來自對大數據的提煉,因此可以通過有機組織主數據的方法進一步提升其數據價值和一致性。無論是從企業對大數據的要求出發,還是從合理降本增效的角度考慮,企業數字化轉型離不開科學合理的數據共享方式。
對大數據條件下通過主數據管理實現數據共享的個性指標分析如下:
(1)數據共享的可實現性。將能夠代表企業核心業務實體的數據作為主數據從企業海量數據中抽離出來,并統一管理其數據質量、數據元和信息分類編碼,通過單一用戶視圖的方式分發給各個應用系統,既保證了主數據的同源性,又規范了數據的標準化,提高了處理速度,使數據共享的可行性得到了極大提升。
(2)成本。開發主數據管理系統的費用對等部分系統集成費用,低于總體制定標準的總支出。
(3)速度。相較于總體制定標準方式中,從標準定制到實施更新所消耗的時間,主數據管理用于開發和設計的時間更加短。
(4)可拓展性。為了方便管理主數據的數據質量、數據分發和清理,主數據管理系統將主數據元與相應的數據集中在了一個平臺中,增加了系統可擴展性。
綜上所述,對比部分數據集成、總體制定標準和主數據管理這三種數據共享方式的可實現性、成本、時間和可拓展性得出,大數據條件下,主數據管理的個性指標均表現十分優秀,不但可實現性強,而且速度更快,所需投入的成本更低,也具備足夠的可拓展性。因此想要應對企業數字化轉型中出現的數據共享問題,主數據管理必然是最佳選擇。
綜上所述,基于大數據特性的主數據管理可以最大限度地實現企業的數據共享,是大數據時代前提下企業最好的選擇??梢杂行椭髽I突破大數據的桎梏,解決信息孤島和海量數據問題,更能為企業的可視化展示以及信息資源的深度挖掘打下堅實的基礎。