李孟
摘 要:數據管理是利用計算機技術對數據進行有效的采集、存儲、處理和應用的過程,目的在于充分有效發揮數據的價值。隨著大數據時代的到來,越來越多企業意識到數據將會給企業帶來的巨大經濟價值,馬云在致阿里巴巴股東公開信中就說過:“我們集團本質上是一家擴大數據價值的公司”。維克托·邁爾·舍恩伯格在《大數據時代》一書中通過上百個通俗易懂的案例生動闡述了大數據所引發的變革以及全新的商業模式與投資機會。然而,在這股“大數據浪潮”之下也需要我們冷靜下來思考一下,我們企業現階段的信息需求是什么,我們企業的數據管理處于什么層次。
關鍵詞:數據分析;數據挖掘;BI
中圖分類號:F279.23 文獻標志碼:A 文章編號:2095-2945(2017)23-0149-02
1 企業進行數據管理的必要性
企業中各類業務系統穩定運行,為何還要搭建企業的數據管理平臺?大部分企事業單位已經建立了比較完善的CRM、PM、OA、ERP等信息化系統,這些系統運行一段時間以后會在數據庫中產生大量分散、獨立的歷史數據。這種數據架構存在以下問題:
(1)從業務的視角來看
業務系統過多,彼此的數據沒有互通,大量的數據只是一些看不懂的數字,并不能獲得其背后所隱藏的有價值的信息。這種情況下,涉及到數據分析就麻煩了,可能需要分析人員從多個系統中提取數據,再進行數據整合,之后才能分析。而人為整合出錯率高,數據分析也存在不及時、效率低的問題。
(2)從系統的視角來看
隨著公司數據越來越大,各業務系統運行效率已經十分低下,而數據分析又是一項比較費資源的任務,對服務器造成更大的負擔,影響用戶體驗。因此自然會想到通過重新構建一個諸如數據倉庫之類的大數據處理平臺,將數據抽取出來,應用獨立服務器來處理數據查詢、分析任務,來釋放業務系統的壓力。
結合上面的問題來看,如何將數據轉化為信息,讓業務人員及管理者能掌握與利用這些信息來輔助決策,才是企業數據管理的重要意義所在。在大數據背景之下,必須要考慮到數據之間的關聯性,獨立分散的數據是沒有意義的,需要把數據放在一個完整的數據場景中才能看出存在的問題。
2 企業數據管理階段
2.1 養數據階段
在最初的養數據階段,企業內只有少量基礎數據,如零售企業只有進銷存的相關數據,而沒有消費者的行為數據,無法繪制出一個基本的消費者畫像,更談不上數據驅動業務了。
養數據應該包含以下三個方面:
(1)完善數據結構
要擴展數據的采集渠道以及覆蓋范圍,將企業數據庫中有的字段必須全部收集起來,盡可能地不要留白。暫時用不到的數據,本著先收集再應用的原則,把數據先養大。
(2)提高數據質量,將數據做精
現階段企業獲取數據如此容易,數據的增長速度如此之快,對于企業來說,控制數據源的質量和內容、保證數據完整性與規范性非常關鍵。開發數據分析應用的時候,數據就等于原材料;當原材料質量不過關的情況下,做出來的產品就很容易出問題。
(3)養成數據入庫的習慣
數據入庫就是盡可能的讓數據在數據庫中,別讓一些基礎數據躺在excel中。這樣做一是更安全,二是更利于數據的場景化,要把數據放在一個“數據框架”(場景)中,考慮數據之間的關聯性,才能看出存在的問題,否則就只是一些干巴巴的數字。
養數據是一種數據戰略,是基于對業務深入理解的高層次商業決策,養數據越早積累的就越多,一旦養成,會產生巨大的商業價值。一個企業在養數據的層面上謀劃越深越前瞻性,才可能在數據驅動營運,驅動決策的路上越走越順。
2.2 基于報表系統的數據分析階段
現在的企業或多或少都在做數據分析,最常見的就是報表系統。只是有的用Excel表格,有的用專業的數據分析軟件。在這個階段的主要特點是基于歷史數據做分析,在這種情況下一般傳統的分析方法和工具就夠了,因為我們主要工作是在“發現事實”而不是挖掘關聯。通過對數據的分析,企業會發現自身在數據應用方面的短板,會去重新布局企業的數據需求,繼續第一階段的養數據,所以第一、二兩個階段一般是相互交錯的。
隨著數據的增多與需求的提高,傳統的報表系統也面臨如下的諸多困境:
(1)數據多,信息少
各類表格填滿了大量的數據,卻沒辦法讓業務人員看清楚這些數據到底代表了什么信息、有什么發展趨勢,相互之間又有什么聯系?
(2)難以多維度交互分析與查詢
定制的報表過于固定,往往只能反映出某一個維度的信息。比如,我們能在一張表中查出不同區域下不同產品的銷量,在另一張表中查出不同區域、不同年齡段的顧客銷量。但這兩張表確無法回答“華中地區青年顧客購買手機類產品的情況”等相關問題。諸如此類的業務相關問題需要從多個角度進行交互分析。
(3)難以挖掘潛在的規律
報表系統展示的只是表面上的信息,但在海量數據中隱藏有哪些規律呢?哪類客戶的價值最大,產品間的關聯度如何?越深層的規律對于決策支持的價值就越大,但同時也越難被挖掘出來。
(4)難以追溯歷史,易形成數據孤島
由于業務系統的數據相對分散,而多年前的歷史數據大多被系統備份出去了,從而導致對長期的歷史追溯與宏觀分析的難度大大增加。
2.3 基于數據挖掘的商業智能(BI)階段
商業智能帶來的更多是決策支持價值。基于數據挖掘的BI系統誕生目的并非取代傳統的數據報表,相反報表系統將會長期與數據分析與挖掘系統并存。針對特定的數據與問題,選擇不同的挖掘算法找到數據下隱藏的規律,從而用來預測和支持決策,最后以合適的知識模式用于進一步分析決策工作。endprint
與數據分析對比一下總結起來兩者的區別就是:數據分析是利用大量的歷史數據樣本來總結已發生的情況并預測整個事件未來的總體走向和相關概率;數據挖掘則能夠透過事件的表象來發現隱藏在其背后的蛛絲馬跡,從而找到暗藏的事件規律以及表面看似無關的事物之間背后的聯系,比如客戶的偏好、客戶流失傾向預測、收入預測等,為企業提供經驗性總結和預見性的業務支撐。
對于企業開展數據化管理工作也要遵循上述三個階段,循序漸進,真正將數據管理工作落到實處。
3 企業數據管理需要注意的問題
3.1 理解數據分析與管理的意義
對企業來說并不是購買一套數據分析或商業智能工具,有一個運行數據分析的平臺就邁入了數據分析時代。在這之前首先需要弄清楚的問題是究竟分析什么,分析的結果如何應用。要以目標為導向,而不是以工具為導向。
數據化管理應該是一種管理方法,而不僅僅只是一個分析的動作,它的目的是為了將數據轉化成知識,提升營運水平,重點在于應用。數據分析再好、BI工具再好,如果不能幫助管理也沒有意義。
所以,好的BI產品應該是技術和業務的完美結合,想讓你的數據分析結果有價值必須有產品經理這種思維,也就是提高數據的業務化程度,將分析結果運用到生產、銷售等各個環節中去。
3.2 數據應用因小而美
在傳統企業中普遍存在組織機構大、經營范圍廣、管理層級多、業務邏輯復雜等情況,而對于集團化的企業更存在復雜的控股關系等問題。在傳統企業全方位開展數據分析工作非常困難,需要根據某一階段所面臨的經營管理問題有效識別出核心的數據分析需求,而沒有重點的數據分析既不現實也沒有效果。
“小”不是指數據量,而是指應用的目標很具體。打個比方來說,對于一個數據應用來說,如果目的是判斷兩種決策誰更有效以及兩者差異在哪里,這就是一個很具體的問題;但如果目標是如何讓公司更多贏利,這就是一個空泛的目標。按照小角度切入的想法設計數據應用,就可以做得具體而快速,而且可以避免因源數據的變化而導致數據缺失的問題。
3.3 注重企業數據管理體系的建設
企業的數據管理體系建設是一項系統工程,不可一蹴而就,建設過程中也需遵循如下相關原則:
數據管理是一項長期的工作,應該立足長遠做整體規劃,結合實際情況分布實施。
在數據管理各階段的管控目標應該結合本階段的實際需要,合理安排資源,體現其實用價值,避免盲目地求大求全。
數據管理平臺建設完成并不代表整個體系就建好了,還需成立相應的組織機構,圍繞管控目標來制定相關流程、規范、制度,將管控工作落到實處并通過平臺運轉起來。
管控體系是不斷演變優化的,在各種制度流程形成后應該有個適應期,在執行過程中逐漸積累經驗、總結教訓,再反饋調整。
總之,如何在企業的管理和分析決策中充分發揮數據分析與管理的價值是一門管理和商業藝術,需要被企業的管理層和業務單位重視起來。
參考文獻:
[1]桑文鋒.數據驅動設計:數據處理流程、分析方法和實戰案例[Z].
[2]車品覺.用數據,更要養數據[Z].大數據文摘.endprint