999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大 數(shù) 據(jù) 治 理 體 系

2018-07-05 02:42:24甘似禹車品覺楊天順吳俊偉上海億通國際股份有限公司上海00國信優(yōu)易數(shù)據(jù)研究院北京0007上海儀電集團有限公司上海0000上海科學院上海00
計算機應用與軟件 2018年6期
關鍵詞:質量企業(yè)

甘似禹 車品覺 楊天順 吳俊偉(上海億通國際股份有限公司 上海 00)(國信優(yōu)易數(shù)據(jù)研究院 北京 0007)(上海儀電(集團)有限公司 上海 0000)(上海科學院 上海 00)

0 引 言

隨著移動互聯(lián)、物聯(lián)網(wǎng)和云計算等技術發(fā)展,全球數(shù)據(jù)體量急劇膨脹,數(shù)據(jù)的重要性和數(shù)據(jù)爆炸性增長帶來的問題被廣泛關注。伴隨數(shù)據(jù)產(chǎn)生和采集的方式不同、數(shù)據(jù)來源于不同的組織實體、數(shù)據(jù)存儲結構和訪問模式差異、數(shù)據(jù)的更新和流通頻繁等因素,數(shù)據(jù)的狀態(tài)蕪雜散亂,跨界融合大數(shù)據(jù)應用舉步維艱。隨著數(shù)據(jù)的深度分析和挖掘,我們日常行為、企業(yè)決策、政府宏觀調控等對數(shù)據(jù)的依賴度增加,對數(shù)據(jù)的規(guī)范性、可信度、安全性等要求越來越高,對大數(shù)據(jù)治理的需求也越發(fā)迫切。

1 大數(shù)據(jù)治理概述

大數(shù)據(jù)技術是信息技術發(fā)展的一個重要里程碑。企業(yè)的信息系統(tǒng)建設烙印著企業(yè)規(guī)模和信息技術的發(fā)展軌跡,普遍存在各系統(tǒng)間數(shù)據(jù)標準和規(guī)范不同、信息相互不通等問題,致使系統(tǒng)的協(xié)同性等問題越來越顯著:

? 各系統(tǒng)分步規(guī)劃、分散建設,信息孤島現(xiàn)象突出;主要業(yè)務數(shù)據(jù)不能有序集中整合,業(yè)務數(shù)據(jù)的完整性、正確性無法保障。

? 缺乏統(tǒng)一的數(shù)據(jù)規(guī)范和數(shù)據(jù)模型,致使組織內對數(shù)據(jù)的描述、理解難以一致。

? 數(shù)據(jù)管理職能體系不完備,對元數(shù)據(jù)、主數(shù)據(jù)、數(shù)據(jù)質量等重點領域管理職責分散、權責不清,無法保障數(shù)據(jù)標準和規(guī)范的有效執(zhí)行、數(shù)據(jù)質量有效控制。

? 對數(shù)據(jù)更新、維護、備份、銷毀等數(shù)據(jù)全生命周期管理不完善。

大數(shù)據(jù)治理成為解決以上瓶頸的有效手段,為多源、異構、跨界大數(shù)據(jù)應用夯實基礎。大數(shù)據(jù)治理相對于傳統(tǒng)的數(shù)據(jù)治理,在實施軟件方面賦予了顯著的大數(shù)據(jù)技術特性,但從治理的籌劃協(xié)調、治理結果的業(yè)務和技術目標,到數(shù)據(jù)質量改進、隱私和安全管控等方法論基本一致。

1.1 大數(shù)據(jù)治理現(xiàn)狀

數(shù)據(jù)治理已有十多年歷史。經(jīng)過多年積累,國際上數(shù)據(jù)治理產(chǎn)品體系趨于成熟,形成了許多成功案例并構建了豐富的行業(yè)知識庫和標準規(guī)范,產(chǎn)生了諸如IBM、SAP、Oracle、Informatica等業(yè)界巨頭。

近年來國內數(shù)據(jù)治理產(chǎn)品發(fā)展迅速,雖然產(chǎn)品線還顯單薄或產(chǎn)品欠成熟,離市場的需求存在一定的距離,但對國內數(shù)據(jù)治理市場發(fā)揮越來越大的影響。我國許多商業(yè)銀行在元數(shù)據(jù)管理、數(shù)據(jù)質量管理等領域有多年的嘗試和應用。近期先進制造業(yè)異軍突起,隨著“數(shù)字化工廠”的進程,先進制造業(yè)積累了大量的數(shù)據(jù),數(shù)據(jù)治理充分釋放這些數(shù)據(jù)的價值,為企業(yè)的效率提高和業(yè)務創(chuàng)新奠定良好基礎。

1.2 大數(shù)據(jù)治理意義

大數(shù)據(jù)治理體系幫助企業(yè)建立一個針對數(shù)據(jù)生命周期可自我改進的有序、迭代的長效管理機制,滿足數(shù)據(jù)的所有相關方的信息訴求:

? 數(shù)據(jù)的可用性:通過主數(shù)據(jù)管理消除信息孤島,提高數(shù)據(jù)在組織內共享流通;通過元數(shù)據(jù)管理統(tǒng)一數(shù)據(jù)相關方對數(shù)據(jù)的理解。

? 數(shù)據(jù)的可信度:根據(jù)應用場景需求,對數(shù)據(jù)質量進行客觀評估和改善。

? 數(shù)據(jù)管理成本:降低數(shù)據(jù)使用、管理、理解溝通的成本,及優(yōu)化數(shù)據(jù)更新的成本。

? 數(shù)據(jù)的安全性:在保障數(shù)據(jù)流通的前提下,控制隱私信息、確保數(shù)據(jù)安全。

大數(shù)據(jù)治理完善企業(yè)內信息資源的整合、對接和共享,提升整個企業(yè)的信息化水平。大數(shù)據(jù)治理涉及企業(yè)各個部門、覆蓋絕大多數(shù)業(yè)務環(huán)節(jié),特別在一些企業(yè)發(fā)展瓶頸上起到關鍵作用。國內某著名大型互連網(wǎng)公司,在整個業(yè)務從PC端向移動互聯(lián)過渡時,PC和Mobile的業(yè)務衡量指標差異太大,系統(tǒng)升級的過程中暴露了大量的數(shù)據(jù)匹配問題,因此痛下決心推動了一次覆蓋企業(yè)的大數(shù)據(jù)治理,從根本上改善和解決數(shù)據(jù)的各類問題。

1.3 大數(shù)據(jù)治理體系

大數(shù)據(jù)治理是將數(shù)據(jù)作為企業(yè)資產(chǎn),在企業(yè)范圍內對數(shù)據(jù)處理流程、政策、標準、技術和人員進行定義和職能協(xié)調,實現(xiàn)對數(shù)據(jù)的可用性管理和可控增長,為企業(yè)制定更好的業(yè)務決策、降低風險并改善業(yè)務流程奠定基礎。本文從實用角度考慮,大數(shù)據(jù)治理主要包括協(xié)同籌劃、過程實施和監(jiān)控評估三大主要板塊,以及基礎模塊,如圖1所示。

圖1 大數(shù)據(jù)治理體系

相對于數(shù)據(jù)治理,數(shù)據(jù)管理是一個更大范疇的概念,幾乎覆蓋圖1中全部模塊。本文聚焦在協(xié)同籌劃、過程實施、監(jiān)控評估三個方面研討大數(shù)據(jù)治理的具體實踐。

2 大數(shù)據(jù)治理協(xié)同籌劃

大數(shù)據(jù)治理是一個復雜而艱辛的過程,涉及企業(yè)內全部業(yè)務流程,首先需要統(tǒng)一思想,協(xié)同企業(yè)戰(zhàn)略和數(shù)據(jù)戰(zhàn)略,研討大數(shù)據(jù)治理體系架構,研制企業(yè)的數(shù)據(jù)標準和規(guī)范。

2.1 統(tǒng)一認知和戰(zhàn)略協(xié)同

企業(yè)內應該在兩個方面認知達成一致:

一方面需要對企業(yè)的數(shù)據(jù)治理現(xiàn)狀進行全面的盤查摸底。充分分析數(shù)據(jù)的產(chǎn)生和采集的方式、數(shù)據(jù)存儲的現(xiàn)狀、數(shù)據(jù)標準規(guī)范體系和合規(guī)性校驗情況、數(shù)據(jù)生命周期和歸檔管理、數(shù)據(jù)質量現(xiàn)狀評估、安全隱私和訪問管控情況、數(shù)據(jù)開放和創(chuàng)新研發(fā)環(huán)境等,真實評估本企業(yè)數(shù)據(jù)治理的難度、成本和改善的目標等。

另一方面大數(shù)據(jù)戰(zhàn)略在企業(yè)戰(zhàn)略規(guī)劃中的重要程度日益增加,各級數(shù)據(jù)治理相關方必須結合企業(yè)戰(zhàn)略、企業(yè)文化、業(yè)務需求,不斷地溝通、教育和推廣數(shù)據(jù)資產(chǎn)的重要性,以及數(shù)據(jù)治理職能的業(yè)務貢獻,提高利益相關者對數(shù)據(jù)治理問題及效益的認可度。同時企業(yè)內相關職能部門和人員應充分認識到數(shù)據(jù)治理是一個持久努力、循環(huán)迭代的逐漸改善過程,而不能期望一勞永逸。

在大數(shù)據(jù)時代,大數(shù)據(jù)戰(zhàn)略將融合業(yè)務需求、增強業(yè)務感知、促進業(yè)務優(yōu)化,從而依賴強大的、高質量的數(shù)據(jù)驅動業(yè)務創(chuàng)新,為企業(yè)帶來戰(zhàn)略轉型機遇。在制定大數(shù)據(jù)戰(zhàn)略時必須以大數(shù)據(jù)的服務創(chuàng)新和價值創(chuàng)造,驅動業(yè)務發(fā)展為最終目的,根據(jù)業(yè)務模式、企業(yè)結構、企業(yè)文化等因素進行戰(zhàn)略規(guī)劃。

2.2 治理組織和主要角色

統(tǒng)一認知、協(xié)同戰(zhàn)略后,緊跟著“搭班子、帶隊伍”,成立各級數(shù)據(jù)治理組織并落實各類相關角色。不同企業(yè)數(shù)據(jù)治理組織架構和角色定義有不同的要求和優(yōu)先級,采用不同的方式來決定組織和個人的職責,但通常都包括以下幾個典型的機構:

1) 數(shù)據(jù)治理委員會 數(shù)據(jù)治理的最高權威機構。企業(yè)最高層領導出任主席,以確保委員會決策的效率和權威;數(shù)據(jù)資源豐富的部門領導為委員,保障數(shù)據(jù)治理相關工作順利展開;數(shù)據(jù)治理專員和數(shù)據(jù)治理制度專員負責日常工作。

2) 數(shù)據(jù)治理制度委員會 數(shù)據(jù)管理專員組成的跨部門協(xié)調團隊,擬定和管理數(shù)據(jù)治理相關制度、標準和規(guī)范,負責支持和監(jiān)督數(shù)據(jù)治理委員會發(fā)起的數(shù)據(jù)治理舉措。以上兩類委員會通常為聯(lián)席會議機構。

3) 數(shù)據(jù)治理辦公室 常設機構。由企業(yè)數(shù)據(jù)分管領導牽頭、業(yè)務和技術數(shù)據(jù)管理專員組成的跨職能團隊,監(jiān)督落實數(shù)據(jù)治理委員會和制度委員會的工作安排。辦公室應該擁有企業(yè)數(shù)據(jù)采購的審批權、相關數(shù)據(jù)部門核心人員(包括負責人)的晉升評估權,有利于企業(yè)的數(shù)據(jù)治理工作良好開展和數(shù)據(jù)資產(chǎn)增值的長效管理。

4) 數(shù)據(jù)治理相關角色 數(shù)據(jù)管理專員根據(jù)特定功能要求,組成數(shù)據(jù)治理實施基礎單位。具有代表性的數(shù)據(jù)管理專員包括:由企業(yè)高層擔任的高層數(shù)據(jù)治理專員,主題域專家或領導擔任的業(yè)務數(shù)據(jù)治理專員,由業(yè)務人員承擔的數(shù)據(jù)治理制度負責人,直接負責數(shù)據(jù)治理實施的數(shù)據(jù)治理執(zhí)行官等主要角色,及數(shù)據(jù)架構師、數(shù)據(jù)分析師、質量分析師、數(shù)據(jù)管理員等企業(yè)內角色和數(shù)據(jù)中間人、知識工作者、監(jiān)管機構等特定場景角色。

2.3 數(shù)據(jù)標準和規(guī)范

數(shù)據(jù)標準和規(guī)范通常由數(shù)據(jù)治理制度委員會牽頭編制,由數(shù)據(jù)治理委員會審批發(fā)布,由數(shù)據(jù)治理辦公室監(jiān)督執(zhí)行及定期重新評估。數(shù)據(jù)標準和規(guī)范應該包括:數(shù)據(jù)建模和數(shù)據(jù)架構準則規(guī)范、采集整合和數(shù)據(jù)清理標準規(guī)程、數(shù)據(jù)安全標準規(guī)范、標準代碼庫和參考數(shù)據(jù)管理控制規(guī)范、內部管理標準規(guī)程、相關的國際、國家或行業(yè)標準等。

企業(yè)普遍意識到數(shù)據(jù)標準和規(guī)范的重要性,不同程度展開了數(shù)據(jù)標準和規(guī)范體系建設,但通常存在數(shù)據(jù)標準和規(guī)范的系統(tǒng)性、完整性和執(zhí)行力度不足;對標準和規(guī)范的認同度低和管理體系匱乏;數(shù)據(jù)標準和規(guī)范多停留在文檔管理階段,未能有效地管理、及時更新和廣泛采用等問題。

數(shù)據(jù)標準和規(guī)范不僅要以文件的形式下發(fā),更關鍵的是及時抽取其中標準和規(guī)范作為技術或業(yè)務元數(shù)據(jù)的具體內容,通過元數(shù)據(jù)管理工具將有關標準和規(guī)范具體應用到數(shù)據(jù)管理和系統(tǒng)研發(fā)中,從而深入、長遠指導企業(yè)的數(shù)據(jù)應用和系統(tǒng)開發(fā)。

3 大數(shù)據(jù)治理核心功能

如圖1所示,大數(shù)據(jù)治理過程實施涉及許多模塊,其中核心單元包括元數(shù)據(jù)管理、數(shù)據(jù)質量管理和主數(shù)據(jù)管理等三大功能。

3.1 元數(shù)據(jù)管理

元數(shù)據(jù)(Metadata)流行而抽象的定義是“關于數(shù)據(jù)的數(shù)據(jù)”,詞前綴“Meta”起源于亞里斯多德的名著《形而上學》特別創(chuàng)造的詞Metaphysics,被賦予了“延續(xù)與超越、更高抽象層次”的含義。數(shù)據(jù)反映了真實世界的交易、事件、對象和關系,而元數(shù)據(jù)反映了數(shù)據(jù)的交易、事件、對象和關系。

具體而言,元數(shù)據(jù)是關于企業(yè)所使用的物理數(shù)據(jù)、技術和業(yè)務流程、數(shù)據(jù)規(guī)則和約束、以及數(shù)據(jù)的物理和邏輯結構的相關信息,也是數(shù)據(jù)標準和規(guī)范、數(shù)據(jù)質量指標的重要基礎和載體。

3.1.1 元數(shù)據(jù)的種類

元數(shù)據(jù)通常分為業(yè)務元數(shù)據(jù)、技術元數(shù)據(jù)、操作元數(shù)據(jù)和管理元數(shù)據(jù)等四類。業(yè)務元數(shù)據(jù)指導技術元數(shù)據(jù),技術元數(shù)據(jù)參考業(yè)務元數(shù)據(jù)進行設計,操作元數(shù)據(jù)是信息系統(tǒng)的管理要素匯聚。管理元數(shù)據(jù)是元數(shù)據(jù)管理過程產(chǎn)生的數(shù)據(jù)子集,將在下一節(jié)中介紹。

業(yè)務元數(shù)據(jù)是業(yè)務目標和元數(shù)據(jù)用戶之間的紐帶,便于理解、定位和訪問業(yè)務數(shù)據(jù)。業(yè)務元數(shù)據(jù)包括業(yè)務指標及相關計算公式、業(yè)務規(guī)則和算法、數(shù)據(jù)質量規(guī)則和度量指標、企業(yè)級數(shù)據(jù)模型、實體和屬性的業(yè)務名稱和業(yè)務定義、專業(yè)術語等。

技術元數(shù)據(jù)是指在數(shù)據(jù)庫、文件或其他系統(tǒng)中數(shù)據(jù)元素及其表示的說明,提供了對數(shù)據(jù)的存放位置、數(shù)據(jù)的存儲類型、數(shù)據(jù)的血緣關系等信息。技術元數(shù)據(jù)主要包括技術規(guī)則、數(shù)據(jù)結構屬性、數(shù)據(jù)映射關系和數(shù)據(jù)血緣、統(tǒng)計指標等。

操作元數(shù)據(jù)提供關于數(shù)據(jù)使用方面的信息,如最近數(shù)據(jù)更新、訪問等信息;數(shù)據(jù)管理制度,如數(shù)據(jù)的增刪規(guī)則、數(shù)據(jù)擁有人、數(shù)據(jù)共享規(guī)則和協(xié)議;滿足信息系統(tǒng)運維需求的信息,如數(shù)據(jù)遷移、數(shù)據(jù)源和目標系統(tǒng)信息、批處理程序、任務頻率、備份和恢復信息、歸檔規(guī)則等信息。

3.1.2 元數(shù)據(jù)管理

元數(shù)據(jù)管理是指元數(shù)據(jù)的定義、收集、管理和發(fā)布的方法、工具及流程的集合,以相關元數(shù)據(jù)規(guī)范、指引為基礎,以元數(shù)據(jù)管理工具為技術支撐,與應用系統(tǒng)的開發(fā)、設計和版本控制流程緊密結合的完整體系。

元數(shù)據(jù)管理需充分考慮企業(yè)自身實際情況,實現(xiàn)企業(yè)級、版本化、標準化、自動化管理,注重系統(tǒng)的易用性、數(shù)據(jù)流向和影響分析、血緣分析等。元數(shù)據(jù)管理工具要強化元數(shù)據(jù)抽取、版本管理、訪問控制管理等功能的智能化管理。

在對元數(shù)據(jù)管理過程中也將產(chǎn)生一個數(shù)據(jù)子集,通常稱管理元數(shù)據(jù),主要指與數(shù)據(jù)管理相關的組織、崗位、職責、流程。它是管理數(shù)據(jù)的管理專員、監(jiān)管制度、責任分配的數(shù)據(jù),也包含元數(shù)據(jù)管理的信息。

3.1.3 元數(shù)據(jù)管理層級

元數(shù)據(jù)管理分為三大階段:

1) 原始階段 元數(shù)據(jù)處于無序、自發(fā)的狀態(tài),元數(shù)據(jù)分散在個體或小團體中,或元數(shù)據(jù)從屬于業(yè)務系統(tǒng)中。

2) 集中階段 從元數(shù)據(jù)局部產(chǎn)生、開始集中存儲,進化到基于統(tǒng)一的元數(shù)據(jù)標準、交叉管控和上下游協(xié)同,進行元數(shù)據(jù)集中管理。

3) 有序階段 基于各類元數(shù)據(jù)間的關聯(lián),建立基于主題域層次結構,增強元數(shù)據(jù)的可讀性,從而遵循統(tǒng)一的元數(shù)據(jù)模型和規(guī)范,實現(xiàn)元數(shù)據(jù)的自動更新,實現(xiàn)各應用系統(tǒng)間數(shù)據(jù)格式的映射和自動生成。

3.1.4 元數(shù)據(jù)的作用

大數(shù)據(jù)時代數(shù)據(jù)來源廣泛、品種蕪雜、結構多樣,加上數(shù)據(jù)流通頻繁、更新周期短、應用跨度大等特征,高效管理數(shù)據(jù)是對企業(yè)能力的全面挑戰(zhàn),而元數(shù)據(jù)是數(shù)據(jù)高效管理的關鍵抓手。元數(shù)據(jù)的重要性可以通過一個歷史悲劇透視。1990年美國火星探測計劃,探測器在火星著陸失敗,不僅造成巨大的經(jīng)濟損失更是一次社會災難,導致這場災難的原因是一個細微的疏忽:研發(fā)團隊間將計量單位牛頓與磅搞混了。

通過元數(shù)據(jù),企業(yè)可以統(tǒng)一數(shù)據(jù)標準、表達形式,更清晰表達數(shù)據(jù)含義和數(shù)據(jù)間關系,強化技術和業(yè)務團隊間協(xié)調共享成果、減少交流障礙,減少企業(yè)整體培訓成本;減少冗余數(shù)據(jù)和流程,減少數(shù)據(jù)維護成本,完善數(shù)據(jù)生命周期,最大程度發(fā)揮數(shù)據(jù)的價值;完善數(shù)據(jù)質量度量指標,構建質量評估和改進迭代;實現(xiàn)公共資源的統(tǒng)一分配和登記、影響分析和血緣管理,支持數(shù)據(jù)流通和數(shù)據(jù)集成,有助于跨業(yè)務系統(tǒng)間數(shù)據(jù)整合,支持主數(shù)據(jù)構建統(tǒng)一的訪問管控體系,減少信息系統(tǒng)項目研發(fā)的風險。

綜上所述,元數(shù)據(jù)承接企業(yè)數(shù)據(jù)標準和規(guī)范,決定數(shù)據(jù)架構滿足業(yè)務需求的路徑,元數(shù)據(jù)管理成為數(shù)據(jù)治理計劃的關鍵要素,傳送了企業(yè)數(shù)據(jù)治理的能力。元數(shù)據(jù)管理計劃的任何失敗,都會導致數(shù)據(jù)子集孤立、數(shù)據(jù)質量差和無法訪問關鍵信息等問題,最終導致大數(shù)據(jù)治理失敗。

3.2 數(shù)據(jù)質量管理

數(shù)據(jù)成為企業(yè)戰(zhàn)略資源,合理有效地使用高質量的數(shù)據(jù)有助于企業(yè)正確決策,提升企業(yè)綜合競爭力。數(shù)據(jù)質量關系信息系統(tǒng)成敗并直接影響數(shù)據(jù)價值,低質量數(shù)據(jù)導致開發(fā)出來的系統(tǒng)與用戶的預期大相徑庭。

數(shù)據(jù)質量管理包含對數(shù)據(jù)本身的管理和數(shù)據(jù)訪問過程的質量管理。數(shù)據(jù)本身質量通過準確性、完整性、一致性等數(shù)據(jù)屬性界定,訪問過程質量即使用、存儲和傳輸過程中數(shù)據(jù)質量的控制和處理。

3.2.1 數(shù)據(jù)質量的度量指標

數(shù)據(jù)質量度量指標體系,最常見分為數(shù)據(jù)主要屬性、輔助屬性和場景屬性指標。數(shù)據(jù)主要屬性指標包括準確性、完整性、一致性、唯一性、時效性等,各屬性指標可拆分細化指標,以便數(shù)據(jù)質量量化評估和改進。

1) 準確性

數(shù)據(jù)內容正確性:數(shù)據(jù)內容符合預期,真實反映被描述對象。

數(shù)據(jù)格式合規(guī)性:數(shù)據(jù)格式(包括數(shù)據(jù)類型、數(shù)值范圍、數(shù)據(jù)長度、精度等)滿足預期要求。

2) 完整性

記錄連續(xù)性:非重疊、未中斷的當前數(shù)據(jù)和歷史數(shù)據(jù)。

內容完整性:提供所有必需的記錄和必需的值,不存在數(shù)據(jù)缺失。

3) 一致性

相同數(shù)據(jù)一致性:同一數(shù)據(jù)在不同位置存儲或被不同應用使用時,數(shù)據(jù)一致。

關聯(lián)數(shù)據(jù)一致性:在相同或不同數(shù)據(jù)子集內關聯(lián)數(shù)據(jù)符合一致性約束規(guī)則。

4) 唯一性

重復性:數(shù)據(jù)記錄或屬性的重復程度,每個實體均由單條主記錄表示。

冗余性:任何子數(shù)據(jù)集在主數(shù)據(jù)內僅存儲一次,每個業(yè)務對象均有唯一的標識。

5) 時效性

有效性:對應有效生命周期范圍內,數(shù)據(jù)記錄數(shù)或頻率分布符合真實的業(yè)務情況。

及時性:符合數(shù)據(jù)生命周期序列,反映對應時間戳的當前及時更新而非過期數(shù)據(jù)。

3.2.2 數(shù)據(jù)質量的評估和改進

數(shù)據(jù)質量的評估和改進一般從場景分析、評估指標、評估計劃等準備工作開始;再采用數(shù)據(jù)質量管理工具實施數(shù)據(jù)質量評估和改進;最后總結質量評估和改進是否達到預期效果,并抽取評估和改進過程的有關經(jīng)驗完善豐富相關知識庫,根據(jù)需要制定優(yōu)化方案,啟動下一個評估和改進過程。如圖2所示,數(shù)據(jù)質量管理本身也是一個持續(xù)迭代改進的過程。

第一步事先規(guī)劃。參照企業(yè)特定行業(yè)場景,確定符合企業(yè)業(yè)務的數(shù)據(jù)質量訴求,選擇本次評估和改進的對象(主數(shù)據(jù)子集);甄選和核對數(shù)據(jù)標準和規(guī)范(在完善的數(shù)據(jù)治理體系中,該類信息應該正確地配置在元數(shù)據(jù)管理工具中),確定評估指標和相關規(guī)則;制定質量評估和改進的具體計劃和流程。

第二步具體實施。遵照事先規(guī)劃,配置數(shù)據(jù)質量管理工具,確定對象、標準、度量指標、質量要求等,啟動質量評估工具。質量評估不僅根據(jù)數(shù)據(jù)質量的度量指標對數(shù)據(jù)進行掃描分析,也需結合業(yè)務場景稽核業(yè)務規(guī)則發(fā)現(xiàn)深層次的質量問題。根據(jù)評估結果進行瑕疵分析,以提供數(shù)據(jù)現(xiàn)狀的詳細分析報告,并且針對企業(yè)質量訴求完善質量改進措施,通過多次迭代逐步改善數(shù)據(jù)質量,達到預期的質量要求。

第三步事后分析。分析數(shù)據(jù)質量評估和改進效果,將出現(xiàn)的質量問題分類歸檔,豐富數(shù)據(jù)質量知識庫;優(yōu)化數(shù)據(jù)質量規(guī)范和流程,訓練數(shù)據(jù)質量管理工具智能執(zhí)行力。目前瑕疵分析和質量改進的自動化、智能化程度普遍較低,面對龐大的數(shù)據(jù)人工介入數(shù)據(jù)質量管理成本很高且效率較低,期望通過行業(yè)知識庫積累、機器學習和訓練的加強,逐漸減少人工的介入,提高整體數(shù)據(jù)服務能力。

圖2 數(shù)據(jù)質量管理流程

數(shù)據(jù)質量的評估和改進是一個逐步完善、循環(huán)迭代趨近質量需求的過程。隨著企業(yè)業(yè)務的增長、信息化系統(tǒng)的豐富和整合、大量外部數(shù)據(jù)的補充等因素,各業(yè)務場景數(shù)據(jù)子集根據(jù)數(shù)據(jù)生命周期需多次重新評估和改進,數(shù)據(jù)質量管理形成一個大小迭代嵌套的閉環(huán)過程。

3.3 主數(shù)據(jù)

主數(shù)據(jù)管理是對主數(shù)據(jù)值域進行控制,實現(xiàn)跨系統(tǒng)的一致、共享、上下文相關地使用主數(shù)據(jù),是對核心業(yè)務實體真實情況的最準確、及時的反映。

主數(shù)據(jù)管理把企業(yè)的多個業(yè)務系統(tǒng)中最核心的、最需共享的數(shù)據(jù)進行整合,集中進行數(shù)據(jù)的清洗和標準化,并且以集成服務的方式把統(tǒng)一的、完整的、具有權威的數(shù)據(jù)分發(fā)給需要使用這些數(shù)據(jù)的應用系統(tǒng)。一個成功的主數(shù)據(jù)管理必須具有持續(xù)數(shù)據(jù)改進能力。

3.3.1 主數(shù)據(jù)集

主數(shù)據(jù)包含企業(yè)業(yè)務場景中的人財物數(shù)據(jù)、參考數(shù)據(jù)和其他非結構化數(shù)據(jù)等。人財物數(shù)據(jù)包括:企業(yè)和客戶人員等數(shù)據(jù)、商品數(shù)據(jù)、財務數(shù)據(jù)和地址和物流數(shù)據(jù)等;參考數(shù)據(jù)包括:行業(yè)知識庫、公共代碼、行業(yè)標準、參考值域等數(shù)據(jù);非結構化數(shù)據(jù)包括:文本、圖形、報表、視頻和錄音等數(shù)據(jù)。

數(shù)據(jù)已經(jīng)成為企業(yè)核心資產(chǎn),數(shù)據(jù)資產(chǎn)是以主數(shù)據(jù)為核心、相關元數(shù)據(jù)等為輔的數(shù)據(jù)包。數(shù)據(jù)資產(chǎn)能夠順利在企業(yè)內部共享、外部流通,主要取決于數(shù)據(jù)的隱私性和數(shù)據(jù)價值的公共屬性的平衡。在金融領域,“黑名單”是一個典型的具有公共屬性的數(shù)據(jù),所有銀行和金融機構都有足夠的動力把自己的黑名單分享出來,并對整個行業(yè)的黑名單感興趣。如果企圖促使銀行間流通隱私性極強的白名單,注定舉步維艱,很難成功。

3.3.2 主數(shù)據(jù)整合和管理

高品質、高可訪問性的主數(shù)據(jù)是企業(yè)永恒的追求。由于行業(yè)應用無法在創(chuàng)建數(shù)據(jù)時確保其完整性及避免數(shù)據(jù)重復,因此需要將主數(shù)據(jù)集從這些行業(yè)應用中分離出來。將這些行業(yè)應用數(shù)據(jù)經(jīng)過嚴格的清洗、匹配和合并流程,并按照企業(yè)數(shù)據(jù)標準和規(guī)范進行數(shù)據(jù)質量管理處理,最后集成到主數(shù)據(jù)管理系統(tǒng)中。

成熟的主數(shù)據(jù)管理消除了點對點集成,降低數(shù)據(jù)維護成本。主數(shù)據(jù)管理通常包括以下幾個功能模塊:

創(chuàng)建、使用、管理和監(jiān)控主數(shù)據(jù):企業(yè)范圍的主數(shù)據(jù)集成處置、規(guī)范管理,企業(yè)用戶能夠訪問統(tǒng)一、可靠的主數(shù)據(jù),有效地管理數(shù)據(jù)變化和異常情況。

建模功能:對所有通用主數(shù)據(jù)域建模,并保留相關元數(shù)據(jù)、數(shù)據(jù)沿襲以及審計和合規(guī)性的歷史記錄。

黃金記錄:指主數(shù)據(jù)集內滿足跨應用共享并符合數(shù)據(jù)質量指標要求的相關數(shù)據(jù)子集。黃金記錄通常在單元格級別建立唯一的“黃金記錄”版本,并在整個企業(yè)內部共享。

揭示各數(shù)據(jù)之間的關系:將公司和渠道合作伙伴的數(shù)據(jù)整理到企業(yè)層次結構,實行數(shù)據(jù)的有序分類管理,檢驗并揭示數(shù)據(jù)之間的技術和業(yè)務關系。

3.3.3 數(shù)據(jù)生命周期管理

數(shù)據(jù)生命周期包括數(shù)據(jù)發(fā)生(生成、采集)、在線處理(處理、存儲、維護、引用)、歸檔銷毀(在線歸檔、離線備份、銷毀)等三大階段,數(shù)據(jù)在生命周期不同階段價值不同,通過數(shù)據(jù)更新和品質改進,可以維持或提升數(shù)據(jù)的價值。主數(shù)據(jù)生命周期是數(shù)據(jù)生命周期最重要的子集和主要研究對象,覆蓋了數(shù)據(jù)匯聚、數(shù)據(jù)服務和數(shù)據(jù)管理等數(shù)據(jù)在線處理階段,如圖3所示。

圖3 主數(shù)據(jù)生命周期

有效的主數(shù)據(jù)生命周期管理是提升數(shù)據(jù)的訪問效率、降低數(shù)據(jù)的管理成本的關鍵,維護和更新“黃金記錄”是主數(shù)據(jù)生命周期中最重要的一項工作。

主數(shù)據(jù)的各子集往往跨越不同行業(yè)應用,需要保障不同子集同類數(shù)據(jù)的一致性、關聯(lián)數(shù)據(jù)的業(yè)務約束一致性。主數(shù)據(jù)的新鮮度也需及時維持,為行業(yè)應用提供最新洞悉能力,使企業(yè)依據(jù)最新數(shù)據(jù)進行決策,避免“用春天的數(shù)據(jù)推演秋天的情況”。主數(shù)據(jù)的黃金記錄集將高效地為主數(shù)據(jù)解決該類問題。

在線歸檔和離線備份是提高主數(shù)據(jù)訪問和處理效率的另一項重要工作。隨著企業(yè)數(shù)據(jù)體量的急劇膨脹,實時在線業(yè)務系統(tǒng)的處理能力面臨巨大的壓力,一般配置靈活的在線歸檔策略,分解實時業(yè)務系統(tǒng)的壓力,并對不同的數(shù)據(jù)子集配置適當?shù)膫浞蒌N毀策略,減輕系統(tǒng)基礎設施的投資壓力。

4 大數(shù)據(jù)治理其他相關模塊

大數(shù)據(jù)治理是一個繁復而持續(xù)的工作,除以上介紹的大數(shù)據(jù)治理核心功能外,還涉及很多如基礎技術功能、數(shù)據(jù)隱私和安全管理等模塊。

4.1 數(shù)據(jù)匯集和建模

在大數(shù)據(jù)治理概念中數(shù)據(jù)匯集外延更廣泛,不僅需要整合現(xiàn)有系統(tǒng)分散的數(shù)據(jù)、匯集新增數(shù)據(jù),在匯集的過程中還需要甄別數(shù)據(jù)集對應的元數(shù)據(jù)是否完善,進行數(shù)據(jù)質量評估,并按安全規(guī)范標注隱私數(shù)據(jù),確保主數(shù)據(jù)的規(guī)范性、新鮮度、正確性等滿足業(yè)務要求。

從數(shù)據(jù)隸屬于分散業(yè)務系統(tǒng)的原生態(tài),衍進到數(shù)據(jù)集中存儲和管理的有序模式,數(shù)據(jù)匯集過程可能蜿蜒波折、步步艱辛。許多企業(yè)的信息系統(tǒng)都是多年積累逐步開發(fā),架構差異大、數(shù)據(jù)分散、數(shù)據(jù)一致性和準確性差,需要借助于適當?shù)臉I(yè)務模型,盡可能避免業(yè)務流程調整的前提下,分次分批進行數(shù)據(jù)匯聚,適應數(shù)據(jù)的存儲變遷和集中管理。

業(yè)務模型必須基于數(shù)據(jù)模型,應該由業(yè)務經(jīng)驗豐富的專員把握建模的粒度。如果數(shù)據(jù)模型粒度太細,細微的業(yè)務流程變化都將引起數(shù)據(jù)模型的變化,不利于系統(tǒng)的持續(xù)穩(wěn)定。現(xiàn)在通常使用自動建模工具完成建模工作。

4.2 數(shù)據(jù)隱私與安全

大數(shù)據(jù)治理側重于研討數(shù)據(jù)在保存、使用和交換過程中的安全,及數(shù)據(jù)內容的隱私保護,而非系統(tǒng)或網(wǎng)絡安全。不同組織對數(shù)據(jù)隱私與安全的要求不同。對一個商業(yè)公司而言,沒有業(yè)務的數(shù)據(jù)安全是沒有意義的,所有應該業(yè)務為先,安全其后。對一個關系到國計民生的政府部門而言,數(shù)據(jù)隱私與安全保護往往放到第一位。

單一數(shù)據(jù)的隱私問題比較容易解決,在元數(shù)據(jù)中配置相關數(shù)據(jù)項的隱私等級,通過隱私掃描工具對該類數(shù)據(jù)項標注隱私等級。有些數(shù)據(jù)集間涉及一些復雜的業(yè)務邏輯關系,關聯(lián)融合后出現(xiàn)隱私漏洞,需借助于分析能力強大并且具備深度學習智能的隱私掃描工具探測相關漏洞。

數(shù)據(jù)通常分公共數(shù)據(jù)、有限隱私數(shù)據(jù)、完全隱私數(shù)據(jù)三個大類,按數(shù)據(jù)保護法律法規(guī)和企業(yè)業(yè)務需求,進一步制定企業(yè)級的數(shù)據(jù)隱私細分等級,通過數(shù)據(jù)訪問管控系統(tǒng)實施到各級隱私保護。公共數(shù)據(jù)多沿用訪問角色的控制管理機制,有限隱私數(shù)據(jù)和完全隱私數(shù)據(jù)的訪問權限依賴于具體業(yè)務應用,再結合數(shù)據(jù)使用目的和訪問角色來處理該類數(shù)據(jù)流通。如身份證ID是有限敏感數(shù)據(jù),業(yè)務應用的目的是按身份證區(qū)域統(tǒng)計年齡分布,授權角色均可通過該業(yè)務應用訪問身份證數(shù)據(jù)獲得統(tǒng)計結果。

公共數(shù)據(jù)對所有授權角色開放,為避免惡意盜取源數(shù)據(jù),通常監(jiān)控數(shù)據(jù)的訪問流量并設置異常應急處置機制。對隱私數(shù)據(jù)的直接、簡單脫敏,將使數(shù)據(jù)價值大幅衰減,并不值得提倡。本文主張設計一套完整的數(shù)據(jù)隱私與安全訪問管控體系來解決敏感數(shù)據(jù)訪問問題,如圖4所示,既能確保隱私數(shù)據(jù)的安全,又沒有降低數(shù)據(jù)的價值。

圖4 數(shù)據(jù)訪問管控

“行業(yè)應用系統(tǒng)”通過“數(shù)據(jù)訪問代理”間接訪問隱私數(shù)據(jù),再通過“數(shù)據(jù)輸出代理”將運算結果推送回對應的“行業(yè)應用系統(tǒng)”。“行業(yè)應用系統(tǒng)”中使用隱私數(shù)據(jù)的“應用算法”模塊需要獨立封裝。訪問完全隱私數(shù)據(jù)時,需要對“應用算法”進行嚴格的使用目的檢驗甚至代碼級的白盒測試,并將“應用算法”從“行業(yè)應用系統(tǒng)”中剝離出來,部署在可控的監(jiān)控運行環(huán)境中托管,如圖4中“應用算法封裝”模塊。

訪問有限隱私數(shù)據(jù)時,根據(jù)業(yè)務場景、業(yè)務應用的可信度等,確定對相應“應用算法”的校驗程度和封裝情況。應用算法模塊假道“數(shù)據(jù)服務接口”,通過“數(shù)據(jù)訪問代理”綜合行業(yè)應用性質、訪問目的、用戶權限、數(shù)據(jù)隱私類別等因素判斷數(shù)據(jù)訪問的有效性。并在應用算法模塊完成相關業(yè)務運算后,通知“數(shù)據(jù)輸出代理”校驗運算結果的合規(guī)性,再通過“結果數(shù)據(jù)通道”推送到對應“行業(yè)應用系統(tǒng)”,完成數(shù)據(jù)從訪問到結果輸出的可控閉環(huán)操作。

綜上所述,建立企業(yè)級的隱私等級分類,通過敏感掃描工具給敏感數(shù)據(jù)貼上等級標簽,再通過數(shù)據(jù)訪問管控體系執(zhí)行隱私保護,最大限度地提供敏感數(shù)據(jù)的合法、可控訪問。

4.3 樣本數(shù)據(jù)和應用推演

以多源、異構、融合為特征的大數(shù)據(jù)行業(yè)應用,涉及多種數(shù)據(jù)流通共享、不同數(shù)據(jù)規(guī)范兼容協(xié)調,需要一個良好的研發(fā)環(huán)境嘗試數(shù)據(jù)的兼容、優(yōu)化應用算法和參數(shù)、校驗數(shù)據(jù)訪問管控等。隨著大量數(shù)據(jù)積累,數(shù)據(jù)驅動創(chuàng)新應用、挖掘數(shù)據(jù)洞察能力、機器深度學習等需求,都需要一個如圖5所示的實驗推演環(huán)境,開放所有的樣本數(shù)據(jù)集,方便創(chuàng)新業(yè)務和算法進行多方位試錯。

圖5 大數(shù)據(jù)應用推演沙箱

大數(shù)據(jù)應用推演沙箱主要有樣本數(shù)據(jù)管理、訪問安全管控和服務資源調度等三大主要功能模塊。樣本數(shù)據(jù)發(fā)生器是樣本數(shù)據(jù)管理最重要的構件之一,參照主數(shù)據(jù)的類型、值域、一致性、概率分布、隱私安全級別等因素,再根據(jù)數(shù)據(jù)標準和規(guī)范、取相關元數(shù)據(jù)對應信息,創(chuàng)建各類樣本數(shù)據(jù)子集。參考主數(shù)據(jù)生命周期,確定各樣本數(shù)據(jù)子集的更新頻度,以確保數(shù)據(jù)的新鮮度。

大數(shù)據(jù)應用推演沙箱為用戶提供通用服務能力、數(shù)據(jù)緩沖管理、開發(fā)和映射框架等大數(shù)據(jù)應用研發(fā)的基礎環(huán)境,服務資源調度模塊協(xié)調沙箱的各類任務并為沙箱用戶合理分配資源。訪問安全管控模塊根據(jù)行業(yè)應用涉及的數(shù)據(jù)隱私等級,參照“數(shù)據(jù)隱私和安全”章節(jié)相關的數(shù)據(jù)訪問規(guī)范,對數(shù)據(jù)訪問目和輸出結果進行核查,并根據(jù)數(shù)據(jù)隱私等級和可控性要求對相關業(yè)務算法模塊制定封裝和部署的具體要求,確保行業(yè)應用投入實際運營后的數(shù)據(jù)安全。

5 大數(shù)據(jù)治理監(jiān)控評估

5.1 監(jiān)控與審計

大數(shù)據(jù)治理是一個復雜的系統(tǒng)工程,針對體量龐大、來源不同、格式差異的數(shù)據(jù)集,況且不同數(shù)據(jù)子集間業(yè)務關系錯綜復雜,不論完善元數(shù)據(jù)體系、改善主數(shù)據(jù)質量,還是保障數(shù)據(jù)安全,都難一蹴而就,需要漸進、持續(xù)迭代地改進。通過對數(shù)據(jù)治理過程監(jiān)控、對事后治理效果審計評估,不斷優(yōu)化數(shù)據(jù)治理方案和目標,持續(xù)提高企業(yè)數(shù)據(jù)治理的能力和效果。

過程監(jiān)控偏重于數(shù)據(jù)治理執(zhí)行過程中的合規(guī)性分析,審計評估側重于本輪數(shù)據(jù)治理最終成效分析。過程監(jiān)控是在數(shù)據(jù)治理實施過程中,檢查制度是否健全,組織職能是否持續(xù)有效,角色分工是否清晰到位,操作是否遵循相關的制度和規(guī)范,從而在實施過程中及時控制風險、確保成果的可預期性。審計評估是在數(shù)據(jù)治理實施結束后,評估主數(shù)據(jù)是否集中存儲并管理,主數(shù)據(jù)質量改善狀況;主數(shù)據(jù)是否獲得隱私和安全規(guī)范的保護;數(shù)據(jù)標準和規(guī)范是否覆蓋主數(shù)據(jù)全部子集,并在元數(shù)據(jù)中完整真實反映;元數(shù)據(jù)體系是否完整,數(shù)據(jù)質量管理度量指標是否健全等。并就評估審計結果進行剖析,提出下一輪數(shù)據(jù)治理的優(yōu)化方案。

監(jiān)控是對現(xiàn)階段治理效果的保證,評估是對下一個治理迭代效果的提升。

5.2 大數(shù)據(jù)治理成熟評估

大數(shù)據(jù)治理的成熟度等級,可以從領導關注、規(guī)范標準、元數(shù)據(jù)等幾個方面綜合評估。

? 成熟度0級:無意識階段

無全局性數(shù)據(jù)標準或規(guī)范,元數(shù)據(jù)處于初始階段,最高領導層幾乎不關注數(shù)據(jù)質量和安全。

? 成熟度1級:初始階段

形成一些局部標準或臨時性規(guī)則,元數(shù)據(jù)從屬于業(yè)務系統(tǒng),主數(shù)據(jù)分散存儲和管理,數(shù)據(jù)治理主要由幾個富有熱情的基層人員推動。

? 成熟度2級:可重復階段

數(shù)據(jù)標準和規(guī)范逐漸完善,元數(shù)據(jù)集中存儲、分散管理,數(shù)據(jù)治理由大批企業(yè)中低層人員參與并推動。

? 成熟度3級:定義階段

數(shù)據(jù)標準和規(guī)范化通過元數(shù)據(jù)逐漸為應用系統(tǒng)引用,元數(shù)據(jù)集中存儲和管理,數(shù)據(jù)治理和企業(yè)戰(zhàn)略開始協(xié)同,并獲企業(yè)高層領導支持和各業(yè)務部門參與。

? 成熟度4級:管理階段

形成了完善的數(shù)據(jù)標準和規(guī)范體系,元數(shù)據(jù)模型驅動數(shù)據(jù)治理的效果可度量可跟蹤,數(shù)據(jù)治理由業(yè)務高層和技術高層共同推進。

? 成熟度5級:優(yōu)化階段

數(shù)據(jù)視為企業(yè)資產(chǎn)進行管理,數(shù)據(jù)治理作為一項獨立的核心業(yè)務職能展開;自動化進行元數(shù)據(jù)管理;企業(yè)最高管理層全力贊助和支持。

5.3 數(shù)據(jù)資產(chǎn)評估

數(shù)據(jù)已經(jīng)成為越來越多企業(yè)最具戰(zhàn)略意義的資產(chǎn)。如何獲取足以支撐企業(yè)發(fā)展的數(shù)據(jù)資源、如何優(yōu)化數(shù)據(jù)源形成數(shù)據(jù)資產(chǎn)、如何彰顯數(shù)據(jù)資產(chǎn)的價值做大做強企業(yè),是數(shù)據(jù)經(jīng)濟時代每個企業(yè)都要面對的問題,也是企業(yè)跨越式發(fā)展的一次契機。

數(shù)據(jù)形成資產(chǎn)的關鍵步驟就是數(shù)據(jù)必須經(jīng)過有效的治理,形成可信、安全、合規(guī)、可用且便于管理的數(shù)據(jù)集。數(shù)據(jù)資產(chǎn)是基于業(yè)務環(huán)節(jié)相對完整的數(shù)據(jù)子集、相關數(shù)據(jù)標準和規(guī)范、對應的元數(shù)據(jù)子集、安全隱私訪問規(guī)范等元素形成數(shù)據(jù)包,為行業(yè)應用提供直接和間接的支持。對數(shù)據(jù)資產(chǎn)化的評估,是大數(shù)據(jù)治理成效的一個重要方面,直接反映了數(shù)據(jù)治理對數(shù)據(jù)價值提升的效果。

6 結 語

大數(shù)據(jù)治理是一個持續(xù)迭代的復雜性系統(tǒng)性工程,需從企業(yè)的戰(zhàn)略層面出發(fā),企業(yè)各層級相關人員充分溝通協(xié)調,統(tǒng)一認識到數(shù)據(jù)資產(chǎn)價值的重要性和數(shù)據(jù)治理行為對業(yè)務發(fā)展的巨大貢獻。

通過以上討論,從實際應用的角度展示一個完整的大數(shù)據(jù)治理框架體系,為企業(yè)數(shù)據(jù)治理過程中事先籌劃協(xié)同、實施中各功能具體實現(xiàn)、事后評估優(yōu)化提供了一個可參考模型。為數(shù)據(jù)資產(chǎn)化后進入流通領域,促進更多跨界、融合行業(yè)創(chuàng)新應用提供一個完整的數(shù)據(jù)隱私和安全保護體系。

數(shù)據(jù)治理過程涉及企業(yè)的方方面面,不僅是對數(shù)據(jù)價值充分梳理和挖掘的過程,也是企業(yè)內部管理職能優(yōu)化和執(zhí)行力強化的過程,還是提升企業(yè)核心競爭力,在現(xiàn)有業(yè)務系統(tǒng)基礎上醞釀跨界融合創(chuàng)新應用的契機。

[1] DAMA國際. DAMA數(shù)據(jù)管理致使體系指南[M]. 北京:清華大學出版社,2012.

[2] 維克托·邁爾·舍恩伯格,肯尼斯·庫克耶. 大數(shù)據(jù)時代[M]. 浙江:浙江人民出版社,2013.

[3] 陸顧新,陳石軍,王立等,等. 銀行數(shù)據(jù)治理[M]. 北京:機械工業(yè)出版社,2016.

[4] 張韶華,潘蓉,宗宇偉,等. 大數(shù)據(jù)治理與服務[M]. 上海:上海科學技術出版社,2016.

[5] 趙飛,王樂,鄧忠軍,等. 基于全生命周期的主數(shù)據(jù)管理:MDM詳解與實踐[M].北京:清華大學出版社,2015.

[6] 蔡莉,朱揚勇. 大數(shù)據(jù)質量[M]. 上海:上海科學技術出版社,2016.

[7] Fisher Tony. The data asset, How smart companies govern their data for business success[M].News Jersey:John Wiley & Sons, Inc.,2009.

[8] 劉永楠, 鄒兆年, 李建中,等. 數(shù)據(jù)完整性的評估方法[J]. 計算機研究與發(fā)展, 2013, 50(S1):230- 238.

[9] 丁小歐,王宏志,張笑影,等.數(shù)據(jù)質量多種性質的關聯(lián)關系研究[J]. 軟件學報,2016,27(7):1626- 1644.

[10] 熊贇,朱楊勇,陳志淵. 大數(shù)據(jù)挖掘[M]. 上海:上海科技出版社,2016.

[11] 車品覺. 決戰(zhàn)大數(shù)據(jù)[M]. 浙江:浙江人民出版社,2016.

[12] PomerantzJeffery. 元數(shù)據(jù):用數(shù)據(jù)的數(shù)據(jù)管理你的世界[M]. 北京:中信前沿經(jīng)濟出版社,2017.

[13] SoaresSunil.大數(shù)據(jù)治理[M].北京:清華大學出版社,2014.

猜你喜歡
質量企業(yè)
企業(yè)
企業(yè)
企業(yè)
企業(yè)
企業(yè)
“質量”知識鞏固
質量守恒定律考什么
敢為人先的企業(yè)——超惠投不動產(chǎn)
云南畫報(2020年9期)2020-10-27 02:03:26
做夢導致睡眠質量差嗎
關于質量的快速Q(mào)&A
主站蜘蛛池模板: 91小视频在线观看免费版高清| 欧美一区二区三区国产精品| 欧美不卡视频一区发布| 亚洲国产日韩欧美在线| 国产激情影院| 91尤物国产尤物福利在线| 中日韩欧亚无码视频| 亚洲综合精品香蕉久久网| 午夜三级在线| 中文字幕欧美日韩高清| 思思99热精品在线| 999在线免费视频| 久草视频一区| 四虎永久在线| 99视频精品全国免费品| 久久午夜夜伦鲁鲁片无码免费| 91免费片| 日韩福利在线视频| 在线播放国产99re| 亚洲,国产,日韩,综合一区| 中文字幕乱妇无码AV在线| 欧美一区二区三区不卡免费| 国产激情国语对白普通话| 亚洲区视频在线观看| 国产精品视频第一专区| 久久大香伊蕉在人线观看热2| 99精品在线视频观看| 黄色不卡视频| 欧美激情福利| 人妻丰满熟妇av五码区| 91色在线视频| 成人福利在线观看| 亚洲乱码精品久久久久..| 色综合天天综合中文网| 亚洲无码在线午夜电影| 97综合久久| 农村乱人伦一区二区| 午夜丁香婷婷| 麻豆国产精品一二三在线观看| 国产精品私拍99pans大尺度| 日韩大片免费观看视频播放| 一级香蕉人体视频| 久久综合色天堂av| 嫩草在线视频| 欧美日韩一区二区三区在线视频| 制服丝袜国产精品| www.亚洲国产| 亚洲码一区二区三区| 伊人激情综合| 中文字幕亚洲无线码一区女同| 99re免费视频| 精品人妻一区二区三区蜜桃AⅤ| 韩国福利一区| 久久国产精品波多野结衣| 97青草最新免费精品视频| 日韩精品一区二区深田咏美| 国产精品手机在线播放| 手机看片1024久久精品你懂的| 亚洲第一区在线| 亚洲日产2021三区在线| 一区二区无码在线视频| 亚洲国产天堂久久综合| 亚洲欧美日本国产综合在线| 激情影院内射美女| 一级一级特黄女人精品毛片| 久久男人资源站| 在线免费观看AV| 亚洲综合极品香蕉久久网| 伦精品一区二区三区视频| 亚洲第一区欧美国产综合| 青青久在线视频免费观看| 久久久久青草大香线综合精品| 婷婷色中文网| 成人精品免费视频| 亚洲二区视频| 极品国产在线| 色综合久久无码网| 日韩亚洲综合在线| 欧美三級片黃色三級片黃色1| 亚洲码在线中文在线观看| 色首页AV在线| 国产三级毛片|