999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于可編排組件的數(shù)據(jù)質(zhì)量治理技術(shù)研究

2020-11-29 14:06:12陳鳳超趙俊煒
機(jī)電信息 2020年33期
關(guān)鍵詞:規(guī)則數(shù)據(jù)庫(kù)質(zhì)量

黎 鳴 陳鳳超 趙俊煒

(廣東電網(wǎng)有限責(zé)任公司東莞供電局,廣東東莞523000)

0 引言

在大數(shù)據(jù)環(huán)境下,數(shù)據(jù)信息呈現(xiàn)出爆炸式增長(zhǎng)的趨勢(shì),部分無(wú)價(jià)值的數(shù)據(jù)混雜其中,引發(fā)了數(shù)據(jù)質(zhì)量問(wèn)題。從根本上看,數(shù)據(jù)質(zhì)量問(wèn)題的癥結(jié)在業(yè)務(wù)上,即數(shù)據(jù)管理不到位,一些表層技術(shù)問(wèn)題如若深挖,其實(shí)仍是業(yè)務(wù)問(wèn)題。對(duì)此,應(yīng)從業(yè)務(wù)的角度,在可編排組件的基礎(chǔ)上構(gòu)建切實(shí)可行的質(zhì)量評(píng)估標(biāo)準(zhǔn)與治理流程,充分發(fā)揮質(zhì)量治理的作用,以有效解決數(shù)據(jù)質(zhì)量問(wèn)題。

1 可編排組件處理流程

可編程組件涉及內(nèi)容較多,如資源編排負(fù)責(zé)資源分配,服務(wù)編排負(fù)責(zé)將各項(xiàng)業(yè)務(wù)部署到服務(wù)器中,工作負(fù)載編排則負(fù)責(zé)在資源之間共享工作負(fù)載,其處理流程包括以下內(nèi)容:

(1)數(shù)據(jù)抓取。主要源于用戶、爬取、實(shí)驗(yàn)與計(jì)算機(jī)仿真。

(2)數(shù)據(jù)預(yù)處理。針對(duì)采集的數(shù)據(jù)信息進(jìn)行預(yù)處理,主要包括數(shù)據(jù)選擇、轉(zhuǎn)換與清洗等方面,可有效減少數(shù)據(jù)重復(fù)與缺失等情況發(fā)生。

(3)關(guān)聯(lián)規(guī)則挖掘。將文件或數(shù)據(jù)導(dǎo)入分布式計(jì)算平臺(tái),利用Hive SQL等對(duì)數(shù)據(jù)中的有效特征進(jìn)行提取,繪制大寬表。整合提取的數(shù)據(jù)建模,利用邏輯回歸、決策樹(shù)、協(xié)同過(guò)濾等算法獲得最終結(jié)果。

(4)可視化編排。針對(duì)上述處理完畢的數(shù)據(jù)進(jìn)行多維展示分析,對(duì)渲染性能、移植效率與交互體驗(yàn)等問(wèn)題進(jìn)行綜合分析。在大數(shù)據(jù)編排理論支持下進(jìn)行多種數(shù)據(jù)格式轉(zhuǎn)換,構(gòu)建可編排組件庫(kù),剔除異構(gòu)的無(wú)效數(shù)據(jù),完善可視化編排與展示系統(tǒng)[1]。

2 數(shù)據(jù)質(zhì)量治理技術(shù)的應(yīng)用內(nèi)容與方法

2.1 治理目標(biāo)

數(shù)據(jù)質(zhì)量管理的目標(biāo)在于提高數(shù)據(jù)質(zhì)量,使報(bào)表、分析與應(yīng)用更加精準(zhǔn)高效。時(shí)至今日,雖然數(shù)據(jù)治理的范圍拓展許多,但在研究數(shù)據(jù)資產(chǎn)管理、自動(dòng)化數(shù)據(jù)治理、知識(shí)圖譜等概念時(shí),提高數(shù)據(jù)質(zhì)量仍是重中之重。究其原因,數(shù)據(jù)價(jià)值要想得到充分發(fā)揮,關(guān)鍵在于其質(zhì)量的高低,高質(zhì)量的數(shù)據(jù)將為數(shù)據(jù)應(yīng)用打下堅(jiān)實(shí)基礎(chǔ)。據(jù)統(tǒng)計(jì),數(shù)據(jù)科學(xué)家與分析人員每天30%的工作量都花費(fèi)在真假數(shù)據(jù)的辨別上,在低質(zhì)量數(shù)據(jù)環(huán)境下,數(shù)據(jù)分析也變得小心翼翼,極大地阻礙了組織業(yè)務(wù)的正常運(yùn)營(yíng)。由此可見(jiàn),加強(qiáng)數(shù)據(jù)質(zhì)量管理對(duì)提高其質(zhì)量具有重要意義,是勢(shì)在必行的優(yōu)先任務(wù)。

2.2 治理方法

要想提高數(shù)據(jù)質(zhì)量,應(yīng)以問(wèn)題數(shù)據(jù)作為切入點(diǎn),對(duì)問(wèn)題分析、解決與優(yōu)化積累進(jìn)行綜合分析,由此形成良性循環(huán),促進(jìn)數(shù)據(jù)質(zhì)量的持續(xù)提升。首先,應(yīng)對(duì)數(shù)據(jù)質(zhì)量問(wèn)題進(jìn)行整理和分析,明確當(dāng)前數(shù)據(jù)質(zhì)量情況;其次,對(duì)于不同質(zhì)量問(wèn)題采用與之相應(yīng)的解決措施,制定科學(xué)詳盡的解決方案;然后問(wèn)題認(rèn)責(zé),動(dòng)態(tài)跟蹤方案執(zhí)行效果,監(jiān)督檢查,持續(xù)優(yōu)化;最終構(gòu)建知識(shí)庫(kù),使數(shù)據(jù)質(zhì)量得到顯著提升,為后來(lái)者提供參考依據(jù)。

2.3 取舍標(biāo)準(zhǔn)

按照規(guī)定標(biāo)準(zhǔn)進(jìn)行取舍,主要包括兩個(gè)方面:一是數(shù)據(jù)質(zhì)量治理流程方面,上文中提到的治理流程屬于較為理想的狀態(tài),但對(duì)于不同組織內(nèi)部來(lái)說(shuō),實(shí)施力度有所區(qū)別;二是不同時(shí)間維度方面的取舍,采用多樣處理方式,根據(jù)時(shí)間維度進(jìn)行劃分,數(shù)據(jù)類型劃分為三種,即未來(lái)、當(dāng)前與歷史數(shù)據(jù)。在解決多種類型數(shù)據(jù)質(zhì)量問(wèn)題時(shí),應(yīng)科學(xué)利用取舍之道,依靠多種方式達(dá)到理想的數(shù)據(jù)質(zhì)量處理目標(biāo)[2]。

3 可編排組件的數(shù)據(jù)質(zhì)量管理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

3.1 系統(tǒng)設(shè)計(jì)

3.1.1 設(shè)計(jì)描述

該系統(tǒng)主要包括配置界面與數(shù)據(jù)庫(kù)兩項(xiàng)內(nèi)容;用戶通過(guò)平臺(tái)配置數(shù)據(jù)校驗(yàn)規(guī)則與執(zhí)行方案,其中,前者為數(shù)據(jù)庫(kù)存儲(chǔ),要求讀寫日志表;后者為數(shù)據(jù)庫(kù)Job,一個(gè)執(zhí)行方案可調(diào)用多個(gè)校驗(yàn)規(guī)則。二者均可在用戶配置完畢后由程序自動(dòng)生成,生成程序則可根據(jù)問(wèn)題數(shù)據(jù)表制定數(shù)據(jù)質(zhì)量報(bào)告。

3.1.2 主要功能

一是問(wèn)題發(fā)現(xiàn)功能,通過(guò)數(shù)據(jù)源、策略與規(guī)則配置發(fā)現(xiàn)問(wèn)題,并對(duì)相應(yīng)數(shù)據(jù)源、數(shù)據(jù)質(zhì)量與執(zhí)行情況進(jìn)行監(jiān)控;二是問(wèn)題分析功能,以數(shù)據(jù)質(zhì)量報(bào)告為依據(jù)進(jìn)行問(wèn)題分析;三是問(wèn)題跟蹤功能,依靠缺陷池信息對(duì)數(shù)據(jù)問(wèn)題進(jìn)行追蹤;四是支撐功能,數(shù)據(jù)質(zhì)量系統(tǒng)根據(jù)組織機(jī)構(gòu)管理、日志管理、權(quán)限配置等實(shí)現(xiàn)功能。

3.1.3 系統(tǒng)架構(gòu)

資源層:主要是指數(shù)據(jù)管理模塊的實(shí)體映射層;服務(wù)層:針對(duì)質(zhì)量報(bào)告、執(zhí)行方案、校驗(yàn)規(guī)則、執(zhí)行結(jié)果等進(jìn)行管理和服務(wù);編排層:介于數(shù)據(jù)層與業(yè)務(wù)層之間,可對(duì)數(shù)據(jù)庫(kù)進(jìn)行相應(yīng)操作;展現(xiàn)層:在數(shù)據(jù)治理模塊基礎(chǔ)上對(duì)可視化界面進(jìn)行展示,包括質(zhì)量報(bào)告、規(guī)則與日志查詢等界面。具體的層級(jí)與作用如表1所示。

3.2 系統(tǒng)應(yīng)用

3.2.1 配置管理

在該系統(tǒng)中,采用一個(gè)存儲(chǔ)過(guò)程調(diào)用校驗(yàn)SQL,便可獲得最終的校驗(yàn)結(jié)果。但校驗(yàn)策略不可單獨(dú)實(shí)施,還應(yīng)附加到執(zhí)行方案之中才可。一方面,規(guī)則配置。規(guī)則模板屬于一系列SQL模板,可用于生成常規(guī)校驗(yàn)規(guī)則,如編碼檢查、唯一性檢查、長(zhǎng)度檢查與業(yè)務(wù)檢查等方面。配置良好的規(guī)則模板通常會(huì)在配置單表規(guī)則中使用;在模板校驗(yàn)過(guò)程中,一般提供七種不同的規(guī)則模板,可在“單表規(guī)則”中進(jìn)行調(diào)用。另一方面,執(zhí)行策略配置。執(zhí)行方案便是校驗(yàn)規(guī)則的方案,作用在于對(duì)規(guī)則進(jìn)行執(zhí)行。完善的方案中蘊(yùn)含多個(gè)校驗(yàn)規(guī)則,該方案可設(shè)置生效、失效、是否執(zhí)行與周期等等,通過(guò)不同分類對(duì)方案進(jìn)行執(zhí)行和管理[3]。

表1 數(shù)據(jù)質(zhì)量治理系統(tǒng)

3.2.2 數(shù)據(jù)源管理

此類管理應(yīng)用于定義數(shù)據(jù)來(lái)源,包括數(shù)據(jù)表管理、數(shù)據(jù)庫(kù)配置兩個(gè)方面,可為校驗(yàn)規(guī)則提供信息支撐。在管理過(guò)程中,應(yīng)配置數(shù)據(jù)庫(kù)的相關(guān)信息,由此生成與之相對(duì)的日志清單。該項(xiàng)管理具有增加、刪除、修改與查詢等功能。數(shù)據(jù)庫(kù)連接信息如圖1所示。

圖1 配置數(shù)據(jù)庫(kù)連接信息

在圖1中,前一個(gè)框代表的是插入或更新數(shù)據(jù)源;后一個(gè)框代表的是管理數(shù)據(jù)源。由此便可實(shí)現(xiàn)對(duì)“已經(jīng)建立數(shù)據(jù)源”的連接監(jiān)控,支持實(shí)時(shí)查看數(shù)據(jù)源的連接情況,對(duì)錯(cuò)誤連接進(jìn)行查詢和改正。

(1)執(zhí)行管理。主要對(duì)校驗(yàn)結(jié)果進(jìn)行查詢,如執(zhí)行的起始時(shí)間、校驗(yàn)總數(shù)、當(dāng)前狀態(tài)、問(wèn)題數(shù)據(jù)數(shù)量、執(zhí)行異常等。

(2)質(zhì)量報(bào)告。該報(bào)告可應(yīng)用于執(zhí)行結(jié)果分析,具有定義和導(dǎo)出報(bào)表等功能;根據(jù)特定指標(biāo)進(jìn)行報(bào)表分類,依照不同類別進(jìn)行組織管理,以樹(shù)形結(jié)構(gòu)為主,帶有一個(gè)根節(jié)點(diǎn),并結(jié)合實(shí)際情況進(jìn)行存儲(chǔ),為后續(xù)管理提供便利。

(3)問(wèn)題整改。當(dāng)校驗(yàn)規(guī)則中出現(xiàn)問(wèn)題數(shù)據(jù)后,應(yīng)明確問(wèn)題的解決流程。通過(guò)問(wèn)題整改可對(duì)缺陷信息進(jìn)行查詢。策略實(shí)施后,問(wèn)題數(shù)據(jù)將自動(dòng)匯入缺陷池中。

(4)質(zhì)量監(jiān)控。有助于查詢數(shù)據(jù)質(zhì)量信息,根據(jù)不同維度對(duì)缺陷情況進(jìn)行統(tǒng)計(jì),為用戶提供更加清楚明確的質(zhì)量監(jiān)控情況。

4 結(jié)語(yǔ)

綜上所述,在大數(shù)據(jù)時(shí)代背景下,數(shù)據(jù)信息爆炸式增長(zhǎng),數(shù)據(jù)質(zhì)量提升成為數(shù)據(jù)治理技術(shù)的應(yīng)用目標(biāo)之一。要想提高數(shù)據(jù)質(zhì)量,首先應(yīng)清楚數(shù)據(jù)質(zhì)量問(wèn)題的成因,并構(gòu)建組織架構(gòu),制定數(shù)據(jù)質(zhì)量治理系統(tǒng),并通過(guò)配置管理、數(shù)據(jù)源管理等方式,針對(duì)不同數(shù)據(jù)類型采取相應(yīng)的處理措施,做到事前預(yù)防、事中控制與事后改善相結(jié)合,從根本上改善數(shù)據(jù)質(zhì)量,達(dá)到理想的治理目標(biāo)。

猜你喜歡
規(guī)則數(shù)據(jù)庫(kù)質(zhì)量
撐竿跳規(guī)則的制定
“質(zhì)量”知識(shí)鞏固
數(shù)獨(dú)的規(guī)則和演變
質(zhì)量守恒定律考什么
做夢(mèng)導(dǎo)致睡眠質(zhì)量差嗎
讓規(guī)則不規(guī)則
Coco薇(2017年11期)2018-01-03 20:59:57
數(shù)據(jù)庫(kù)
TPP反腐敗規(guī)則對(duì)我國(guó)的啟示
數(shù)據(jù)庫(kù)
數(shù)據(jù)庫(kù)
主站蜘蛛池模板: 一级黄色欧美| 操国产美女| 5555国产在线观看| 亚洲一区二区三区香蕉| 国产精品成人观看视频国产 | 亚洲国产成人麻豆精品| 国产精品美女自慰喷水| igao国产精品| 成人国产免费| 国产欧美中文字幕| 欧美一区二区福利视频| 72种姿势欧美久久久大黄蕉| 一级毛片基地| 在线观看国产黄色| 97人人模人人爽人人喊小说| 青青操视频免费观看| 999国内精品久久免费视频| 婷五月综合| 少妇极品熟妇人妻专区视频| 国产一区成人| 亚洲一区二区无码视频| 久久综合结合久久狠狠狠97色| 亚洲人免费视频| AⅤ色综合久久天堂AV色综合| 成人精品免费视频| 亚洲最新网址| 午夜激情婷婷| 无码网站免费观看| 国产亚洲美日韩AV中文字幕无码成人| 久久无码高潮喷水| 无码日韩精品91超碰| 2021天堂在线亚洲精品专区| 国产午夜人做人免费视频中文| 午夜无码一区二区三区| 免费激情网址| 秘书高跟黑色丝袜国产91在线| 色成人综合| 99热免费在线| 国产精品午夜福利麻豆| 精品一區二區久久久久久久網站| 亚洲精品国产自在现线最新| 久久精品无码一区二区国产区| 欧美精品成人一区二区视频一| 色综合天天综合中文网| 国产一级一级毛片永久| 99精品影院| 一本大道香蕉久中文在线播放| 色综合综合网| 国产成人精品亚洲日本对白优播| 亚洲午夜福利精品无码| 在线观看亚洲天堂| 狠狠躁天天躁夜夜躁婷婷| 超碰精品无码一区二区| 韩日无码在线不卡| 精品免费在线视频| 欧美午夜视频在线| 狠狠色丁香婷婷| 亚洲 欧美 偷自乱 图片| 亚洲制服中文字幕一区二区| 97超级碰碰碰碰精品| 五月婷婷综合在线视频| 无码'专区第一页| 国产偷国产偷在线高清| 天天做天天爱天天爽综合区| 萌白酱国产一区二区| 中文字幕调教一区二区视频| 国产日本一线在线观看免费| 国产va免费精品| 国内精品视频| 久久激情影院| 8090成人午夜精品| h网站在线播放| 欧美人人干| 亚洲中文精品人人永久免费| 露脸真实国语乱在线观看| 在线欧美日韩| 99精品视频九九精品| 国产成人久久777777| 国产精品太粉嫩高中在线观看| 国产高清在线丝袜精品一区| 伊人天堂网| 亚洲日本一本dvd高清|