999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

商業(yè)智能在一卡通數(shù)據(jù)分析中的應(yīng)用與實現(xiàn)

2019-07-08 02:23:41周勇強
電腦知識與技術(shù) 2019年13期

周勇強

摘要:業(yè)務(wù)系統(tǒng)運行多年沉淀的大量數(shù)據(jù)已成為企業(yè)新的數(shù)字資源,通過深入分析和挖掘,發(fā)現(xiàn)其中有價值的信息,為管理決策提供支持,已成為很多企業(yè)的新需求。以某校在一卡通POS交易數(shù)據(jù)分析方面存在的需求為起點,采用Microsoft商業(yè)智能技術(shù)體系及產(chǎn)品集,應(yīng)用Kimball維度建模方法,構(gòu)建了適合實際情況的、易于擴展的DW/BI解決方案。重點研究系統(tǒng)架構(gòu)、維度建模及OLAP數(shù)據(jù)分析。

關(guān)鍵詞:商業(yè)智能;數(shù)據(jù)倉庫;OLAP;維度模型;多維數(shù)據(jù)集

中圖分類號:TP311.13 ? ? ? ?文獻標識碼:A

文章編號:1009-3044(2019)13-0283-03

某校的一卡通系統(tǒng)已運行多年,積累了大量業(yè)務(wù)數(shù)據(jù),但缺乏靈活的數(shù)據(jù)分析手段。下面是一些業(yè)務(wù)需求:

① 管理層希望從卡戶、商戶、時間、POS終端、用餐團隊等多個角度快速分析POS交易數(shù)據(jù),并可靈活切換分析角度及分析粒度。

② 教職工餐廳在工作餐(中餐)時段,用餐人員有時排起長隊有時空閑,管理層希望分析用餐流量分布規(guī)律,提升管理服務(wù)水平。

本案例需求進入了商業(yè)智能(BI)的應(yīng)用范疇,即:將應(yīng)用數(shù)據(jù)在數(shù)據(jù)倉庫(DW)系統(tǒng)中組織成一致的分析型數(shù)據(jù),然后通過聯(lián)機分析處理(OLAP)或數(shù)據(jù)挖掘(DM)等技術(shù)手段,發(fā)現(xiàn)有價值的信息,為管理決策提供支持。本案例研究將Kimball維度建模技術(shù)融入Microsoft商業(yè)智能技術(shù)體系及產(chǎn)品集,構(gòu)建DW/BI解決方案,重點研究系統(tǒng)架構(gòu)、維度建模及OLAP多維數(shù)據(jù)分析。

1 系統(tǒng)架構(gòu)

在數(shù)據(jù)倉庫領(lǐng)域,Kimball數(shù)據(jù)倉庫構(gòu)建方法是一種以業(yè)務(wù)過程為導(dǎo)向的、迭代式的敏捷開發(fā)模式,其維度建模技術(shù)幾乎已經(jīng)成為數(shù)據(jù)倉庫建模的最佳實踐。另一方面,微軟BI方案擁有覆蓋整個BI生命周期的完整、完全集成的技術(shù)體系及產(chǎn)品集,各部分可有效地協(xié)同工作。將Kimball方法融入微軟BI平臺,可快速構(gòu)建易于維護的、高性價比的DW/BI系統(tǒng)。本案例系統(tǒng)架構(gòu)見圖1,由源數(shù)據(jù)區(qū)、SSIS、SQL Server RDBMS、SSAS、BI應(yīng)用等部分組成。

源數(shù)據(jù)區(qū)包含一卡通等多個OLTP系統(tǒng)數(shù)據(jù)庫。

SSIS(SQL Server Integration Services)用于構(gòu)建ETL系統(tǒng)。ETL從源數(shù)據(jù)區(qū)抽取數(shù)據(jù),經(jīng)過清洗、規(guī)格化等處理后轉(zhuǎn)換成分析型數(shù)據(jù),加載到關(guān)系數(shù)據(jù)倉庫數(shù)據(jù)庫中。其中ETL數(shù)據(jù)存儲用于存儲ETL過程中的有關(guān)數(shù)據(jù)。

關(guān)系數(shù)據(jù)倉庫數(shù)據(jù)庫是數(shù)據(jù)倉庫數(shù)據(jù)保存的第一個位置,由SQL Server RDBMS管理,數(shù)據(jù)結(jié)構(gòu)按星型維度模型組織。這個數(shù)據(jù)庫用于向SSAS(SQL Server Analysis Services)管理的多維數(shù)據(jù)倉庫數(shù)據(jù)庫提供數(shù)據(jù)。

多維數(shù)據(jù)倉庫數(shù)據(jù)庫是數(shù)據(jù)倉庫數(shù)據(jù)保存的第二個位置,由SSAS生成和管理。 SSAS采用MOLAP存儲模式將關(guān)系數(shù)據(jù)倉庫數(shù)據(jù)庫中的數(shù)據(jù)在多維數(shù)據(jù)倉庫數(shù)據(jù)庫中重組為多維數(shù)據(jù)集。SSAS通過OLAP服務(wù)向終端用戶開放多維數(shù)據(jù)倉庫數(shù)據(jù)庫,提供OLAP分析及數(shù)據(jù)挖掘功能。

在BI應(yīng)用部分,終端用戶使用Excel軟件通過SSAS連接多維數(shù)據(jù)倉庫數(shù)據(jù)庫,進行OLAP分析或數(shù)據(jù)挖掘。

2 維度建模

2.1 維度建模的基本概念

Kimball維度建模是圍繞業(yè)務(wù)過程進行的。業(yè)務(wù)過程是業(yè)務(wù)流程中一個可度量的事件或活動,業(yè)務(wù)過程捕獲或生成的度量指標稱為度量值(或事實),參與業(yè)務(wù)過程的對象稱為維度。使用Kimball方法建模,首先需要通過需求分析選取業(yè)務(wù)過程,每次針對一個業(yè)務(wù)過程建模,迭代式地構(gòu)建數(shù)據(jù)倉庫。

保證每次迭代所構(gòu)建的數(shù)據(jù)集市能在整個數(shù)據(jù)倉庫體系中無縫融合,并能適應(yīng)未來發(fā)展的Kimball方法是采用數(shù)據(jù)倉庫總線架構(gòu)??偩€架構(gòu)和一致性維度、一致性事實共同組成了Kimball多維體系結(jié)構(gòu)的基礎(chǔ),形成了一套可以逐步建立數(shù)據(jù)倉庫的方法論。其核心是在體系結(jié)構(gòu)確立階段,設(shè)計出在整個企業(yè)內(nèi)具有統(tǒng)一解釋的標準化的維度和事實,即一致性維度和一致性事實。一致性維度就像企業(yè)范圍內(nèi)的一組總線,將多個數(shù)據(jù)集市在邏輯上結(jié)合在一起,一致性事實保證不同數(shù)據(jù)集市間的事實數(shù)據(jù)可以交叉探查,所有數(shù)據(jù)集市聯(lián)合組成分布式數(shù)據(jù)倉庫??山柚贙imball的企業(yè)總線矩陣列出企業(yè)范圍中的業(yè)務(wù)過程及維度,企業(yè)總線矩陣是DW/BI系統(tǒng)的總體數(shù)據(jù)架構(gòu)藍圖,是每次迭代的路標。

在維度模型中事實和維度是分開存儲的,事實存儲在事實表中,維度存儲在各自的維度表中,事實表中除了度量值,一般只存儲指向維度表的外鍵,事實表和維度表通過主外鍵關(guān)聯(lián)在一起。

本案例維度模型按星型模式設(shè)計,在星型模型中,通過反規(guī)范化設(shè)計將存在關(guān)聯(lián)關(guān)系的維度表合并存儲在一張維度表中,因為消除了復(fù)雜的維表間關(guān)聯(lián),因此提高了查詢性能,且更易被用戶理解。

2.2 維度建模

按Kimball的4步設(shè)計方法進行維度建模。

2.2.1 選擇業(yè)務(wù)過程

在本案例的企業(yè)數(shù)據(jù)倉庫總線矩陣中,包含有POS交易、圖書借還、會議簽到等眾多業(yè)務(wù)過程。用戶當前的主要需求可以歸納為對POS交易數(shù)據(jù)進行分析,而POS交易數(shù)據(jù)來自于卡戶在POS終端刷卡扣費、充值等交易活動,并存儲在一卡通系統(tǒng)數(shù)據(jù)庫中,因此“POS交易”業(yè)務(wù)過程有最高的業(yè)務(wù)價值、有源數(shù)據(jù)支撐、易于實現(xiàn),應(yīng)優(yōu)先建模。限于篇幅,本文只選擇這個業(yè)務(wù)過程建模,并將維度模型進行了簡化。

2.2.2 聲明粒度

粒度是指數(shù)據(jù)倉庫中數(shù)據(jù)的細化和綜合程度。DW/BI系統(tǒng)幾乎總是要求數(shù)據(jù)盡可能以最細粒度(原子粒度)來表示,原子粒度數(shù)據(jù)能以任何方式進行切分操作,從而回答各種不可預(yù)測的分析請求,提供最佳的分析靈活性。在本案例中,最細粒度是POS交易的每次刷卡數(shù)據(jù)。

2.2.3 確定維度

粒度確定后,根據(jù)業(yè)務(wù)場景可確定日期、時間、人員、POS終端、錢包等維度,見圖2。維度表的主鍵命名以“Key”結(jié)尾,均采用代理鍵;來自業(yè)務(wù)系統(tǒng)的業(yè)務(wù)主鍵命名以“ID”結(jié)尾,用于識別數(shù)據(jù)來源。維度表使用代理主鍵是公認的最佳實踐,用于整合不同源數(shù)據(jù)、處理第二種類型的緩慢變化維度(Type 2 SCD)。

日期維度:“日”是日期維度的原子粒度。為了滿足不同場合對分析粒度及報表標簽名稱的需求,設(shè)計了年、季度、月、日、星期、節(jié)假日等各種日期維度屬性。日期維度存在多種層次結(jié)構(gòu),如年/季度/月/日、年/周/日等。本案例使用的日期范圍是前10年及今后20年,共約11000條記錄。

當天時間維度:用餐流量可以通過用餐時間段內(nèi)以分鐘為粒度的用餐流量變化規(guī)律進行分析。除了當天時間的時、分,還設(shè)計了餐次等時間段屬性。當天時間維度表有1440條記錄,如果將當天時間和日期合并在一起,將產(chǎn)生約1500萬條記錄的巨大的日期維度表,因此我們將日期和當天時間分開存儲,這兩張維表容量都很小,性能得以提高。

人員維度:人員維度是企業(yè)數(shù)據(jù)倉庫總線中一個較為復(fù)雜的一致性維度。包含人員數(shù)據(jù)的業(yè)務(wù)系統(tǒng)有一卡通系統(tǒng)、主業(yè)務(wù)管理平臺、酒店管理系統(tǒng)、圖書管理系統(tǒng)等,這些系統(tǒng)已經(jīng)作了對接,人員、部門等主要數(shù)據(jù)是共享的,但每個源系統(tǒng)創(chuàng)建的共享數(shù)據(jù)所共享的范圍各不相同,整個企業(yè)中這些共享數(shù)據(jù)的產(chǎn)生和更新以源系統(tǒng)為準,因此ETL需要從這幾個系統(tǒng)中抽取各系統(tǒng)的源頭數(shù)據(jù)。 “源系統(tǒng)ID”用于區(qū)分數(shù)據(jù)源頭。對人員姓名、部門、狀態(tài)、人員類別等的變化按Type 2 SCD進行處理,對于性別、出生日期等屬性按Type 1 SCD進行處理。

POS終端維度:在一卡通系統(tǒng)中,POS交易終端配置在“交易站點”中。交易終端分為A、B二類,每個站點可以容納一個A類終端或一個以上B類終端。因此每個交易終端可使用(站點ID,終端機號ID)進行唯一性識別(A類終端的終端機號ID固定為0)

錢包維表:一卡通系統(tǒng)支持多個電子錢包。

交易類型維表:包含商務(wù)消費、卡戶存款等交易類型。

2.2.4 確定事實

POS交易過程獲取的事實有交易金額、優(yōu)惠金額等,擴展事實還有交易人次、交易人數(shù)等。擴展事實可在BI工具中通過添加計數(shù)、非重復(fù)計數(shù)等實現(xiàn)。

3 OLAP多維數(shù)據(jù)分析

使用Excel的數(shù)據(jù)透視表和數(shù)據(jù)透視圖連接多維數(shù)據(jù)倉庫數(shù)據(jù)庫,通過簡單的鼠標拖放操作,即可以即席查詢(Ad Hoc)方式進行OLAP多維數(shù)據(jù)分析。以下是兩個分析例子。

3.1 團隊商務(wù)收費構(gòu)成的即席分析

圖3是兩個團隊的團隊商務(wù)收費構(gòu)成透視表。分析對象為“POS交易”多維數(shù)據(jù)集,分析的事實是交易金額,分析維度有交易類型、日期(年/季度/月/日)、POS終端、當天時間(餐次)、人員(部門/人員)。通過鼠標點擊維度標簽上的加、減號,即可實現(xiàn)上鉆、下鉆操作;通過鼠標拖放調(diào)整維度組合、對維度進行過濾和排序,即可實現(xiàn)變換分析角度、進行切片/切塊分析。

3.2 用餐流量分析

圖4是教職工餐廳2017年2季度中餐刷卡流量透視圖,分析對象為“POS交易”多維數(shù)據(jù)集,分析的事實是刷卡次數(shù),分析維度有POS終端、日期(年/季度/月/日)、當天時間(時/分)。

中餐時間段為11:30~12:30。由圖可知,用餐流量高峰出現(xiàn)在11:50~12:05,在11:30~12:10這段時間中,除了用餐高峰外的用餐流量較為均衡,開餐時間11:30之前有少量用餐流量,用餐結(jié)束時間12:30之前20分鐘(12:10~12:30)用餐人數(shù)稀少。

接下來,切換日期維度到其它的季度,或者上鉆到年份,或者下鉆到月份、日來進行更細致的觀察,我們得到了和上述分析類似的結(jié)論(限于篇幅,不再展示這些數(shù)據(jù))

根據(jù)以上分析,管理層可以結(jié)合實際情況優(yōu)化用餐流量,如:一、適當調(diào)整中餐時間段;二、進一步分析不同人群的流量分布規(guī)律(如:即席添加一個人員維度并上鉆到部門粒度,即可以折線圖等方式顯示每個部門的流量分布),結(jié)合學校業(yè)務(wù)特點有針對性地向非高峰時段引導(dǎo)用餐流量。

4 結(jié)論

本案例快速構(gòu)建了一個能滿足當前需求、適合學校發(fā)展實際情況的DW/BI系統(tǒng)。本系統(tǒng)有不少改進或擴展空間,后續(xù)可在目前基礎(chǔ)上迭代式發(fā)展,如添加更多業(yè)務(wù)過程、擴展數(shù)據(jù)挖掘功能、加入第三方工具、開發(fā)自定義BI應(yīng)用,以發(fā)掘出更多有價值的信息。

參考文獻:

[1] (美)Ralph Kimball.數(shù)據(jù)倉庫生命周期工具箱[M]. 唐富年,等,譯. 2版.北京:清華大學出版社,2009.

[2] Ralph Kimball,Margy Ross.The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling, 3rd Edition[M]: US: Wiley Computer Publishing,2013.

[3] (美)Lynn Langit.SQL Server 2008商業(yè)智能完美解決方案[M]. 張猛,等,譯.北京:人民郵電出版社.2010.

[4] Ralph Kimball. Design Tip #15: Combining SCD Techniques [EB/OL]. https://decisionworks.com/2000/10/design-tip-15-combining-scd-techniques/.

【通聯(lián)編輯:代影】

主站蜘蛛池模板: 女人爽到高潮免费视频大全| 亚洲中文字幕在线精品一区| 2020极品精品国产| 黄色网址手机国内免费在线观看| 暴力调教一区二区三区| 黄色一级视频欧美| 日韩精品专区免费无码aⅴ| …亚洲 欧洲 另类 春色| 成人国产一区二区三区| 国产流白浆视频| 亚洲福利网址| 亚洲91在线精品| 红杏AV在线无码| 亚洲精品你懂的| 精品少妇人妻无码久久| 少妇人妻无码首页| 999国产精品永久免费视频精品久久 | 91丨九色丨首页在线播放| 国产女人爽到高潮的免费视频| 人妻丝袜无码视频| 日本亚洲成高清一区二区三区| 国产成人高清亚洲一区久久| 香蕉久人久人青草青草| 91青草视频| 欧美性精品| 67194成是人免费无码| 中日韩欧亚无码视频| 狼友视频国产精品首页| 福利在线一区| 久久久久青草大香线综合精品 | 四虎影视国产精品| 欧美精品亚洲二区| 久久久久亚洲精品成人网| 国产自在线拍| 亚洲色偷偷偷鲁综合| 国模沟沟一区二区三区| 中文无码影院| 中文无码日韩精品| 亚洲欧美激情小说另类| 男女男免费视频网站国产| 无码又爽又刺激的高潮视频| 国产精品美女自慰喷水| 久久国产精品电影| 91色爱欧美精品www| 日本成人精品视频| 欧美日本在线观看| 91破解版在线亚洲| 亚洲欧美色中文字幕| 日本亚洲欧美在线| 国产日韩久久久久无码精品| 在线观看亚洲天堂| 久久伊人操| 在线99视频| 国产成熟女人性满足视频| 午夜色综合| 国产精品丝袜在线| 久久精品亚洲热综合一区二区| 日a本亚洲中文在线观看| 久久国产高清视频| 在线观看亚洲人成网站| 欧美区一区| 国产69囗曝护士吞精在线视频| 青青青亚洲精品国产| 在线看片免费人成视久网下载| 国产成人永久免费视频| 国产成人精品一区二区不卡 | 自拍偷拍一区| 国产91在线|日本| 欧美国产日产一区二区| 久996视频精品免费观看| 亚洲av日韩av制服丝袜| 国产xx在线观看| 在线中文字幕日韩| 人与鲁专区| 伊人久热这里只有精品视频99| 欧美成人影院亚洲综合图| 99国产精品国产| 99久久99视频| 欧亚日韩Av| 亚洲男人的天堂久久香蕉网| 香蕉视频在线观看www| 91精品综合|