999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數(shù)據(jù)分析的分布式MOLAP技術要點

2018-02-02 18:07:48劉磊
電腦知識與技術 2018年1期
關鍵詞:大數(shù)據(jù)

劉磊

摘要:實際工作中需要使用大數(shù)據(jù)技術,但是由于其帶有規(guī)模效應,不利于數(shù)據(jù)分析、數(shù)據(jù)管理、數(shù)據(jù)存儲等工作。為了確保工作質量,相關技術人員通過研究和試驗,發(fā)現(xiàn)使用分布式文件系統(tǒng)優(yōu)勢明顯,應用MapReduce編程模型可以解決上述問題。具體而言,使用MOLAP技術之后,利用多維模型進行維度的映射,同時使用線性化算法將測量到的維度等數(shù)據(jù)存儲到分布式文件中。該文對在大數(shù)據(jù)背景下分布式MOLAP技術要點進行分析,希望給有關人士一些借鑒。

關鍵詞:大數(shù)據(jù);分布式;MOLAP技術

中圖分類號:TP3 文獻標識碼:A 文章編號:1009-3044(2018)01-0009-02

Abstract: In practical work, large data technology is needed, but because of its scale effect, it is not conducive to data analysis, data management, data storage and so on. In order to ensure the quality of work, the relevant technical personnel through research and experiment, found that the use of distributed file system has obvious advantages, the application of MapReduce programming model can solve these problems. Specifically, after using MOLAP technology, the multi-dimensional model is used to map the dimensions, and the linear algorithm is used to store the measured dimensions and other data into the distributed file. Below on the background of big data distributed MOLAP technology analysis, hoping to draw some reference for the relevant people.

Key words: Big data; distributed; MOLAP Technology

對于MOLAP技術也稱之為DOLAP,其使用了多維數(shù)據(jù)模型,包括維和和事實兩個部分,具體操作中必須要找到維和與事實之間的映射關系。DOLAP使用了星象模式,同時使用了關系數(shù)據(jù)庫,將事實數(shù)據(jù)和維信息都存儲到數(shù)據(jù)庫表中。通過外鍵操作做好對事實數(shù)據(jù)的映射、維信息的映射等。

1 分析維編碼算法和維的遍歷算法

1.1 對維編碼算法進行深度分析

技術人員都清楚,實際工作中應用OLAP技術進行操作時,需要對維進行頻繁的操作,由此可見,實際運行中遍歷算法和維編碼是非常關鍵的技術。下面就深入對兩種技術進行分析,希望相關人員掌握要領。對于維編碼的方法而言,主要包括兩種,分別是十進制編碼和二進制編碼。對于二進制編碼而言,內部也將其稱之為位圖編碼,操作中對相關編碼進行拼接,進而得到維的級別信息,除此之外,還可以結合編碼位移做到對維的遍歷,達到最終的技術效果。但是實際使用二進制編碼過程中,很容易導致稀疏問題。對于實際運用的十進制編碼而言,具體運行操作過程中,系統(tǒng)會對所有級別的維值都使用十進制數(shù)進行編碼,雖然可以達到相關目的,但是也存在一定的問題,其不能直接得到維值和編碼,同時也不能得到相應的映射。在大數(shù)據(jù)背景下運行,為了有效避免出現(xiàn)稀疏等問題,在DOLAP技術當中進行了處理,其應用十進制進行編碼,在此基礎上,還開創(chuàng)了一種維的遍歷算法,通過這一算法對維值、編碼間的映射進行計算。具體而言,設l是維d中的某個維級別,對x∈[1,|md(l)|],vx∈md(l),vx的編碼為code(vx),那么就有code(vx)=x1.[1],具體的算法如下:

維編碼算法.Input: Dimension d: A target dimension;

Function: DimensionCoding.

1. FOR i=1 TO |L(d)|;

2. FOR j=0 TO |md(li)|?1;

3. Dimension value of vi,j∈md(li)

4. Vi

5. j.code=j;

5. END FOR

6. END FOR

在現(xiàn)實環(huán)境中大多數(shù)維屬于數(shù)值型,例如其流水號、價格、經(jīng)度、高度等,可以結合其值域進行劃分,由此可見,對于數(shù)值的維可以很容易滿足約束條件,但是還有非數(shù)值的維,包括部門、城市、日期等,根據(jù)這一情況,實際操作時可以使用空值填補維值數(shù),在同一節(jié)點上包含相同數(shù)目的子節(jié)點,相關人員可以參考日期維編碼結果。一般在月級別上每個月的天數(shù)都是不同的,但是為了滿足在這一技術系統(tǒng)中的相關定義,就要設定每月都是31天,針對這一情況,實際操作時一般技術人員會在2月插入29日,或者插入30日和31日。維在實際應用中會變得更加復雜,為了提高工作效率,要將其進行簡化,維層次的劃分方法有很多,包括維值數(shù)法,但是必須滿足定義條件。具體處理時可以選用取舍和合并的方法,將TCP-H的雪花模式進行化簡,將其變?yōu)樾切湍J剑玫降慕Y果可以是SSB數(shù)據(jù)集中的維模式。對于SUPPLIER維表而言,可以選用區(qū)域屬性(Nation,Region,City)作為劃分維層次的重要依據(jù),最終會得到維層次Nation-Region-City。除此之外,可以在維Nation-Region-City維值樹中添加空值,這樣就滿足相關定義,符合其約束條件[2]。endprint

1.2 分析維的遍歷算法

對于DOLAP的維技術人員可以將其視為單根樹,記作Td,但是要記住ALL是Td的根節(jié)點,可以記做第0級別,對每個級別中的維值視為節(jié)點。對于其中每個兄弟節(jié)點而言,都有其相同數(shù)目的子節(jié)點。具體進行OLAP操作時,需要對維值樹Td進行遍歷操作,而且操作頻率較高,工作量比較大。例如要沿著Td下降,或者沿著Td攀升,設其有關系i∈[1,m1],li+1dli,然后就有l(wèi)i+1→li,技術人員要清楚,其中的(vi+1)=vi是比較重要的一個操作內容,利用制定的編碼機制,可以表示為vi∈md(li),vi+1∈md(li+1),這樣就會得到vi與vi+1二者上卷之間的關系ρd。這種上卷關系,我們可以通過編碼運算實現(xiàn)Td中的上卷操作[3]。

2 分析數(shù)據(jù)的存儲

對于傳統(tǒng)的DOLAP技術而言,進行數(shù)據(jù)立方存儲成本比較高,而且操作復雜,尤其對高維數(shù)據(jù)立方進行存儲,或者對維包進行存儲,其里面含有大量的維值,其存儲成本就更大。在傳統(tǒng)技術當中,利用訪問過程中的多維數(shù)組提高OLAP的操作,但是在大數(shù)據(jù)環(huán)境下這一操作非常難實現(xiàn),其多維組是利用計算機得到的,沒有必要進行存儲,由此可見,其使用數(shù)據(jù)立方進行存儲代價非常小。DOLAP技術可以對維進行簡化,確保在同一級別上維的編碼時連續(xù)十進制數(shù),在此基礎上,每一個兄弟節(jié)點都有一個相同的子節(jié)點,針對這一情況可以得知,每個維信息只需要維級別的信息進行存儲,降低了存儲的代價。技術人員可以設維d由m個維級別組成[4],直接記作{li|i∈[1,m]},這樣就有d,其存儲可以表示這一維級別和維級別規(guī)模的序偶所組成的集合,記做{li,|li||i∈[1,m]},在這一公式中l(wèi)i表示這一維級別的名稱,由此可見,在這方面使用DOLAP技術之后,工作人員就可以使用XML文件進行信息的存儲,同時將其保存到集群主節(jié)點中。

3 對OLAP算法進行深入分析

通過對OLAP算法和MapReduce進行分析,發(fā)現(xiàn)其建立了不同視圖,在使用OLAP算法時[5],可以將其抽象為四元組進行表示,分別是Target,Range,Aggregation,Result,其中,Target代表待分析的數(shù)據(jù)立方(元數(shù)據(jù));Range代表立方中待分析數(shù)據(jù)的數(shù)據(jù)范圍。Aggregation指的是聚集函數(shù),例如mean、sum、maximum、minimum。其中的Result表示元數(shù)據(jù),如果Target最高值比Result的最高維級別低時,就表示已經(jīng)完成了上卷操作,無論輸入還是輸出都是數(shù)據(jù)立方。技術人員要清楚,經(jīng)過查詢之后會生成新的立方,由此可見,Result、Target二者的維度可能有所不同。一般都使用維度進行度量的查詢,對于OLAP算法而言,在操作查詢中也是由維度構成的,Range屬于一個多維二元組,準確指出了Target需要分析數(shù)據(jù)的范圍。該算法和傳統(tǒng)的MapReduce進行對比,可以使用比較特殊的多維模型對度量、維和等進行組織。存儲代價比較小。因此在實踐中得到了普及,一線人員也非常青睞這一方法。

4 總結

通過以上對大數(shù)據(jù)下DOLAP技術的分析,發(fā)現(xiàn)這一技術主要包含以下四方面的內容,第一點,該技術可以使用比較特殊的多維模型對度量、維和等進行組織。第二點,通過對維編碼、遍歷算法的分析,可以做到對維值樹上的上卷下鉆操作。第三點,傳統(tǒng)維的存儲方式比較復雜,代價較大,為了提高工作效率,對存儲方法進行了簡化,并做到維和度量的映射關系。第四點,技術人員通過深入研究,最終提出了一種OLA算法,將這一算法和HaoLap進行對比,發(fā)現(xiàn)后者在數(shù)據(jù)裝載方面沒有優(yōu)勢,OLA算法的優(yōu)勢非常明顯,在此基礎上對這一算法的特點進行總結,希望為以后的發(fā)展奠定基礎。

參考文獻:

[1] 宋杰, 郭朝鵬, 王智,等. 大數(shù)據(jù)分析的分布式MOLAP技術[J]. 軟件學報, 2014, 25(4).

[2] 姜博. 大數(shù)據(jù)分析的分布式MOLAP技術[J]. 通訊世界, 2015(24).

[3] 熊寧. 大數(shù)據(jù)分析的分布式MOLAP技術[J]. 信息技術與信息化, 2015(2).

[4] 周青. 大數(shù)據(jù)分析在智能變電站狀態(tài)監(jiān)測系統(tǒng)中的應用研究[D]. 華北電力大學, 2016.

[5] 蔣外文, 熊東平, 張肖霞. 基于多維數(shù)據(jù)庫的MOLAP存儲及查詢技術研究[J]. 計算機工程與應用, 2005, 33(24).endprint

猜你喜歡
大數(shù)據(jù)
基于在線教育的大數(shù)據(jù)研究
中國市場(2016年36期)2016-10-19 04:41:16
“互聯(lián)網(wǎng)+”農產品物流業(yè)的大數(shù)據(jù)策略研究
中國市場(2016年36期)2016-10-19 03:31:48
基于大數(shù)據(jù)的小微電商授信評估研究
中國市場(2016年35期)2016-10-19 01:30:59
大數(shù)據(jù)時代新聞的新變化探究
商(2016年27期)2016-10-17 06:26:00
淺談大數(shù)據(jù)在出版業(yè)的應用
今傳媒(2016年9期)2016-10-15 23:35:12
“互聯(lián)網(wǎng)+”對傳統(tǒng)圖書出版的影響和推動作用
今傳媒(2016年9期)2016-10-15 22:09:11
大數(shù)據(jù)環(huán)境下基于移動客戶端的傳統(tǒng)媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數(shù)據(jù)背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數(shù)據(jù)+輿情:南方報業(yè)創(chuàng)新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 国产女人在线| 国产无遮挡猛进猛出免费软件| 999精品色在线观看| 亚洲欧美日韩中文字幕在线一区| 午夜影院a级片| 国产精品3p视频| 免费A级毛片无码无遮挡| 亚洲有码在线播放| 国产喷水视频| 毛片手机在线看| 亚洲丝袜中文字幕| 依依成人精品无v国产| 亚洲欧美日韩精品专区| 婷婷综合缴情亚洲五月伊| 国产精品hd在线播放| 成人综合久久综合| 亚洲开心婷婷中文字幕| 野花国产精品入口| 国产SUV精品一区二区6| 欧美不卡视频在线| 国产女人在线| 2022国产91精品久久久久久| 国产成人免费视频精品一区二区| 亚洲最大福利视频网| 四虎永久在线视频| 在线亚洲精品自拍| 在线视频亚洲欧美| 中文字幕日韩丝袜一区| 成人免费午间影院在线观看| 欧美狠狠干| 亚洲不卡无码av中文字幕| 男人天堂伊人网| 日韩无码视频网站| 波多野结衣中文字幕一区二区| 欧美成人精品一级在线观看| 国产精品无码AⅤ在线观看播放| 久久青草免费91观看| 亚洲精品视频免费看| 女人18毛片水真多国产| 中文字幕不卡免费高清视频| 激情六月丁香婷婷四房播| 九九线精品视频在线观看| 国产成人亚洲欧美激情| 亚洲中文在线看视频一区| 人妻中文久热无码丝袜| 国产性精品| 国产精品永久久久久| 亚洲综合九九| 亚洲视频无码| 欧美日韩在线观看一区二区三区| 亚洲精品桃花岛av在线| a级毛片毛片免费观看久潮| yjizz视频最新网站在线| 手机精品福利在线观看| 亚洲成综合人影院在院播放| 国产欧美日韩va另类在线播放| 国产精品对白刺激| 日韩在线视频网站| 国产福利免费观看| 成人年鲁鲁在线观看视频| 国模极品一区二区三区| 亚洲免费三区| 538国产在线| 福利在线一区| 国模极品一区二区三区| 日韩免费毛片| 免费人成网站在线高清| 欧美.成人.综合在线| 99久久精品无码专区免费| 国产成人禁片在线观看| 亚洲精品无码日韩国产不卡| 日韩一区精品视频一区二区| 国产又色又刺激高潮免费看| 狠狠亚洲婷婷综合色香| 国产精品第页| 一本视频精品中文字幕| 久久精品无码一区二区日韩免费| 国产欧美中文字幕| 欧美a级在线| 亚洲欧美人成人让影院| 欧美一区精品| 一本大道香蕉中文日本不卡高清二区 |