999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Spark的數(shù)據(jù)分析可視化平臺設計與實現(xiàn)

2022-09-21 07:55:38周正宇康華夏劉文軍陳晨
電腦知識與技術 2022年24期
關鍵詞:圖表可視化數(shù)據(jù)庫

周正宇,康華夏,劉文軍,陳晨

(1.蘇州工業(yè)職業(yè)技術學院軟件與服務外包學院,江蘇蘇州 215104;2.蘇州礪行信息科技有限公司,江蘇蘇州 215151)

1 引言

隨著物聯(lián)網(wǎng)、云計算、大數(shù)據(jù)等信息技術與傳統(tǒng)產(chǎn)業(yè)的不斷融合,無論是企業(yè)內(nèi)部的經(jīng)營管理數(shù)據(jù)還是供應鏈數(shù)據(jù)都呈現(xiàn)爆炸式增長。通過對行業(yè)相關數(shù)據(jù)的深入分析,可以直觀掌握其業(yè)務運營狀況,為戰(zhàn)略決策、業(yè)務調(diào)整提供依據(jù);另一方面,供應鏈協(xié)同使得需求預測、產(chǎn)能分析、協(xié)同研發(fā)等成為可能,產(chǎn)業(yè)數(shù)據(jù)的融合顯著提高了企業(yè)應對風險的能力。大數(shù)據(jù)時代,數(shù)據(jù)作為企業(yè)的核心資產(chǎn),加以分析利用成為提升企業(yè)核心競爭力的關鍵[1-2]。

傳統(tǒng)的數(shù)據(jù)統(tǒng)計、分析挖掘已經(jīng)顯露短板,特別是隨著數(shù)據(jù)量不斷攀升,離線的數(shù)據(jù)分析效率低下的瓶頸日益凸顯。相較之下,基于B/S 架構(gòu)的數(shù)據(jù)分析可視化平臺在大數(shù)據(jù)分析技術的支持下更加適合挖掘數(shù)據(jù)潛在價值,提供可靠的輔助決策信息,能促進企業(yè)核心競爭能力的建立,確保企業(yè)的可持續(xù)發(fā)展[3-7]。

本文針對該問題,給出了一種適用于海量數(shù)據(jù)下,基于Spark和前端技術實現(xiàn)快速定制化數(shù)據(jù)分析的平臺設計和實現(xiàn)方案。利用數(shù)據(jù)倉庫、線上分析處理等技術對客戶數(shù)據(jù)進行系統(tǒng)的存儲和管理,通過各種數(shù)據(jù)統(tǒng)計分析工具對業(yè)務數(shù)據(jù)進行分析并進行可視化展示,從而實現(xiàn)企業(yè)對數(shù)據(jù)進行有效的管理和整合。

2 關鍵問題

2.1 運算性能

如今,企業(yè)業(yè)務的復雜度越來越高,所產(chǎn)生的數(shù)據(jù)量也越來越大,想要對這些數(shù)據(jù)進行快速而有效的處理是一個龐大的工程。傳統(tǒng)C/S 架構(gòu)的數(shù)據(jù)分析工具多使用單機CPU 進行運算,在業(yè)務數(shù)據(jù)量龐大的今天已經(jīng)難以滿足實際需要。使用分布式系統(tǒng)的數(shù)據(jù)分析可視化平臺對系統(tǒng)的運行效率有著巨大的提升,同時采用B/S架構(gòu)的交互技術帶來良好的用戶體驗。

2.2 數(shù)據(jù)可視化

傳統(tǒng)的數(shù)據(jù)分析工具需要用戶懂得SQL操作,通常需要用戶和技術人員反復討論,選擇特定的字段生成目標圖表。這一過程中往往有交流和理解上的困難,給用戶帶來不佳的操作體驗。本系統(tǒng)使用Vue.js的draggable組件,實現(xiàn)了對數(shù)據(jù)字段的直接拖拽生產(chǎn)分析結(jié)果的功能,并且用戶可以根據(jù)業(yè)務需求和邏輯自定義圖表來呈現(xiàn)精確的可視化效果,大大便捷了用戶的操作。

2.3 分析模型

數(shù)據(jù)的價值在于通過模型分析后為行業(yè)管理者提供參考決策。一方面需要選擇合理的數(shù)據(jù)可視化的圖表,科學有效地展示給用戶;另一方面,需要確定與業(yè)務匹配的數(shù)據(jù)分析算法模型進行支撐。平臺自主選擇數(shù)據(jù)源,并且集成主流的分析模型供用戶選擇。由于用戶的業(yè)務不盡相同,需要的算法模型難以通用,因而要求平臺具有二次開發(fā)能力,支持橫向拓展算法模型。

3 系統(tǒng)設計

3.1 系統(tǒng)架構(gòu)

平臺的架構(gòu)設計如圖1所示。從右到左分為存儲層、數(shù)據(jù)處理層和展示層。存儲層主要用Greenplum分布式數(shù)據(jù)庫存儲用戶所連接的數(shù)據(jù)庫數(shù)據(jù),可供服務器更快地進行數(shù)據(jù)處理,而不必等用戶操作時再去讀取用戶數(shù)據(jù)。這一模式大大提高了運行效率。數(shù)據(jù)處理層使用Spark 并行查詢讀取數(shù)據(jù)庫數(shù)據(jù),再充分利用Spark內(nèi)存計算的優(yōu)點,將數(shù)據(jù)通過基于內(nèi)存的分布式文件系統(tǒng)Alluxio緩存進內(nèi)存,通過內(nèi)存計算來快速處理數(shù)據(jù),返回處理結(jié)果。展示層采用Vue.js+Element.ui 技術實現(xiàn)前端可拖拽頁面的呈現(xiàn),使數(shù)據(jù)分析結(jié)果按照用戶的想法進行直觀展現(xiàn)。

圖1 系統(tǒng)架構(gòu)圖

3.2 數(shù)據(jù)存儲

本系統(tǒng)使用Greenplum-Spark Connector 連接器(GSC)以打通GreenPlum 數(shù)據(jù)庫和Spark。GSC 是由Drive 節(jié)點和Executor節(jié)點構(gòu)成,本質(zhì)上是一個Spark application,其工作機制如圖2所示。當系統(tǒng)使用GSC讀取GreenPlum數(shù)據(jù)時,其中Drive節(jié)點先通過JDBC 的請求方式訪問GreenPlum 的master 節(jié)點來獲取關于被讀取數(shù)據(jù)元數(shù)據(jù)的信息。GSC將根據(jù)這些元數(shù)據(jù),讓多個Executor 節(jié)點并行地讀取GreenPlum 數(shù)據(jù)庫中所需要的數(shù)據(jù),來提高讀取數(shù)據(jù)的效率,以提升用戶的體驗。

圖2 GSC工作機制圖

3.3 數(shù)據(jù)讀取

Spark 用戶通常使用Saprk RDD Cache 將數(shù)據(jù)以RDD 的結(jié)構(gòu)存儲在Spark Executor 中,以后每次對這個RDD 進行操作時就無需重新計算,直接從內(nèi)存或者磁盤中提取持久化的RDD數(shù)據(jù)。但是存儲RDD 所需的內(nèi)存可能會非常大,進而導致Spark Executor的計算內(nèi)存相對變小,甚至有可能因計算內(nèi)存不足導致Spark 作業(yè)崩潰,致使數(shù)據(jù)沒有被持久化到內(nèi)存中。本系統(tǒng)為解決這類問題將RDD 數(shù)據(jù)存儲在Alluxio 中,這樣Spark Executor 就不需要配置存儲數(shù)據(jù)需要的內(nèi)存,只需配置計算所需內(nèi)存。Alluxio 提供了RDD 數(shù)據(jù)所需的內(nèi)存,即使Saprk 作業(yè)崩潰,數(shù)據(jù)也會被Alluxio 持久化到內(nèi)存中。Spark 仍然可以從內(nèi)存讀取數(shù)據(jù),將數(shù)據(jù)提供給web 前端,極大地提高了系統(tǒng)的穩(wěn)定性和運行效率。該機制下的數(shù)據(jù)流轉(zhuǎn)如圖3所示。

圖3 數(shù)據(jù)流轉(zhuǎn)圖

3.4 拖拽式可視化

系統(tǒng)的可視化是基于Vue.js+Element.ui技術實現(xiàn)的。其中可拖拽的功能實現(xiàn)主要引用了Vue 的相關draggable 組件。其中涉及的主要事件和執(zhí)行時機包括:

1)ondragstart:在拖動開始時執(zhí)行。

2)ondragover:被拖動的對象在進入另一容器范圍內(nèi)時執(zhí)行。

3)ondragenter:在被拖動的對象進入該容器范圍內(nèi)時執(zhí)行。

4)ondragleave:在被拖動的對象離開其容器范圍內(nèi)時執(zhí)行。

5)ondragend:拖動完成時執(zhí)行。

6)ondrag,ondrop:分別為拖動時執(zhí)行和釋放鼠標時執(zhí)行。系統(tǒng)根據(jù)這些事件實現(xiàn)了根據(jù)拖拽的字段生成對應維度和數(shù)值的圖表;實現(xiàn)了對圖表大小和位置的編輯等自由度高的功能。

3.5 數(shù)據(jù)分析模型

平臺通過Spark中可拓展的機器學習庫Spark MLlib進行數(shù)據(jù)分析模型搭建,特別使用其包含的算法依賴實現(xiàn)了線性回歸、邏輯回歸等預測模型。Spark MLlib 的算法工具包括聚類、回歸、分類、協(xié)同過濾、降維等,同時可以進行底層優(yōu)化,其算法還可以進行擴充。系統(tǒng)通過Spark MLlib 可快速實現(xiàn)數(shù)據(jù)分析模型的橫向拓展。可供用戶更好地進行業(yè)務邏輯和算法模型匹配,提高分析結(jié)果的質(zhì)量,便于用戶更好地進行決策。

4 系統(tǒng)實現(xiàn)

4.1 圖表生成

網(wǎng)站界面設計遵循簡約風格。如圖4所示,給出了一個航班分析應用示例。用戶在左上角選擇數(shù)據(jù)源,然后拖動興趣字段名放入中間的維度或者數(shù)值,即可自動生成折線圖。用戶可以根據(jù)具體需求,在右下角切換圖表類型,可以對字段進行排序和篩選。示例中,折線圖所顯示的是對航班的數(shù)據(jù)進行數(shù)據(jù)處理的結(jié)果。x軸為航班號,y軸為航班人次。可以看出各個航班的當日人次,反映出客流量的差異。所生成的圖表可以保存,并支持下載成圖片作為素材提供給用戶。平臺支持對字段進行統(tǒng)計操作,如求和、平均值、方差、標準差、聚類等多種計算方式和分析功能。同時也支持數(shù)據(jù)分析模型的拓展。

圖4 圖表生成圖

4.2 圖表組合

前端頁面中可以新建可視化圖表,并支持將保存過的圖表添加進來,通過對圖表進行拖動、拉伸,并按照用戶意愿自定義圖表大小和位置,最后組合為可視化大屏。如圖5 所示,通過拖拽方式構(gòu)建了一個航班數(shù)據(jù)可視化大屏。此外,用戶點擊分享能夠生成鏈接,把生成的鏈接發(fā)送給其他用戶進行共享。

圖5 報表生成圖

5 結(jié)論

信息技術迅猛發(fā)展的今天,業(yè)務產(chǎn)生的數(shù)據(jù)量是非常龐大的,這些數(shù)據(jù)流轉(zhuǎn)快速、類型多樣、價值密度低。其中蘊含的商業(yè)價值很難被挖掘利用,這也成為現(xiàn)階段企業(yè)的難題。本文設計的大數(shù)據(jù)分析可視化平臺通過Spark內(nèi)存計算、GreenPlum分布式數(shù)據(jù)庫、可拖拽式的頁面呈現(xiàn)等技術,對該類型問題提供了一種有效的解決方案。特別地,本方案支持大數(shù)據(jù)算力,并且服務器可以進行橫向和縱向拓展,為問題的解決提供了一種有益的嘗試。

猜你喜歡
圖表可視化數(shù)據(jù)庫
基于CiteSpace的足三里穴研究可視化分析
基于Power BI的油田注水運行動態(tài)分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
基于CGAL和OpenGL的海底地形三維可視化
“融評”:黨媒評論的可視化創(chuàng)新
傳媒評論(2019年4期)2019-07-13 05:49:14
數(shù)據(jù)庫
財經(jīng)(2017年2期)2017-03-10 14:35:35
雙周圖表
足球周刊(2016年14期)2016-11-02 10:54:56
雙周圖表
足球周刊(2016年10期)2016-10-08 18:30:55
圖表
世界博覽(2016年16期)2016-09-27 18:25:26
數(shù)據(jù)庫
財經(jīng)(2016年3期)2016-03-07 07:44:46
數(shù)據(jù)庫
財經(jīng)(2016年6期)2016-02-24 07:41:51
主站蜘蛛池模板: 久久免费看片| 91在线国内在线播放老师| 久久久久亚洲AV成人人电影软件| 亚洲精品无码AV电影在线播放| 国产剧情伊人| 成人欧美日韩| 中文字幕在线免费看| 青草国产在线视频| 玖玖精品在线| 在线观看无码av五月花| 老汉色老汉首页a亚洲| 97视频精品全国在线观看| 国产精品尹人在线观看| 无码免费视频| 91无码视频在线观看| 国产视频 第一页| 亚洲人妖在线| 国产剧情一区二区| 国产日本欧美亚洲精品视| 欧美激情视频一区| 欧美日韩va| 91小视频在线观看| 亚洲爱婷婷色69堂| 亚洲精品卡2卡3卡4卡5卡区| 国产网站免费观看| 国产色伊人| 激情综合网址| 最新午夜男女福利片视频| 免费又爽又刺激高潮网址 | 一级爱做片免费观看久久| 成年A级毛片| 国产打屁股免费区网站| 欧美精品在线观看视频| 免费高清a毛片| 伊人色在线视频| 国产成人精品综合| 欧美日韩精品综合在线一区| 999在线免费视频| 久久窝窝国产精品午夜看片| 性网站在线观看| 国产丝袜无码精品| 青青草原国产| 国产va在线观看| 国产精品理论片| 日韩毛片免费观看| 亚洲中文字幕久久精品无码一区| 日本午夜视频在线观看| 91久久夜色精品国产网站| 黄网站欧美内射| 中文字幕乱妇无码AV在线| 国产SUV精品一区二区6| 欧美精品在线视频观看| 人妻无码中文字幕一区二区三区| 无码AV动漫| 欧美福利在线观看| 国产综合精品日本亚洲777| 国产精品成人第一区| 国产在线视频福利资源站| 成年人国产视频| 久久免费视频播放| 免费一级毛片完整版在线看| 免费观看亚洲人成网站| 亚洲欧美成aⅴ人在线观看| 免费女人18毛片a级毛片视频| 99re这里只有国产中文精品国产精品 | 91视频精品| 国产成年女人特黄特色毛片免 | 在线观看av永久| 国产美女免费| 五月丁香伊人啪啪手机免费观看| 国产成人精品免费视频大全五级| 美女无遮挡免费视频网站| 成人一级黄色毛片| 一区二区三区四区精品视频| 成人免费视频一区| 日韩国产一区二区三区无码| 亚洲国产成人久久77| 免费一级毛片不卡在线播放| 日韩毛片免费观看| 国产精品夜夜嗨视频免费视频| 亚洲欧洲AV一区二区三区| 玖玖精品在线|