999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于StarRocks的實時數倉設計

2023-02-23 01:26:28高海峰葉春明
計算機時代 2023年2期
關鍵詞:數據處理

高海峰,葉春明

(上海理工大學管理學院,上海 200090)

0 引言

當今社會,數字化、信息化和智能化已成為時代特征,數字經濟已成為經濟發展的必然支持。隨著5G時代的來臨,數字經濟成為新的發展動力,數字化轉型成為企業發展戰略的一個重要選擇。

IBM Marketing cloud的一份最新報告中指出“僅過去兩年就建立了今天90%的資料,每天建立2.5 億億字節,隨著新設備、傳感器和新技術的出現,數據增長率也會隨之加速。”

目前,我國已發展出一系列成熟的大數據基礎設施,批計算方面有基于Spark 計算的分布式集群,流計算方面有基于Storm 的分布式集群。大數據的存儲方面有基于融合型數據庫的TiDB,有基于MPP 架構的數據庫ClickHouse[1],有基于Hadoop 的Hive 等等[2]。但是,由于技術迭代更新,各類運算與儲存設備層出不窮,我們在做集群模式的選型時,須遵循三方面的基本原則:集群的穩定性、數據處理的高效性和投資的合理性。應結合實際情況,采用相對成熟的更先進的技術,提高整體應用性能,并減少資源的浪費,提升整體的應用建設效能。

基于上述考慮,本文提出一種新型實時數倉設計方案,結合使用了基于StarRocks的存儲技術以及基于Flink的實時計算技術[3],應用于數據中臺[4]相關領域的業務中,在性能以及吞吐量等方面都有明顯的提升。一方面,有效減少了整個集群中服務器節點的數量,進而節約了硬件資源的投入;另一方面,大幅提高了整體的計算性能。

1 Flink概述

Apache Flink 是一個較成熟的流計算技術,主要用于在無邊界和有邊界數據流上進行有狀態的計算。Flink 的兼容性以及擴展性都非常優秀,常見的集群環境中都可以運行Flink,計算的速度媲美內存計算的速度,計算的數據規模可以達到任意規模。

Apache Flink 功能非常強大,可以開發多種不同種類的應用[5]。它的主要特征包含:流批一體化、事件支持、精細的狀態管理以及精確一次的狀態一致性保障等。Flink不僅可以運行在多種資源管理框架上,包括YARN、Mesos、Kubernetes 等,也可以運行在裸機集群上。在高可用模式下,不存在單點故障的問題。事實證明,Flink 可以擴展到數千核心,其狀態可以達到TB 級別,且仍能保持高吞吐、低延遲的特點。全球各地,有非常多要求苛刻的流處理應用都運行在Flink上面。

Flink 是近兩年大數據計算領域的一顆新星。但是,在我國很多的大型互聯網企業中均有實際應用,如阿里、美團、京東等。本文對三種主流的開源流處理框架做對比[6],具體如表1所示。

表1 3種主流的開源流處理框架的技術對比

基于以上的綜合比較分析,Flink 是一個設計優良的框架,低延遲、高性能、高吞吐是三個典型的特征,非常符合項目的選型特征,所以本文采用Flink 技術作為流計算支撐。

2 StarRocks概述

StarRocks 是一款高性能分析型數據倉庫,使用向量化、MPP 架構、可實時更新的列式存儲引擎等技術實現多維、實時、高并發的數據分析。StarRocks 既支持從各類實時和離線的數據源高效導入數據,也支持直接分析數據湖上各種格式的數據。同時StarRocks具備水平擴展,高可用,高可靠,易運維等特性。廣泛應用于實時數倉、OLAP 報表、數據湖分析等場景。

StarRocks 也是近兩年在大數據分析領域發展起來的一顆新星,但在國內許多大型互聯網企業的數倉建設中均有應用,本文對近幾年主流開源數倉技術作對比,具體如表2所示。

表2 ClickHouse和StarRocks的對比

綜合比較之下,StarRocks 是一個非常不錯的選擇,不僅性能出色,而且功能也非常強大,解決了很多傳統數倉架構的問題,所以這是本文采用StarRocks作為數倉的根本原因。

3 架構設計

3.1 整體架構設計

本項目的整體設計結合了分層架構[7]和功能模塊化[8]思路。模塊間采用標準接口的方式,便于升級替換,整體架構分為三層,具體如圖1所示。

圖1 系統整體架構圖

⑴數據采集層:支持多源異構數據的采集。包括:各類關系型數據庫、非關系型數據庫、日志平臺、統一數據采集工具等。

⑵數據處理層:與數據采集的源數據端進行對接,從而實現數據的多樣化處理。包括流計算、批計算等,并對外提供統一的數據查詢服務。

⑶數據應用層:基于數據處理層提供的統一數據查詢服務,提供多場景應用的支持。包括數據可視化分析、實時場景等。

3.2 實時數倉架構設計

在圖1 所示的系統整體架構圖基礎上,對實時鏈路以及數據倉庫等細節進行細化,遵循分層架構的原則,將數據處理層進一步拆分為兩層:數據處理層和數據存儲層,旨在突出Flink 的核心角色以及StarRocks 在數據存儲中的核心角色。實時數倉的架構設計,具體如圖2所示。

圖2 實時數倉架構圖

4 業務實現

圖3 所示為考勤業務場景數據處理的流程,技術選型[9]為Kafka+Flink+Redis+StarRocks。

圖3 考勤業務場景數據處理流程圖

Kafka 用于實時傳遞需要計算的數據,Flink 用于實時計算并將計算結果存儲于Redis 中,StarRocks 承擔數據倉庫的職責,包括ODS、DWD、DWS、ADS 層,并對外提供統一數據查詢服務。

4.1 數據采集

考勤數據實時寫入Kafka 集群,基于業務屬性和數據規模的考慮,對KafkaTopic 做了細化設計,具體如表3所示。

表3 KafkaTopic設計

4.2 數據處理

Flink計算的時間維度如表4所示。

表4 Flink計算的時間維度

考勤場景的數據范圍及計算要求如表5所示。

表5 考勤場景的數據范圍及計算要求

4.3 數據存儲

本文采用的存儲技術是StarRocks 集群,具體如圖4所示。

圖4 StarRocks的數據存儲

StarRocks 支持使用物化視圖來進行查詢加速。不同于一些同類產品的物化視圖需要異步和原表做數據同步,StarRocks 的物化視圖可以自動根據原表更新數據。只要原表數據發生變更,物化視圖的更新也同步完成,不需要額外的操作。

4.4 應用效果

根據本文的設計方案,集群部署了50 臺物理機,可以達到以下的性能要求:處理數據量50T/天,處理數據條數200億條/天。

經過多輪綜合驗證,具體的時延效果如表6所示。大幅節省了物理機的部署,降低了CPU 使用率,具體性能效果如表7所示。

表6 時延效果表

表7 性能效果表

基于StarRocks 的13 種查詢場景的性能效果,如表8所示。

表8 StarRocks性能效果表

120億數據規模下的性能效果,如圖5所示。

圖5 StarRocks與ClickHouse性能對比

從圖5 數據可見,StarRocks 的查詢性能明顯優于ClickHouse,這得益于StarRocks 針對HLL 查詢的性能優化。

5 結束語

本文面向解決傳統數倉架構的效率和吞吐量等問題,設計了高效的實時數倉架構,結合使用了Flink流計算技術及StarRocks 存儲技術。并結合企業內的考勤業務場景,實現了基于Kafka+Flink+Redis+StarRocks技術組合的系統升級上線。在減少一倍硬件資源投入的情況下,時延降低至原先的一半,數據處理吞吐性能提升至四倍以上,滿足了企業對于高并發、實時計算、低延遲和大數據存儲的需求,達到了降本增效的目的。

猜你喜歡
數據處理
驗證動量守恒定律實驗數據處理初探
認知診斷缺失數據處理方法的比較:零替換、多重插補與極大似然估計法*
心理學報(2022年4期)2022-04-12 07:38:02
ILWT-EEMD數據處理的ELM滾動軸承故障診斷
水泵技術(2021年3期)2021-08-14 02:09:20
ADS-B數據處理中心的設計與實現
電子測試(2018年4期)2018-05-09 07:28:12
MATLAB在化學工程與工藝實驗數據處理中的應用
基于希爾伯特- 黃變換的去噪法在外測數據處理中的應用
大數據處理中基于熱感知的能源冷卻技術
計算機工程(2015年4期)2015-07-05 08:28:04
Matlab在密立根油滴實驗數據處理中的應用
數據處理能力在求職中起關鍵作用
我國首個“突發事件基礎數據處理標準”發布
主站蜘蛛池模板: 亚洲综合香蕉| 国产高清不卡视频| 九九热精品免费视频| 午夜视频在线观看区二区| 另类综合视频| 日韩小视频在线观看| 好吊妞欧美视频免费| 国产欧美日韩专区发布| 国产精品开放后亚洲| 欧美人与性动交a欧美精品| 亚洲午夜片| 成人午夜亚洲影视在线观看| 欧美劲爆第一页| 97国产在线观看| 午夜啪啪福利| 91亚洲影院| 丰满人妻久久中文字幕| 九九久久精品免费观看| 精品综合久久久久久97超人| 亚洲Va中文字幕久久一区| 国产白丝av| 国产伦片中文免费观看| 久久精品91麻豆| 亚洲伊人久久精品影院| 亚洲第一成年人网站| 尤物午夜福利视频| 国产伦片中文免费观看| 99re精彩视频| 手机精品视频在线观看免费| 国产成人成人一区二区| 精品伊人久久大香线蕉网站| 喷潮白浆直流在线播放| 亚洲国产日韩一区| 国产97视频在线| 亚洲区视频在线观看| 99热精品久久| 天堂成人在线| 色综合五月| 最新国产午夜精品视频成人| 国产欧美日韩18| 亚洲熟女中文字幕男人总站| 无码区日韩专区免费系列 | 亚洲一区二区黄色| 2020亚洲精品无码| 国产人碰人摸人爱免费视频| 亚洲无码高清免费视频亚洲| 国产精品第三页在线看| 久久免费视频6| 91精品国产91久久久久久三级| 在线中文字幕网| 高h视频在线| 92午夜福利影院一区二区三区| 丁香婷婷在线视频| 亚洲不卡影院| 夜夜操国产| 中文字幕在线观| 亚洲欧美另类视频| 九九视频在线免费观看| 99视频在线观看免费| 色有码无码视频| 国产中文一区a级毛片视频| 91精品专区国产盗摄| 青草精品视频| 一级看片免费视频| 国产在线一二三区| 国产视频入口| 国产永久免费视频m3u8| 久草青青在线视频| 毛片网站在线看| 香蕉伊思人视频| 欧美日在线观看| 午夜无码一区二区三区在线app| 91亚洲精品国产自在现线| 啪啪国产视频| 欧美日韩福利| 国产亚洲精品无码专| 人妻无码一区二区视频| 午夜啪啪福利| 色吊丝av中文字幕| 欧美一级高清免费a| 99re在线观看视频| 日韩av电影一区二区三区四区|