999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Hadoop的海量數據處理平臺

2021-09-10 15:40:08國標丁帥男吳雨桐
客聯 2021年4期
關鍵詞:數據處理

國標 丁帥男 吳雨桐

【摘 要】近幾年,云計算產業飛速發展,大數據處理技術也在不斷成熟。與此同時,國內移動互聯網市場規模不斷擴大,用戶數量己經超過5億,并帶來了海量的移動互聯網流量數據。在此背景下,如何基于云計算大數據處理技術來承載海量網絡數據處理業務,是一個非常有研究價值的課題。

【關鍵詞】流量數據;Hadoop;數據處理

一、MapReduce分布式處理技術

Hadoop平臺的MapReduce框架采用主從架構,由一個JobTracker主節點和多個TaskTracker從節點構成。JobTracker模塊負責MapReduce作業的調度,包括分配用戶提交的作業執行順序、Map任務和Reduce任務的分配和執行,推測性任務的執行等,從節點中TaskTracker模塊負責處理主節點指派的任務,包括執行Map任務、Reduce任務和推測性任務。MapReduce框架運行流程如下。

(一)用戶提交作業。用戶編寫自己的MapReduce程序并在客戶端節點上運行,作業客戶端實例化后,向JobTracke:模塊提交該作業信息,申請分配作業的ID號。然后作業客戶端在驗證本次作業相關信V、無誤的情況下,將作業資源存放到分布式文件系統中,默認情況下,Hadoop使用HDFS作為其文件存儲系統。最后客戶端向JobTracker模塊提交作業執行請求。

(二)JobTracker初始化用戶作業。JobTracker收到用戶提交的作業后,創建該作業實例對象并配置相關數據,包括該作業使用的Jar包存放位置、輸入數據分塊信J自、以及作業對應的配置文件信息、等等。然后JobTracker根據其配置的一調度算法(默認為先進先出調度算法)將該作業放入其作業對待,用于后續分配。

(三)任務分配。當前MapReduce的機制中使用心跳通信機制來進行任務分配。即從節點中的TaskTracke:模塊定時向.lobTracker發送心跳通信,JobTracker的作業隊列若有待分配的作業,則其根據收到的信息、決定是否向該TaskTracker分配任務。當從節點上TaskTracker模塊的Map任務槽有空閑時,JobTracker節點根據感知策略向該節點分配合適的Map任務。需要說明的是,JobTracker在分配任務時,優先往TaskTracker分配Map任務,只有在TaskTracker模塊上Map任務槽無空閑時才分配Reduce任務。

(四)TaskTracker執行Map任務。TaskTracker在執行Map或者Reduce任務時,每執行一個任務均會啟動一個Java子進程來運行該任務。當啟動子進程之前,TaskTracker模塊首先從HDFS中讀取該作業客戶端之前存放的作業相關信息,然后再創建一個Java子進程來執行用戶自己編寫的Map任務。Map任務運行后會定期輸出數據緩存在內存中。當緩存數據超過指定限額時,Map任務會將數據緩存到該從節點的磁盤中。

(五)TaskTracke:執行Reduce任務。當有Map任務執行完畢,同時有TaskTracker模塊存在空閑Reduce槽的情況下,當該TaskTracker從節點與JobTracker通信時,JobTracker會分配該作業對應的Reduce任務給該從節點。需要說明的是,由于Reduce任務的輸入數據來源于各個Map任務的輸出,沒有本地數據的概念,因此JobTracker直接分配隊列中的Reduce任務即可。Reduce任務運行時,首先從對應的Map任務所在的節點讀取中間數據。當Reduce任務得到其所需的數據后開始執行用戶編寫的Reduce任務程序。Reduce任務運行時,

將其輸出結果存放到HDFS中。

(六)完成一次作業運行。Reduce任務全部完成后,輸出結果根據用戶指定的目錄存放。JobTracker根據各個TaskTracker發送的心跳信息知道該作業已經運行完畢,設置該作業的完成標記,同時向作業客戶端發送作業完成的通知和相關統計數據。需要說明的是,在作業運行期間,用戶客戶端從持續收到作業運行的進度信息。

二、結語

本章節介紹了在當前移動互聯網及其引發的網絡業務快速增長的現狀下,本文使用Hadoop技術來進行網絡流量數據處理的必要性。并對基于Hadoop的海量網絡數據處理平臺的總體架構,以及該平臺所使用的數據采集和傳輸技術,基于HDFS的海量網絡數據存儲技術和基于MapReduce的海量數據處理技術等關鍵技術進行了詳細介紹。此外,本章節對海量網絡數據處理平臺當前需要重點解決的技術問題進行了詳細分析。從而為本文后續開展的研究工作進行了鋪墊,打下良好的基礎。

【參考文獻】

[1]劉軍,Hadoop大數據處理人民郵電出版社,2013

[2]趙衛中,馬慧芳,傅燕翔等,基于云計算平臺Hadoop的并行K-Mean聚類算法設計研

究,計算機科學,38(10) 2011, 166-168

[3]Xue S J, Pan W B, Fang W, A Novel Approach in Improving I/O Performance of SrnallMeteorological Files on HDFS, Applied Mechanics and Materials, 1172012 1759-1765.

[4]Yazd S A, Venkatesan S, Mittal N, Energy Efficient Hadoop Using MirroredReplication Policy, Reliable Distributed Systems (SRDS), 2012 IEEE 31st Symposium on:457-462.Data BlockIEEE, 2012

猜你喜歡
數據處理
驗證動量守恒定律實驗數據處理初探
認知診斷缺失數據處理方法的比較:零替換、多重插補與極大似然估計法*
心理學報(2022年4期)2022-04-12 07:38:02
ILWT-EEMD數據處理的ELM滾動軸承故障診斷
水泵技術(2021年3期)2021-08-14 02:09:20
ADS-B數據處理中心的設計與實現
電子測試(2018年4期)2018-05-09 07:28:12
MATLAB在化學工程與工藝實驗數據處理中的應用
基于希爾伯特- 黃變換的去噪法在外測數據處理中的應用
大數據處理中基于熱感知的能源冷卻技術
計算機工程(2015年4期)2015-07-05 08:28:04
Matlab在密立根油滴實驗數據處理中的應用
數據處理能力在求職中起關鍵作用
我國首個“突發事件基礎數據處理標準”發布
主站蜘蛛池模板: 亚洲精品爱草草视频在线| 极品尤物av美乳在线观看| 国产情精品嫩草影院88av| 久久国语对白| 国产视频a| 精品国产成人av免费| 91外围女在线观看| 国产第八页| 久久不卡国产精品无码| 5388国产亚洲欧美在线观看| 国产一区在线视频观看| 国产亚洲精品资源在线26u| 久久99蜜桃精品久久久久小说| 国产极品美女在线观看| 久久久久久尹人网香蕉| 毛片免费观看视频| 国产精品视频导航| 2020国产在线视精品在| 亚洲天堂网站在线| 久久6免费视频| 精品国产www| 毛片大全免费观看| 免费看a级毛片| 午夜不卡视频| 伊在人亚洲香蕉精品播放| 波多野结衣AV无码久久一区| 国产精品美人久久久久久AV| 91青青视频| 亚洲国产成人麻豆精品| 国产精品无码一区二区桃花视频| 亚洲永久免费网站| 国产精品久久久久鬼色| 国产97公开成人免费视频| 五月天婷婷网亚洲综合在线| 曰韩人妻一区二区三区| 国产十八禁在线观看免费| 日韩欧美国产三级| 欧美在线导航| 美女无遮挡免费网站| 尤物精品国产福利网站| 老色鬼久久亚洲AV综合| 亚洲男人的天堂在线观看| 极品国产一区二区三区| 国产白浆一区二区三区视频在线| 欧美国产日韩另类| 日韩a级片视频| 色成人亚洲| 亚洲色图在线观看| 欧美在线网| 亚洲侵犯无码网址在线观看| 国产va在线观看| 国产制服丝袜91在线| 久久久久久高潮白浆| 国产福利不卡视频| 久久久噜噜噜| 国产杨幂丝袜av在线播放| 999精品在线视频| 天天干天天色综合网| 一本大道视频精品人妻 | 色综合天天综合中文网| 亚洲欧美在线综合图区| 黄色网在线免费观看| 456亚洲人成高清在线| 一区二区三区国产精品视频| 国产成人精品一区二区三在线观看| 动漫精品中文字幕无码| 国产一区在线观看无码| 综合人妻久久一区二区精品 | 天堂网亚洲综合在线| 亚洲欧美国产五月天综合| 毛片一级在线| 国产网站黄| 综合网久久| 91久久精品日日躁夜夜躁欧美| 高清无码不卡视频| 国产亚洲欧美日本一二三本道| 国产迷奸在线看| 亚洲天堂网在线播放| 日本三级欧美三级| 97精品国产高清久久久久蜜芽 | 欧美色视频日本| 国产乱视频网站|