999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Hadoop的海量數據處理平臺

2021-09-10 15:40:08國標丁帥男吳雨桐
客聯 2021年4期
關鍵詞:數據處理

國標 丁帥男 吳雨桐

【摘 要】近幾年,云計算產業飛速發展,大數據處理技術也在不斷成熟。與此同時,國內移動互聯網市場規模不斷擴大,用戶數量己經超過5億,并帶來了海量的移動互聯網流量數據。在此背景下,如何基于云計算大數據處理技術來承載海量網絡數據處理業務,是一個非常有研究價值的課題。

【關鍵詞】流量數據;Hadoop;數據處理

一、MapReduce分布式處理技術

Hadoop平臺的MapReduce框架采用主從架構,由一個JobTracker主節點和多個TaskTracker從節點構成。JobTracker模塊負責MapReduce作業的調度,包括分配用戶提交的作業執行順序、Map任務和Reduce任務的分配和執行,推測性任務的執行等,從節點中TaskTracker模塊負責處理主節點指派的任務,包括執行Map任務、Reduce任務和推測性任務。MapReduce框架運行流程如下。

(一)用戶提交作業。用戶編寫自己的MapReduce程序并在客戶端節點上運行,作業客戶端實例化后,向JobTracke:模塊提交該作業信息,申請分配作業的ID號。然后作業客戶端在驗證本次作業相關信V、無誤的情況下,將作業資源存放到分布式文件系統中,默認情況下,Hadoop使用HDFS作為其文件存儲系統。最后客戶端向JobTracker模塊提交作業執行請求。

(二)JobTracker初始化用戶作業。JobTracker收到用戶提交的作業后,創建該作業實例對象并配置相關數據,包括該作業使用的Jar包存放位置、輸入數據分塊信J自、以及作業對應的配置文件信息、等等。然后JobTracker根據其配置的一調度算法(默認為先進先出調度算法)將該作業放入其作業對待,用于后續分配。

(三)任務分配。當前MapReduce的機制中使用心跳通信機制來進行任務分配。即從節點中的TaskTracke:模塊定時向.lobTracker發送心跳通信,JobTracker的作業隊列若有待分配的作業,則其根據收到的信息、決定是否向該TaskTracker分配任務。當從節點上TaskTracker模塊的Map任務槽有空閑時,JobTracker節點根據感知策略向該節點分配合適的Map任務。需要說明的是,JobTracker在分配任務時,優先往TaskTracker分配Map任務,只有在TaskTracker模塊上Map任務槽無空閑時才分配Reduce任務。

(四)TaskTracker執行Map任務。TaskTracker在執行Map或者Reduce任務時,每執行一個任務均會啟動一個Java子進程來運行該任務。當啟動子進程之前,TaskTracker模塊首先從HDFS中讀取該作業客戶端之前存放的作業相關信息,然后再創建一個Java子進程來執行用戶自己編寫的Map任務。Map任務運行后會定期輸出數據緩存在內存中。當緩存數據超過指定限額時,Map任務會將數據緩存到該從節點的磁盤中。

(五)TaskTracke:執行Reduce任務。當有Map任務執行完畢,同時有TaskTracker模塊存在空閑Reduce槽的情況下,當該TaskTracker從節點與JobTracker通信時,JobTracker會分配該作業對應的Reduce任務給該從節點。需要說明的是,由于Reduce任務的輸入數據來源于各個Map任務的輸出,沒有本地數據的概念,因此JobTracker直接分配隊列中的Reduce任務即可。Reduce任務運行時,首先從對應的Map任務所在的節點讀取中間數據。當Reduce任務得到其所需的數據后開始執行用戶編寫的Reduce任務程序。Reduce任務運行時,

將其輸出結果存放到HDFS中。

(六)完成一次作業運行。Reduce任務全部完成后,輸出結果根據用戶指定的目錄存放。JobTracker根據各個TaskTracker發送的心跳信息知道該作業已經運行完畢,設置該作業的完成標記,同時向作業客戶端發送作業完成的通知和相關統計數據。需要說明的是,在作業運行期間,用戶客戶端從持續收到作業運行的進度信息。

二、結語

本章節介紹了在當前移動互聯網及其引發的網絡業務快速增長的現狀下,本文使用Hadoop技術來進行網絡流量數據處理的必要性。并對基于Hadoop的海量網絡數據處理平臺的總體架構,以及該平臺所使用的數據采集和傳輸技術,基于HDFS的海量網絡數據存儲技術和基于MapReduce的海量數據處理技術等關鍵技術進行了詳細介紹。此外,本章節對海量網絡數據處理平臺當前需要重點解決的技術問題進行了詳細分析。從而為本文后續開展的研究工作進行了鋪墊,打下良好的基礎。

【參考文獻】

[1]劉軍,Hadoop大數據處理人民郵電出版社,2013

[2]趙衛中,馬慧芳,傅燕翔等,基于云計算平臺Hadoop的并行K-Mean聚類算法設計研

究,計算機科學,38(10) 2011, 166-168

[3]Xue S J, Pan W B, Fang W, A Novel Approach in Improving I/O Performance of SrnallMeteorological Files on HDFS, Applied Mechanics and Materials, 1172012 1759-1765.

[4]Yazd S A, Venkatesan S, Mittal N, Energy Efficient Hadoop Using MirroredReplication Policy, Reliable Distributed Systems (SRDS), 2012 IEEE 31st Symposium on:457-462.Data BlockIEEE, 2012

猜你喜歡
數據處理
驗證動量守恒定律實驗數據處理初探
認知診斷缺失數據處理方法的比較:零替換、多重插補與極大似然估計法*
心理學報(2022年4期)2022-04-12 07:38:02
ILWT-EEMD數據處理的ELM滾動軸承故障診斷
水泵技術(2021年3期)2021-08-14 02:09:20
ADS-B數據處理中心的設計與實現
電子測試(2018年4期)2018-05-09 07:28:12
MATLAB在化學工程與工藝實驗數據處理中的應用
基于希爾伯特- 黃變換的去噪法在外測數據處理中的應用
大數據處理中基于熱感知的能源冷卻技術
計算機工程(2015年4期)2015-07-05 08:28:04
Matlab在密立根油滴實驗數據處理中的應用
數據處理能力在求職中起關鍵作用
我國首個“突發事件基礎數據處理標準”發布
主站蜘蛛池模板: 青草精品视频| 亚洲电影天堂在线国语对白| 四虎国产永久在线观看| 成人国产一区二区三区| 亚洲成a人片77777在线播放 | 国产综合精品日本亚洲777| a级毛片一区二区免费视频| 亚洲精品桃花岛av在线| 日日拍夜夜操| 欧美一区二区三区国产精品| 日韩欧美高清视频| 色综合色国产热无码一| 亚洲区第一页| 欧美国产三级| 超清无码熟妇人妻AV在线绿巨人| 国产精品视频导航| 日本影院一区| 精品国产黑色丝袜高跟鞋| 一本久道久久综合多人| 成·人免费午夜无码视频在线观看| 免费jjzz在在线播放国产| 国内精品视频区在线2021| 亚洲三级电影在线播放| 91午夜福利在线观看精品| 亚洲视频黄| 人妻一本久道久久综合久久鬼色| 国产精品短篇二区| 日韩色图区| 国内精品91| 欧美综合成人| 97精品久久久大香线焦| 日韩欧美中文| 日韩无码真实干出血视频| 一本视频精品中文字幕| 国产成人在线无码免费视频| 欧美日韩午夜| 日本精品视频| 欧美成人看片一区二区三区| 亚洲天堂日韩av电影| 日韩高清无码免费| 久久国产av麻豆| 欧美精品在线看| 欧美精品一二三区| 中国黄色一级视频| 欧美亚洲欧美| 婷婷亚洲视频| 亚洲天堂网站在线| 国产欧美日韩综合一区在线播放| 天天综合网亚洲网站| 色综合网址| 99热线精品大全在线观看| 激情在线网| 污网站免费在线观看| 国产在线观看成人91| 久久精品国产电影| 欧美成人免费午夜全| 亚洲欧州色色免费AV| 亚洲色无码专线精品观看| 日韩无码真实干出血视频| 一级毛片免费播放视频| 欧美精品v欧洲精品| 少妇被粗大的猛烈进出免费视频| 一级毛片免费的| 国产亚洲精品在天天在线麻豆 | 成人噜噜噜视频在线观看| 99re经典视频在线| 亚洲国产精品人久久电影| 人妻丰满熟妇av五码区| 色婷婷久久| 亚州AV秘 一区二区三区| 国产极品美女在线| 无码久看视频| 国产爽爽视频| 国产精品一区在线观看你懂的| 亚洲欧美自拍视频| 永久免费无码成人网站| 国产99免费视频| 九色国产在线| 国产浮力第一页永久地址| 97视频免费在线观看| 伊人国产无码高清视频| 亚洲精品欧美重口|