999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Hadoop分布式存儲架構(gòu)的性能分析

2018-09-12 07:30:36王凌暉解云月周美華
現(xiàn)代電子技術(shù) 2018年18期
關(guān)鍵詞:云計算

王凌暉 解云月 周美華

摘 要: 近幾十年,隨著互聯(lián)網(wǎng)的發(fā)展,數(shù)據(jù)正在呈爆炸式增長。為了保存和處理這些數(shù)據(jù),傳統(tǒng)的IT架構(gòu)已經(jīng)滿足不了,云計算應(yīng)運而生。Hadoop是云計算下的一種分布式處理的軟件架構(gòu),能夠?qū)Υ髷?shù)據(jù)進行存儲和處理,而它最核心的兩大組件就是HDFS和MapReduce,分別實現(xiàn)了分布式文件存儲和分布式并行任務(wù)處理。文中,將基于PEPA對HDFS進行建模分析,并對HDFS的性能進行評估。

關(guān)鍵詞: Hadoop; 云計算; 分布式存儲; HDFS; PEPA; 性能評估

中圖分類號: TN915?34 文獻標識碼: A 文章編號: 1004?373X(2018)18?0092?04

Performance analysis of Hadoop distributed storage architecture

WANG Linghui, XIE Yunyue, ZHOU Meihua

(School of Information Engineering, Yangzhou University, Yangzhou 225000, China)

Abstract: In recent decades, data has been in explosive growth with the development of the Internet. As the traditional IT architecture cannot meet the requirements of storing and processing the data, cloud computing has emerged. Hadoop is a distributed processing software architecture using cloud computing, which can store and process big data. The two main core components of Hadoop is the Hadoop Distributed File System (HDFS) and MapReduce, which implement distributed file storage and distributed parallel task processing respectively. In this paper, modeling analysis for the HDFS is conducted based on the Performance Evaluation Process Algebra (PEPA), so as to evaluate the performance of the HDFS.

Keywords: Hadoop; cloud computing; distributed storage; HDFS; PEPA; performance evaluation

云計算是一種異于傳統(tǒng)IT架構(gòu)的模式,其數(shù)據(jù)分布存儲和計算在不同的節(jié)點上。用戶能夠按照自己的需求獲取所需的服務(wù),而不需要從頭搭建起整個架構(gòu)。整個存儲和計算對普通用戶是透明的。用戶可以像對水電付費一樣對自己需要的計算能力付費。Hadoop[1]正是云計算下的一種分布式的數(shù)據(jù)處理框架,它有兩大核心組件,MapReduce[2]和HDFS[3](Hadoop Distributed File System),分別負責(zé)數(shù)據(jù)的處理和讀寫。在本文中,使用一種形式化語言PEPA(Performance Evaluation Process Algebra)來對HDFS的性能進行分析。

1 背景介紹

1.1 HDFS架構(gòu)

HDFS是一種分布式的文件存儲架構(gòu),適合運行在通用硬件上;它是一個高度容錯性的系統(tǒng),適合部署在廉價的機器上。HDFS采用Master/Slave架構(gòu),一個HDFS集群通常由一個NameNode和多個DataNode組成。NameNode負責(zé)管理文件系統(tǒng)的元數(shù)據(jù)以及客戶端對文件的訪問。DateNode存儲實際數(shù)據(jù),一般是一個節(jié)點一個。HDFS暴露了文件系統(tǒng)的名字空間,以文件的形式存儲數(shù)據(jù)。存儲時一個文件會被分成一個或多個數(shù)據(jù)塊,這些塊存儲在DataNode上。NameNode負責(zé)文件系統(tǒng)的名字空間操作,管理數(shù)據(jù)塊到DataNode節(jié)點的映射。DataNode負責(zé)處理文件客戶端的讀寫請求。

1.2 PEPA

PEPA是一種描述系統(tǒng)內(nèi)部組件及組件之間交互的形式化語言[4?5],可以很好地應(yīng)用到很多并發(fā)系統(tǒng)上[6?8],也可以抽取出系統(tǒng)的性能指標。在PEPA中,動作可以定義為([α,γ]),[α∈A]代表動作類型,[γ]代表動作速率,[A]是所有可能的動作集合。速率[γ]可以被看作指數(shù)分布的參數(shù),因此[γ∈R+]。一個狀態(tài)P在完成一個動作([α,γ])后轉(zhuǎn)換為Q,記作[P?α,γ.Q],這次轉(zhuǎn)移可以記為[P(α,γ)Q]。PEPA的語法介紹如下:

1) 前綴操作:[α,γ.P]

系統(tǒng)執(zhí)行動作[α,γ]以后表現(xiàn)為狀態(tài)P,執(zhí)行動作為[α],執(zhí)行時間服從參數(shù)為[γ]的指數(shù)分布。

2) 選擇操作:P+Q

P+Q表示一個系統(tǒng)可能表現(xiàn)為狀態(tài)P或者Q。如果P和Q的活動都執(zhí)行,選擇一個最先執(zhí)行完的動作,另一個狀態(tài)會被放棄,系統(tǒng)表現(xiàn)成選中動作的執(zhí)行結(jié)果。并發(fā)操作如圖1所示。

系統(tǒng)的兩個狀態(tài)P和Q是并發(fā)執(zhí)行,其中L是可能的并發(fā)動作的集合,對于L中的任何動作,都需要P和Q相互協(xié)作這個動作才能執(zhí)行。當(dāng)執(zhí)行不在L中的動作時,P和Q可以不用同步動作。記為[P∥Q]。

3) 隱藏操作:[PL]

集合L中的所有動作類型對外部的觀察者來說都是隱藏的。系統(tǒng)表現(xiàn)為P除了集合L中任何活動類型都是隱藏的。

4) 常量操作:[A?P]

常量A的動作和組件P相似。通過相互遞歸定義來定義有限狀態(tài)的無限行為。

2 PEPA模擬HDFS

2.1 HDFS模型

如圖1所示,HDFS由三個組件組成[9]:Clinet組件,NameNode組件和DataNode組件。

2.1.1 Client

Client首先將要傳輸?shù)奈募指畛蓧K(block)文件執(zhí)行client_split_block動作,默認大小為64 MB。然后Client向NameNode組件發(fā)送數(shù)據(jù)請求執(zhí)行client_send_write動作。Client收到NameNode返回的DataNode組件的可用信息以后,Client將塊文件分割成package文件執(zhí)行client_split_package動作,以流式寫入的方式寫入到DataNode節(jié)點執(zhí)行client_send_package動作。

數(shù)據(jù)發(fā)送完畢后,Client會收到DataNode發(fā)送的發(fā)送完畢消息,然后Client向NameNode發(fā)送數(shù)據(jù)發(fā)送結(jié)束消息執(zhí)行client_send_done動作。本次數(shù)據(jù)發(fā)送結(jié)束。

[Client1?client_split_block,rclient_split_block.Client2]

[Client2?client_send_write,rclient_send_write.Client3]

[Client3?namenode_return_availabilty,?.Client4]

[Client4?client_split_package,rclient_split_package.Client5]

[Client5?client_send_package,rclient_send_package.Client6]

[Client6?datanode_send_client,?.Client7]

[Client7?client_send_done,rclient_send_done.Client0]

2.1.2 NameNode

NameNode收到Client的發(fā)送數(shù)據(jù)請求以后,返回DataNode的可用信息執(zhí)行nameNode_return_availabilty動作,當(dāng)DataNode接收完Client發(fā)送的數(shù)據(jù)后,會同時向NameNode和Client發(fā)送結(jié)束消息,然后Client收到結(jié)束消息后,接著會向NameNode發(fā)送結(jié)束消息,發(fā)送完畢。

[NameNode1?client_send_write,?.NameNode2]

[NameNode2?namenode_return_availabilty,rnamenode_return_availabilty.][NameNode3]

[NameNode3?datanode_send_namenode,?.NameNode4]

[NameNode4?client_send_done,?.NameNode0]

2.1.3 DataNode

當(dāng)Client把block塊分割成package以后,接著會把這些package發(fā)送到DataNode,DataNode接收完畢以后,同時向NameNode和Client發(fā)送結(jié)束消息,執(zhí)行datanode_send_namenode動作和datanode_send_client動作。

[DataNode1?client_send_package,?.DataNode2]

[DataNode2?datanode_send_namenode,rdatanode_send_namenode.]

[datanode_send_client,rdatanode_send_client.DataNode0]

定義相同的并行動作類型為[CM?(C||…||C)],可以得到系統(tǒng)描述如下:

[Client1M?L1NameNode11?L2DataNode1N],

[L1={client_send_write,namenode_return_availabilty,]

[client_send_package,datanode_send_client,client_send_done}]

[L2={datanode_send_namenode}]

2.2 參數(shù)設(shè)置

表1規(guī)定了PEPA模型中每個動作的速率。表2給定了各組件的初始個數(shù)。

2.3 仿 真

通過Matlab對HDFS的文件存儲進行模擬仿真。主要是得到系統(tǒng)的響應(yīng)時間,響應(yīng)時間是指從執(zhí)行第一個動作開始到最后一個動作結(jié)束經(jīng)過的時間,它是一個系統(tǒng)性能的重要指標。而在下面的實驗中,它是從client_split_block到client_send_done動作結(jié)束的持續(xù)時間。

圖2顯示Client組件對響應(yīng)時間的影響,隨著Client數(shù)量的增多,響應(yīng)時間逐漸增大。因為這是隨著Client的增大,任務(wù)量逐漸增大,需要處理的文件變多。同時也說明,隨著任務(wù)的增多,HDFS的存儲能力也在下降。

DataNode數(shù)量與響應(yīng)時間的關(guān)系如圖3所示,3條曲線基本沒有區(qū)別,這表明DataNode節(jié)點對響應(yīng)時間的影響并不是很大,因為在存儲數(shù)據(jù)時,只需要隨機地選擇3個DataNodes(默認情況下),即使DataNode數(shù)量很多,也并不能影響讀寫數(shù)據(jù)的速度。

從圖4可以看出,隨著Client_send_package速率的提高,響應(yīng)時間在減少,但是當(dāng)速率提高到一定程度時,響應(yīng)時間基本不再變化。這是因為雖然Client發(fā)送數(shù)據(jù)包的速度提高了,但其他組件的速度并沒有變化,當(dāng)數(shù)據(jù)包到達其他組件時,處理速度沒有跟上,拉低了整個系統(tǒng)的響應(yīng)時間。但是在一定程度下,可以通過提高Client發(fā)送數(shù)據(jù)包的速度來降低響應(yīng)時間,比如提高帶寬,或者提高DataNode組件I/O能力等。

3 結(jié) 語

本文通過基于PEPA理論的建模和分析,找出不同組件之間的相互聯(lián)系和交互,對影響HDFS性能瓶頸進行了分析。但是PEPA并不適用于云計算平臺規(guī)模特別大的情況,這種情況下可以使用Fluid approximation method[10],它可以快速地得到在可接受范圍內(nèi)精度的結(jié)果,所以下一步的工作可以使用Fluid approximation method結(jié)合對大規(guī)模的云計算平臺進行進一步分析。

參考文獻

[1] 董新華,李瑞軒,周灣灣,等.Hadoop系統(tǒng)性能優(yōu)化與功能增強綜述[J].計算機研究與發(fā)展,2013,50(z2):1?15.

DONG Xinhua, LI Ruixuan, ZHOU Wanwan, et al. Performance optimization and feature enhancements of Hadoop system [J]. Journal of computer research and development, 2013, 50(S2): 1?15.

[2] 李成華,張新訪,金海,等.MapReduce:新型的分布式并行計算編程模型[J].計算機工程與科學(xué),2011,33(3):129?135.

LI Chenghua, ZHANG Xinfang, JIN Hai, et al. MapReduce: a new programming model for distributed parallel computing [J]. Computer engineering & science, 2011, 33(3): 129?135.

[3] 郝樹魁.Hadoop HDFS和MapReduce架構(gòu)淺析[J].郵電設(shè)計技術(shù),2012(7):37?42.

HAO Shukui. Brief analysis of the architecture of Hadoop HDFS and MapReduce [J]. Designing techniques of posts and telecommunications, 2012(7): 37?42.

[4] DING J. A comparison of fluid approximation and stochastic simulation for evaluating content adaptation systems [J]. Wireless personal communications, 2015, 84(1): 231?250.

[5] DING J, HILLSTON J, LAURENSON D I. Evaluating the response time of large scale content adaptation systems using performance evaluation process algebra [C]// Proceedings of IEEE International Conference on Communications. Cape town: IEEE, 2010: 1?5.

[6] WANG H, LAURENSON D I, HILLSTON J. Evaluation of RSVP and mobility?aware RSVP using performance evaluation process algebra [C]// Proceedings of IEEE International Conference on Communications. Beijing: IEEE, 2008: 192?197.

[7] 潘耘,王勵成,余鎮(zhèn)危,等.基于隨機進程代數(shù)的Overlay網(wǎng)絡(luò)上的QoS性能評價[J].北京郵電大學(xué)學(xué)報,2009,32(z1):129?133.

PAN Yun, WANG Licheng, YU Zhenwei, et al. Based on stochastic process algebra overlay network QoS performance evaluation [J]. Journal of Beijing University of Posts and Telecommunications, 2009, 32(S1): 129?133.

[8] 黃金才,陳灑然,程光權(quán).艦艇編隊防空過程建模及分析[J].國防科技大學(xué)學(xué)報,2014,36(3):184?190.

HUANG Jincai, CHEN Saran, CHENG Guangquan. Modeling and analysis of air defense process for warship formation [J]. Journal of National University of Defense Technology, 2014, 36(3): 184?190.

[9] 李寬.基于HDFS的分布式Namenode節(jié)點模型的研究[D].廣州:華南理工大學(xué),2011.

LI Kuan. Research of the model of distributed Namenodes in HDFS [D]. Guangzhou: South China University of Technology, 2011.

[10] HILLSTON J. Fluid flow approximation of PEPA models [C]// Proceedings of Second International Conference on the Quantitative Evaluation of Systems. Torino: IEEE, 2005: 1?10.

猜你喜歡
云計算
云計算虛擬化技術(shù)在電信領(lǐng)域的應(yīng)用研究
基于云計算的醫(yī)院信息系統(tǒng)數(shù)據(jù)安全技術(shù)的應(yīng)用探討
談云計算與信息資源共享管理
志愿服務(wù)與“互聯(lián)網(wǎng)+”結(jié)合模式探究
云計算與虛擬化
基于云計算的移動學(xué)習(xí)平臺的設(shè)計
基于云計算環(huán)境下的ERP教學(xué)改革分析
科技視界(2016年22期)2016-10-18 14:33:46
基于MapReduce的故障診斷方法
實驗云:理論教學(xué)與實驗教學(xué)深度融合的助推器
云計算中的存儲虛擬化技術(shù)應(yīng)用
科技視界(2016年20期)2016-09-29 13:34:06
主站蜘蛛池模板: 亚洲婷婷六月| 草草线在成年免费视频2| 国产日韩欧美成人| 久久久久国产精品嫩草影院| 综合色天天| 免费毛片网站在线观看| 国产波多野结衣中文在线播放| 五月天婷婷网亚洲综合在线| 久久久久亚洲AV成人网站软件| 好吊妞欧美视频免费| 99视频免费观看| 波多野结衣二区| 毛片久久久| 中文无码精品a∨在线观看| 四虎国产精品永久在线网址| 亚洲精品男人天堂| 午夜a视频| 亚洲人成网址| 天天摸天天操免费播放小视频| 国产成人午夜福利免费无码r| 久久精品国产精品国产一区| 国产美女免费| 毛片免费在线| 国产成人精品在线| 丁香五月激情图片| 亚洲一级色| 国产99久久亚洲综合精品西瓜tv| 亚洲精品不卡午夜精品| 亚洲一区网站| 18黑白丝水手服自慰喷水网站| 亚洲精品高清视频| 青青草a国产免费观看| 国产91丝袜在线播放动漫| 亚洲精品第五页| 国产激情国语对白普通话| 国产亚洲精品资源在线26u| 国产免费福利网站| 在线观看无码av免费不卡网站 | 亚洲欧美人成电影在线观看| 四虎永久在线视频| 97人人模人人爽人人喊小说| 午夜精品影院| 国产一级视频在线观看网站| 国产小视频在线高清播放| 中文字幕天无码久久精品视频免费| 91亚瑟视频| 99国产精品国产高清一区二区| 全部免费毛片免费播放| 露脸国产精品自产在线播| 色男人的天堂久久综合| 国产在线自揄拍揄视频网站| a亚洲天堂| 久久久四虎成人永久免费网站| 中文字幕2区| 婷婷丁香色| 国产凹凸一区在线观看视频| 国产人在线成免费视频| 欧美a在线看| 毛片网站免费在线观看| 丝袜无码一区二区三区| 久久亚洲国产视频| 香蕉视频国产精品人| 国产麻豆福利av在线播放| 国产美女在线观看| 天天操精品| 67194在线午夜亚洲| 凹凸精品免费精品视频| 日本一区二区不卡视频| 久久精品国产亚洲麻豆| 无码啪啪精品天堂浪潮av| 欧美精品成人一区二区在线观看| 无码区日韩专区免费系列| 一本无码在线观看| 免费观看无遮挡www的小视频| 尤物精品视频一区二区三区| 亚洲国内精品自在自线官| 国产成人精品亚洲日本对白优播| 欧洲高清无码在线| 国产国拍精品视频免费看| 伦精品一区二区三区视频| 国产农村妇女精品一二区| 欧美亚洲中文精品三区|