999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Hadoop參數優化研究

2021-09-10 07:22:44王薇
電子樂園·中旬刊 2021年1期
關鍵詞:排序優化實驗

王薇

摘要:為了更好的驗證通過參數的優化可以提高Hadoop性能,我們可以采用的測試方法有:基準測試、穩定性測試、高可用測試、擴展性測試、安全性測試等。本文以基準測試方法為主來驗證參數優化后,實現對Hadoop性能的調優。本文主要針對hadoop內部的17個參數進行優化,通過基準測試中terasort和WordCount的復合算法的執行時間來校驗參數的優化情況,實驗過程中搜集系統的cpu和內存使用率,磁盤io和網絡io的吞吐量等指標。圖1-3充分說明了參數默認值與參數調整后的對比情況。實驗結果表明,hadoop參數調整優化后,在一定情況下實現了hadoop的性能調優。

關鍵字:Hadoop;參數優化;性能調優

引言

大數據軟件平臺主要由分布式文件系統、分布式計算系統、NoSQL 數據庫、分布式數據倉庫、分布式數據庫等構成,能夠提供大數據的存儲、管理和計算能力。大數據軟件平臺主要包括開源的Hadoop、Spark等,一般部署在通用硬件平臺上[1-2]。

由于Hadoop自身包含的參數比較多,參數之間的關系也比較復雜。經過簡單的實驗驗證,本文主要對表1中的17個參數進行優化,并且參數優化是遵循順序、疊加的方式,從而到達Hadoop的性能調優。

實驗設計和算法研究

為了更好的驗證通過參數的優化可以提高Hadoop性能,我們可以采用的測試方法有:基準測試、穩定性測試、高可用測試、擴展性測試、安全性測試等。本文以基準測試方法為主來驗證參數優化后,實現對Hadoop性能的調優。

基準測試是一種測量和評估軟件性能指標的活動。可以在某個時間通過基準測試建立一個已知的性能水平(稱為基準線)[3],當系統的軟硬件環境發生變化之后再進行一次基準測試以確定那些變化對性能的影響。

基準測試的測試方法有很多種,根據Hadoop的Map Reduce過程,本文主要以TeraSort算法和WordCount算法來驗證表1中的17個參數調整后,對Hadoop性能在特定條件下影響及優化。

本實驗中hadoop測試環境是采用1個Name Node節點,4個Date Node節點的模式進行。

算法研究:

1)TeraSort 算法

Terasort算法的工作原理需要以下幾個步驟:

首先,采樣;

其次,map task對于數據記錄做標記-

最后reduce局部排序,再順序輸出。

1TB排序通常用于衡量分布式數據處理框架的數據處理能力。Terasort是Hadoop中的一個排序作業,在2008年,Hadoop在1TB排序基準評估中贏得第一名,耗時209秒。TeraSort巧妙的利用了Hadoop的MapReduce機制來實現了Sort的目的,與Hadoop機制的完美結合也許是它優異排序成績的一個重要原因。而也正因為如此,我們可以在集群上利用TeraSort來測試Hadoop,它將具有很高的測試利用價值[4]。

Terasort的特點是混合型的,它的數據類型為文本,測試過程中所需的數據來源為Hadoop 自帶TeraGen生成。

TeraSort只是一個小工具,比起生產應用作業,可能是微不足道了。但一個小工具,如果能夠挖掘到底,背后也會有大價值;尤其對測試來講,如果能夠對背景知識有更多的了解,一個小工具可以轉換成眾多方便且有價值的測試用例;并且,如果能對一個小工具舉一反三,也能夠為其他地方的測試提供價值。

2)WordCount算法

(1) 將文件拆分為多個文件。 由于測試文件比較小,每個文件都是一個split,把文件分割成行,形成<key, value>對,再分割成<key, value>對。 移交用戶定義的map方法,生成新的<key, value>對,如圖1所示。

(2)Mapper得到map方法輸出的<key, value>對后,會根據key的值對它們進行排序,并執行Combine過程,將key累加到相同的值,得到Mapper的最終輸出 . 如圖2所示。

(3) Reducer首先對從Mapper接收到的數據進行排序,然后通過用戶自定義的reduce方法進行處理,得到一個新的<key, value>對,輸出結果為WordCount,如圖3所示。

本文首先根據terasort算法對17個參數進行調優,然后根據WordCount算法繼續進行參數調整,以達到性能在一定情況下達到最佳狀態。在實驗過程中,主要根據算法的執行時間來驗證了參數調整的正確性。同時采用PAT工具監控算法執行過程中系統的CPU、內存、磁盤IO和網絡IO等參數。

實驗數據中單個文件大小為1G,文件數量為512,總文件大小為512G。

實驗結果

通過實驗,我們可以了解到參數之間存在著互相影響的關系,測試后發現隨著參數調整,算法的執行時間在減少,充分的說明了隨著參數的優化,hadoop性能實現一定的優化。

我們可以了解到隨著調整17個參數的默認值,算法的執行時間有明顯的縮短,在17個參數都處于默認值的情況下,算法的執行時間為21776秒。圖1展現了參數默認值與參數調整后算法的執行時間的對比情況,參數優化后,極大的提高了算法的執行時間。圖2清晰的展現了參數默認值與參數調整后算法的執行過程中,hadoop對服務器的cpu/內存的使用率對比情況,cpu的占用率明顯有所增大,內存的使用率也有所增大。圖3清晰的展現了參數默認值與參數調整后算法的執行過程中,hadoop對服務器的磁盤IO,網絡 IO吞吐量明顯有所增大。

經過驗證,說明參數調整后在一定程度上提高了性能。

總結

本文主要是通過基準測試中TeraSort算法和WordCount算法相結合復合算法的運行時間來驗證對Hadoop的參數進行調優,進而優化hadoop的性能。Hadoop性能調優不僅涉及到Hadoop本身的性能調優,還涉及更底層的硬件、操作系統和Java虛擬機等系統的調優。為了更好的使用Hadoop,我們應根據實際應用場景及要求,對hadoop參數進行優化,使hadoop性能在特定情況下達到最優。

參考文獻references

[1]Saravanan S, Karthick K E, Balaji A, et al. Performance Comparison of Apache Spark and Hadoop Based Large Scale Content Based Recommender System[M]// Intelligent Systems Technologies and Applications. 2018:66-73.

[2]Ashlesha S, R. M. A Review of Hadoop Ecosystem for BigData[J]. International Journal of Computer Applications, 2018, 180(14):35-40.

[3]Trivedi M, Nambiar R. Lessons Learned: Performance Tuning for Hadoop Systems[M]// Performance Evaluation and Benchmarking. Traditional - Big Data - Interest of Things. 2017.

[4]Pahl C. Performance and Energy Optimization on Terasort Algorithm by Task Self-Resizing[J]. Information Technology & Control, 2014, 44(1):30-40.

猜你喜歡
排序優化實驗
記一次有趣的實驗
超限高層建筑結構設計與優化思考
房地產導刊(2022年5期)2022-06-01 06:20:14
排序不等式
民用建筑防煙排煙設計優化探討
關于優化消防安全告知承諾的一些思考
一道優化題的幾何解法
恐怖排序
做個怪怪長實驗
節日排序
刻舟求劍
兒童繪本(2018年5期)2018-04-12 16:45:32
主站蜘蛛池模板: 国产日韩丝袜一二三区| 欧美午夜精品| 亚洲欧美国产高清va在线播放| 在线欧美一区| 精品少妇三级亚洲| h视频在线播放| 日韩欧美国产另类| 一级一级一片免费| 亚洲无码精品在线播放| 午夜精品久久久久久久2023| 国产欧美精品午夜在线播放| 久久国产热| 亚洲精品图区| 91精品在线视频观看| 最新国产成人剧情在线播放| 高清精品美女在线播放| 99久视频| 亚洲综合经典在线一区二区| …亚洲 欧洲 另类 春色| 在线观看无码a∨| 婷婷六月激情综合一区| 2018日日摸夜夜添狠狠躁| 天天躁夜夜躁狠狠躁图片| 欧美亚洲激情| 亚洲一区无码在线| 欧美日韩精品在线播放| 色国产视频| 久久久久国产精品熟女影院| 成人va亚洲va欧美天堂| 亚洲视屏在线观看| 国产毛片高清一级国语| 国产91蝌蚪窝| 99re这里只有国产中文精品国产精品| 91无码人妻精品一区二区蜜桃 | 免费观看欧美性一级| 欧美一级专区免费大片| 精品久久高清| 少妇极品熟妇人妻专区视频| 毛片在线播放a| 亚洲综合极品香蕉久久网| 多人乱p欧美在线观看| 98超碰在线观看| 午夜视频免费试看| 漂亮人妻被中出中文字幕久久| 久久成人免费| 一区二区三区毛片无码| 国产福利免费视频| 国产免费人成视频网| 久久特级毛片| 亚洲天堂免费观看| 国产无码制服丝袜| 久草中文网| 无码内射中文字幕岛国片 | 国产av剧情无码精品色午夜| 一级全黄毛片| 最新国产高清在线| 精品亚洲国产成人AV| 久久久噜噜噜| 日本久久网站| 人妖无码第一页| 久久精品欧美一区二区| 一本无码在线观看| 日韩国产无码一区| 久久semm亚洲国产| 欧美激情二区三区| 亚洲欧美自拍一区| 青草娱乐极品免费视频| 亚洲人成在线精品| 久久精品无码中文字幕| 伊人精品成人久久综合| 国产真实自在自线免费精品| 一级成人a毛片免费播放| 免费观看男人免费桶女人视频| 欧美精品伊人久久| 精品国产福利在线| 综合网天天| 国产正在播放| 亚洲欧美精品一中文字幕| 国产日韩AV高潮在线| 欧美日韩精品综合在线一区| 国产美女免费| 国产一级在线观看www色 |