999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于HDFS的社區(qū)文件存儲(chǔ)策略改進(jìn)

2020-11-06 12:14:26賓茂梨王榆心懷瑜畢夢(mèng)怡方宗悅
科學(xué)與財(cái)富 2020年24期

賓茂梨 王榆心 懷瑜 畢夢(mèng)怡 方宗悅

摘要:互聯(lián)網(wǎng)技術(shù)發(fā)展日新月異,居民越加重視社區(qū)信息化服務(wù)升級(jí),我國各社區(qū)信息化系統(tǒng)存在諸多問題,社區(qū)系統(tǒng)的孤立導(dǎo)致文件難以共享且針對(duì)社區(qū)系統(tǒng)的存儲(chǔ)方案不夠完善。本課題針對(duì)以上問題,提出對(duì)HDFS的小文件存儲(chǔ)策略進(jìn)行改進(jìn)。通過小文件的特征判斷相似性,進(jìn)行小文件的分類與合并,根據(jù)測(cè)試,該策略對(duì)于無規(guī)則的文件合并策略,讀取速度得到提高。

關(guān)鍵詞:智慧社區(qū),HDFS,小文件存儲(chǔ)

0???? 引言

隨著智慧社區(qū)的不斷發(fā)展,生成了海量的信息數(shù)據(jù),目前智慧社區(qū)信息系統(tǒng)固化,社區(qū)信息難以共享。要實(shí)現(xiàn)真正的智慧社區(qū),需要對(duì)社區(qū)大數(shù)據(jù)進(jìn)行合理高效運(yùn)用,分布式文件存儲(chǔ)系統(tǒng)更加符合如今的大數(shù)據(jù)時(shí)代。

本文介紹了一種以HDFS分布式文件存儲(chǔ)為基礎(chǔ),針對(duì)HDFS對(duì)于小文件處理不足進(jìn)行改進(jìn),可以提高文件存儲(chǔ)性能。

1???? Hadoop小文件合并方法

1.1? Hadoop Archive方案

Hadoop Archive方案是將多個(gè)小文件合并成一個(gè)文件,且合并后的文件中包含被合并文件的元數(shù)據(jù)信息和文件內(nèi)容,主要由MapReduce將小文件內(nèi)容進(jìn)行歸并形成歸檔文件[1]。

這個(gè)方案雖然可以歸檔小文件,但是歸檔后不易更改,需要全部解壓后進(jìn)行更改后再進(jìn)行歸檔。歸檔小文件后原文件不會(huì)自行刪除;歸檔操作需要依賴MapReduce,查詢文件耗時(shí)長;且歸檔操作只適用于已經(jīng)存入HDFS集群中的小文件,歸檔過程會(huì)占用集群額外的計(jì)算資源。

2???? 小文件存儲(chǔ)改進(jìn)方案

本文接下來的內(nèi)容主要解決以下兩個(gè)問題。第一,如何判定多大的文件是小文件進(jìn)而進(jìn)行合并預(yù)處理;第二,小文件如何根據(jù)特征屬性進(jìn)行合并,研究與設(shè)計(jì)具體合并規(guī)則和步驟。最后將改進(jìn)后策略進(jìn)行測(cè)試并比對(duì)測(cè)試結(jié)果。

2.1? 小文件大小劃分

在提出優(yōu)化方案前,首先需要定義小文件[2],定義小文件的文件大小就是當(dāng)文件大小大于某一值時(shí),HDFS中文件的存儲(chǔ)效率極大的降低,這一分界點(diǎn)即為本課題研究目標(biāo)。將NameNode節(jié)點(diǎn)內(nèi)存中每KB可存文件數(shù)量作為衡量標(biāo)準(zhǔn),記為NPK。

式中,N——HDFS上存儲(chǔ)的文件數(shù)

Mn——NameNode所消耗的內(nèi)存量

通常,文件和具有三個(gè)副本單元的塊的元數(shù)據(jù)分別消耗250和 368字節(jié)的內(nèi)存[3],則NameNode消耗內(nèi)存計(jì)算公式為:

測(cè)試NameNode節(jié)點(diǎn)的內(nèi)存占用情況再分別讀取HDFS下載文件,測(cè)試下載時(shí)長和MSPF[4],結(jié)果如圖2.1所示。

由圖2.1可得,在數(shù)值在0 到交點(diǎn)間時(shí)增長明顯,而后增長緩慢,通過線性擬合可得2.70為讀取效率臨界點(diǎn),此時(shí)文件大小為7.33MB,故小文件指小于7.33MB文件。

2.2? 小文件合并文件規(guī)則

上一節(jié)確定了小文件的具體劃分,將小文件處理過程置于預(yù)處理節(jié)點(diǎn)中,在存入HDFS集群前就實(shí)現(xiàn)對(duì)小文件分類與合并以解決滯后性,合并規(guī)則如圖2.2所示。

采用SimHash算法對(duì)文件進(jìn)行相似性判斷并分類,將達(dá)到數(shù)據(jù)塊大小的分類進(jìn)行文件合并,合并生成SequenceFile文件和相應(yīng)的IndexFile索引文件,最后將合成的SequenceFile文件同大文件一樣存入HDFS集群中。將小文件按社區(qū)文件特征屬性進(jìn)行合并,可以提升文件讀取速度,還可以減輕HDFS內(nèi)存壓力。

3???? 測(cè)試結(jié)果與分析

HDFS集群負(fù)責(zé)文件的存儲(chǔ),服務(wù)端預(yù)處理節(jié)點(diǎn)負(fù)責(zé)小文件處理工作。為減小誤差,采用去尾平均值作為測(cè)試結(jié)果。

分別采用原生HDFS小文件處理策略和改進(jìn)后的策略,進(jìn)行小文件存儲(chǔ)時(shí)間測(cè)試,存儲(chǔ)耗時(shí)結(jié)果如圖3.1所示。

由圖可見,本文提出的改進(jìn)策略在存取文件過程中較原生存儲(chǔ)策略有極大提高。

參考文獻(xiàn):

[1]?? 關(guān)海超.小文件處理及算法并行化在Hadoop上的設(shè)計(jì)與實(shí)現(xiàn)[D].重慶:重慶大學(xué).2015.

[2]?? 閆建,李瑞,劉薩娜.機(jī)遇、挑戰(zhàn)與展望:“互聯(lián)網(wǎng)+”背景下的政府治理創(chuàng)新[J].重慶理工大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2017,30(1):76-81.

[3]?? He H,Du Z,Zhang W,et al.Optimization strategy of Hadoop small file storage for big data in healthcare[J].Journal of Supercomputing,2016,72(10):3696-3707.

[4]?? 段效琛,李英娜,賈會(huì)玲,等.初始信息素篩選的蟻群優(yōu)化算法在HDFS副本選擇中的研究[J].傳感器與微系統(tǒng),2017,(4):31-33.

作者簡(jiǎn)介:

賓茂梨(1997-),男,在讀研究生,研究方向:物聯(lián)網(wǎng)技術(shù)與應(yīng)用

基金:重慶市教委雛鷹計(jì)劃第九期研究項(xiàng)目“基于PID控制的簡(jiǎn)易風(fēng)洞控制器設(shè)計(jì)”(CY200602)

主站蜘蛛池模板: 亚洲欧美在线精品一区二区| 91在线日韩在线播放| 欧洲在线免费视频| 夜夜操国产| 婷婷99视频精品全部在线观看| 欧美精品二区| 国产成人免费观看在线视频| 思思99思思久久最新精品| 无码网站免费观看| 国产情精品嫩草影院88av| 亚洲天堂伊人| 美女扒开下面流白浆在线试听| 国产尹人香蕉综合在线电影| 成人国产一区二区三区| 日本久久网站| 欧美日在线观看| 狠狠色综合久久狠狠色综合| 啪啪国产视频| 制服丝袜 91视频| 欧美一区中文字幕| 亚洲午夜18| 91精品亚洲| 国产人人干| 少妇高潮惨叫久久久久久| 久久99蜜桃精品久久久久小说| 欧美狠狠干| 中文成人在线视频| 4虎影视国产在线观看精品| 蜜臀AV在线播放| 欧美精品三级在线| 国产日本欧美在线观看| 91欧美在线| 国产免费黄| 色偷偷男人的天堂亚洲av| 91精品国产一区自在线拍| 色亚洲成人| 偷拍久久网| 国产制服丝袜91在线| 久久精品视频亚洲| 国产成人午夜福利免费无码r| 国产jizz| 色丁丁毛片在线观看| 韩日午夜在线资源一区二区| 欧美特黄一级大黄录像| 亚洲天堂视频在线免费观看| jizz在线观看| 国产精品午夜福利麻豆| 亚洲无线一二三四区男男| 五月六月伊人狠狠丁香网| 在线一级毛片| 欧美精品成人一区二区视频一| 香蕉色综合| 99精品一区二区免费视频| 人妻精品久久无码区| 欧美成人影院亚洲综合图| 久久免费视频播放| vvvv98国产成人综合青青| 国产精品亚洲天堂| 国内精品视频在线| 亚洲午夜综合网| AV网站中文| 色欲不卡无码一区二区| 四虎国产精品永久在线网址| 手机成人午夜在线视频| 日本亚洲最大的色成网站www| 亚洲成网站| 毛片久久网站小视频| 多人乱p欧美在线观看| 欧美高清视频一区二区三区| 国产人成在线观看| 亚洲免费三区| 美臀人妻中出中文字幕在线| 久久免费看片| 国产精品女同一区三区五区| 香蕉精品在线| 在线视频亚洲色图| 无码国内精品人妻少妇蜜桃视频| 人人澡人人爽欧美一区| 国产美女人喷水在线观看| 亚洲AV无码乱码在线观看代蜜桃| 亚洲a免费| 黄色在线网|