999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Hadoop的云計(jì)算數(shù)據(jù)主動銷毀研究

2015-12-02 02:28:52周椿入呂瀚森何佳羲
關(guān)鍵詞:用戶

楊 榆, 雷 敏, 周椿入, 呂瀚森, 何佳羲

(1.北京郵電大學(xué)信息安全中心,北京100876;2.災(zāi)備技術(shù)國家工程實(shí)驗(yàn)室,北京100876)

0 引言

隨著云計(jì)算飛速發(fā)展,云安全成為當(dāng)前云計(jì)算研究的重點(diǎn)方向。用戶將個人的隱私數(shù)據(jù)存放到云存儲集群中,用戶雖然能夠在本地對遠(yuǎn)程云服務(wù)器上的數(shù)據(jù)進(jìn)行增刪改查的操作,但卻不能像本地存儲一樣擁有對數(shù)據(jù)的完全控制權(quán)限。當(dāng)用戶刪除云端數(shù)據(jù)后,并不能徹底刪除用戶數(shù)據(jù),導(dǎo)致用戶數(shù)據(jù)殘留。如果用戶的數(shù)據(jù)涉及用戶隱私或機(jī)密,殘留數(shù)據(jù)留在云端服務(wù)器的介質(zhì)中,一旦用戶的殘留數(shù)據(jù)被惡意恢復(fù)利用,將損害用戶利益甚至造成更加重大的危害[1]。

針對云存儲服務(wù)器端用戶數(shù)據(jù)刪除后的數(shù)據(jù)殘留問題,提出通過修改Hadoop源碼中的Block刪除行為,即在Block刪除之前先進(jìn)行數(shù)據(jù)覆寫,達(dá)到銷毀數(shù)據(jù)殘留目的主動銷毀機(jī)制(Active Data Deletion,ADD)。經(jīng)過仿真驗(yàn)證,修改后的Hadoop系統(tǒng)可以有效地覆寫B(tài)lock文件,達(dá)到徹底銷毀原始數(shù)據(jù)的目標(biāo)。同時(shí)針對不同的安全需求采用不同復(fù)雜度的覆寫算法,并測試不同復(fù)雜度的覆寫算法的性能。

1 HDFS數(shù)據(jù)殘留問題分析

Hadoop是目前使用最為廣泛的云計(jì)算系統(tǒng),大部分商用云計(jì)算系統(tǒng)都是基于Hadoop的二次開發(fā)。Hadoop分布式文件系統(tǒng)HDFS(Hadoop Distributed File System)作為Hadoop的核心模塊,為系統(tǒng)所有業(yè)務(wù)提供分布式存儲服務(wù)。設(shè)計(jì)目的是提供一個高容錯,且能部署在廉價(jià)硬件上的分布式系統(tǒng);同時(shí),能支持高吞吐量,適合大規(guī)模數(shù)據(jù)集應(yīng)用[2]。

Hadoop基于Linux系統(tǒng)搭建,一般由一個主節(jié)點(diǎn)和若干個從節(jié)點(diǎn)組成。HDFS主要由Name Node(名字節(jié)點(diǎn))和DataNode(數(shù)據(jù)節(jié)點(diǎn))組成,文件存儲時(shí),Name Node將其分成若干個數(shù)據(jù)塊Block作為本地文件存儲在不同的DataNode上。當(dāng)文件刪除時(shí),DataNode刪除操作調(diào)用Java的File類對象的f.delete方法刪除。因此HDFS的文件刪除機(jī)制和普通本地Linux操作系統(tǒng)下的文件刪除機(jī)制相同,并不會在對數(shù)據(jù)執(zhí)行刪除操作之前對數(shù)據(jù)塊文件進(jìn)行任何覆寫或內(nèi)容銷毀處理[3]。在Linux文件系統(tǒng)中,文件刪除操作不會徹底銷毀已刪除數(shù)據(jù),在新的內(nèi)容寫入磁盤之前,殘留的數(shù)據(jù)內(nèi)容還將繼續(xù)存儲在磁盤中。所以,HDFS中的數(shù)據(jù)并沒有被實(shí)際銷毀。在云系統(tǒng)的環(huán)境下,數(shù)據(jù)的所有權(quán)和控制權(quán)分離,用戶不能完全掌控自己存儲在云端的數(shù)據(jù)。只要利用數(shù)據(jù)恢復(fù)技術(shù),惡意的用戶或云服務(wù)提供商都可能恢復(fù)普通用戶已經(jīng)刪除的數(shù)據(jù),存在很大的安全隱患。

搭建一個仿真Hadoop平臺,采用遠(yuǎn)程登錄方式訪問Hadoop云計(jì)算系統(tǒng),上傳圖片和文本文件,隨后對上傳的圖片和文本文件進(jìn)行刪除。利用二進(jìn)制工具Hexedit可查看到相關(guān)block文件在磁盤中并未被徹底刪除,并且可以恢復(fù)。通過仿真實(shí)驗(yàn)驗(yàn)證Hadoop分布式文件系統(tǒng)HDFS確實(shí)存在數(shù)據(jù)殘留問題,而Hadoop系統(tǒng)對此并未采取任何防范措施。

2 主動銷毀方案設(shè)計(jì)

要完成數(shù)據(jù)主動銷毀的目標(biāo),結(jié)合數(shù)據(jù)覆寫算法,可選的方案有兩種。第一種方案是監(jiān)控文件索引表,在文件刪除后對相應(yīng)磁盤位置進(jìn)行數(shù)據(jù)覆寫;第二種方案是在文件刪除之前先進(jìn)行覆寫,銷毀數(shù)據(jù)之后再進(jìn)行刪除。

對于第一種方案,通過對磁盤操作的研究和分析,在文件刪除后覆寫磁盤對應(yīng)位置是可行的,但是要區(qū)分正常刪除的文件和需要覆寫刪除的文件非常困難。在云計(jì)算系統(tǒng)中,除用戶上傳下載的文件以Block的形式存儲之外,還有諸多系統(tǒng)文件和其他應(yīng)該受到保護(hù)的文件,如果監(jiān)控文件索引表,對所有刪除文件都進(jìn)行覆寫銷毀,此方法不可行。

對于第二種方案,在文件刪除之前先進(jìn)行覆寫,只需要找到所有Block的存儲位置即可,通過分析和修改Hadoop源碼可以找到所有Block的存儲位置;另一方面,因?yàn)橹粚lock文件進(jìn)行覆寫,并且由Hadoop自主完成而非節(jié)點(diǎn)主機(jī)上的其他程序完成覆寫,這就避免方案一中可能出現(xiàn)的文件區(qū)分的問題。

經(jīng)過方案比較后,采取方案二作為主動銷毀方案的切入點(diǎn),從用戶客戶端和云服務(wù)器端兩方面分析與考慮,提出主動銷毀的方案,下面對這兩種方案進(jìn)行分析。

2.1 用戶客戶端主動銷毀

由于用戶在客戶端無法獲取文件在HDFS上的具體存儲情況,所以不能像處理本地文件一樣操作HDFS中的文件,需要通過Hadoop提供的API進(jìn)行文件讀寫處理。

對于文件的寫入操作,Hadoop提供create和append方法,分別表示創(chuàng)建和追加文件:create創(chuàng)建一個新的文件,并根據(jù)大小分配Block;append在原文件的基礎(chǔ)上從末尾追加數(shù)據(jù),不可更改原文件中已有的數(shù)據(jù)。使用create創(chuàng)建與原文件同名的覆寫文件覆蓋。

在客戶端,對用戶來說覆寫文件確實(shí)替換了原有的文件。但事實(shí)上,新添加的文件并沒有覆蓋原來的文件數(shù)據(jù)。整個過程在Hadoop中可以理解為:首先檢測到要創(chuàng)建的新文件與原文件同名,則先對原文件正常刪除,再創(chuàng)建新的同名文件,而原文件在磁盤中并未被替換。創(chuàng)建新文件之后,可以看到Block編號已經(jīng)增加,利用Hexedit也可查看到原磁盤位置存儲的數(shù)據(jù)并沒有發(fā)生改變,由此可得知,利用Hadoop所提供的API在客戶端無法達(dá)到修改文件的目的,不能完成數(shù)據(jù)的主動銷毀。

2.2 服務(wù)器端主動銷毀

通過實(shí)踐證明無法在客戶端完成文件主動銷毀,則只有從服務(wù)器端入手,分析Hadoop源碼得知任何文件的操作的最終對象都是Block,文件刪除也不例外。當(dāng)DataNode接收到刪除文件的指令后,先檢查文件名驗(yàn)證是否存在,接著從Name Node獲取對應(yīng)的Block信息,包括編號,存儲位置等,最后調(diào)用Java的File類方法delete刪除Block文件。設(shè)計(jì)思路就是在刪除Block之前調(diào)用數(shù)據(jù)覆寫算法將文件覆寫,在破壞原有的數(shù)據(jù)后再執(zhí)行刪除操作,就可以完成數(shù)據(jù)的主動銷毀,從而保護(hù)數(shù)據(jù)安全。

基于以上分析,提出的ADD數(shù)據(jù)主動銷毀策略,具體流程如圖1所示。

圖1 ADD主動銷毀流程

當(dāng)需要刪除數(shù)據(jù)時(shí),Hadoop系統(tǒng)向刪除任務(wù)函數(shù)傳遞Block參數(shù),ADD主動銷毀機(jī)制獲取到Block相關(guān)信息后,打開即將刪除的Block文件,調(diào)用數(shù)據(jù)覆寫算法覆寫后保存并關(guān)閉文件,然后返回到刪除任務(wù)函數(shù),正常執(zhí)行完刪除操作,從而可以破壞原有數(shù)據(jù),從而防止用戶存留在服務(wù)器上的數(shù)據(jù)被惡意恢復(fù)。

3 仿真測試

采用Hadoop對系統(tǒng)進(jìn)行仿真,仿真的環(huán)境為Hadoop-2.6.0版本。仿真測試的過程為:

(1)通過遠(yuǎn)程登錄訪問Hadoop集群,上傳文件到HDFS中存儲。

(2)在DataNode節(jié)點(diǎn)使用二進(jìn)制工具查看磁盤,尋找相應(yīng)的Block文件信息并作記錄。

(3)用戶端遠(yuǎn)程刪除上傳的文件,再次在DataN-ode節(jié)點(diǎn)上使用二進(jìn)制工具查看磁盤,尋址到記錄的相同位置,對比前后的數(shù)據(jù)是否相同并嘗試恢復(fù)。

(4)如果相同且能夠恢復(fù),則表示覆寫失敗,主動銷毀并沒有實(shí)現(xiàn);如果不同則表示覆寫成功,嘗試恢復(fù)為新文件,能恢復(fù)但恢復(fù)后的文件不能有效辨認(rèn)信息或根本無法恢復(fù),則表示主動銷毀數(shù)據(jù)成功。

3.1 仿真步驟

仿真步驟如下:

(1)修改Hadoop源代碼,將作者編寫的主動數(shù)據(jù)銷毀算法集成到Hadoop代碼中,利用修改并編譯后的安裝包重新搭建部署Hadoop集群。

(2)上傳測試圖片文件pngtest.png到HDFS,并檢查和記錄blk編號。

(3)在slave1節(jié)點(diǎn)使用Hexedit查看磁盤信息,尋找到 blk_1073741835,其存儲位置起始于 sector:26792072,結(jié)束于26792140,如圖2所示。

圖2 blk對應(yīng)磁盤位置信息

(4)執(zhí)行刪除指令,再次查看磁盤信息,除了刪除的日志信息外,無法找到之前的文件內(nèi)容信息,根據(jù)日志可以看出,覆寫算法已經(jīng)被調(diào)用,說明覆寫成功,如圖3所示。

圖3 blk刪除日志

(5)上傳文本文件 txttest.txt,重復(fù)(1)~(4)步驟,再次驗(yàn)證覆寫成功。

3.2 仿真結(jié)果與有效性分析

通過上述仿真步驟可以看出,優(yōu)化后的Hadoop系統(tǒng)實(shí)現(xiàn)了對block文件的覆寫和刪除操作,并且檢查磁盤數(shù)據(jù)并未發(fā)現(xiàn)殘留,證明整個數(shù)據(jù)覆寫刪除機(jī)制的有效性,算法可以滿足普通用戶的隱私安全需要。

圖4為測試文本文件在未刪除之前,覆寫前后的文件內(nèi)容比較。

圖4 文件覆寫前后對比

仿真實(shí)驗(yàn)僅對數(shù)據(jù)進(jìn)行一次覆寫,對安全級別要求更高的數(shù)據(jù),可以采用多次覆寫的方法以達(dá)到更高安全級別要求。目前比較常用的全零覆寫、DOD5220.22-M、DOD5220.22-M7等算法等都是應(yīng)用廣泛和成熟的算法。這些成熟的數(shù)據(jù)覆寫算法經(jīng)過檢驗(yàn),可以保證數(shù)據(jù)銷毀的效果。

3.3 性能分析

為測試本算法的性能。覆寫相同大小的文本文件采取全零覆寫、隨機(jī)一次性覆寫、DOD5220.22-M和DOD5220.22-M7等4種覆寫算法進(jìn)行性能測試。實(shí)驗(yàn)環(huán)境CPU型號為Intel Core i3-4150@3.50 GHz雙核,硬盤為希捷ST1000DM003 1ER162 1TB/7200轉(zhuǎn)/分硬盤,文本文件大小為71586816 Byte約為70 MB。具體性能測試的信息如圖5所示。

圖5 覆寫算法性能分析

由圖5可以看出,全零覆寫所需時(shí)間最短,DOD5220.22-M7所需時(shí)間越長,即隨著覆寫算法的復(fù)雜度增加,覆寫時(shí)間相應(yīng)增加。另一方面,數(shù)據(jù)量越大,各算法所需的時(shí)間差距也就越大。

在實(shí)際應(yīng)用環(huán)境中,不同數(shù)據(jù)塊Block分布在不同DataNode上,在對一個文件進(jìn)行覆寫銷毀時(shí),不同DataNode對所相關(guān)的Block并行覆寫效率更高。例如一個10 GB大文件,除去備份大約有160個Block分布在不同的DataNode上,假設(shè)集群中有10個DataNode節(jié)點(diǎn),那么每個節(jié)點(diǎn)平均有16個Block。采用全零覆寫算法覆寫銷毀這個10 GB的文件,按照10個節(jié)點(diǎn)并行覆寫,那么覆寫的時(shí)間消耗為23到24秒。上述時(shí)間是在實(shí)驗(yàn)環(huán)境下的估算,在真實(shí)的大集群環(huán)境中速度顯然會更快,而且采用其他如多線程等并行技術(shù),還可以進(jìn)一步提高覆寫操作的性能。

4 結(jié)束語

云存儲的特點(diǎn)是存儲即服務(wù),但普通用戶無法接觸和完全控制存儲在云端的個人數(shù)據(jù),一旦用戶存儲在云端的數(shù)據(jù)刪除后被惡意恢復(fù)利用,將侵犯用戶的隱私。針對云存儲系統(tǒng)的數(shù)據(jù)殘留問題,改進(jìn)原云計(jì)算系統(tǒng)的刪除行為,提出一種數(shù)據(jù)主動銷毀的策略——ADD機(jī)制,即對云端數(shù)據(jù)塊采取“先覆寫后刪除”策略徹底刪除,并基于Hadoop的分布式文件系統(tǒng)HDFS按照此機(jī)制修改了源代碼,搭建全分布式集群測試了策略的確是有效且可行的;在此之后,對比了不同數(shù)據(jù)覆寫算法的性能,分析出在實(shí)際應(yīng)用中,文中提出的ADD機(jī)制也是有效且可行的。

[1] 潘富斌.基于Hadoop的安全云存儲系統(tǒng)研究與實(shí)現(xiàn)[D].成都:電子科技大學(xué),2013.

[2] Garry Turkington.張治起,譯.Hadoop基礎(chǔ)教程(Hadoop beginner's guide)[M].北京:人民郵電出版社,2014.

[3] 鄧謙.基于Hadoop的云計(jì)算安全機(jī)制研究[D].南京:南京郵電大學(xué),2013.

[4] 李寧,王東亮等.Hadoop云計(jì)算一體機(jī)實(shí)踐指南[M].北京:機(jī)械工業(yè)出版社,2013.

[5] 馬媛.基于Hadoop的云計(jì)算平臺安全機(jī)制研究[J].信息安全與通信保密,2012,(6).

[6] 張逢吉吉,陳進(jìn),陳海波,等.云計(jì)算中的數(shù)據(jù)隱私性保護(hù)與自我銷毀[J].計(jì)算機(jī)研究與發(fā)展,2011.48(7):1155-1167.

[7] 成靜靜.基于Hadoop的分布式云計(jì)算/云存儲方案的研究與設(shè)計(jì)[J].數(shù)據(jù)通信,2012,(5):14-16.

[8] Wang L,Von laszewski g,Younge a,etal.Cloud computing:a perspective study[J].New Generation Computing,2010,28(2):137-146.

[9] LV Chengtong,LI Qing,LEI Zhou,et al.PaaS:a revolution for information technology platforms[C].ICENT 2010-2010 International Conference on Educational and Network Technology,2010:346-349.

[10] LEE B S,YAN Shixing,MA Ding,et al.Aggregating IaaS service[C].Proceedings-2011 Annual SRII Global Conference,SRII 2011,2011:335-338.

猜你喜歡
用戶
雅閣國內(nèi)用戶交付突破300萬輛
車主之友(2022年4期)2022-08-27 00:58:26
您撥打的用戶已戀愛,請稍后再哭
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關(guān)注用戶
商用汽車(2016年5期)2016-11-28 09:55:15
兩新黨建新媒體用戶與全網(wǎng)新媒體用戶之間有何差別
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
挖掘用戶需求尖端科技應(yīng)用
Camera360:拍出5億用戶
100萬用戶
主站蜘蛛池模板: 精品91视频| 婷婷六月综合| 99精品国产自在现线观看| 国产亚洲精品无码专| 激情网址在线观看| 欧美日韩一区二区三| 在线国产毛片| 欧美啪啪一区| 91成人试看福利体验区| 婷婷五月在线| 99久久国产精品无码| 免费精品一区二区h| 91综合色区亚洲熟妇p| 狠狠做深爱婷婷综合一区| 午夜在线不卡| 九九九久久国产精品| 日本a∨在线观看| 久久夜色精品| 91久久精品日日躁夜夜躁欧美| 在线观看无码av五月花| 最新亚洲av女人的天堂| 国产精品护士| 毛片在线看网站| 天天躁夜夜躁狠狠躁图片| 国产真实二区一区在线亚洲| 国产视频a| 国产一区自拍视频| 成人国产小视频| 亚洲一区二区成人| 国产成人精品无码一区二| 性视频久久| 亚洲欧洲日产国码无码av喷潮| 99人妻碰碰碰久久久久禁片| 国产成人高清亚洲一区久久| 日韩欧美高清视频| 国产交换配偶在线视频| 亚洲国产中文精品va在线播放| 久久青草视频| 福利国产微拍广场一区视频在线 | 久久精品国产免费观看频道| 伊人久久大线影院首页| 黄色a一级视频| 免费播放毛片| 欧美在线一二区| 在线日韩一区二区| 青草精品视频| 亚洲A∨无码精品午夜在线观看| 国产一区三区二区中文在线| 亚洲AV色香蕉一区二区| 中日无码在线观看| 东京热av无码电影一区二区| 亚洲高清在线天堂精品| 欧美一区二区福利视频| 人妻免费无码不卡视频| 五月婷婷精品| 精品国产免费观看| 东京热高清无码精品| 国产欧美专区在线观看| 欧美日韩一区二区三| 国产黑丝视频在线观看| 99久久国产综合精品女同| 国产一区成人| 亚洲国产精品一区二区第一页免 | 91精品专区国产盗摄| 国产精品专区第1页| 美女无遮挡拍拍拍免费视频| 黄色免费在线网址| 国产精品毛片在线直播完整版| 26uuu国产精品视频| 久久香蕉国产线看观看精品蕉| 国产xx在线观看| 国产一区二区三区免费观看| 一区二区三区在线不卡免费| 亚洲av无码专区久久蜜芽| 天天摸夜夜操| 小说区 亚洲 自拍 另类| 欧美一区二区三区香蕉视| 国产在线拍偷自揄观看视频网站| 91在线精品麻豆欧美在线| 欧美国产综合色视频| 精品国产中文一级毛片在线看| 亚洲精品国产成人7777|