999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向高分辨率影像分布式處理的HDFS存儲研究

2018-06-14 05:46:58王敬平沈晨周潔黃子君
數(shù)字技術與應用 2018年3期
關鍵詞:語義信息

王敬平 沈晨 周潔 黃子君

(中國電子科技集團公司第三十二研究所,上海 201800)

隨著遙感衛(wèi)星技術和成像技術的不斷發(fā)展,“高分”系列衛(wèi)星覆蓋了從全色、多光譜到高光譜,從光學到雷達,從太陽同步軌道到地球同步軌道等多種類型,構成了一個具有高空間分辨率、高光譜分辨率、高時相分辨率和高輻射分辨率能力的對地觀測系統(tǒng)。高分辨率遙感數(shù)據(jù)進行數(shù)據(jù)處理,已不是簡單的數(shù)據(jù)密集型或計算密集型模式,而是數(shù)據(jù)密集和計算密集的混合模式,高分影像地面數(shù)據(jù)處理系統(tǒng)已逐步由集中式的高性能計算模式向分布式的存儲及計算模式發(fā)展。本文從高分影像分布式處理的實際需求出發(fā),分析了開源分布式存儲系統(tǒng)HDFS的存儲特性,圍繞影像分布式計算進行了存儲優(yōu)化,改進后的HDFS分布式文件系統(tǒng)能夠較好的支撐影像分布式計算,提高了地面影像數(shù)據(jù)處理的效率。

圖2 HDFS的數(shù)據(jù)分塊圖解

1 傳統(tǒng)Hadoop的分布式存儲及計算

1.1 HDFS分布式存儲原理及數(shù)據(jù)分塊

1.1.1 HDFS分布式存儲

HDFS(Hadoop Distribute File System),是為以流的方式存取大文件而設計的,適用于GB、TB及PB級的數(shù)據(jù)存儲,具有一次寫多次讀的特性。HDFS采用主從(Master/Slave)的架構模型,如圖 1所示,一個HDFS集群是由一個Namenode(名稱節(jié)點)和多個Datanode(數(shù)據(jù)節(jié)點)組成的(不考慮Namenode的高可用配置)。名稱節(jié)點作為主服務器,主要負責客戶端對文件的訪問操作和文件系統(tǒng)命名空間的管理,數(shù)據(jù)節(jié)點主要負責數(shù)據(jù)的實際存儲。

1.1.2 HDFS數(shù)據(jù)分塊

HDFS將文件劃分成不同的塊(Block),數(shù)據(jù)塊大小默認為64MB,可以在Hadoop的配置文件hdfs-site.xml中對這個值(dfs.Block.size)進行自定義,單位是Byte。

HDFS在順序劃分文件的時候,當文件最后一個塊沒有達到一個標準塊的大小時,也會被視為其本身大小的一個塊,而不是占用一個標準塊的存儲空間,保證文件在HDFS上存儲時占用的實際存儲空間與文件大小一致。如圖2,以一個300MB大小的文件為例,在Block size被設置為64MB的HDFS上會被如下分割成5個文件塊:

1.2 MapReduce并行計算原理

MapReduce是一種分布式計算模型,主要是解決海量數(shù)據(jù)的計算問題,將復雜的并行計算過程高度地抽象為兩個函數(shù):Map和Reduce。Hadoop中的MapReduce是一個使用簡單的軟件框架,基于MapReduce編寫出來的應用程序可以運行在大規(guī)模集群上,并以—種可靠容錯的方式并行處理的數(shù)據(jù)集可達到上T級別、P級別,實現(xiàn)了Hadoop在集群上的任務和數(shù)據(jù)的并行處理與計算。

圖4 高分辨率影像并行計算設計思路

圖5 基于HDFS的影像數(shù)據(jù)分塊(a)

如圖3所示,MapReduce處理大數(shù)據(jù)集的過程,把大數(shù)據(jù)集分解成若干小數(shù)據(jù)集,每一個(或幾個)數(shù)據(jù)集分別由集群中的一個節(jié)點進行處理,并生成中間結(jié)果,這些中間結(jié)果隨后又由大量的節(jié)點合并,形成最終結(jié)果。

2 高分辨率影像的分布式存儲及并行計算

高分辨率影像并行計算建立在海量分布式存儲之上,使用數(shù)據(jù)節(jié)點作為計算節(jié)點,盡最大努力保證在那些存儲了數(shù)據(jù)的節(jié)點上執(zhí)行計算任務。這種方式可有效地減少數(shù)據(jù)在網(wǎng)絡中的傳輸,降低任務對網(wǎng)絡帶寬的需求,避免使網(wǎng)絡帶寬成為瓶頸,所以“本地計算”可以說是節(jié)約帶寬最有效的方式。

將要處理的影像文件語義分成多個輸入分片,在多臺數(shù)據(jù)節(jié)點上同時進行計算。作業(yè)管理節(jié)點為每個輸入分片構建一個Map任務,最后再由一個或多個Reduce任務將所有Map任務處理的結(jié)果進行匯總。

如圖4所示,三個數(shù)據(jù)分片分別存儲在三個數(shù)據(jù)節(jié)點上,作業(yè)被分成三個Map任務,一個Reduce任務。三個Map任務首先并行執(zhí)行,產(chǎn)生的中間文件通過網(wǎng)絡傳輸給另一個數(shù)據(jù)節(jié)點,執(zhí)行Reduce任務,最后把輸出結(jié)果寫入到海量分布式系統(tǒng)中。

在GeoTIFF影像的文件頭中,存儲了用于描述影像的所有元數(shù)據(jù)信息,包括像元數(shù)據(jù)的位數(shù)、數(shù)據(jù)偏移量、調(diào)色板數(shù)據(jù)、數(shù)據(jù)壓縮方式、圖像形態(tài)、圖像行列編排方式、圖像通道(波段)、分辨率、坐標、投影方式等。這些元數(shù)據(jù)信息在影像的識別、解析、處理中發(fā)揮著重要的作用,失去這些元數(shù)據(jù)信息將導致像元數(shù)據(jù)難以被識別及利用。

如圖5所示,采用HDFS的分塊策略對GeoTIFF影像進行數(shù)據(jù)分塊(假設影像數(shù)據(jù)300MB,數(shù)據(jù)分塊大小為64MB),文件被分成5個Block,并將會被存儲到不同的Datanode節(jié)點上。

從圖5中,可以發(fā)現(xiàn)只有其中第一個Block中包含有影像的元數(shù)據(jù),且該元數(shù)據(jù)為完整影像的元數(shù)據(jù)信息,但其他的數(shù)據(jù)塊僅為二進制流數(shù)據(jù),未包含任何元數(shù)據(jù)信息。基于HDFS的影像數(shù)據(jù)分塊,在分布式計算運行時,負責計算Block2到Block5的影像處理算法將只能拿到文件塊中存儲的字節(jié)流,不能獲取偏移量、數(shù)據(jù)類型、分辨率、坐標等信息,該影像處理算法也就無法識別和處理該數(shù)據(jù)塊的圖像像元。

如圖6所示,也可以調(diào)整HDFS中的dfs.Block.size的大小,使其大小超過影像的大小(如設置dfs.Block.size = 320MB),遙感影像文件會完整的存儲在一個文件塊中,相應的影像處理算法即可以完整的讀取影像的元數(shù)據(jù)信息及像元數(shù)據(jù),并對影像進行操作。但高分辨率影像一般分景存儲,而每景數(shù)據(jù)一般都在幾百MB,甚至GB以上,若設置dfs.Block.size為相應大小,這樣也就無法對影像數(shù)據(jù)進行細粒度的分布式并行計算,也失去了使用HDFS存儲的意義。

因此,在高分辨率影像分布式并行計算時,我們應該著重分析和優(yōu)化:對高分辨率影像進行語義分割,提高影像的處理效率,并對處理后的影像仍然存儲在分布式存儲系統(tǒng)中,以及提供有效的語義合并手段。

圖6 基于HDFS的影像數(shù)據(jù)分塊(b)

圖7 高分影像語義分塊三種方式

3 面向高分辨率影像處理的存儲優(yōu)化

3.1 高分辨率影像的語義分塊及合并

高分辨率影像的語義分塊的目標是解決高分辨率影像在分塊之后,依然能夠作為獨立高分影像被影像處理算法識別及處理,并且能夠適應基于Hadoop的分布式存儲與計算。

高分辨率影像存在三種圖像數(shù)據(jù)劃分方式,如圖7所示,其中(1)為矩形塊;(2)表示水平條帶;(3)為豎直條帶,在處理不同影像時,可以結(jié)合實際處理任務來選何種劃分方法:像素級的處理并行化分支較小,進行數(shù)據(jù)劃分時較為簡單,特征處理如線條所示,按照豎直條帶和水平條帶來劃分,在目標級、特征級處理期間,需要結(jié)合相應的問題、并行計算支撐環(huán)境來選擇具體的劃分方式。需要特別關注的是,為了適應一些類型的圖像處理算法(例如卷積運算),影像在切分時相鄰條帶之間也可以保留一定量的冗余,例如矩形塊方式切割,數(shù)據(jù)塊的有效區(qū)域是a*b,但切割保留的區(qū)域則要包含冗余區(qū)域,圖中分塊0-0的保留區(qū)域是(a+△a)*(b+△b),分塊1-1的保留區(qū)域是(△a+a+△a)*(△b+b+△b)。

如圖8所示,高分辨率影像語義分塊與合并的流程示意圖:

(1)語義分塊:在獲取原始影像數(shù)據(jù)的元數(shù)據(jù)信息和像元數(shù)據(jù)后,采用圖7中的一種分塊方式(例如矩形分塊),生成多個Block1、Block2、Block3等,然后依據(jù)原始影像數(shù)據(jù)的元數(shù)據(jù)信息和分塊位置信息,分別對各個Block進行影像數(shù)據(jù)信息重建,形成各個獨立分塊影像文件,可被影像處理算法識別及處理;

(2)語義合并:各個分塊影像數(shù)據(jù)經(jīng)過影像處理之后(例如影像配準、幾何校正等),生成新的影像文件數(shù)據(jù),在解析獲得各個新的影像文件的元數(shù)據(jù)信息和像元數(shù)據(jù),依據(jù)各個分塊位置信息(含冗余區(qū)域信息),合并得到新影像數(shù)據(jù)文件,并更新影像數(shù)據(jù)的元數(shù)據(jù)信息。

圖8 高分辨率影像的語義分塊與合并

3.2 HDFS相關模塊設計優(yōu)化

(1)語義分塊、語義合并函數(shù)。使用GDAL構建Image Semantic Block、Image Semantic Merge兩個函數(shù),用于實現(xiàn)對高分影像數(shù)據(jù)的語義分塊和語義合并功能。

(2)HDFS Client。在LibHDFS接口中,重寫Write和Read接口函數(shù),集成ImageSemanticBlock、ImageSemanticMerge函數(shù),改造HDFS的分塊和合并的機制,并提供能夠獨立訪問HDFS數(shù)據(jù)塊影像的獨立接口IndependentBlockRead、IndependentBlockWrite。

(3)HDFS Namenode。在數(shù)據(jù)文件元數(shù)據(jù)信息中,需添加每個影像分塊位于整個影像中的位置信息,在INodeFile類中增加blockArea信息和getBlockArea函數(shù)。

(4)HDFS Datanode。在HDFS寫入數(shù)據(jù)塊時,會對所有分塊計算校驗和,并在讀取時驗證校驗和,需在ChecksumFileSystem類中,增加影像分塊元數(shù)據(jù)校驗和變量metaDataChecksum和setMetaDataChecksum函數(shù)。

4 結(jié)語

本文介紹了高分辨率影像的分布式存儲及并行計算的原理及過程,分析了傳統(tǒng)HDFS存儲無法適用高分影像分布式并行計算的原因,研究了高分辨率影像的語義分塊與語義合并的方法與技術,并對HDFS進行了改造與優(yōu)化,最終實現(xiàn)了面向分布式并行計算的高分辨率影像的分布式存儲,有效支撐并提高了高分影像的分布式處理效率。由于開源HDFS系統(tǒng)非常龐大,我們在對HDFS的改造過程中,存在不能完全理解HDFS的所有源代碼,所以圍繞HDFS的改造與優(yōu)化的穩(wěn)定性、可靠性以及代碼的影響域,還有待進一步測試與驗證。

[1]孟祥輝,李浩川,姚璐,王少坤.分布式并行計算技術在遙感數(shù)據(jù)處理中的應用[J].電子技術與軟件工程,2016,(24):174.

[2]馬偉鋒,李偉.遙感影像數(shù)據(jù)并行計算中數(shù)據(jù)分配策略研究[J].浙江工業(yè)大學學報,2016,(6):270-274.

[3] 程付超,苗放,楊文暉,陳墾.適用于海量遙感影像的分布式計算框架設計與實現(xiàn)[J].物探化探計算技術,2014,(5):358-361.

[4]劉建華,毛政元.高空間分辨率光學遙感影像分割方法研究綜述[J].遙感信息,2009,(6):95-101.

[5]PLAZAA, DU Q, CHANG Y L, et al. High performance computing for hyperspectral remote sensing[J].IEEE Journal of Selected Topics in Applied Earth Observa-tions and Remote Sensing,2011,4(3):528-544.

猜你喜歡
語義信息
語言與語義
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
“上”與“下”語義的不對稱性及其認知闡釋
認知范疇模糊與語義模糊
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
“深+N季”組配的認知語義分析
當代修辭學(2011年6期)2011-01-29 02:49:50
語義分析與漢俄副名組合
外語學刊(2011年1期)2011-01-22 03:38:33
修辭的基礎——語義和諧律
當代修辭學(2010年1期)2010-01-23 06:35:10
信息
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 99re热精品视频中文字幕不卡| 最新亚洲人成网站在线观看| 亚洲男人的天堂网| 国产乱子伦一区二区=| 国产精品成人免费综合| 久久综合结合久久狠狠狠97色| 久久精品亚洲专区| 亚洲天堂成人在线观看| a天堂视频| 欧美日韩在线国产| 亚洲不卡影院| 精品伊人久久久香线蕉| 欧美精品亚洲二区| 免费在线视频a| 亚洲第一成年人网站| 成人福利在线看| 免费看av在线网站网址| 亚洲系列无码专区偷窥无码| 亚洲精品人成网线在线| 99伊人精品| 日本午夜精品一本在线观看| 尤物成AV人片在线观看| 亚洲精品视频网| 国模视频一区二区| 8090午夜无码专区| 欧美性猛交xxxx乱大交极品| 欧美性精品不卡在线观看| 91精品情国产情侣高潮对白蜜| 欧美午夜在线播放| 456亚洲人成高清在线| 91免费国产高清观看| 国产高清在线观看| 亚洲最大福利视频网| 国产毛片高清一级国语 | 超碰aⅴ人人做人人爽欧美 | 丁香婷婷激情综合激情| 97无码免费人妻超级碰碰碰| 久久久久人妻一区精品| 国产一区二区三区在线观看视频| 777午夜精品电影免费看| 97成人在线观看| 国产亚洲精品yxsp| 国产视频只有无码精品| 久久综合久久鬼| 三上悠亚精品二区在线观看| 2021亚洲精品不卡a| 国产精品自在在线午夜区app| 国产白浆视频| 欧美成在线视频| 重口调教一区二区视频| 欧美一区国产| 日本三级精品| 五月丁香在线视频| 日韩国产高清无码| 日本免费福利视频| 国产欧美视频一区二区三区| 欧美中出一区二区| 国产精品永久免费嫩草研究院| 久青草免费视频| 欧美专区日韩专区| 91香蕉国产亚洲一二三区 | 午夜精品区| 91精品啪在线观看国产60岁| 欧美色视频在线| h网站在线播放| 国产亚洲精品yxsp| 色丁丁毛片在线观看| 欧美.成人.综合在线| 欧美亚洲日韩中文| 97超碰精品成人国产| 毛片视频网址| 激情六月丁香婷婷四房播| 国产国产人成免费视频77777| 美女高潮全身流白浆福利区| 特级毛片免费视频| 日韩精品中文字幕一区三区| 激情综合婷婷丁香五月尤物| 国产成人精品18| 日韩乱码免费一区二区三区| 亚洲天堂视频在线观看免费| 在线精品自拍| 欧美成人亚洲综合精品欧美激情|