999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

柵格地理數(shù)據(jù)并行格式轉(zhuǎn)換引擎*

2015-06-21 12:39:37張帥,李滿春,陳振杰
關(guān)鍵詞:引擎進(jìn)程

柵格地理數(shù)據(jù)并行格式轉(zhuǎn)換引擎*

張帥1,2,3,4,李滿春1,2,陳振杰1,2,黃濤1,2,姜曉慧5
(1.南京大學(xué)地理與海洋科學(xué)學(xué)院,江蘇南京210023;2.南京大學(xué)地理信息技術(shù)江蘇省重點(diǎn)實(shí)驗(yàn)室,江蘇南京210023;3.伊利諾伊大學(xué)香檳分校地理系,伊利諾伊61801;4.伊利諾伊大學(xué)香檳分校國家超級計(jì)算機(jī)應(yīng)用中心,伊利諾伊61801;5.國電南瑞科技股份有限公司,江蘇南京211106)

如今大規(guī)模地理數(shù)據(jù)正在社會各個(gè)部門和組織中迅速積累,但是由于部門利益和歷史沿襲等原因,大規(guī)模地理數(shù)據(jù)共享仍然極具挑戰(zhàn),相應(yīng)共享技術(shù)需求仍然極其旺盛。作為地理數(shù)據(jù)共享的基礎(chǔ)方式之一,傳統(tǒng)單機(jī)地理數(shù)據(jù)格式轉(zhuǎn)換技術(shù),一方面受限于磁盤讀寫及帶寬瓶頸,另一方面面對日趨龐大的數(shù)據(jù)規(guī)模,已很難滿足實(shí)際應(yīng)用需求。因此提出一種針對柵格地理數(shù)據(jù)的并行格式轉(zhuǎn)換引擎,采用高性能計(jì)算集群環(huán)境支持大規(guī)模柵格地理數(shù)據(jù)轉(zhuǎn)換共享,大幅降低了大規(guī)模柵格地理數(shù)據(jù)轉(zhuǎn)換過程的時(shí)間成本。柵格地理數(shù)據(jù)并行格式轉(zhuǎn)換引擎采用基于公共接口的設(shè)計(jì)理念,框架靈活、具有良好的擴(kuò)展性,支持地理數(shù)據(jù)格式的讀寫自定義以及新數(shù)據(jù)格式添加,能夠?qū)崿F(xiàn)接入數(shù)據(jù)格式間的任意兩兩轉(zhuǎn)換。為驗(yàn)證引擎框架及其處理效率,在Lustre并行集群環(huán)境下以格網(wǎng)數(shù)據(jù)交換格式(國家地理空間數(shù)據(jù)交換格式)向常見柵格地理格式的轉(zhuǎn)換為示例進(jìn)行了測試實(shí)驗(yàn)。結(jié)果表明,柵格地理數(shù)據(jù)并行格式轉(zhuǎn)換引擎能夠在8個(gè)節(jié)點(diǎn)Lustre集群中達(dá)到7.54的良好并行加速比。

柵格數(shù)據(jù)格式轉(zhuǎn)換;并行計(jì)算;高性能計(jì)算;地理計(jì)算;Lustre并行文件系統(tǒng)

地理信息共享技術(shù)經(jīng)過幾十年的發(fā)展和討論,形成了許許多多的方案方法[1],其中具有代表性的方法可分為三類:地理數(shù)據(jù)格式轉(zhuǎn)換技術(shù)、基于中間件技術(shù)的地理數(shù)據(jù)共享技術(shù)以及基于網(wǎng)絡(luò)服務(wù)的地理數(shù)據(jù)互操作技術(shù)[2-3]。地理數(shù)據(jù)格式轉(zhuǎn)換是最為基礎(chǔ)的地理信息共享方式,其目的是將存儲在一個(gè)系統(tǒng)中的地理數(shù)據(jù)通過數(shù)據(jù)轉(zhuǎn)換的方式導(dǎo)入到目標(biāo)系統(tǒng)中,實(shí)現(xiàn)數(shù)據(jù)共享[4]?;谥虚g件技術(shù)的地理數(shù)據(jù)共享為前端用戶提供了統(tǒng)一的數(shù)據(jù)視圖,很好地處理了數(shù)據(jù)自治與統(tǒng)一的關(guān)系,在更廣的范圍上和更多樣化的平臺下,支持了地理數(shù)據(jù)的共享和互操作[1,5-9]。基于網(wǎng)絡(luò)服務(wù)的數(shù)據(jù)互操作構(gòu)建在Web服務(wù)標(biāo)準(zhǔn)基礎(chǔ)之上,如開放地理空間信息聯(lián)盟(Open Geospatial Consortium,OGC)制訂的網(wǎng)絡(luò)地圖服務(wù)(Web Map Service,WMS)和網(wǎng)絡(luò)要素服務(wù)(Web Feature Service,WFS)等服務(wù)組件,可以在超文本傳送協(xié)議(HyperText Transfer Protocol,HTTP)之上通過基于可擴(kuò)展標(biāo)記語言(Extensible Markup Language,XML)的消息傳遞機(jī)制實(shí)現(xiàn)與其他軟件程序之間的交互[2-3]。

然而,由于地理數(shù)據(jù)本身的異構(gòu)性、語義的模糊、描述文檔的缺失或者存儲結(jié)構(gòu)的差異等問題,大規(guī)模地理數(shù)據(jù)共享至今仍然極具挑戰(zhàn)性[5,10-12]。中間件技術(shù)與網(wǎng)絡(luò)服務(wù)技術(shù)雖能夠在網(wǎng)絡(luò)端大范圍實(shí)現(xiàn)數(shù)據(jù)共享與互操作,但數(shù)據(jù)訪問與處理速度往往較慢,應(yīng)用層對數(shù)據(jù)的控制能力較弱,且現(xiàn)實(shí)中許多組織部門并不愿意開放數(shù)據(jù)庫接口而僅僅是將數(shù)據(jù)以通用格式的形式發(fā)布提供下載共享[13-15];隨著地理信息采集技術(shù)的長足發(fā)展,地理數(shù)據(jù)規(guī)模開始急劇膨脹[16],存儲在美國國家航空航天局地球觀測系統(tǒng)的數(shù)據(jù)和信息系統(tǒng)(NASA EOSDIS)中的遙感影像數(shù)據(jù)已經(jīng)超過3PB,而且還在以每天5TB的速度增加[17];云計(jì)算、大數(shù)據(jù)、流計(jì)算等新興技術(shù)持續(xù)涌現(xiàn),多核并行計(jì)算和多節(jié)點(diǎn)集群處理正在變得越來越常見,促使傳統(tǒng)地理計(jì)算模式向數(shù)據(jù)密集型高性能計(jì)算模式演變[18-19],傳統(tǒng)串行地理數(shù)據(jù)格式轉(zhuǎn)換技術(shù)在處理大規(guī)模地理數(shù)據(jù)時(shí)已是力不從心,更無法有效利用現(xiàn)今多核、多節(jié)點(diǎn)并行處理的巨大優(yōu)勢。

地理數(shù)據(jù)格式轉(zhuǎn)換過程屬于典型的數(shù)據(jù)密集型處理任務(wù),單機(jī)并行處理,如采用多線程OpenMP、GPU等技術(shù),雖能夠帶來一定的效率提升,但是數(shù)據(jù)I/O瓶頸明顯且難以實(shí)現(xiàn)大規(guī)模處理水平擴(kuò)展?;贖adoop技術(shù)的集群架構(gòu),采用Hadoop分布式文件系統(tǒng)及MapReduce并行編程模型,適合處理超大規(guī)模集群計(jì)算,而在中小規(guī)模集群環(huán)境下優(yōu)勢不明顯[19-20],且Hadoop對地理信息系統(tǒng)(Geographic Information System,GIS)組件支持仍處于探索階段,并不適合進(jìn)行大范圍GIS業(yè)務(wù)處理[20-21]。高性能計(jì)算集群由于發(fā)展時(shí)間早,技術(shù)較為成熟,在業(yè)務(wù)部門擁有較為廣泛的技術(shù)基礎(chǔ),是研究實(shí)現(xiàn)地理數(shù)據(jù)并行格式轉(zhuǎn)換技術(shù)的理想平臺。

本文在Lustre高性能集群技術(shù)基礎(chǔ)上,提出一種面向柵格地理數(shù)據(jù)的并行格式轉(zhuǎn)換引擎(Parallel Geo-Raster data Conversion Engine,PGRCE),使得柵格地理數(shù)據(jù)格式轉(zhuǎn)換能夠在高性能計(jì)算集群的支持下進(jìn)行,以達(dá)到快速高效共享地理數(shù)據(jù)的目的。Lustre文件系統(tǒng)是由OpenSFS (Open Scalable File Systems incorporation)開發(fā)的一個(gè)開源、高性能的分布式并行全局文件系統(tǒng)[22]。在高性能計(jì)算中,Lustre并行文件系統(tǒng)具有極其廣泛的應(yīng)用,全球排名前100的高性能計(jì)算機(jī)系統(tǒng)中,超過60%的高性能計(jì)算機(jī)使用了Lustre文件系統(tǒng)[22]。Lustre針對大文件的讀/寫做了優(yōu)化,可以為集群系統(tǒng)提供高性能的I/O吞吐率、全局?jǐn)?shù)據(jù)共享環(huán)境、節(jié)點(diǎn)的失效冗余處理,較好地滿足了高性能計(jì)算集群系統(tǒng)的需要[23-24]。

PGRCE采用基于公共接口的設(shè)計(jì)方法,框架靈活且具有很好的擴(kuò)展性,能夠支持地理數(shù)據(jù)格式的自定義以及添加新的數(shù)據(jù)格式,實(shí)現(xiàn)接入地理數(shù)據(jù)格式間的任意兩兩轉(zhuǎn)換。PGRCE框架中包括三個(gè)主要部分:柵格數(shù)據(jù)公共接口、格式轉(zhuǎn)換與擴(kuò)展機(jī)制以及引擎并行調(diào)度策略。PGRCE統(tǒng)一使用柵格數(shù)據(jù)抽象數(shù)據(jù)模型作為公共接口解讀不同格式柵格數(shù)據(jù);引擎格式轉(zhuǎn)換與擴(kuò)展機(jī)制規(guī)定地理數(shù)據(jù)格式轉(zhuǎn)換實(shí)際發(fā)生的方式,并提供開放接口以備新格式加入;并行調(diào)度策略采用靜態(tài)與動態(tài)相結(jié)合的負(fù)載均衡方法平衡各進(jìn)程間的數(shù)據(jù)處理,保障格式轉(zhuǎn)換引擎高效健壯運(yùn)行。

1 柵格地理數(shù)據(jù)抽象數(shù)據(jù)模型

柵格地理數(shù)據(jù)抽象數(shù)據(jù)模型居于PGRCE的中間層,連接著數(shù)據(jù)源格式與目標(biāo)格式,是PGRCE所有支持格式的公共接口,用于描述解析不同格式的柵格地理數(shù)據(jù)。柵格地理數(shù)據(jù)格式多種多樣,地理數(shù)據(jù)格式轉(zhuǎn)換庫(Geospatial Data Abstraction Library,GDAL)官網(wǎng)羅列了100余種柵格數(shù)據(jù)格式[25],但是柵格數(shù)據(jù)大都基于像元,具有格網(wǎng)結(jié)構(gòu),只是在像元組織結(jié)構(gòu)或者附加信息描述上各有不同,這種特性構(gòu)成了抽象數(shù)據(jù)模型設(shè)計(jì)的基礎(chǔ)。

PGRCE抽象數(shù)據(jù)模型主要由柵格數(shù)據(jù)集(Dataset)、柵格波段(RasterBand)、空間參考(SpatialReference)、元數(shù)據(jù)(Metadata)、柵格數(shù)據(jù)屬性表(RasterAttributeTable)等部分構(gòu)成,參見圖1。Dataset對象中定義了柵格數(shù)據(jù)的通用信息,表征著柵格地理數(shù)據(jù)文件或數(shù)據(jù)庫,但是每種格式必須實(shí)例化各自的數(shù)據(jù)集對象,以個(gè)性化定義數(shù)據(jù)格式的讀寫與操作。Dataset對象同時(shí)關(guān)聯(lián)著SpatialReference對象以及Metadata對象,其中空間參考信息采用OpenGISWell Known Text字符串定義,由SpatialReference對象維護(hù),Metadata則包含一系列由鍵值對組成的描述項(xiàng)。

圖1 柵格地理數(shù)據(jù)抽象數(shù)據(jù)模型Fig.1 Abstract datamodel of PGRCE

Dataset對象通常由多個(gè)RasterBand對象共同組成,RasterBand負(fù)責(zé)具體存儲柵格數(shù)據(jù),因此與數(shù)據(jù)直接相關(guān)的RasterAttributeTable以及RasterOverviews對象都直接與RasterBand對象相關(guān)聯(lián),用于描述相應(yīng)柵格波段特征。由于柵格數(shù)據(jù)的像元點(diǎn)坐標(biāo)涉及兩個(gè)坐標(biāo)體系(像素坐標(biāo)和地理坐標(biāo)),因此抽象數(shù)據(jù)模型采用變換方程式(1)描述兩者的關(guān)系。

其中,(X,Y)為像元點(diǎn)地理坐標(biāo),(xp,yp)為像元點(diǎn)像素坐標(biāo),a1~a6為坐標(biāo)轉(zhuǎn)換參數(shù)。像素坐標(biāo)系以圖像的左上角點(diǎn)為原點(diǎn),當(dāng)圖像格網(wǎng)為正南正北走向時(shí),a3=a5=0,(a1,a4)為像素坐標(biāo)原點(diǎn)在地理坐標(biāo)系中的坐標(biāo),a2表示X方向像元分辨率,a6則為Y方向像元分辨率。

2 數(shù)據(jù)格式轉(zhuǎn)換與擴(kuò)展機(jī)制

由于現(xiàn)實(shí)中柵格地理數(shù)據(jù)格式數(shù)量并不確定,PGRCE采用一種動態(tài)管理機(jī)制提供數(shù)據(jù)格式的動態(tài)擴(kuò)展,允許新格式以自定義的方式裝入,框架如圖2所示。新格式只需要實(shí)現(xiàn)由Dataset對象和RasterBand對象定義的數(shù)據(jù)組織框架,繼承Dataset與RasterBand類并定義其獨(dú)特的數(shù)據(jù)讀取方式、元數(shù)據(jù)獲取方式、仿射變換系數(shù)以及數(shù)據(jù)文件創(chuàng)建方式等,完成由Provider定義的讀寫接口,并在系統(tǒng)中注冊,就能夠參與PGRCE支持的格式轉(zhuǎn)換過程。另外,PGRCE在設(shè)計(jì)時(shí)以GDAL Raster為參考柵格數(shù)據(jù)標(biāo)準(zhǔn),在實(shí)現(xiàn)時(shí)兼容GDAL數(shù)據(jù)源。

圖2 柵格地理數(shù)據(jù)并行格式轉(zhuǎn)換引擎架構(gòu)Fig.2 The architecture of PGRCE

PGRCE同時(shí)采用一種專門的機(jī)制——Provider Manager(PM),管理注冊的格式。PM在PGRCE中扮演一種信息字典的角色,將有前端傳入的轉(zhuǎn)換命令翻譯成PGRCE可以處理的指令,指導(dǎo)PGRCE進(jìn)行數(shù)據(jù)裝載與輸出。當(dāng)PGRCE試圖打開一個(gè)數(shù)據(jù)集時(shí),其也需要在PM中查找相應(yīng)的注冊格式,獲取對應(yīng)格式的Provider,調(diào)用Provider的自定義接口完成數(shù)據(jù)集的讀取過程。因此,新的數(shù)據(jù)格式必須在PM中注冊,只有這樣其才有可能參與到數(shù)據(jù)格式轉(zhuǎn)換的過程。

PGRCE首先使用抽象數(shù)據(jù)模型解析源數(shù)據(jù),建立源數(shù)據(jù)信息與目標(biāo)數(shù)據(jù)參數(shù)的映射關(guān)系,根據(jù)輸入?yún)?shù)的具體指令完成轉(zhuǎn)換操作,其處理流程如圖3所示。某些地理數(shù)據(jù)格式的數(shù)據(jù)集可能含有嵌套關(guān)系,PGRCE采用遞歸調(diào)用的方式逐層處理,而如果前端命令要求對目標(biāo)數(shù)據(jù)集進(jìn)行某種處理,PGRCE則先將處理后的結(jié)果保存在虛擬數(shù)據(jù)集中,完成裁制后寫入目標(biāo)數(shù)據(jù)格式文件。

圖3 柵格地理數(shù)據(jù)并行格式轉(zhuǎn)換引擎處理流程Fig.3 Workflow of PGRCE

3 引擎任務(wù)并行調(diào)度策略

PGRCE采用主從并行模式設(shè)計(jì),包含兩種角色進(jìn)程:管理進(jìn)程和計(jì)算進(jìn)程。管理進(jìn)程主要負(fù)責(zé)公共事務(wù),如創(chuàng)建目標(biāo)數(shù)據(jù)格式文件、數(shù)據(jù)任務(wù)劃分、任務(wù)分配與調(diào)度、計(jì)算結(jié)果收集統(tǒng)計(jì)等,而計(jì)算進(jìn)程則接收指令并負(fù)責(zé)完成具體數(shù)據(jù)塊格式轉(zhuǎn)換操作,周期性地獲取任務(wù)、處理格式轉(zhuǎn)換任務(wù)以及反饋處理結(jié)果,如圖4所示。管理進(jìn)程對源數(shù)據(jù)文件的劃分是在其元數(shù)據(jù)基礎(chǔ)上的邏輯劃分,每個(gè)劃分?jǐn)?shù)據(jù)塊由式(2)定義:

式中:xn為數(shù)據(jù)塊在xp方向的寬度,通常取數(shù)據(jù)集柵格寬度;yn為數(shù)據(jù)塊在yp方向上的最大跨度;ε表示柵格數(shù)據(jù)集中包含的波段數(shù);τ為數(shù)據(jù)集中每個(gè)像元所占的字節(jié)數(shù);v0表示數(shù)據(jù)塊的最大容量。對于所有劃分結(jié)果,管理進(jìn)程使用一個(gè)列表和一個(gè)塊棧來進(jìn)行維護(hù)。

圖4 柵格地理數(shù)據(jù)并行格式轉(zhuǎn)換引擎主從任務(wù)調(diào)度模式Fig.4 Master-slave task scheduler in PGRCE

當(dāng)塊棧非空時(shí),管理進(jìn)程從塊棧中取出待處理數(shù)據(jù)塊,然后與從空閑計(jì)算進(jìn)程隊(duì)列中取出的計(jì)算進(jìn)程組合構(gòu)成操作指令,發(fā)送給相應(yīng)計(jì)算進(jìn)程,同時(shí)在數(shù)據(jù)塊處理統(tǒng)計(jì)表中記錄進(jìn)程運(yùn)行開始時(shí)間戳。計(jì)算進(jìn)程接收到管理進(jìn)程發(fā)送的指令后,首先根據(jù)數(shù)據(jù)塊的描述信息從源數(shù)據(jù)中讀取相應(yīng)的數(shù)據(jù)塊,交由轉(zhuǎn)換內(nèi)核函數(shù)進(jìn)行數(shù)據(jù)格式轉(zhuǎn)換,并寫進(jìn)目標(biāo)數(shù)據(jù)格式塊文件,同時(shí)將進(jìn)程處理統(tǒng)計(jì)信息發(fā)送給管理進(jìn)程。管理進(jìn)程接收到進(jìn)程成功執(zhí)行的反饋信息之后,將進(jìn)程入棧作為空閑進(jìn)程準(zhǔn)備再次使用,同時(shí)記錄進(jìn)程結(jié)束處理時(shí)間;如果管理進(jìn)程收到計(jì)算進(jìn)程反饋的是失敗消息或計(jì)算進(jìn)程超過一定時(shí)間仍沒有反饋,管理進(jìn)程將強(qiáng)制計(jì)算進(jìn)程終止操作,收回計(jì)算資源,并為該數(shù)據(jù)塊重新分配計(jì)算資源加以處理。

格式轉(zhuǎn)換操作屬于數(shù)據(jù)密集型計(jì)算任務(wù),大規(guī)模數(shù)據(jù)讀寫效率直接左右轉(zhuǎn)換效率。因此,PGRCE采用并行文件系統(tǒng)Lustre管理柵格地理數(shù)據(jù),并使用MPI-IO處理多節(jié)點(diǎn)多進(jìn)程并發(fā)訪問,加快數(shù)據(jù)的讀寫效率。然而,需要指出的是,管理進(jìn)程并不與地理數(shù)據(jù)直接交互,其數(shù)據(jù)劃分策略基于地理數(shù)據(jù)的元數(shù)據(jù),計(jì)算進(jìn)程負(fù)責(zé)數(shù)據(jù)的具體讀寫與處理,只有這樣才能最大程度上減少進(jìn)程間的通信,節(jié)約計(jì)算資源,提高并行處理效率。

4 應(yīng)用實(shí)例

為了檢驗(yàn)PGRCE架構(gòu)和性能,將大規(guī)模格網(wǎng)數(shù)據(jù)交換格式文件(CNSDTF-DEM)轉(zhuǎn)換為常見柵格數(shù)據(jù)格式GeoTIFF作為測試用例。格網(wǎng)數(shù)據(jù)交換格式是中國地球空間數(shù)據(jù)交換格式國家標(biāo)準(zhǔn)(GB/T 17798—2007)中定義的柵格數(shù)據(jù)格式,其數(shù)據(jù)文件由文件頭以及數(shù)據(jù)體兩部分共同組成。文件頭中定義了數(shù)據(jù)的一般性信息,包括數(shù)據(jù)起始點(diǎn)、柵格分辨率、柵格大小、投影參考信息、壓縮方法以及柵格值數(shù)據(jù)類型等,數(shù)據(jù)體則為數(shù)值矩陣,文件頭中定義的壓縮方法不同,數(shù)據(jù)組織略有不同,如圖5所示。

圖5 格網(wǎng)數(shù)據(jù)交換格式數(shù)據(jù)文件組成Fig.5 Data structure in CNSDTF-DEM

使用PGRCE進(jìn)行CNSDTF-DEM數(shù)據(jù)格式轉(zhuǎn)換,首先需要按照公共接口實(shí)現(xiàn)CNSDTF-DEM數(shù)據(jù)格式的Provider,并在PM中注冊,接入PGRCE框架。CNSDTF-DEM數(shù)據(jù)格式較為簡單,PGRCE中一個(gè)CNSDTF-DEM數(shù)據(jù)文件表示一個(gè)Dataset對象,僅含有一個(gè)RasterBand對象。而空間參考信息可以從文件頭文件[CoordinateSystemType]中讀取,實(shí)例化為SpatialReference對象。PGRCE以一行柵格數(shù)據(jù)為數(shù)據(jù)劃分的基本單位,每個(gè)數(shù)據(jù)塊大小上限取v0=320MB,并由式(2)計(jì)算得到分塊劃分行數(shù)。

測試程序運(yùn)行在一個(gè)由9臺高性能計(jì)算節(jié)點(diǎn)構(gòu)成的Lustre并行計(jì)算機(jī)集群(1個(gè)元數(shù)據(jù)服務(wù)器(MetaData Sever,MDS),9個(gè)元數(shù)據(jù)存儲目標(biāo)(Object Storage Targer,OST),每個(gè)節(jié)點(diǎn)由8核Intel(R)Xeon(R)CPU E5-2603、16GB內(nèi)存構(gòu)成,共享8TB Lustre外存)上,測試數(shù)據(jù)由程序產(chǎn)生,數(shù)據(jù)量大小共32GB。分別測試了該數(shù)據(jù)在串行算法、單機(jī)并行處理以及集群并行處理情況下的轉(zhuǎn)換效率,結(jié)果如圖6所示。由圖中可以看出,使用串行算法需要近32min才能將測試數(shù)據(jù)處理完成,在單機(jī)并行環(huán)境下使用3個(gè)計(jì)算進(jìn)程最快可以在約14min內(nèi)完成處理任務(wù),達(dá)到2.24的加速比,在集群并行環(huán)境下使用8個(gè)計(jì)算進(jìn)程可以在約4min內(nèi)完成,獲得7.54的加速比。

圖6 柵格地理數(shù)據(jù)并行格式轉(zhuǎn)換引擎測試結(jié)果Fig.6 PGRCE testing results

數(shù)據(jù)格式轉(zhuǎn)換操作是典型的數(shù)據(jù)密集型計(jì)算任務(wù),I/O效率從根本上決定了任務(wù)處理效率。PGRCE在并行策略設(shè)計(jì)上采用主從并行模式,進(jìn)程間僅有少量指令通信,通信代價(jià)微乎其微,而各從進(jìn)程又單獨(dú)處理計(jì)算任務(wù),在沒有讀寫瓶頸制約的條件下,理論上并行轉(zhuǎn)換引擎可以達(dá)到與從進(jìn)程數(shù)量正相關(guān)的加速比。

單機(jī)共享磁盤并行處理環(huán)境下,1個(gè)管理進(jìn)程,3個(gè)計(jì)算進(jìn)程,并行加速比最好,但由于受制于單個(gè)硬盤讀寫速度限制,進(jìn)程間易發(fā)生硬盤讀寫競爭,并行處理加速比只能夠達(dá)到2.24。集群并行處理環(huán)境下,由于Lustre并行文件系統(tǒng)使用條帶化數(shù)據(jù)劃分存儲技術(shù),9個(gè)OST理想情況下數(shù)據(jù)讀寫效率能夠達(dá)到9倍線性效果,因此測試程序在8個(gè)計(jì)算進(jìn)程條件下能夠達(dá)到7.54的加速比。

5 結(jié)論

地理數(shù)據(jù)格式轉(zhuǎn)換技術(shù)作為實(shí)現(xiàn)數(shù)據(jù)共享的基礎(chǔ)工具,仍然在地理數(shù)據(jù)共享問題上扮演著重要角色。但是,隨著數(shù)據(jù)處理規(guī)模日趨龐大以及多核計(jì)算和大規(guī)模集群計(jì)算日益普遍,傳統(tǒng)串行數(shù)據(jù)格式轉(zhuǎn)換技術(shù)已經(jīng)難以勝任,因其很難有效充分利用多核并行處理的優(yōu)勢。因此,本文面向并行計(jì)算軟硬件環(huán)境,提出了PGRCE,實(shí)現(xiàn)了大規(guī)模柵格地理數(shù)據(jù)格式轉(zhuǎn)換操作的并行處理,大大提高了柵格地理數(shù)據(jù)格式轉(zhuǎn)換效率。測試結(jié)果表明,PGRCE具有良好可擴(kuò)展性,能夠在大規(guī)模數(shù)據(jù)處理中表現(xiàn)出良好的并行加速效果,適合在集群環(huán)境下支持大規(guī)模數(shù)據(jù)格式轉(zhuǎn)換并行處理操作。

References)

[1]Sheth A P.Changing focus on interoperability in information systems:from system,syntax,structure to semantics,in interoperating geographic information systems[M]// Goodchild M,Egenhofer M,F(xiàn)egeas R,et al.Interoperating Geographic Information Systems,Springer US,1999,495: 5-29.

[2]龔健雅,高文秀.地理信息共享與互操作技術(shù)及標(biāo)準(zhǔn)[J].地理信息世界,2006,4(3):18-27.GONG Jianya,GAOWenxiu.Sharing and interoperability of geospatial information[J].Geomatics World,2006,4(3): 18-27.(in Chinese)

[3]Gong J Y,Shi L T,Du D S,et al.Technologies and standards on spatial data sharing[C]//Proceedings of 20th ISPRS:Geo-imagery Bridging Continents,2004,34:118-128.

[4]Bishr Y.Overcoming the semantic and other barriers to GIS interoperability[J].International Journal of Geographical Information Science,1998,12(4):299-314.

[5]Devogele T,Parent C,Spaccapietra S.On spatial database integration[J].International Journal of Geographical Information Science,1998,12(4):335-352.

[6]Kavouras M,Kokla M.A method for the formalization and integration of geographical categorizations[J].International Journal of Geographical Information Science,2002,16(5): 439-453.

[7]Stoimenov L,Djordjevic-Kajan S.An architecture for interoperable GISuse in a local community environment[J].Computers&Geosciences,2005,31(2):211-220.

[8]Butenuth M,v.G?sselnb G,Tiedgec M,et al.Integration of heterogeneous geospatial data in a federated database[J].ISPRS Journal of Photogrammetry and Remote Sensing,2007,62(5):328-346.

[9]Paul M,Ghosh S K.A framework for semantic interoperability for distributed geospatial repositories[J].Computing and Informatics,2008,27(1):73-92.

[10]Gupta A,Marciano R,Zaslavsky I,et al.Integrating GIS and imagery through XML-based informationmediation[C]// Proceeding of ISD'99 Selected Papers from the International Workshop on Integrated Spatial Databases,Digital Inages and GIS,1999:211-234.

[11]Paudyal D R,Mcdougall K,Apan A.The impact of varying statutory arrangements on spatial data sharing and access in regional NRM bodies[J].Isprs Annals of Photogrammetry Remote Sensing&Spatial Information Sciences,2014,Ⅱ-8:193-197.

[12]Chao H,Chou T Y.Empirical research on organizational infrastructuremodel impact to spatial data sharing[J].Annals of GIS,2013,19(4):263-271.

[13]Safra E,Kanza Y,Sagiv Y,et al.Ad hoc matching of vectorial road networks[J].International Journal of Geographical Information Science,2013,27(1):114-153.

[14]Wang Y D,Gong JY,Huang JT,et al.The data transfer method based on geo-spatial data transfer format[J].Acta Geodaetica et Cartogaphica Sinica,2000,29(2):142-148.

[15]Wong SH,Swartz SL,Sarkar D.A middleware architecture for open and interoperable GISs[J].IEEE Multimedia,2002,9(2):62-76.

[16]Wang S,Cao G,Zhang Z,et al.A cyber GIS environment for analysis of location-based social media data,in locationbased computing and services[M].Hassan A K,Amin H.2nd ed.USA:CRC Press,2013:187-205.

[17]VatsavaiR R,Ganguly A,Chandola V,etal.Spatiotemporal data mining in the era of big spatial data:algorithms and applications[C]//Proceedings of the 1st ACM SIGSPATIAL InternationalWorkshop on Analytics for Big Geospatial Data 2012,ACM:Redondo Beach,California,2012:1-10.

[18]Hey T,Tansley S,Tolle K.The fourth paradigm:dataintensive scientific discovery[M].USA:Microsoft Research,2009.

[19]孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計(jì)算機(jī)研究與發(fā)展,2013,50(1):146-169.MENG Xiaofeng,CIXiang.Big datamanagement:concepts,techniques and challenges[J].Journal of Computer Research and Development,2013,50(1):146-169.(in Chinese)

[20]李建江,崔健,王聃,等.MapReduce并行編程模型研究綜述[J].電子學(xué)報(bào),2011,39(11):2635-2642.LI Jianjiang,CUI Jian,WANG Dan,et al.Survey of MapReduce parallel programmingmodel[J].Acta Electronica Sinica,2011,39(11):2635-2642.(in Chinese)

[21]王爾琪,黃騫,滕壽威.地理空間信息并行處理架構(gòu)與系統(tǒng)研究[J].測繪與空間地理信息,2013,36(S1):1-7.WANG Erqi,HUANG Qian,TENG Shouwei.Parallel GIS architecture and system[J].Geomatics&Spatial Information Technology,2013,36(S1):1-7.(in Chinese)

[22]OpenSFS.About Lustre File System[EB/OL].[2015-06-20].http://opensfs.org/lustre/

[23]張鈺森,吳慶波,譚郁松.基于Lustre的大規(guī)模文件系統(tǒng)擁塞控制算法的研究[J].計(jì)算機(jī)研究與發(fā)展,2011,48(S1):189-193.ZHANG Yusen,WU Qingbo,TAN Yusong.An investigation of a congestion control algorithm for large scale file system based on Lustre[J].Journal of Computer Research and Development,2011,48(S1):189-193.(in Chinese)

[24]張媛,盧澤新,劉亞萍.NFS over Lustre性能評測與分析[J].計(jì)算機(jī)工程,2007,33(10):274-276.ZHANG Yuan,LU Zexin,LIU Yaping.Performance evaluation and analysis of NFS over Lustre[J].Computer Engineering,2007,33(10):274-276.(in Chinese)

[25]GDAL/OGR.GDALRaster Formats[EB/OL].[2014-03-07].http://www.gdal.org/formats_list.html.

Parallel geo-raster data conversion engine

ZHANGShuai1,2,3,4,LIManchun1,2,CHEN Zhenjie1,2,HUANG Tao1,2,JIANGXiaohui5
(1.School of Geographic and Oceanographic Sciences,Nanjing University,Nanjing 210023,China;2.Jiangsu Key Lab of Geographical Information Technology,Nanjing University,Nanjing 210023,China;3.Department of Geography,University of Illinois at Urbana-Champaign,Illinois 61801,United States;4.National Center for Supercomputing Applications,University of Illinois at Urbana-Champaign,Illinois61801,United States;5.Nari Technology Development Limited Company,Nanjing 211106,China)

Large scale geo-raster data have been accumulated all over the world in different departments and organizations during the past decades,but quite often in a variety of data formats,resulting in geospatial data sharing as an everlasting headache.Despite of various methodologies created,geospatial data conversion hasalwaysbeen a fundamental and efficientway for geospatial data sharing.However,as the size of data tends to be larger and larger,themethodologywhich wasbounded by limited disk data transfer rateand bandwidth,needsa re-write and upgrade.A parallel geo-raster data conversion engine(PGRCE)was proposed to dealwithmassive geo-raster data sharing efficiently by utilizing high performance computing technologies.PGRCE was designed in an extendable and flexible framework,and was capable of customizing the way of reading and writing of particular spatial data formats.An experiment,in which geo-raster data in the CNSDTF-DEM format(Raster spatial data defined in Chinese Geospatial Data Transfer Format Standard)were transferred using PGRCE in a parallel file system(Lustre),were conducted to validate the engine framework and its performance.Results show that PGRCE can achieve a 7.54 speedup on a Luster cluster of 8 nodes..

geo-raster data format conversion;parallel computing;high performance computing;geocomputation;Lustre cluster

P208

A

1001-2486(2015)05-009-06

10.11887/j.cn.201505002

http://journal.nudt.edu.cn

2015-03-02

國家863計(jì)劃資助項(xiàng)目(2011AA120301);南京大學(xué)研究生科研創(chuàng)新基金資助項(xiàng)目(2013CL09)

張帥(1988—),男,安徽亳州人,博士研究生,E-mail:zhangshuai.nju@gmail.com;陳振杰(通信作者),男,副教授,博士,碩士生導(dǎo)師,E-mail:chenzj@nju.edu.cn

猜你喜歡
引擎進(jìn)程
以學(xué)促干 挺膺擔(dān)當(dāng) 激活砥礪前行的紅色引擎
債券市場對外開放的進(jìn)程與展望
中國外匯(2019年20期)2019-11-25 09:54:58
三生 三大引擎齊發(fā)力
藍(lán)谷: “涉藍(lán)”新引擎
商周刊(2017年22期)2017-11-09 05:08:31
無形的引擎
河南電力(2015年5期)2015-06-08 06:01:46
基于Cocos2d引擎的PuzzleGame開發(fā)
我國高等教育改革進(jìn)程與反思
Linux僵死進(jìn)程的產(chǎn)生與避免
男女平等進(jìn)程中出現(xiàn)的新矛盾和新問題
俄羅斯現(xiàn)代化進(jìn)程的阻礙
主站蜘蛛池模板: 丝袜高跟美脚国产1区| 99精品福利视频| 欧美国产三级| 欧美色丁香| 久久亚洲综合伊人| 青青青草国产| 全部毛片免费看| 高潮爽到爆的喷水女主播视频 | 久久综合亚洲色一区二区三区| 伊人久久大香线蕉成人综合网| 欧美亚洲欧美区| 制服丝袜无码每日更新| 亚洲AV一二三区无码AV蜜桃| 国产欧美日本在线观看| 欧美一区二区精品久久久| 国产精品第一区| 国产综合精品日本亚洲777| 精品91自产拍在线| 1级黄色毛片| 不卡网亚洲无码| 久久国产黑丝袜视频| av在线人妻熟妇| 国产国拍精品视频免费看 | 自拍偷拍欧美日韩| 久久国产精品国产自线拍| 97色伦色在线综合视频| 蝴蝶伊人久久中文娱乐网| 白丝美女办公室高潮喷水视频| 57pao国产成视频免费播放| 日韩精品一区二区三区中文无码| 青青操视频在线| …亚洲 欧洲 另类 春色| 国产精品污污在线观看网站| 亚洲愉拍一区二区精品| 国产精品尤物在线| 国产一区二区三区在线精品专区| 秋霞午夜国产精品成人片| 久久亚洲黄色视频| 日韩成人免费网站| 久久熟女AV| 久久久久夜色精品波多野结衣| 五月综合色婷婷| 欧美一级高清片欧美国产欧美| 看国产毛片| 一级毛片高清| 国产免费羞羞视频| 国产麻豆永久视频| 国产办公室秘书无码精品| 欧美国产日韩另类| 亚洲精品第一在线观看视频| 国产特一级毛片| 美女被狂躁www在线观看| 欧美日韩理论| 嫩草国产在线| 91久久偷偷做嫩草影院精品| 伊人久久综在合线亚洲2019| 欧美日本激情| 国产噜噜在线视频观看| 18禁黄无遮挡免费动漫网站| 亚洲无码高清一区| 国产极品美女在线播放| 久久精品丝袜| 99手机在线视频| 国产特级毛片aaaaaaa高清| 97青青青国产在线播放| 欧美一道本| 麻豆国产在线不卡一区二区| 亚洲熟女偷拍| 欧美国产日韩在线播放| 亚洲人成影院在线观看| 国产一区二区三区在线观看免费| 亚洲中文字幕在线一区播放| 久久精品无码中文字幕| 999福利激情视频| 国产浮力第一页永久地址| 无码中文字幕乱码免费2| 1769国产精品免费视频| 久久亚洲中文字幕精品一区| 亚洲高清无码久久久| 国产亚洲视频免费播放| 国产欧美精品一区二区| 91精品啪在线观看国产91九色|