999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

土地適宜性分析的數(shù)據(jù)處理技術(shù)框架及其構(gòu)件研究

2017-03-15 12:36:03文琴羅飛曹亮
電子技術(shù)與軟件工程 2017年2期

文琴++羅飛++曹亮

摘 要 現(xiàn)在對(duì)土地適宜性分析的需求日益復(fù)雜化、多樣化,傳統(tǒng)的將數(shù)據(jù)與GIS技術(shù)相結(jié)合的土地適應(yīng)分析方式已經(jīng)滿(mǎn)足不了系統(tǒng)的性能需求。本文針對(duì)現(xiàn)有的土地適應(yīng)性分析的需求,研究分析了一種將NetCDF存儲(chǔ)與Spark分布式計(jì)算相結(jié)合的高性能數(shù)據(jù)處理方式。我們將數(shù)據(jù)處理的各個(gè)關(guān)鍵步驟分解成標(biāo)準(zhǔn)的構(gòu)件,針對(duì)土地性適應(yīng)分析我們將分析過(guò)程分解為了三個(gè)主要的標(biāo)準(zhǔn)構(gòu)件分別為:數(shù)據(jù)存儲(chǔ)構(gòu)件是將數(shù)據(jù)用NetCDF模型進(jìn)行存儲(chǔ),以便將多數(shù)據(jù)源數(shù)據(jù)統(tǒng)一存儲(chǔ),減少數(shù)據(jù)檢索時(shí)間,提高數(shù)據(jù)的存儲(chǔ)效率;數(shù)據(jù)插值構(gòu)件是利用分布式計(jì)算框架Spark對(duì)土地適宜性分析中的數(shù)據(jù)進(jìn)行并行插值(離散點(diǎn)數(shù)據(jù)插值為格點(diǎn)數(shù)據(jù));每個(gè)格點(diǎn)適宜度的計(jì)算構(gòu)件是利用分布式計(jì)算框架Spark并行計(jì)算每個(gè)格點(diǎn)的適宜性等級(jí),以提高數(shù)據(jù)處理效率。最后以人工草地建植適宜性綜合管理系統(tǒng)為例,給出了一個(gè)基于Spark及NetCDF構(gòu)件的實(shí)例,研究結(jié)果表明將NetCDF與Spark技術(shù)應(yīng)用于土地適宜性分析以及將其以構(gòu)件的形式進(jìn)行開(kāi)發(fā)可大大提高分析的效率。

【關(guān)鍵詞】Spark NetCDF 土地適宜性分析 構(gòu)件

1 引言

由于土地適宜性分析中很多模塊的分析數(shù)據(jù)是標(biāo)準(zhǔn)的數(shù)據(jù)格式,針對(duì)這些數(shù)據(jù),我們根據(jù)以前的積累和經(jīng)驗(yàn)建立一些標(biāo)準(zhǔn)的構(gòu)件,構(gòu)件可以在以后的分析中進(jìn)行復(fù)用,這樣很大程度上節(jié)約了重新開(kāi)發(fā)所需要的時(shí)間,避免了重新開(kāi)發(fā)可能會(huì)導(dǎo)致的錯(cuò)誤,從而提高了軟件開(kāi)發(fā)的效率和軟件的質(zhì)量。而以構(gòu)件的形式實(shí)現(xiàn)軟件復(fù)用,又被視為是現(xiàn)實(shí)可行的主要方法之一。為了提高土地適宜性分析的開(kāi)發(fā)效率和開(kāi)發(fā)質(zhì)量,本文重點(diǎn)研究土地適宜性分析中重要的三個(gè)過(guò)程即:數(shù)據(jù)的存儲(chǔ)、數(shù)據(jù)的插值和每個(gè)格點(diǎn)適應(yīng)度的計(jì)算的高性能構(gòu)件。

在已有的土地適宜性分析研究中,隨著土地適宜性分析數(shù)據(jù)的增多,數(shù)據(jù)資料存儲(chǔ)技術(shù)和數(shù)據(jù)處理技術(shù)存有一定的缺陷,在這些研究中基本上利用的都是GIS空間數(shù)據(jù)存儲(chǔ)模型對(duì)多樣性數(shù)據(jù)資料進(jìn)行存儲(chǔ),當(dāng)數(shù)據(jù)量增多時(shí),對(duì)多樣性數(shù)據(jù)資料進(jìn)行存取時(shí),存取速度會(huì)成為系統(tǒng)性能的瓶頸。對(duì)數(shù)據(jù)進(jìn)行處理時(shí),數(shù)據(jù)的執(zhí)行時(shí)間增加且數(shù)據(jù)執(zhí)行的效率降低。所以土地適宜性分析的數(shù)據(jù)存儲(chǔ)效率及數(shù)據(jù)的處理效率較低。因此本文提出將數(shù)據(jù)處理的各個(gè)關(guān)鍵步驟分解成標(biāo)準(zhǔn)的構(gòu)件,其中在數(shù)據(jù)存儲(chǔ)構(gòu)件中,利用NetCDF數(shù)據(jù)模型來(lái)存儲(chǔ)土地適宜性分析中的數(shù)據(jù),以提高數(shù)據(jù)存儲(chǔ)效率;在數(shù)據(jù)插值構(gòu)件和每個(gè)格點(diǎn)適宜度的計(jì)算構(gòu)件中,利用分布式計(jì)算框架Spark將土地適宜性分析中的離散點(diǎn)數(shù)據(jù)并行插值及并行計(jì)算每個(gè)格點(diǎn)的適宜性等級(jí),以提高數(shù)據(jù)的處理效率。

2 土地適宜性分析

2.1 技術(shù)架構(gòu)

采用J2EE體系框架,面向SOA(Service Oriented Architecture,面向服務(wù)的體系架構(gòu)),利用裝配的形式搭建系統(tǒng)功能模塊,實(shí)現(xiàn)常用構(gòu)件。將土地適宜性分析系統(tǒng)中關(guān)鍵的三個(gè)過(guò)程:數(shù)據(jù)的存儲(chǔ)、數(shù)據(jù)的插值和每個(gè)格點(diǎn)適應(yīng)度的計(jì)算分別做成構(gòu)件。由于土地適宜性分析系統(tǒng)中,需要分析的數(shù)據(jù)是多樣的、復(fù)雜的。同時(shí)通過(guò)對(duì)GIS空間數(shù)據(jù)存儲(chǔ)模型、關(guān)系數(shù)據(jù)庫(kù)模型以及NetCDF模型的數(shù)據(jù)存儲(chǔ)效率進(jìn)行分析,得知NetCDF的數(shù)據(jù)存儲(chǔ)效率相比于其他兩個(gè)存儲(chǔ)模型具有明顯的優(yōu)勢(shì),因此在數(shù)據(jù)存儲(chǔ)構(gòu)件中選用NetCDF數(shù)據(jù)模型來(lái)表示土地適宜性分析中的數(shù)據(jù),使用統(tǒng)一的格式對(duì)其進(jìn)行表示。

由于分布式計(jì)算框架Spark是一個(gè)基于內(nèi)存計(jì)算的集群計(jì)算系統(tǒng),可將中間結(jié)果直接保存在內(nèi)存中,無(wú)需進(jìn)行IO操作,這加快了數(shù)據(jù)的分析。因此,在數(shù)據(jù)插值構(gòu)件和每個(gè)格點(diǎn)適宜度的計(jì)算構(gòu)件中利用分布式計(jì)算框架Spark對(duì)土地適宜性分析系統(tǒng)中的離散點(diǎn)數(shù)據(jù)插值為格點(diǎn)數(shù)據(jù)過(guò)程和每個(gè)格點(diǎn)適宜性等級(jí)的計(jì)算過(guò)程進(jìn)行并行優(yōu)化,加快土地適宜性系統(tǒng)的數(shù)據(jù)處理速度。基于NetCDF數(shù)據(jù)格式與分布式計(jì)算框架Spark的土地適宜性分析的技術(shù)架構(gòu)如圖1土地適宜性分析的技術(shù)框架圖所示。

圖1的數(shù)據(jù)存儲(chǔ)過(guò)程中的離散點(diǎn)數(shù)據(jù)和格點(diǎn)數(shù)據(jù)分別由NetCDF數(shù)據(jù)模型的表示如圖2數(shù)據(jù)存儲(chǔ)構(gòu)件。數(shù)據(jù)插值過(guò)程的詳細(xì)描述如圖3數(shù)據(jù)插值構(gòu)件以及圖5中的并行插值部分所示。圖1中每個(gè)格點(diǎn)適宜度的計(jì)算過(guò)程的詳細(xì)分析如圖4每個(gè)格點(diǎn)適宜度的計(jì)算構(gòu)件及圖5的中并行計(jì)算每個(gè)格點(diǎn)的適宜度所示。

2.2 數(shù)據(jù)存儲(chǔ)構(gòu)件

土地適宜性分析系統(tǒng)中,主要涉及到離散點(diǎn)數(shù)據(jù)和格點(diǎn)數(shù)據(jù)這兩類(lèi)數(shù)據(jù),且這兩類(lèi)數(shù)據(jù)在在進(jìn)行數(shù)據(jù)分析時(shí)均利用NetCDF數(shù)據(jù)模型進(jìn)行表示。離散點(diǎn)數(shù)據(jù)指的是在研究區(qū)域內(nèi)分布不均勻的觀(guān)測(cè)數(shù)據(jù)。格點(diǎn)數(shù)據(jù)指的是在研究區(qū)域內(nèi)經(jīng)過(guò)離散點(diǎn)數(shù)據(jù)插值后的,分布均勻的數(shù)據(jù)。數(shù)據(jù)存儲(chǔ)構(gòu)件的功能主要是將離散點(diǎn)數(shù)據(jù)和格點(diǎn)數(shù)據(jù)分別用NetCDF數(shù)據(jù)模型進(jìn)行表示。構(gòu)件的基本思路如下:

首先傳入需要用NetCDF數(shù)據(jù)模型表示的離散點(diǎn)數(shù)據(jù)或者是格點(diǎn)數(shù)據(jù),再利用NetCDF接口進(jìn)行解碼,最后得到以NetCDF數(shù)據(jù)模型表示的離散點(diǎn)數(shù)據(jù)或者格點(diǎn)數(shù)據(jù),圖2為原始數(shù)據(jù)以NetCDF數(shù)據(jù)格式表示的數(shù)據(jù)格式轉(zhuǎn)化過(guò)程。

2.3 數(shù)據(jù)插值構(gòu)件

在進(jìn)行土地適宜性分析時(shí),為了能更加準(zhǔn)確的計(jì)算出研究區(qū)域內(nèi)每個(gè)網(wǎng)格點(diǎn)的適宜度,需要將研究區(qū)域內(nèi)的所有離散點(diǎn)數(shù)據(jù)插值為研究區(qū)域內(nèi)的格點(diǎn)數(shù)據(jù),該過(guò)程的數(shù)據(jù)模型轉(zhuǎn)化如圖3所示,此過(guò)程稱(chēng)為數(shù)據(jù)插值過(guò)程。為了提高土地適宜性分析的效率,利用分布式計(jì)算框架Spark對(duì)土地適宜性分析中的數(shù)據(jù)進(jìn)行并行插值同時(shí)將該過(guò)程做成一個(gè)常規(guī)的構(gòu)件如圖3所示,在使用該構(gòu)件之前需要搭建好該構(gòu)件所需的分布式計(jì)算框架Spark集群環(huán)境,構(gòu)件的基本思路如下:

首先傳入需要插值的離散點(diǎn)數(shù)據(jù),該離散點(diǎn)數(shù)據(jù)由NetCDF表示,再根據(jù)插值算法,在分布式計(jì)算框架Spark集群環(huán)境下將離散點(diǎn)數(shù)據(jù)并行插值為格點(diǎn)數(shù)據(jù),其中插值算法是通過(guò)外界傳入的參數(shù)或預(yù)置規(guī)則進(jìn)行選擇的,該土地適宜性分析系統(tǒng)中利用到的插值算法主要有反距離權(quán)重插值和Cressman方法,由于需要處理的數(shù)據(jù)空間分布的不同,反距離權(quán)重插值(IDW)算法提供了兩個(gè)分支,IDW_Neighbour用于空間分布連續(xù)的數(shù)據(jù),IDW_Radius運(yùn)用于空間分布不連續(xù)的數(shù)據(jù)。插值后的中間結(jié)果可保存在內(nèi)存中。

2.4 每個(gè)格點(diǎn)適宜度的計(jì)算構(gòu)件

將離散點(diǎn)數(shù)據(jù)并行插值為研究區(qū)域內(nèi)的格點(diǎn)數(shù)據(jù)后,需要計(jì)算每個(gè)格點(diǎn)的適宜度。本文將該過(guò)程做成了一個(gè)常規(guī)構(gòu)件,在使用該構(gòu)件之前需要搭建該構(gòu)件所需的分布式計(jì)算框架Spark集群環(huán)境,利用分布式計(jì)算框架Spark并行計(jì)算每個(gè)格點(diǎn)的適宜性等級(jí),每個(gè)格點(diǎn)適宜度的計(jì)算構(gòu)件(如圖4所示)的基本思路如下:

首先傳入需要計(jì)算的格點(diǎn)數(shù)據(jù),格點(diǎn)數(shù)據(jù)由NetCDF表示,再將每個(gè)格點(diǎn)根據(jù)事先預(yù)定好的適宜性公式,在分布式計(jì)算框架Spark集群環(huán)境下并行計(jì)算每個(gè)格點(diǎn)適宜性等級(jí),最終得到每個(gè)格點(diǎn)的適宜性等級(jí),畫(huà)出等值線(xiàn)。整個(gè)數(shù)據(jù)處理流程如圖5所示。

如圖5所示,首先將計(jì)算任務(wù)進(jìn)行分解,然后再將分解的任務(wù)分配到不同的處理器上,再在分布式計(jì)算框架Spark集群環(huán)境下對(duì)數(shù)據(jù)進(jìn)行并行插值過(guò)程和并行計(jì)算每個(gè)格點(diǎn)適宜度過(guò)程。

3 實(shí)例研究

本節(jié)結(jié)合人工草地建植適宜性綜合管理系統(tǒng),給出基于Spark及NetCDF構(gòu)件的土地適宜性分析研究的實(shí)例。人工草地建植適宜性綜合管理系統(tǒng)旨在為牧民用戶(hù)提供特定地段上特定牧草的適宜性分析。

人工草地建植適宜性綜合管理系統(tǒng)的開(kāi)發(fā)模型如圖6所示。該開(kāi)發(fā)模型是基于Spark及NetCDF構(gòu)件方式實(shí)現(xiàn)的,系統(tǒng)分為草場(chǎng)基礎(chǔ)數(shù)據(jù)管理、草場(chǎng)建植適宜性分析計(jì)算、草場(chǎng)建植適宜性詢(xún)?nèi)竽K,其中草場(chǎng)基礎(chǔ)數(shù)據(jù)管理中的概念數(shù)據(jù)存儲(chǔ)利用基于NetCDF的數(shù)據(jù)存儲(chǔ)構(gòu)件實(shí)現(xiàn),草場(chǎng)建植適宜性分析計(jì)算利用基于Spark的數(shù)據(jù)插值構(gòu)件和每個(gè)格點(diǎn)適宜度的計(jì)算構(gòu)件實(shí)現(xiàn)?;诖藰?gòu)件模型的人工草地建植適宜性綜合管理系統(tǒng)在實(shí)際的開(kāi)發(fā)和使用中發(fā)現(xiàn)此構(gòu)件技術(shù)大大提高了軟件開(kāi)發(fā)的效率、縮短軟件開(kāi)發(fā)的周期和提高軟件開(kāi)發(fā)的質(zhì)量。

4 結(jié)束句

為了降低軟件開(kāi)發(fā)成本,縮短軟件開(kāi)發(fā)周期,提高軟件開(kāi)發(fā)效率和軟件質(zhì)量,本文提出將土地適宜性分析中的三個(gè)關(guān)鍵的過(guò)程即數(shù)據(jù)的存儲(chǔ)、數(shù)據(jù)的插值和每個(gè)格點(diǎn)適應(yīng)度的計(jì)算分別做成三個(gè)常規(guī)的構(gòu)件,同時(shí)為了優(yōu)化土地適宜性分析中的數(shù)據(jù)存儲(chǔ)技術(shù)和數(shù)據(jù)處理技術(shù),本文利用NetCDF數(shù)據(jù)模型及分布式計(jì)算框架Spark分別對(duì)土地適宜性分析進(jìn)行優(yōu)化處理,以提高土地適宜性分析的效率。研究NetCDF數(shù)據(jù)模型和分布式計(jì)算框架Spark為土地適宜性分析系統(tǒng)的數(shù)據(jù)存儲(chǔ)技術(shù)和數(shù)據(jù)處理技術(shù)提供較好的理論及實(shí)踐基礎(chǔ)。

參考文獻(xiàn)

[1]王想紅,劉紀(jì)平等.基于NetCDF數(shù)據(jù)模型的海洋環(huán)境數(shù)據(jù)三維可視化研究[J].測(cè)繪科學(xué),2013:59-61.

[2]孫建偉,孫昭晨,陳軒等.NetCDF格式數(shù)據(jù)的創(chuàng)建及應(yīng)用[J].交通標(biāo)準(zhǔn)化,2010(226):31-34.

[3]Matei Zaharia 著.Spark大型集群上的快速和通用數(shù)據(jù)處理架構(gòu)[D].加州大學(xué)伯克利分校,2014:20-24.

[4]陳虹君.基于Hadoop平臺(tái)的Spark框架研究.[C]四川:電腦知識(shí)與技術(shù),2014:8407-8408.

[5]黎文陽(yáng).大數(shù)據(jù)處理模型Apache Spark研究[D].現(xiàn)代計(jì)算機(jī)(普及版),2015:55-60.

[6]Spark[J/OL].http://spark.apache.org.

[7]許鵬 著.Apache Spark源碼剖析[M].電子工業(yè)出版社,2015:23-30.

[8]夏俊鸞,黃潔等.Spark大數(shù)據(jù)處理技術(shù)[M].電子工業(yè)出版社,2015.

[9]劉文軍,李靖等.基于NetCDF數(shù)據(jù)模型的氣象資料存儲(chǔ)設(shè)計(jì)[D].安徽農(nóng)業(yè)科學(xué),2009:1370-1371.

[10]李亞萍著.土地適宜性評(píng)價(jià)方法的研究[J].現(xiàn)代化農(nóng)業(yè),2009:30-32.

[11]Lastovetsky A.Parallel Testing of Distributed Software[J].Information and Software Technology,2009,47(10):657-662.

[12]Parveen P,Tilley T.Towards a Distributed Execution Framework for JUnit Test Cases[C]//Proc.of IEEE International Conference on Software Maintenance.[S.l.]:IEEE Press,2009: 425-428.

作者簡(jiǎn)介

文琴(1991-),女,四川省成都市人。研究生學(xué)歷。現(xiàn)為宿遷市科技局局長(zhǎng)、高級(jí)工程師。主要研究方向?yàn)闅庀笮畔⒒夹g(shù)。

羅飛(1977-),女,四川省成都市人?,F(xiàn)為成都信息工程大學(xué)軟件工程學(xué)院副教授。主要研究方向?yàn)闅庀笮畔⒒夹g(shù)、數(shù)據(jù)集成與可視化研究方向的研究。

曹亮(1985-),男,四川省成都市人?,F(xiàn)為成都信息工程大學(xué)軟件工程學(xué)院講師。研究方向?yàn)閿?shù)據(jù)庫(kù)技術(shù)、數(shù)據(jù)挖掘技術(shù)。

作者單位

成都信息工程大學(xué)軟件工程學(xué)院 四川省成都市 610225

主站蜘蛛池模板: 中文字幕首页系列人妻| 国产尤物在线播放| 免费观看成人久久网免费观看| 欧美视频在线观看第一页| 亚洲人成影视在线观看| 亚洲一级毛片免费观看| 日韩在线欧美在线| 国产亚洲精品在天天在线麻豆| 亚洲日本在线免费观看| 九九热精品在线视频| 亚洲三级色| 久久精品无码一区二区日韩免费| 乱人伦中文视频在线观看免费| 99精品一区二区免费视频| 欧美日韩第二页| 一区二区日韩国产精久久| 亚洲婷婷丁香| 国产无人区一区二区三区| 亚洲—日韩aV在线| 999国产精品| 国产黄在线观看| 亚洲欧美另类中文字幕| 精品伊人久久久香线蕉| 国产欧美日韩va另类在线播放 | 日韩美一区二区| 国产色婷婷视频在线观看| 色亚洲成人| 国产噜噜在线视频观看| 成人av专区精品无码国产| 亚洲第一页在线观看| 国产成人综合日韩精品无码首页 | 国产精品亚洲综合久久小说| 国产地址二永久伊甸园| 日韩 欧美 国产 精品 综合| 亚洲成人网在线播放| 亚洲成在线观看| 中文天堂在线视频| 99在线视频免费观看| 国产尤物jk自慰制服喷水| 亚洲午夜福利精品无码| 国产成人精品亚洲77美色| 4虎影视国产在线观看精品| 国产无码精品在线| 亚洲一级毛片在线观播放| 成人免费午间影院在线观看| 伊人91在线| 狠狠久久综合伊人不卡| 国产一级毛片yw| 免费a级毛片视频| 亚洲美女一级毛片| 色综合a怡红院怡红院首页| 国产主播福利在线观看| 97se亚洲综合| 欧美亚洲另类在线观看| 国产成人福利在线视老湿机| 精品福利国产| 欧洲亚洲一区| 欧美曰批视频免费播放免费| www精品久久| 欧美在线黄| 乱人伦视频中文字幕在线| 日韩在线2020专区| 精品视频一区在线观看| 精品国产免费观看| 久操中文在线| 久久伊人操| 91精品国产自产在线老师啪l| www亚洲精品| 国产男女XX00免费观看| 国产最新无码专区在线| 97av视频在线观看| jizz国产在线| 伊人蕉久影院| 看av免费毛片手机播放| 久久久精品无码一区二区三区| 国产美女叼嘿视频免费看| 欧美精品在线免费| 久久99久久无码毛片一区二区| 综合色在线| 国产精品手机视频一区二区| 国产另类视频| 尤物视频一区|