999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Hadoop的GNSS網(wǎng)基線向量的分布式處理

2017-11-10 11:52:42楊國慶岳東杰陳浩尹斌權(quán)
全球定位系統(tǒng) 2017年4期
關(guān)鍵詞:數(shù)據(jù)處理

楊國慶,岳東杰,陳浩,尹斌權(quán)

(河海大學(xué) 地球科學(xué)與工程學(xué)院,江蘇 南京 211100)

基于Hadoop的GNSS網(wǎng)基線向量的分布式處理

楊國慶,岳東杰,陳浩,尹斌權(quán)

(河海大學(xué) 地球科學(xué)與工程學(xué)院,江蘇 南京 211100)

對(duì)于海量的GNSS觀測(cè)數(shù)據(jù),常規(guī)的集中式數(shù)據(jù)處理方法面臨著計(jì)算效率低的問題,利用Hadoop平臺(tái)技術(shù)分布式解算基線的方法可以有效地解決這一問題。通過劃分子網(wǎng),調(diào)用GAMIT軟件并行解算基線,63個(gè)IGS站計(jì)算結(jié)果表明,3個(gè)計(jì)算節(jié)點(diǎn)的加速比達(dá)到了6.67,平差得到的坐標(biāo)點(diǎn)精度在毫米量級(jí)。

Hadoop;分布式計(jì)算;基線解算;全球衛(wèi)星導(dǎo)航系統(tǒng)

0 引 言

隨著越來越多的連續(xù)運(yùn)行基準(zhǔn)站(CORS)的建立,全球衛(wèi)星導(dǎo)航系統(tǒng)GNSS(Global Navigation Satellite System)觀測(cè)的數(shù)據(jù)量越來越大,這對(duì)數(shù)據(jù)的存儲(chǔ)以及計(jì)算帶來了很大的挑戰(zhàn)。近年來,網(wǎng)絡(luò)技術(shù)也在不斷的發(fā)展進(jìn)步,網(wǎng)格計(jì)算、云計(jì)算等分布式計(jì)算在海量數(shù)據(jù)的存儲(chǔ)、檢索以及計(jì)算中得到了廣泛的應(yīng)用[1]。如今Hadoop被一些大型互聯(lián)網(wǎng)公司應(yīng)用,比如Google、雅虎等,這些企業(yè)利用Hadoop開發(fā)了開源的大數(shù)據(jù)管理系統(tǒng),展現(xiàn)了Hadoop在處理大數(shù)據(jù)時(shí)的巨大潛力,很多企業(yè)決定引入Hadoop解決面臨的大數(shù)據(jù)難題[2]。本文將Hadoop平臺(tái)技術(shù)引入到GNSS網(wǎng)的基線解算當(dāng)中,對(duì)預(yù)處理后的觀測(cè)文件進(jìn)行分布式存儲(chǔ)與計(jì)算,通過算例驗(yàn)證了利用子網(wǎng)劃分策略和Hadoop技術(shù)分布式解算GNSS網(wǎng)基線向量的效率。

1 Hadoop平臺(tái)技術(shù)

Hadoop作為一個(gè)大數(shù)據(jù)的分布式處理平臺(tái),其特點(diǎn)是非結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ)、聚集、提取和過濾[3]。Hadoop平臺(tái)提供了一組穩(wěn)定可靠的接口以及數(shù)據(jù)服務(wù),實(shí)現(xiàn)了MapReduce算法,能夠把文本分成許多個(gè)可以重復(fù)執(zhí)行的小單元。Hadoop平臺(tái)可以利用分布式處理系統(tǒng)進(jìn)行數(shù)據(jù)的存儲(chǔ),并且可以保持對(duì)數(shù)據(jù)擁有很高的吞吐率,同時(shí)該平臺(tái)還可以自動(dòng)地處理失敗節(jié)點(diǎn)[4]。

Hadoop最核心的模塊為用來存儲(chǔ)節(jié)點(diǎn)文件的分布式文件系統(tǒng)HDFS(Hadoop Distributed File System)和用來計(jì)算大規(guī)模數(shù)據(jù)集群的MapReduce。HDFS能夠以較高的傳輸率對(duì)大量的數(shù)據(jù)進(jìn)行訪問,并且能夠以流的方式對(duì)文本數(shù)據(jù)進(jìn)行訪問;MapReduce可以分解數(shù)據(jù),在數(shù)據(jù)存儲(chǔ)節(jié)點(diǎn)上對(duì)大量數(shù)據(jù)進(jìn)行分析處理。

本文利用HDFS技術(shù)對(duì)預(yù)處理后GNSS觀測(cè)數(shù)據(jù)進(jìn)行分布式存儲(chǔ)和傳輸。HDFS集群包含了一個(gè)Namenode和多個(gè)Datanode[5]。NameNode負(fù)責(zé)管理整個(gè)文件系統(tǒng)的元數(shù)據(jù),維護(hù)文件系統(tǒng)的目錄樹,包括每個(gè)測(cè)站的名稱,對(duì)應(yīng)的觀測(cè)文件的存儲(chǔ)位置。DataNode 負(fù)責(zé)管理觀測(cè)文件數(shù)據(jù)塊,一個(gè)觀測(cè)文件會(huì)按照固定的大小(Blocksize一般為128 M)切成若干塊后分布式存儲(chǔ)在若干臺(tái)Datanode上,每一個(gè)文件塊可以有多個(gè)副本(默認(rèn)為3個(gè)),并存放在不同的Datanode上。通過自己開發(fā)的客戶端向HDFS中寫入或者讀取觀測(cè)數(shù)據(jù)文件。Datanode會(huì)定期向Namenode匯報(bào)自身所保存的文件Block信息,而Namenode則會(huì)負(fù)責(zé)保持文件的副本數(shù)量。HDFS的內(nèi)部工作機(jī)制對(duì)客戶端保持透明,客戶端請(qǐng)求訪問HDFS都是通過向Namenode申請(qǐng)來進(jìn)行。圖1是基于HDFS的觀測(cè)數(shù)據(jù)分布式文件系統(tǒng)體系結(jié)構(gòu)圖。

圖1 基于HDFS的觀測(cè)數(shù)據(jù)分布式文件系統(tǒng)結(jié)構(gòu)

MapReduce是一個(gè)分布式運(yùn)算程序的編程框架,是用戶開發(fā)“基于Hadoop的數(shù)據(jù)分析應(yīng)用”的核心框架。MapReduce核心功能是將用戶編寫的業(yè)務(wù)邏輯代碼和自帶默認(rèn)組件整合成一個(gè)完整的分布式運(yùn)算程序,并發(fā)運(yùn)行在一個(gè)Hadoop集群上。一個(gè)完整的MapReduce程序在分布式運(yùn)行時(shí)有三類實(shí)例進(jìn)程:MRAppMaster負(fù)責(zé)整個(gè)程序的過程調(diào)度及狀態(tài)協(xié)調(diào);MapTask負(fù)責(zé)map階段的整個(gè)數(shù)據(jù)處理流程;ReduceTask負(fù)責(zé)reduce階段的整個(gè)數(shù)據(jù)處理流程。本文在map函數(shù)中通過調(diào)用GAMIT軟件的批處理命令對(duì)基線進(jìn)行解算。

2 基于Hadoop平臺(tái)的基線解算過程

在進(jìn)行Hadoop集群使用的時(shí)候,必須在獨(dú)立節(jié)點(diǎn)以及數(shù)據(jù)“可分”的情況下才能夠利用其進(jìn)行

數(shù)據(jù)的處理[6]。針對(duì)GNSS大網(wǎng),可以使用劃分子網(wǎng)再綜合處理的方法,能夠提高計(jì)算效率,其處理時(shí)間優(yōu)于整體解算,并且解算精度也與直接整體解算在一個(gè)量級(jí)上,可以滿足大規(guī)模GNSS基準(zhǔn)站網(wǎng)數(shù)據(jù)處理的要求[7]。本文在使用2個(gè)和3個(gè)計(jì)算節(jié)點(diǎn)的時(shí)候采取了劃分子網(wǎng)的策略,各個(gè)子網(wǎng)間有4個(gè)重復(fù)的站點(diǎn),以便后續(xù)對(duì)平差后的坐標(biāo)結(jié)果進(jìn)行檢驗(yàn)。

根據(jù)劃分的子網(wǎng)建立多個(gè)索引文件,文件名為子網(wǎng)編號(hào),文件內(nèi)容為測(cè)站點(diǎn)名,各個(gè)點(diǎn)名空格隔開,方便map函數(shù)對(duì)文件內(nèi)容進(jìn)行操作;利用自己編寫的客戶端代碼上傳預(yù)處理后的觀測(cè)文件、精密星歷文件、廣播星歷文件和索引文件至HDFS集群。在map函數(shù)中,通過本地文件系統(tǒng)的應(yīng)用程序編程接口(API),在本地建立GAMIT軟件運(yùn)行需要的工程文件目錄;map函數(shù)經(jīng)解析索引文件得到該子網(wǎng)的所有測(cè)站名,利用HDFS的API從分布式文件系統(tǒng)中拷貝相應(yīng)的觀測(cè)文件、星歷文件至本地建立的相應(yīng)的工程文件夾中;map函數(shù)通過執(zhí)行相應(yīng)的Linux命令進(jìn)入到工程文件中,調(diào)用sh-setup腳本鏈接外部tables表文件,調(diào)用sh-gamit批處理命令進(jìn)行基線解算。處理過程中,一個(gè)索引文件對(duì)應(yīng)一個(gè)子網(wǎng),Hadoop對(duì)每一個(gè)索引文件操作時(shí)都會(huì)分配一個(gè)Maptask,一個(gè)子網(wǎng)正好匹配了一個(gè)Maptask對(duì)其進(jìn)行處理。以上過程如圖2所示。

圖2 基于Hadoop平臺(tái)技術(shù)的基線解算流程

3 計(jì)算實(shí)例及分析

采用亞洲以及周邊地區(qū)63個(gè)IGS連續(xù)運(yùn)行跟蹤站2013年第133天的30 s采樣間隔的預(yù)處理后的觀測(cè)資料,O文件的數(shù)據(jù)量約為252 Mb,站點(diǎn)分布如圖3所示。

圖3 實(shí)驗(yàn)相關(guān)IGS站點(diǎn)分布圖

在VMware Workstation Pro上搭建多臺(tái)虛擬機(jī)建立實(shí)驗(yàn)環(huán)境,虛擬機(jī)內(nèi)存1 Gb,物理核1核,操作系統(tǒng)為CentOS6.7,各節(jié)點(diǎn)計(jì)算環(huán)境基于Hadoop2.6.1,相關(guān)的基線解算采用GAMIT10.6版本。采用Master-Slave集成模式進(jìn)行架構(gòu),如圖4所示。

圖4 基于Hadoop的分布式計(jì)算架構(gòu)

采用劃分子網(wǎng)的分布式計(jì)算策略,單節(jié)點(diǎn)對(duì)整網(wǎng)進(jìn)行基線解算,2個(gè)節(jié)點(diǎn)劃分為2個(gè)子網(wǎng),3個(gè)節(jié)點(diǎn)則劃分為3個(gè)子網(wǎng),各個(gè)子網(wǎng)間有4個(gè)重合站點(diǎn),基線解算時(shí)間取3次結(jié)果的平均值。不同數(shù)量子網(wǎng)個(gè)數(shù)和計(jì)算節(jié)點(diǎn)數(shù)下的解算時(shí)間如表1所示。

表1 不同節(jié)點(diǎn)數(shù)和子網(wǎng)個(gè)數(shù)解算時(shí)間對(duì)比

從表1可以看出,隨著子網(wǎng)個(gè)數(shù)和計(jì)算節(jié)點(diǎn)數(shù)的增加,解算速度顯著加快,3個(gè)節(jié)點(diǎn)處理3個(gè)子網(wǎng)比單機(jī)集中處理整網(wǎng)的加速比提高了6.67倍。

Hadoop能夠把相當(dāng)一部分大型計(jì)算任務(wù)拆成若干小任務(wù)在很多并行的服務(wù)器上運(yùn)算,但是并沒有完全解決計(jì)算瓶頸的問題。一般想象中,增加10倍的處理器并行運(yùn)算,就可以同樣成倍地節(jié)省時(shí)間,但是在工程上這是做不到的。利用Hadoop對(duì)各個(gè)子網(wǎng)進(jìn)行基線解算的過程中,最終的計(jì)算速度取決于最后解算完成的子任務(wù)。因此,并行計(jì)算的時(shí)間是遠(yuǎn)遠(yuǎn)做不到和服務(wù)器數(shù)量成反比。事實(shí)上,使用的處理器越多,并行計(jì)算的效率越低[8]。所以在實(shí)際的工程當(dāng)中,合理地分配計(jì)算資源才能使效率最大化。

解算完成后,從生成的sh_gamit_133.summary文件中查看標(biāo)準(zhǔn)化均方根殘差(NRMS)以及解算總結(jié),一般說來,NRMS值越小,基線估算精度越高;反之精度越低[9]。NRMS是衡量基線解算質(zhì)量的最重要指標(biāo),一般為0.25左右,原則上應(yīng)小于0.3[10]。本實(shí)驗(yàn)得到的NRMS都小于0.2,因此解算結(jié)果滿足精度要求。

最后再對(duì)結(jié)果進(jìn)行GLOBK平差,在globk_comb.org文件中查看平差結(jié)果,各個(gè)子網(wǎng)間重復(fù)基準(zhǔn)站的坐標(biāo)差如圖5所示。

從圖中可以看出,子網(wǎng)間重復(fù)站點(diǎn)坐標(biāo)較差都在1 cm以內(nèi),解算結(jié)果相差較小,精度符合要求。

圖5 各個(gè)子網(wǎng)重復(fù)站點(diǎn)坐標(biāo)較差統(tǒng)計(jì)圖

4 結(jié)束語

隨著CORS站的不斷建成,其連續(xù)觀測(cè)產(chǎn)生的數(shù)據(jù)量越來越大,這對(duì)海量觀測(cè)數(shù)據(jù)的存儲(chǔ)和快速計(jì)算帶來了挑戰(zhàn)。本文利用了Hadoop平臺(tái)技術(shù)和子網(wǎng)劃分策略對(duì)GNSS基線向量網(wǎng)進(jìn)行分布式解算,大大提高了計(jì)算的效率,主要結(jié)果如下:

1) 利用Hadoop平臺(tái)技術(shù)的MapReduce算法,一個(gè)計(jì)算節(jié)點(diǎn)可以分配多個(gè)MapTask并行處理多個(gè)子網(wǎng)的觀測(cè)數(shù)據(jù),有效地分配了計(jì)算資源,實(shí)現(xiàn)了GNSS基線向量網(wǎng)的分布式解算。

2) 采用劃分子網(wǎng)的策略,在實(shí)際工作中效率得到了提高,處理時(shí)間相對(duì)縮減,其解算精度也在毫米量級(jí)。子網(wǎng)劃分策略同時(shí)也滿足了Hadoop技術(shù)數(shù)據(jù)“可分性”的需求,讓Hadoop技術(shù)更好地運(yùn)用在GNSS網(wǎng)的基線解算當(dāng)中。

3) 利用已有的軟件進(jìn)行數(shù)據(jù)處理,一方面減少了軟件開發(fā)的成本,另一方面還能夠保證計(jì)算結(jié)果的質(zhì)量要求。

[1] 李志才,張鵬,孫占義,等. 大規(guī)模GNSS基準(zhǔn)站網(wǎng)快速同步處理方法研究[J]. 測(cè)繪通報(bào),2017(2):65-69.

[2] 樂天. Hadoop:打開大數(shù)據(jù)之門的金鑰匙[N]. 計(jì)算機(jī)世界,2012-02-27(030).

[3] 王凱,曹建成,王乃生,等. Hadoop支持下的地理信息大數(shù)據(jù)處理技術(shù)初探[J]. 測(cè)繪通報(bào),2015(10):114-117.

[4] 戴中華,盛鴻彬,王麗莉. 基于Hadoop平臺(tái)的大數(shù)據(jù)分析與處理[J]. 通訊世界,2015(6):59-60.

[5] 呂志平,陳正生,崔陽,等. 大型CORS網(wǎng)基線向量的分布式處理[J]. 測(cè)繪科學(xué)技術(shù)學(xué)報(bào),2013(4):433-438.

[6] 任仁. Hadoop在大數(shù)據(jù)處理中的應(yīng)用優(yōu)勢(shì)分析[J]. 電子技術(shù)與軟件工程,2014(15):194.

[7] 姜衛(wèi)平,趙倩,劉鴻飛,等. 子網(wǎng)劃分在大規(guī)模GNSS基準(zhǔn)站網(wǎng)數(shù)據(jù)處理中的應(yīng)用[J]. 武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),2011(4):389-391,505.

[8] 吳軍. 智能時(shí)代:大數(shù)據(jù)與智能革命重新定義未來[M]. 北京:中信出版社,2016.

[9] 陳正生,呂志平,崔陽,等. 大規(guī)模GNSS數(shù)據(jù)的分布式處理與實(shí)現(xiàn)[J]. 武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),2015(3):384-389.

[10] 趙建三,楊創(chuàng),聞德保. 利用GAMIT進(jìn)行高精度GPS基線解算的方法及精度分析[J]. 測(cè)繪通報(bào),2011(8):5-8,35.

DistributedProcessingofGNSSNetwork’sBaselineVectorsBasedonHadoop

YANGGuoqing,YUEDongjie,CHENHao,YINBinquan

(CollegeofEarthScienceandEngineering,HohaiUniversity,Nanjing211100,China)

For the massive data of GNSS observation, the method of conventional centralized data processing is facing the problem of low computational efficiency, distributed to process the baseline by using the technology of Hadoop platform, which can solve this problem effectively. By dividing the subnet, calling the GAMIT software to process the baseline in parallel, the result of 63 IGS stations shows that the acceleration ratio of the three compute nodes is 6.67, and the accuracy of the coordinate points is in the order of millimeters.

Hadoop; distributed computing; baseline solution; GNSS

10.13442/j.gnss.1008-9268.2017.04.012

P228.4

A

1008-9268(2017)04-0066-04

2017-05-27

聯(lián)系人: 楊國慶E-mail: gqyang@hhu.edu.cn

楊國慶(1994-),男,江西贛州人,碩士研究生,研究方向?yàn)闇y(cè)量數(shù)據(jù)處理理論與方法。

岳東杰(1966-),女,山東梁山人,教授,主要研究方向?yàn)榻鷾y(cè)量數(shù)據(jù)處理。

陳浩(1993-),男,江蘇鹽城人,碩士研究生,研究方向?yàn)闇y(cè)量數(shù)據(jù)處理理論與方法。

尹斌權(quán)(1994-),男,江蘇徐州人,碩士研究生,研究方向?yàn)闇y(cè)量數(shù)據(jù)處理理論與方法。

猜你喜歡
數(shù)據(jù)處理
驗(yàn)證動(dòng)量守恒定律實(shí)驗(yàn)數(shù)據(jù)處理初探
認(rèn)知診斷缺失數(shù)據(jù)處理方法的比較:零替換、多重插補(bǔ)與極大似然估計(jì)法*
ILWT-EEMD數(shù)據(jù)處理的ELM滾動(dòng)軸承故障診斷
ADS-B數(shù)據(jù)處理中心的設(shè)計(jì)與實(shí)現(xiàn)
MATLAB在化學(xué)工程與工藝實(shí)驗(yàn)數(shù)據(jù)處理中的應(yīng)用
基于希爾伯特- 黃變換的去噪法在外測(cè)數(shù)據(jù)處理中的應(yīng)用
大數(shù)據(jù)處理中基于熱感知的能源冷卻技術(shù)
Matlab在密立根油滴實(shí)驗(yàn)數(shù)據(jù)處理中的應(yīng)用
數(shù)據(jù)處理能力在求職中起關(guān)鍵作用
我國首個(gè)“突發(fā)事件基礎(chǔ)數(shù)據(jù)處理標(biāo)準(zhǔn)”發(fā)布
主站蜘蛛池模板: 免费99精品国产自在现线| 久久99蜜桃精品久久久久小说| 制服丝袜国产精品| 亚洲成人黄色在线观看| 国产办公室秘书无码精品| 99视频在线观看免费| 亚洲国产精品不卡在线| 凹凸国产分类在线观看| 免费一级毛片在线观看| 精品国产美女福到在线不卡f| 扒开粉嫩的小缝隙喷白浆视频| 国产成人午夜福利免费无码r| 久久综合伊人 六十路| 成年人福利视频| 欧美成人午夜视频免看| 国产尹人香蕉综合在线电影| 亚洲人成网线在线播放va| 欧美日本在线播放| 一区二区三区在线不卡免费| 久久精品免费国产大片| 午夜无码一区二区三区在线app| 中文字幕中文字字幕码一二区| 亚洲人成在线精品| 亚洲免费毛片| 天堂在线视频精品| 99精品福利视频| 99精品视频在线观看免费播放| 欧美亚洲中文精品三区| 亚洲中文字幕无码爆乳| 全部毛片免费看| 一边摸一边做爽的视频17国产 | 在线日本国产成人免费的| a毛片在线播放| 亚洲婷婷在线视频| 女人18毛片水真多国产| 99人体免费视频| 热久久这里是精品6免费观看| 免费国产黄线在线观看| 久久精品视频亚洲| 2021国产乱人伦在线播放| 国产在线啪| 欧美日韩国产精品va| 无码免费的亚洲视频| 视频二区亚洲精品| 亚洲人人视频| 亚洲狼网站狼狼鲁亚洲下载| 伊在人亞洲香蕉精品區| 亚洲人成色在线观看| 中文字幕在线日本| 国产激爽大片高清在线观看| 国产成熟女人性满足视频| 国产男人的天堂| 久久综合色视频| 91亚洲视频下载| 成AV人片一区二区三区久久| 久爱午夜精品免费视频| 国产综合色在线视频播放线视| 亚洲免费成人网| 国产尤物在线播放| 亚洲欧美综合另类图片小说区| 57pao国产成视频免费播放| 久草中文网| 又黄又爽视频好爽视频| 亚洲国产精品无码AV| 国产精品思思热在线| 啪啪免费视频一区二区| 亚洲综合中文字幕国产精品欧美| 91在线播放国产| 91美女视频在线| 国产成人毛片| 国产精品99r8在线观看| 国产欧美中文字幕| 99在线观看免费视频| 波多野结衣视频一区二区| 91色在线观看| 色欲不卡无码一区二区| 香蕉久久国产精品免| 亚洲综合激情另类专区| a毛片免费观看| 最新国语自产精品视频在| 欧美精品三级在线| 精品综合久久久久久97超人该|