鄧 建
(天水三和數碼測繪院有限公司 甘肅 天水 741000)
測繪地理信息工作通常為,選擇適宜的測繪技術,對被測量地區進行詳細測繪,通過對地理數據進行測量,將其融入至自然數據庫中。現如今,隨著社會經濟發展及科學技術創新,為測繪地理信息工作提供有力的地理數據支持。另外,在大數據時代,測繪地理信息工作對數據處理能力及成果的需求不斷提升,因此,亟需對大數據技術在測繪地理信息中的應用進一步深入研究。
互聯網技術發展迅速,對于信息傳輸方式以及存儲方式均會產生較大影響。在數據轉化過程中,多元化信息相互疊加,使得信息數據不斷積累,進而形成大數據,在大數據時代,大數據技術對于各個領域均產生較大影響。在大數據技術的實際應用中,信息數據搜集范圍和途徑廣泛,數據信息量龐大,數據處理技術水平比較高,同時信息數據價值取向也具有多樣性特征。
大數據技術的處理方式主要包括以下幾個方面:第一,數據采集。在大數據采集過程中,可從多個數據庫同時入手,充分采納從客戶端傳出的大量數據,用戶根據實際需要可直接訪問數據庫,進而查詢并獲取海量數據。比如,電商在數據存儲方面,可應用MySQL,另外還有其他多種數據庫類型,如Cloudant也可應用于海量數據采集中。利用大數據技術對地理信息數據收集,可多個用戶可同時訪問數據庫,因此并發量比較高,甚至超過數百萬,由此可見,對于收集來的海量數據,必須使用強大的數據庫進行存儲及管理。第二,數據導入以及數據預處理。采集端中含有大量數據,需要對海量數據進行預處理操作。第三,數據分析和統計。在數據統計以及分析過程中,要求合理應用分布式數據庫,通過應用分布式數據庫即可進行數據存儲以及匯總,確保能夠滿足不同客戶的個性化需要。第四,數據挖掘。數據挖掘與數據統計之間有一定不同之處,在數據挖掘前,首先需設計主題,然后再利用計算機進行計算處理,進而達到良好的預測效果。在數據處理中,常用工具類型包括Mahou以及Hadoop等等,數據預測分析難度比較大,同時數據預測復雜程度比較高[1]。
(1)提高工作能力。在地理信息數據處理分析中,需要開始廣泛采集大量的測繪地理信息,但是地理信息數據量龐大,并且類型比較多,因此,為了加強數據利用率和地理信息數據應用價值,必須將大數據技術很好地應用于測繪地理信息工作中。如此能夠獲取大量信息數據,便于提高測繪工作的效率。
(2)構建新的工作模式。在大數據時代下,為測繪地理信息工作帶來新的機遇。應創建科學高效的信息系統,并轉變傳統的工作方式。另外,在具體工作模式下,也可以加入云計算技術,強化測繪地理信息工作技術保障。
(3)升級信息系統。現如今,測繪技術發展迅速,傳統的測繪技術也逐漸暴露出很多不足,但地理信息仍有較好的發展前景。在傳統的測繪工作中,地理信息系統,在較短時間內很難獲取海量數據,并且數據處理準確性有待欠缺,進而對地理信息工作效率有著一定影響。在大數據技術時代,為創新地理測繪工作方式,應加快地理信息系統技術革新,積極推進信息系統升級創新,提高信息數據處理準確性和高效性[2]。
地理信息數據的類型比較復雜多樣,涉及圖形、屬性信息等各類結構化數據,同時還包含多種非結構化數據,包括文檔、視頻、圖片等等。由于信息數據量龐大,因此,可創建多源異構地理信息數據,使用大數據技術開發大數據處理平臺,對大量數據進行有效存儲和應用管理。比如,在Hadoop分布式處理平臺的創建時,可采用HDFS創建數據管理集群,對于數據管理集群節點的海量數據,可結合當前已有的數據量規模、實際需要等情況來優化配置,集群中的大量節點可協同開展,從而提升數據存儲和計算效率。另外,對于結構化數據以及非結構化數據,可創建Hbase數據工廠對數據處理分析,構成結構化數據,再存儲到Hadoop數據庫。除此以外,還需創建Hive數據倉庫,其中結構化數據,均可將其存儲至數據倉庫中。通過聯合應用Hive以及Hbase,能夠對大量結構化地理信息數據以及非結構化地理信息數據統一高效存儲和管理。最后,在數據計算方面,可利用Mapreduce對數據進行分布式計算及分析,通過結合Hadoop集群并行計算功能,提高海量數據處理效果,進而組成完善的Hadoop框架,其結構形式如圖1所示。

圖1 Hadoop架構和HDFS的存儲管理模式
與傳統的數據存儲和管理方式相比,分布式文件系統的存儲功能強大,其應用優勢主要體現在以下幾點:第一,硬件優勢。對分布式文件系統的計算機集群,可結合實際需要進行調整,同時系統的兼容性以及可拓展性比較強,用戶可根據個人需要調整節點數量,同時兼容多種硬件設備類型,確保能夠滿足動態使用實際需要,同時還可促進數據應用率的提升。第二,數據管理和應用優勢。由于具備數據切塊處理功能,因此對于大規模文件也可進行存儲和備份管理,另外,通過應用各類名稱節點,能夠很好提供用戶數據服務,快速查找數據,提高數據利用率。第三,系統冗余副本機制優勢。在Hadoop分布式處理平臺的實際使用過程,能夠保證海量數據的安全性,如果某一副本出現故障,則其他副本依然能夠保持正常運行狀態。另外,在高并發訪問數據時,冗余副本機制可充分發揮其應用優勢,提高數據傳輸效率,同時還可對錯誤數據進行檢查,保證數據安全性和可靠性。
測繪地理信息項目的數據生產過程中,計算機處理性能有著很大影響因素,通過進行大數據分布式處理技術,可實現海量數據的批量化處理,對流數據采取高效計算,同時還擁有圖結構數據計算處理功能以及全局數據查詢分析等功能,因此,通過將大數據技術應用于測繪地理信息管理過程中,可創建良好的運行環境,同時通過選擇專業化軟件,可開展大量多結構地理信息數據處理。研究人員為了探究大數據技術的應用優勢,選擇多元、多分率、多區域影像數據,并分別開展影像處理試驗、數據入庫試驗、向前數據庫集構建試驗。測量區域面積為2.7×105km2,采用3號衛星影像,并利用Pixelgrid-SAT軟件分別制作DEM、DOM以及DSM等,通過有效利用超融合技術創建分布式存儲云主機環境,并利用影像密集匹配技術提取DSM、正射影像處理、影像融合、勻色等等,本次數據處理所需時間為510min。當并發任務為100個時,每景處理時間在5min~6min之間,與傳統數據處理方式相比,處理效率顯著提升。另外,研究人員選擇傾斜影像、地理國情監測以及三調影像一張圖開展試驗,并采用大數據存儲平臺進行數據處理分析,在試驗環境創建中應用Fusion-Sphere搭建10臺虛擬機。在試驗過程中選用多個地理信息專業軟件,并將其應用至大數據應用平臺中進行并行處理。通過研究分析,利用大數據應用平臺進行數據處理,能夠有效加快數據處理速度,并且不會出現卡頓、無法編輯等問題[3]。
可利用大數據技術實施數據挖掘,開展多種結構形式的地理時空數據高效處理工作,通過選擇有效數據對事物作出精準的分析,為相關決策提供可靠依據。比如,對于全球夜光遙感影像資料,可利用大數據技術進行處理。在GDP估算方面,通過廣泛收集夜光遙感影像資料并進行處理和分析,即可了解區域經濟發展情況,進而避免在數據統計中出現偏差,彌補空間信息量不足的問題。由此可見,在大量時空數據中,很多數據的應用價值比較高,但是海量數據分析有一定的難度,而通過利用大數據技術,能提升數據處理能力及分析效率,據此對數據與事物之間的關系展開分析,進而有效降低數據分析難度,充分挖掘數據的應用價值。
(1)大數據背景下的測繪地理信息未來發展前景。大數據時代,要加快技術轉型發展。在數據處理方面,可從空天地專用傳感器拓展至物聯網中的多個非專用傳感器中,進而提高數據獲取效率,同一時間,地理信息用戶群體也從專業用戶拓展至大眾用戶,提高時空信息資源數量。通過感知和分析時空動態數據,對數據變化情況進行監測。
(2)測繪地理信息服務技術創新。測繪地理信息資源具有舉足輕重的作用,在大數據時代,政府應重點關注測繪行業發展,并加大技術、資金等投入量,驅動地理信息服務技術革新和行業發展。在公共服務和管理方面,測繪地理信息能有效的提供服務。現如今,國家政府已提議大測繪發展理念,
(3)注重測繪地理信息的管理。在公共服務和管理方面,測繪地理信息能有效的提供服務。現如今,國家政府已提議大測繪發展理念。互聯網技術、信息技術、云計算技術高速發展,測繪地理信息服務業隨之發展,但是在管理工作中依然存在一些不足,比如安全隱患比較多、信息傳播不通暢等等,對此,要求加強業務管理模式創新,同時制定完善的法律規范。
(4)利用大數據實現深度挖掘地理信息。充分利用大數據技術分析地理信息數據,對測繪服務有著較高的要求。在大數據時代,應創新地理信息服務內容并擴大服務范圍,合理融入智能化技術創建智能傳感器,提高信息數據獲取速度,保證數據質量,提高地理信息服務水平及行業發展。
綜上所述,本文主要對大數據技術在測繪地理信息中的應用方式開展了詳細探究。在大數據時代,測繪地理信息工作隨之持續創新,對于以往的測繪模式以及數據處理模式均產生較大影響,對此,相關企業、測繪部門必須高度重視大數據技術,將其有效應用于測繪地理信息行業中,促進測繪技術創新發展,強化測繪工作管理模式,并提高服務質量。