李芹
摘 要:本文利用地理國情普查基礎數據進行多種地理國情統計單元,采用算術平均法、空間量算、極值法和比值分析法等方法通過緩沖區分析、網絡分析和疊加分析等技術來進行統計,從多維度綜合分析地理國情普查要素的物理結構、空間分布及相互關系,揭示其分布規律和發展趨勢,為科學發展提供依據。
關鍵詞:地理國情普查;基本統計;統計方法
0 引言
“要加強地理國情監測”是國務院副總理李克強同志在2010年12月全國測繪局長會議上重點提出的工作。2013年2月18日《國務院關于開展第一次全國地理國情普查的通知》正式下達(以下簡稱“國情普查”),全國范圍的國情普查工作由此展開。國情普查是查清我國地形地貌、地表覆蓋等自然和人文地理要素的現狀和空間分布狀況。普查的最終成果發布這是以數據形式,這就需要我們對普查數據進行統計,國情普查基本統計是根據地理國情普查采集的點、線、面等幾何特征類型和地理實體對象,以規則地理網格單元、行政區劃與管理單元、地形單元為統計單元,進行地形地貌、植被覆蓋、荒漠與裸露地表、水域、交通網絡、居民地與設施、地理單元的數量、密度、位置、高程、范圍等內容的統計。根據統計成果來充分揭示社會經濟發展和自然資源環境的分布規律,實現地理國情信息對政府、企業和公眾的服務,為國家戰略規劃制定、空間規劃管理、區域政策制定、災害預警、科學研究和為公眾服務提供有力保障。
1 方法研究
地理國情普查基本統計使用的方法主要有空間量算、算數平均法、比值分析法、極值法、疊加分析、緩沖區分析和網絡分析等方法。
1.1 空間量算
空間量算主要量算長度、面積、表面長度、表面面積等。長度和面積的量算就不在贅述,主要介紹下基于CGCS2000國家大地坐標系下的考慮到地球地表起伏的表面長度和表面面積的計算方法。
地表曲線長度計算公式[1]
(1)
式中, 和 表示相鄰兩點空間直角坐標的向量,n表示線段總數。
空間兩點間距離計算公式[2]
(2)
式中 和 為空間任意兩點的空間坐標。
表面面積計算按DEM數據行()對整個邊界區域進行整數網格劃分,構建規則三角網,計算所有構建的三角網的面積,累加所有三角網面積得到地表區域的地表面積,如下圖所示。
`
`
圖1 空間三角形的表示
整個區域的面積公式[2]為:
(3)
中,n表示子區域的個數,N表示子區域中三角形的個數, 表示整個多邊形區域, 表示一個子區域中的一個三角形區域。
單個三角形的計算公式為:
(4)
式中“ ”表示三角形兩條邊構成的向量AB、AC的外積。
1.2算數平均法
算數平均法是求表征數據集中趨勢的一種數學方法,它是一組數據之和除以數據的個數,其結果被稱為算數平均數。算數平均數在統計學上具有更少受到隨機因素影響的優點,缺點是容易受到極端值的影響。
在統計分析中,主要運用于平均高程的計算。
(5)
式中n為統計單元內所有高程點個數, 為第k點的高程
1.3 比值分析法
比值分析法是指通過計算兩個有聯系的指標對比比率來進行分析的方法。利用這種方法所求出的統計指標多為相對指標,用于衡量兩個要素之間的關系。包括占比和構成比兩種。
占比是指統計單元內面狀要素面積總和與單元面積的比值。設統計單元內有n類統計對象,每類總面積為 , , , ,統計單元的面積為S,對于第 ( ≤ ≤ )類對象有
占比: (6)
構成比是指同一統計對象內部的構成,即子類占父類的比重。設統計單元內有n類統計對象,每類面積為 , , , ,對于第 ( ≤ ≤ )類對象有
構成比: (7)
在統計分析中,主要運用于點狀要素密度、線狀要素密度、面狀要素占比、面狀要素構成比、地表平整系數等統計指標使用比值分析法進行計算。
1.4極值法
極值包括最大值和最小值,是指在一個域內函數取得最大值(或最小值)的函數值,使函數取得最大值(或最小值)的點被稱為極值點。
在統計分析中,主要運用于最低高程、最高高程、四至點坐標等統計數據的計算。
1.5疊加分析
疊加分析是指在統一的坐標系統下,對同一區域的兩個或者多個不同主題的數據圖層進行邏輯交、差、并等運算,并對運算結果的屬性進行評定,從而得到該區域的多重屬性特征或建立對象之間的空間對應關系。根據所采用的數據結構的不同,可分為基于矢量數據的疊加分析和基于柵格數據的疊加分析兩種類型。
在統計分析中,主要運用于坡度帶、高程帶、行政區劃與管理單元等統計數據的計算。
1.6 緩沖區分析
緩沖區分析是以點、線、面實體為基礎,在其周圍建立一定寬度范圍內的緩沖區多邊形圖層,然后將該圖層疊加在目標圖層上,進行分析而得到的所需結果。
基于點狀要素的緩沖區,通常是以點為圓心、以一定距離為半徑的圓。基于線狀要素的緩沖區通常是以線為中心軸線,距中心軸線一定距離的平行條帶多邊形。基于面狀要素的緩沖區通常向外或向內擴展一定距離為形成,如圖2、圖3、圖4所示。
圖2 點緩沖區 圖3 線緩沖區 圖4面緩沖區
在統計分析中,主要運用于基于道路中心線采集道路面積,等統計數據的計算。
1.7網絡分析
網絡分析是GIS空間分析的重要組成部分。網絡是由一個點、線的二元關系構成的系統,通常用來描述某種資源或物資沿著路徑在空間上的運動,例如城市道路系統,地下管道系統,河流水網等最優路徑的選擇等,如圖5所示。
地理網絡的表達和存儲主要是使用關聯矩陣和鄰接矩陣其中關聯矩陣是指測度網絡圖中頂點和邊的關聯關系,鄰接矩陣是指測度網絡圖中各頂點之間連通性的程度。
現代意義上的最優路徑已不再僅僅指地理意義上的距離最短,它還可以是指時間最少、費用最省、線路容量最大等。最優路徑廣泛應用于各個行業部門中,是資源配置的重要保障。
圖5 無向網絡分析圖
2 基本統計技術路線圖
3 統計流程
統計分析基于地理國情數據庫據庫,通過數據預處理,提取統計單元,配置相關統計指標,進而進行統計計算,最后得到統計成果[3]。
3.1數據預處理
首先要對BUCA層進行質心的提取。對于同時有點、線、面幾何類型數據的圖層(主要為構筑物中的閘、碼頭等),進行完整化處理,對于面狀要素圖層提取質心,線狀要素圖層提取中心,生成點數據,并攜帶面、線要素分類屬性,合并到點狀數據圖層,最終形成完整的要素點圖層。
由于統計分析中需要計算表面積以及高程帶和坡度帶,需要基于DEM進行相關計算,所以對于DEM有異常值的地方進行修改處理。
3.2統計單元提取
統計分析是以統計單元進行分類統計,所以需要提取統計單元,統計單元包括行政區與管理單元、規則地理格網單元和地形單元[3]。
行政區與管理單元主要是從BOUA5中提取縣級行政區,從BOUA6中提取鄉級行政區,從BOUA8中提取城市中心城區,從BOUA9中提取其他特殊行政管理區。
規則地理格網單元則是按照中心城區100m×100m;縣級1km×1km,由中國測繪科學研究院分省生成,下發到各省。
地形單元是根據高程帶分級標準從DEM中提取高程帶,然后根據高程帶數據進行坡度計算,生成坡度數據,根據坡度帶分級標準,進行圖斑融合進而生成坡度帶數據。
3.3 統計配置
根據統計分析的內容,進行地形地貌、植被覆蓋、水域、荒漠與裸露地表、交通網絡、居民地與設施和地理單元七大類統計對象與統計指標的匹配,統計指標與行政區劃與管理單元、地形單元和規則地理格網的匹配,統計對象與普查數據的匹配,為下一步的統計計算做好匹配,統計配置流程圖如圖7所示。
圖7 基本統計配置流程圖
3.4 統計計算
根據統計配置結果,把統計對象分別按照三類統計單元(順序為行政區與管理單元、地形單元、規則地理格網單元)完成七大統計對象的統計指標計算[4],計算流程如下圖8所示:
圖8 統計計算流程圖
3.5統計成果生成
統計成果生成包括統計報表的生成,格網數據庫的生成。根據統計計算的結果,生成七大統計地類的報表,包括Excel報表格式和mdb數據庫兩種格式。格網數據庫則根據導入的格網數據對對地理國情數據庫進行裁切,保存格式為Arcgis中的gdb文件數據庫格式,最后根據成果匯交要求,整理統計分析成果。
4 結束語
地理國情普查數據真實反映地表覆蓋情況,包括植被覆蓋、地形地貌、水域分布、交通網絡、居民地與設施等情況,以及國情要素的分布情況。通過統計分析所獲得數據具有真實性和現勢性,可廣泛運用于社會主義現代化的經濟建設中。在政府方面,可為政府的整體規劃建設提供準確的數據參考,在宏觀上使建設格局合理配置、資源優化分配,從而制定正確的規劃方案。在民用上,可以用來更新網絡地圖(百度地圖、谷歌地圖等),可以根據道路網、村鎮、醫院和學校等公共設施來評價區域交通的通達性以及醫療和教育的空間配置情況。也可以建立地理國情監測平臺,來反映每年的地表覆蓋和國情要素的變化,并根據多年的數據積累可反映出土地變化的趨勢,從而為政府制定相關政策方針及決策提供科學有效的依據。
參考文獻
[1] 李維森.地理國情普查基本統計[M].北京:測繪出版社,2013.
[2] 董菲.淺議如何進行地理國情統計分析[J].測繪與空間地理信息,2014,37(6):186-187.
[3] 劉耀林,何建華.地理國情多層次統計分析指標體系設計.地理空間信息,2014,12(3):1-4.
[4] 袁衛平,董春,康風光等.地理國情基本統計算法模型管理策略研究.遙感信息,2014,29(4):
62-66.