侯瑞霞 張乃靜 肖云丹 紀 平
(1. 中國林業科學研究院資源信息研究所,北京 100091;2. 國家林業和草原科學數據中心,北京 100091;3. 國家林業和草原局林業遙感與信息技術重點實驗室,北京 100091)
具有空間含義的多級森林資源數據,承載著不同空間專題信息,數據以不同空間形式存在。在信息技術和大數據技術等不斷迅猛發展的時代,不同的森林作業形式、不同的經營管理模式以及不同渠道獲取的森林資源數據,展現了多尺度、非結構化、多源性等特征,但是卻又在不同空間尺度和時間尺度上具有密切的關聯性。在森林資源數據的分析、更新和業務調查應用等工作中,業務處理工作要求獲取的空間數據是連續的以及可相互查詢的,但是面對表達形式多樣、不同時間點(段)的森林資源空間數據,如何有效的完成多源異構的、不同空間尺度的數據集成就成為了數據共享和信息智能檢索應用的一個亟待解決的問題[1?4]。
數據空間作為一個新的概念由此被提出,國內相關的研究正在信息集成和空間數據整合領域開展[4?6]。國家林業和草原科學數據中心根據信息需求的導向,集成多渠道獲取的森林資源數據,本文分析了多源森林資源空間數據的特質和差異性,揭示森林中包含的各種因素之間的空間交互關系以及內在變化規律。同時,通過森林資源空間數據的關聯性分析,實現了多源性森林資源空間數據的統一表達,為林業資源空間語義檢索與共享服務提供空間信息支撐。
森林資源是一個自身不斷變化的研究對象,作為一個動態生長的群體[4],其內在生長的個體相互間存在競爭和互生的關系,因此,從中獲取的空間數據的表達也存在著不確定性。
傳統的林業工作野外數據采集模式,形成了大量的歷史空間資源數據積累,手繪地圖和地圖數字化是主要的空間數據獲取途徑。然而,隨著智慧感知技術和互聯網+技術的不斷發展,遙感信息技術、數字采集以及無人機拍攝識別等不同渠道的數據均成為森林資源空間數據匯集的重要組成部分。不同手段獲得的數據,其存儲格式和處理手段各不相同,從而形成了多種格式數據源共存的局面[4]。信息技術不斷創新,在森林資源空間數據采集的過程中,不同空間區劃的采集標準、采集渠道以及不同操作者等因素,導致空間數據的多源性和差異性。
森林資源空間數據以專題調查的形式存儲[7],在基礎地理空間數據的基礎上,進行專題信息的采集,為林業的各級應用和管理部門服務。由于各級業務職能的不同,數據的關注重點也各有不同,因此,森林資源各類空間數據所承載的關注因子也有不同的側重點(表1)。

表1 森林資源空間數據因子關注重點Table 1 Focus on forest resource spatial data factors
伴隨著信息技術的不斷進步,森林資源空間數據以多種形式的表達方式,充分展示了森林資源的真實狀況。在不同的空間尺度下,同一個森林資源空間實體的表現形式是可以互相轉化的。因此,根據不同的數據可視化需求,森林資源空間數據實現了空間與屬性信息表達的關聯,從數據表達形式上,可以劃分為:點狀數據、線狀數據、面狀數據等;從數據展示類別上,可以劃分為:表格數據、矢量數據、柵格數據(表2)。

表2 森林資源空間數據類別與表達Table 2 Data categories and expression of forest resource space
實現多源的森林資源空間數據集成,必須具備三個必要條件:空間數據、集成軟件以及集成規則[8?11]。空間數據是集成的對象;集成軟件是載體,通常是指可以進行空間信息處理的通用或專題GIS軟件,利用其提供的功能,能夠實現數據集成的主要操作流程;集成規則,是指空間數據集成的依據,也是數據集成的標準參照(圖1)。

圖1 森林資源空間數據集成機制Fig. 1 Space data integration mechanism of forest resources
空間數據集成,是指在對多源性森林資源空間數據進行類別劃分的基礎上,按照數據質量標準進行空間數據的質量檢查,對整體采集或整理的空間數據實現統一管理,形成有效的、完整的空間數據集[12?14]。隨后,利用空間坐標轉換、空間模式轉換以及多尺度集成手段,完成森林資源空間數據的空間定位統一表達;進而,采用多層次空間集成方法,完成空間數據的集成分析,提取空間數據的變化因子,實現多源性森林資源空間數據的信息統一表達,為林業資源空間語義檢索與共享服務提供空間信息支撐。
2.2.1 森林資源空間數據集成質量控制
森林資源空間數據在形式上包括:矢量數據、屬性數據和柵格數據等,進行空間數據的集成工作的第一步就是要實現各類森林資源數據在完整性、準確性等方面的數據質量控制,這樣才能確保空間數據集成的統一表達。
森林資源空間數據質量控制,主要包括:基礎檢查和集成規則檢查[12]。基礎檢查是保證空間數據集成可操作性的第一步,包括文件形式檢查和空間基準檢查等。其中,空間基準檢查又包括地理坐標系統檢查和投影坐標系統檢查。在數據檢查中,空間基準檢查相當重要,可確保各種空間信息之間關系的準確表達,完成空間數據應用共享。森林資源空間數據集成的關鍵是梳理各要素之間的邏輯關系和拓撲關系,因此,集成規則檢查是保證實現空間數據統一表達的重要手段,主要包括:屬性數據檢查、邏輯一致性檢查以及拓撲關系合理性檢查等。進行森林資源空間數據質量控制,是空間信息共享服務的前提和關鍵[15?17]。
2.2.2 森林資源空間數據轉換
森林資源空間數據轉換需要三個方面的信息:1)空間定位信息;2)空間關系;3)屬性數據。森林資源空間數據具有空間定位屬性,不同時間段形成的空間數據,具有對應的空間基準特征,統一的空間基準是保證空間數據集成的一致性、兼容性或可轉換性的基礎條件。一般來說,森林資源空間數據的空間基準信息包括兩個方面:坐標系統和投影系統。坐標系的統一是數據格式轉換的基礎,也是數據集成的基礎。地面上任意一點的位置,均可以采用不同的坐標系來表示。根據數據分析的結果,本文中所采集的森林資源空間數據涵蓋了北京1954年坐標系和1980年西安坐標系,需要進行坐標系統一工作,以確??臻g數據集成的準確性。
森林資源空間數據通過傳統森林作業手段和不斷更新的信息采集技術獲取,不同的采集途徑獲得的空間數據表達形式多種多樣,產生不同的空間數據格式[10]。空間數據格式轉換是做到有效的空間數據集成的關鍵環節??臻g數據格式轉換,即通過專用的轉換程序,把一種格式的空間數據轉換成另一種格式的數據,也可以利用定位信息和屬性信息進行不同的數據類型的轉換,以實現空間數據集成的完整性??臻g數據格式轉換的表現形式,包括不同軟件數據格式的轉換、不同數據類型數據格式的轉換以及不同版本的數據格式轉換[17]。
本文中森林資源空間數據轉換主要通過GIS軟件平臺實現:首先,確定數據格式轉換的對象,分析標準數據格式的組織方式,確定其空間定位范圍和屬性信息的關聯關系;其次,利用轉換工具將其他數據轉為標準數據格式。數據轉換方法包括:數據直接讀取、帶入模型轉換和數據表現形式轉換輸出等。
本文的研究區域定位于廣西熱林中心,收集整理的森林資源空間數據主要包括該區域四個年度的森林資源二類調查數據和兩個年度的森林資源系統抽樣調查數據。這些空間數據的采集時間跨度近二十年,數據信息變化程度大,需要全方位空間數據集成,尋找其關聯關系,為進一步開展森林資源空間數據信息共享及檢索分析提供支撐。
本文分別采集了1998年、2004年、2009年和2014年的森林資源二類調查數據,以面狀信息表達資源調查小班的空間分布狀態、面積、形狀、位置以及實體自身屬性。研究采集的森林資源系統抽樣調查數據包括2011年和2013年兩個年度的數據,以點狀信息表達資源調查空間對象的位置、相對方向以及自身屬性。
森林資源空間數據自身是一個消長變化的數據,在變化進程中,多時間點所采集的數據分別存儲,時間作為數據的一個屬性特征存在,形成時間尺度表達的空間數據。不同時段的數據,在集成結果數據中占有不同的比重;空間屬性特征由不同時段的數據集成密度相互作用,數據集成的密度大,數據特征的權重就高,數據的可信度也就越高。疊加分析是指利用數據要素之間的相關關系,對多時間尺度數據進行處理。
空間數據的集成在相同的數據類型存儲狀態,以及統一的空間投影坐標系統的前提下進行,通過準確的獲取空間關聯信息,充分掌握森林資源的空間變化狀況,為林業資源信息空間檢索與數據檢索提供分析數據支撐。
本文中森林資源調查數據為空間數據,森林資源系統抽樣調查數據以屬性表信息存在,屬性表中存儲空間坐標信息,其X、Y坐標的標示點與森林資源二類調查數據的小班在空間上是重疊的。根據坐標點數據,可以將森林資源系統抽樣調查屬性表數據轉換為樣地空間點狀分布數據,從而實現空間數據集成的數據類型統一(圖2)。

圖2 空間數據不同表達方式轉換Fig. 2 Conversion of spatial data in different expressions
本文中所采集的森林資源調查數據空間位置為固定信息,不同年度的數據,由于采用了不同的坐標系統和地圖投影標準,在空間位置上具有偏差。在分析各年度空間投影信息的基礎上,進行投影轉換工作,使各年度的空間數據存儲于統一的空間坐標系統中,完成空間數據的空間信息標準化。
經過對數據的空間信息提取得知,1998年與2009年的數據空間投影坐標信息相同,為Gauss_Kruger3度投影,Beijing_1954_3_Degree_GK_Zone_36坐標;2004年的森林資源調查數據為GCS_WGS_1984經緯度坐標,未加載投影信息;2014年數據為Gauss_Kruger3度投影,Xian_1980_3_Degree_GK_Zone_36坐標。以2009年森林資源調查空間數據作為空間基準,利用ArcGIS軟件的投影轉換和坐標轉換功能,實現多年度空間數據的空間信息統一。投影轉換前,圖斑位置錯位明顯,誤差高達90 m左右,經過投影轉換和坐標匹配,兩個年度的數據空間位置基本吻合。
森林資源空間數據在完成數據類型轉換和空間投影配置后,將森林資源調查數據與森林資源系統抽樣調查數據進行空間疊加,從而落實樣地點分布與資源小班的空間關聯關系。樣地點分布在資源調查小班中,可以通過點與面的包含關系查詢對含有樣地點的小班進行提取,為資源信息分析提供空間對比數據。
分別以四個年度森林資源調查數據和2011年抽樣調查數據進行疊加信息提取,實驗區提供的抽樣調查樣地布設共238個,按照樣地空間定位為基準,分別與各年度森林資源調查數據實行空間位置疊加,提取應用分布示例數據。其中,1998年數據提取235個空間分布單元數據,2004年數據提取232個空間分布單元數據,2009年共提取出233個小班空間分布數據,2014年共提取186個與小班空間位置疊合的空間分布數據。
以提取空間單元數量最多的2009年森林資源空間分布為基礎,分別對1998年、2004年和2014年的空間數據進行疊加集成。經過分析可知,空間數據變化主要分為三種類型:空間信息合并、空間信息分割和空間重新劃分(圖3)。

圖3 空間數據多源集成不同尺度數據變化類型Fig. 3 Spatial data multi-source integration of different scales of data change types
空間數據合并是指多源數據經過多次調查后,同處一個空間層次上的森林資源主要空間信息因子重合度較高,歸并為一個森林資源空間區劃單位。在進行空間信息查詢時,空間區劃單位中所包含的森林資源調查信息中的優勢樹種、森林類別、林種等內容,進行多源信息相似度為100%。
空間數據分割是指一個森林資源小班由于進行政策干預或森林經營措施調整,開展更新、不同階段的規劃設計等工作,森林資源屬性產生較大變化,在原有小班邊界的基礎上,重新區劃為多個小班用以表現新的資源信息。
空間重新劃分是指更新度較為復雜的多個森林資源小班分布重新進行邊界劃分,并根據編碼規則,重新進行小班編號。空間單元屬性信息變化多樣,在空間尺度上無法直接從上一年度的資源調查數據中進行獲取。
多源森林資源空間數據集成是在數據空間分布區域及特性的基礎上,按照數據的業務空間層次進行差異性分析,利用集成機制,在空間尺度上實現不同信息渠道獲取的森林資源數據的有效統一??臻g數據集成是一個復雜的流程,是支持林業科學數據多層面專題信息的綜合,涉及的技術層面比較廣泛,諸如語義集成技術、共享集成技等。在“互聯網+”已漸漸融入到林業信息化建設的過程中,利用不同的時空集成模型,進行多源森林資源數據更準確的信息回溯與一體化分析,是未來將要推進的工作和研究的方向。伴隨著科學數據大批量的匯交,多業務類型、多專題的空間數據將是數據集成任務的重點,也將是林業和草原科學數據中心實現數據共享服務,開展空間數據有效集成探索的重點。