高志宏,周 旭,程 滔
(國家基礎地理信息中心,北京100830)
地理國情是指那些與地理相關的自然和人文要素的國情,是基本國情的重要組成部分。地理國情從空間角度反映一個國家自然、經濟、人文的狀況,包括國土疆域概況、地理區域特征、地形地貌特征、道路交通網絡、江河湖海分布、土地利用與土地覆蓋、城市布局和城鎮化擴張、孕災環境與災害分布、環境與生態狀況、生產力空間布局等基本情況。開展地理國情普查,可以全面獲取地理國情信息,掌握我國地表自然、生態及人類活動的基本情況,分析其空間分布、基本特征及其相互關系,為開展常態化地理國情監測奠定基礎[1-5]。
地表覆蓋狀態是自然和人文要素共同作用的結果,最能直觀反映地球表層的信息,對地表覆蓋進行普查則能得出各種地理國情的基本狀況[6-8]。因此,地表覆蓋狀態的準確、高效分類對地理國情普查工作的順利開展十分關鍵。地表覆蓋物具有發射、吸收和反射電磁波的特性并隨波長而變化,遙感傳感器能夠獲取和記錄地物發射或反射的電磁波譜特征,因此基于遙感影像可以識別不同的地物[9]。遙感影像分類即是將遙感影像中的像元劃歸到實際地物類別中的過程[10]。遙感技術的新方法、新思想不斷出現,從目視判讀、計算機自動解譯和人機交互等環節不斷提高遙感影像分類的精度和水平;同時分類思想也從基于多光譜像元向基于多尺度面向對象轉變[11-14]。目前,地理國情普查主要依據高分辨率影像數據源開展地表覆蓋解譯與分類。高分辨率遙感影像光譜特征明顯且地物紋理、形狀等信息豐富,然而隨著影像分辨率的提高,也對遙感影像分類的精細程度、方法和精度提出了新的要求。根據地理國情普查前期試點和目前的工作,發現在實際的數據采集過程中存在部分解譯困難和分類精度較低的問題,特別是一些地表覆蓋類型之間的混淆分類現象較為嚴重,導致總體分類精度低、效率不高等問題出現。
本文主要針對實際數據采集過程中存在的混分問題,通過專門的數據收集軟件工具,廣泛收集地表覆蓋分類方面的典型樣例和問題,從一級類內部混淆和跨一級類混淆兩個方面統計容易混淆的類型。同時,基于統計結果進行關聯分析,探討了容易混淆地表覆蓋類型形成的原因和規律,并給出了提高分類精度的建議。本文研究結果可直接服務于地理國情普查工作的開展,為提高地表覆蓋分類精度提供科學參考。
地表覆蓋及變化研究是相對于一定的地表覆蓋分類體系而言的。針對地理國情普查的內容與目標要求,參考現有的國家技術標準和行業技術規范,參照目前國內外已公布的、應用較廣泛的地表覆蓋分類體系,同時綜合考慮了不同行業應用的需求,綜合構建了面向地理國情普查的地表覆蓋分類體系。此分類體系將地表覆蓋分為3個層級,包括耕地、園地、林地、草地、房屋建筑(區)、道路、構筑物、人工堆掘地、荒漠與裸露地表、水域共10個一級類;在此基礎上細分的二級類有46個,部分二級類包含相應的三級類[15]。
根據地表覆蓋的分類體系,并結合具體工作中存在的實際問題,本文首先通過開展實際工作的各個省市獲取典型統計樣本,然后在此基礎上進行處理、整理和統計,最后開展相關關聯分析并給出結論和建議。具體的流程方法如圖1所示。

圖1 技術流程
為了全面、系統、快速有效地收集地理國情普查實際工作中存在的樣例和問題,本研究開發了相應的地理國情普查數據采集樣例與問題收集軟件(EQsub),該軟件包括樣例與問題錄入、樣例與問題庫合并、樣例與問題審核、樣例與問題庫提交確認與導出、樣例與問題處理反饋、反饋樣例與問題庫導出共6個功能模塊,軟件的主界面如圖2所示。通過該軟件收集全國24個省(自治區、直轄市)的1409條樣本作為本文研究的基礎。根據初步提交的樣本,組織技術支持專家對樣本逐個進行集中研討與處理分析,得到有效樣本1311條,作為后續統計與分析的基礎樣本。

圖2 地理國情普查數據采集樣例與問題收集軟件主界面
基于1311條樣本進行容易混分類型的統計,發現地表覆蓋中容易混分的情況共計94組,具體包括一級類內部各類型之間的混分36組,跨一級類的類型混分情況58組。其中,一級類內部混分的情況中,各類型混分數量分別為:耕地1組、園地2組、林地7組、草地5組、構筑物15組(其中硬化地表的三級類之間的混淆12組)、荒漠與裸露地表4組、水域2組。為了能較好地反映不同地物類型混淆的整體情況,分別對一級類內部混分和跨一級類的類型混分兩種情況開展關聯分析,得到如圖3和圖4所示的關聯分析結果圖。根據圖3可以發現構筑物(0700)內部混分的情況最為嚴重,主要是其二級類硬化地表(0710)的三級類之間混淆。根據提交的樣本和混淆類型的定義與特征,硬化地表三級類的混淆原因主要是地類光譜特征相似性強和作業員對定義的理解差錯。園地(0200)、林地(0300)、草地(0400)和荒漠與裸露地表(0900)4種地表覆蓋類型的光譜特征較為相似,是導致各類內部二級類和三級類混淆的主要原因。耕地(0100)和水域(1000)內部覆蓋類型的混淆主要是由于對采集要求的把握不準確造成的。圖4反映了容易混分地表覆蓋類型中跨大類的混淆情況,如圖中所示,旱地(0120)是最容易跨大類混分的類型;其次是天然草地(0410)及其三級類(0411、0412、0413)、林地(0300)、房屋建筑(區)(0500)混分比較突出;此外硬化地表(0710)、其他人工堆掘地(0890)、苗圃(0250)、泥土地表(0920)、路面(0601)以及水面(1001)等在有些情況下也容易跨一級類與其他類型混分。圖4表明跨大類混分的情況整體上比一級類內部混分嚴重,分析不同類型具體的統計樣本,發現由于地物類型光譜特征相似導致的混分較少,定義理解差錯、采集指標不明確、圖斑歸并方式錯誤、立體覆蓋處理原則不明確等因素是造成跨大類混分的主要原因。需要說明的是,上述相互關聯、容易跨大類混分的類型并非在任何情況下都容易混分,只有在某些特定情況下才會出現。

圖3 一級類內部混分關聯分析圖

圖4 跨一級類的類型混分關聯分析圖
通過對樣本的處理、統計和分析,發現造成一些地表覆蓋容易混淆的原因是多方面的,并非所有容易混分類型的錯誤分類都難以避免。為了提高地理國情普查地表覆蓋分類的精度,可以從如下幾個方面入手:首先,應該加強培訓,提高對不同地表覆蓋類型定義和采集要求的認識,盡量避免人為因素導致的分類錯誤;其次,一些地表覆蓋類型的影像光譜特征較為相似,僅從影像光譜特征判斷分類精度較低,解譯時應該結合地物周邊環境和所在地理區域特點進行綜合判讀;最后,應加強對其他輔助資料的收集和利用,豐富數據源資料,提高分類精度。此外,對于一些覆蓋種類簡單、地物圖斑均質性較好的區域可以結合計算機自動分類的方法進行綜合解譯,一方面可以提高分類精度,另一方面也可以提高工作效率。總的來說,上述容易混分的地表覆蓋類型在實際分類工作中需要重點注意,可以綜合利用各種行業權威數據資料和多種方法減少混分的類型和數量,從而提高地表覆蓋分類的精度。同時,在實際的過程質量檢查工作中,上述容易混分的地表覆蓋類型也應重點關注,從而在過程中及時發現錯誤,提高地理國情普查數據的最終成果質量。
地理國情普查是新形勢下測繪地理信息領域一項新的重大工作,是下一步開展地理國情監測的基礎。目前,我國地理國情普查工作剛剛起步,地表覆蓋分類是其中重要的基礎工作之一,相關的研究分析工作還較少。本文面向地理國情普查中地表覆蓋分類中面臨的實際問題,重點研究了其中容易混分的覆蓋類型,基于統計分析給出具體的容易混分類型94組,同時從一級類內部混淆和跨一級類混淆兩個角度進行了關聯分析,發現并非所有容易混分的情況都難以避免。通過提高作業水平、豐富數據資料和改進工作方法可以降低混分的比例,提高地理國情普查數據成果的精度和質量。
[1] 陳俊勇.地理國情監測的學習札記[J].測繪學報,2012,41(5):633-635.
[2] 徐德明.開展地理國情普查 服務經濟社會發展[N].中國測繪報,2013-03-12(1).
[3] 李志剛.淺談國情地理國情與地理[N].中國測繪報,2011-03-11(3).
[4] 史文中,秦昆,陳江平,等.可靠性地理國情動態監測的理論與關鍵技術探討[J].科學通報,2012,57(24):2239-2248.
[5] 李德仁,眭海剛,單杰.論地理國情監測的技術支撐[J].武漢大學學報:信息科學版,2012,37(5):505-512.
[6] 程滔,周旭,劉若梅.面向地理國情監測的地表覆蓋信息提取方法[J].測繪通報,2013(8):84-86.
[7] 宮攀.中國土地覆蓋分類研究[M].北京:經濟科學出版社,2012.
[8] 赫英明,王漢杰,張洪峰.遙感數據的土地覆蓋分類[J].解放軍理工大學學報:自然科學版,2011,12(3):294-300.
[9] 蔡紅艷,張樹文,張宇博.全球環境變化視角下的土地覆蓋分類系統研究綜述[J].遙感技術與應用,2010,25(1):161-167.
[10] 白穆,劉慧平,喬瑜,等.高分辨率遙感圖像分類方法在LUCC中的研究進展[J].國土資源遙感,2010(1):19-23.
[11] 陳忠.高分辨率遙感圖像分類技術研究[D].北京:中國科學院研究生院,2006.
[12] 陳杰,鄧敏,肖鵬峰,等.結合支持向量機與粒度計算的高分辨率遙感影像面向對象分類[J].測繪學報,2011,40(2):135-141.
[13] 陳晨,張友靜.基于多尺度紋理和光譜信息的SVM分類研究[J].測繪科學,2009(1):29-31.
[14] 鄧媛媛,巫兆聰,易俐娜,等.面向對象的高分辨率影像農用地分類[J].國土資源遙感,2010(4):117-121.
[15] 國務院第一次全國地理國情普查領導小組辦公室.第一次全國地理國情普查培訓教材之1·地理國情普查內容與指標[M].北京:測繪出版社,2013.