孫玉鑫 梁慶炎 陳勇明
(1. 廣東省國土資源測繪院, 廣東 廣州 510670;2. 自然資源部 華南熱帶亞熱帶自然資源監測重點實驗室, 廣東 廣州 510670)
紅樹林是生長在熱帶和亞熱帶地區,陸地和海洋交界的海岸潮間帶灘涂上生長的由木本植物組成的喬木和灌木林群落[1]。紅樹林作為一種獨特的實地植被類型,為鳥類、魚類以及海洋生物提供了豐富的食物和良好的棲息環境,在抵御海洋自然災害,維護海灣、河口生態環境,保護沿海實地多樣性方面具有不可替代的重要作用[2]。
傳統的實地調查方法獲取紅樹林物種信息費時費力,且調查工作往往難以深入根系繁茂的紅樹林內部[3]。相比而言,遙感技術更加經濟高效,能夠實現多時相且空間連續監測植被物種的構成[4]。目前,已有大量研究利用遙感技術對紅樹林物種進行識別或分類,中等空間分辨率的多光譜遙感衛星影像,如美國陸地衛星(Landsat)系列衛星、地球觀測衛星系統(systeme probatoire d’observation de la terre,SPOT)和哨兵2號(Sentinel-2)常用于識別地區、國家或全球尺度的紅樹林空間分布,QuickBird、IKONOS、WorldView和Pléiades-1等高空間分辨率多光譜遙感影像,憑借其豐富的空間幾何信息,逐漸用于紅樹林物種的分類研究[5]。
與光譜信息較少的多光譜衛星影像相比,高光譜遙感數據通常對樹種識別或分類更有效,因為它們包含了上百甚至上千個連續波段,具有與植物功能性狀(例如色素含量、比葉面積和氮含量等)相關的光譜細節信息[6]。高光譜數據已廣泛用于紅樹林及其他森林物種(例如溫帶森林、亞熱帶森林、熱帶雨林和城市樹木的分類[7-8]。無人機獲取的高光譜數據分辨率往往會更高,包含大量的光譜、紋理與結構特征信息[9]。如何處理高光譜圖像,識別混合像元中紅樹林的信息,避免錯分漏分是其中的重點難點[10]。為了解決混合像元的問題,需要將混合像元進行亞像元級別的分解[11]。本文基于支持向量機分類方法,引入像元解混技術進行紅樹林分類研究。
用無人機搭載納米高光譜成像儀獲取的南沙濕地公園高空間分辨率、高光譜分辨率影像,用作濕地公園局部區域的紅樹林亞種分類的源數據。
在南沙濕地公園內,開展實地調查,詳細記錄紅樹林基本分布情況,作為紅樹林分類結果的對照。使用手持地物光譜儀獲取的南沙濕地公園實地采樣點位數據和光譜數據作為采樣點光譜數據庫。根據實際調查情況,選擇一處紅樹林物種相對較多,環境影響較為復雜的典型區域,對該區域開展基于無人機高光譜影像的紅樹林樹種分類工作。
影像數據由大疆公司矩陣(Matrice)600專業型無人機搭載美國海德沃公司Nano-Hyperspec微型高光譜成像儀獲得,航高200 m,地面分辨率0.1 m,光譜分辨率2.23 nm,覆蓋光譜范圍400~1000 nm,包含有269個波段。實驗中使用的數據格式為像素按行存儲(band interleaved by line,BIL)。截取其大小為2000×2000像素的影像作為試驗區(圖1)。南沙濕地公園共二期工程,選取一期進行航飛,面積大約2 km2。影像主體部分位于一期中心,地物種類主要是蘆葦、木欖、秋茄、水黃皮、鐵冬青和水面。


圖1 開展紅樹林樹種分類的試驗區域
在實地調查中,在光照充足的情況下,采用手持光譜儀采集樹種的光譜曲線信息,考慮到其他植物、水體、土壤等周圍環境對光譜曲線的影響,同時采集周圍環境的光譜信息,為端元光譜提供參考。
根據實地調查數據對該區域每一個樹種采集樣本,并將采集到的樹種樣本對應到無人機影像中的對應區域,作為各樹種的參考樣本,并以參考樣本的光譜作為參考在全幅影像上均勻地選取一定數量的端元,得到各樹種的候選端元集合,如圖2所示。

圖2 端元制作示意圖
由于水域不是本文關注重點,采用掩膜法手工去除塊圖中的水域部分。
由于無人機拍攝時環境條件存在差異、拍攝時機身的擺動造成不同條帶光譜存在差異、條帶拼接時存在偏移等問題,對高光譜影像進行預處理,包括亮度轉換,反射率校正,幾何校正,再使用遙感圖像處理系統的專業鑲嵌(MosaicPro)模塊對校正結果進行拼接,根據先驗知識和影像各波段質量情況,去除部分波段后得到試驗區的完整塊圖。塊圖包含的波段信息如表1所示。

表1 試驗區影像波段信息
本實驗用到了以下技術方法:
(1)支持向量機(support vector machine,SVM)是一種基于統計學習理論的機器學習算法。它通過解算最優化問題,在高維特征空間中尋找最優分類超平面,從而解決復雜數據的分類及回歸問題[12]。支持向量機屬于一般化線性分類器,這種分類器的特點是他們能夠同時最小化經驗誤差與最大化幾何邊緣區,因此支持向量機也被稱為最大邊緣區分類器。
(2)光譜解混。受高光譜成像儀空間分辨率限制,以及紅樹林區域樹種混雜原因,一個像元內往往包含多個樹種,高光譜遙感圖像存在大量混合像元,對高光譜圖像的混合像元分解得到端元及豐度的過程,一般稱為像元的光譜解混。其中,端元代表圖像中存在的純物質,豐度代表某個像素中的每個端元所點的百分比[13]。
(3)多端元線性混合光譜分解。混合像元是高光譜圖像目標分類準確率降低的主要原因之一,因此不能直接進行基于像元的監督分類[14]。本文使用多端元線性混合光譜分解的方法,即光譜解混時對塊圖的每個像素進行像素級分類,從而得到反映每個像素內具有的樹種及其對應的比例的豐度圖。該豐度圖得到了單個像素內所具有的樹種及其對應的比例,在亞像元級別反映各樹種的分布,更符合真實的樹種分布。在此基礎上,考慮每個像素的最大豐度樹種和相鄰像素的情況,處理形成最終合理的分類結果。
(4)混淆矩陣算法。混淆矩陣算法是現在國際上比較通用的遙感影像分類精度評價方法,在圖像精度評價中,通過將每個實測像元的類別與分類成果圖像中的同一位置的像元類別相比較計算得到[15]。分類情況一般分為4種,如表2所示。

表2 混淆矩陣分類信息表
PT、NF、PF、NF表示:
PT為真的正樣本(true positives,TP)=【正樣本】被正確分為【正樣本】
NT為真的負樣本(true negatives,TN)=【負樣本】被正確分為【負樣本】
PF為假的正樣本(false positives,FP)=【負樣本】被錯誤分為【正樣本】
NF為假的負樣本(false negatives,FN)=【正樣本】被錯誤分為【負樣本】
總體分類準確率(Accuracy)計算公式見式(1)。
基于以上技術方法和建立的端元光譜庫,本文對試驗區紅樹林樹種開展分類工作。
對于支持向量機分類部分,本文將端元光譜庫的樣本直接采用為監督分類的樣本,具體包括蘆葦、木欖、秋茄、水黃皮、鐵冬青。再根據傳統的支持向量機分類模型對預處理后的塊圖執行監督分類,使用傳統的分類方法直接對每個像元賦予了樹種類別,得到支持向量機分類結果。分類結果如圖3所示。

圖3 支持向量機分類結果示意圖
由于傳統的分類方法直接對每個像元賦予特定的類別,但在紅樹林區域是不合理的。在前面的數據基礎上,通過多端元線性混合光譜分解得到各樹種類別的豐度圖,再進一步處理形成分類結果,如圖4所示。

圖4 解混分類結果示意圖
在進行精度評價前,本文根據實地調查情況,制作了樹種總體分布概況示意圖(圖5),作為分類結果的對照。由于試驗區紅樹林空間分布復雜,局部區域不存在只有單一植被的情況,且混雜程度不一,分布圖僅描繪了不同區域的優勢樹種,不排除存在其他植被的可能性。因此,不能直接使用分布圖進行精度評定。

圖5 樹種總體分布概況示意圖
考慮到分布圖的局限性,實驗在充分參考樹種分布概況的前提下,根據紋理、色彩、大小、陰影等特征、直接在影像上采集樣本,作為像元類別實測數據,再分別統計支持向量機分類結果和解混分類結果,形成混淆矩陣,如表3、表4所示。

表3 支持向量機結果混淆矩陣

表4 解混結果混淆矩陣
根據支持向量機分類結果和解混分類結果的混淆矩陣,計算兩種分類方法的總體分類精度,結果如表5所示。

表5 總體精度評價 單位:%
將分類結果與實地調查數據對比,除去個別區域植被繁雜、周圍環境干擾使產生的混合像元難以解混,以及“同物異譜”或“同譜異物”的現象存在,造成部分樹種分類與實際有出入之外,兩種分類結果總體上與實地調查中紅樹林樹種分布的情況基本一致。其中,支持向量機分類總體精度達到80.88%,光譜解混后分類精度進一步達到83.93%。可以看到,在基于無人機高光譜影像的樹種識別中,解混和支持向量機方法都能較好地識別出紅樹林的樹種,總體精度都達到了80%以上。相比于支持向量機分類方法,在近水形成的紅樹林混交區域,解混方法在紅樹林混交區域總體上表現更好,能夠在一定程度上提高紅樹林的分類精度。
在本實驗中,存在不少未能識別成功的區域,經分析影像質量發現,這些區域除了少數是其他植被之外,大部分為陰影、水體附近等影像特征信息較少的區域。光譜解混方法明顯提升了木欖、蘆葦、鐵冬青的分類精度,但在水黃皮、秋茄分類中不占優勢,究其原因:①秋茄和水黃皮之間的波形及反射率值十分相近,在分類時容易錯分;②秋茄本身植株矮小,光譜特征受其他植株影響較大,干擾光譜解混的豐度計算,影響最終分類。
本次實驗進行了大量的紅樹林高光譜數據獲取和處理工作,積累了一些寶貴的經驗。
(1)紅樹林生長區域樹種空間混雜,混合像元眾多,為保證分類準確性,樹種的光譜信息宜優先實地采樣獲取。
(2)對紅樹林樹種分類時不能直接根據像元劃分樹種,必須對像元進行光譜解混,才能得到更接近于真實的分類結果。
(3)高質量的影像數據是實現準確分類不可忽視的重要前提條件。
(4)高光譜影像具有超高的光譜分辨率,能夠反映出不同樹種間的光譜差異,為不同樹種分類提供可能,但仍有部分樹種間的光譜差異十分細微,它們的波形及反射率值都很相近,像元解混存在困難,容易造成錯分,需要進一步研究更有效的分類方法。
總的來說,像元解混是一項行之有效的技術方法,能夠明顯提高目標分類精度,基于高光譜影像進行樹種監督分類的技術手段較為成熟,有著非常廣闊的應用前景[16]。