李雨秦,左小清,李洪忠
(1. 昆明理工大學 國土資源工程學院;2. 中國科學院 深圳先進技術研究院)
紅樹林以有效地防浪護堤,凈化海水,預防赤潮發(fā)生,其具有結構的復雜性,物種的多樣性,生產(chǎn)力的高效性,具有獨特的生態(tài)功能和重大的社會經(jīng)濟價值。而紅樹林可持續(xù)保護需要更好地監(jiān)測紅樹林的演替、分布等動態(tài)信息和結構,因此需要迅速和精準的繪圖,遙感技術的發(fā)展為滿足這一需求提供了可能。
Verheyden等[1]在對斯里蘭卡紅樹林地區(qū)航空攝影照片的目視解譯中,識別出單個樹木的圖像屬性以及物種組合,研究了航空攝影在高分辨率紅樹林植被動態(tài)監(jiān)測中的適用性,結果表明航空照片適用于繪制以屬為基礎的植被地圖。Wang Le[2]等對比使用IKONOS和QuickBird影像,采用最大似然法對巴拿馬的加勒比海岸的三種紅樹林樹種進行了分類,結果顯示二者在紅樹林物種分類領域均獲得了較為期待的結果,并且分類精度均達到了制圖要求。唐煥麗等[3]基于 WorldView-2影像數(shù)據(jù),對比了基于支持向量機的單一尺度和多尺度的面向對象分類方法,結果表明與單一尺度分類方法相比,多尺度分類方法的分類精度更高。
樹木種間分類對于遙感數(shù)據(jù)分辨率要求較高,因此具有更高的空間分辨率和光譜分辨率的影像數(shù)據(jù)可以提供更為精細的紅樹林樹種種間分類結果[4-6]。本文以 WorldView-2多光譜遙感影像數(shù)據(jù)為數(shù)據(jù)源,結合野外實地采樣樣點,對比分析了人工神經(jīng)網(wǎng)絡、支持向量機和隨機森林三種常用的分類方法的適用性,為后續(xù)高分辨率遙感影像的紅樹林中間分類提供參考。
深圳灣是香港和深圳市之間的一個海灣,準確位置介乎中國香港新界西北部和中國廣東省深圳市南山區(qū)的東部對開海域,位于元朗平原以西、蛇口以東。本研究區(qū)為深圳灣紅樹林自然保護區(qū),位于深圳灣北東岸深圳河口的紅樹林鳥類自然保護區(qū)之中,包括福田自然保護區(qū)和米埔自然保護區(qū)(具體位置如圖1所示)。
本文所用數(shù)據(jù)為分辨率為2 m的WorldView-2多光譜遙感影像數(shù)據(jù)(詳細波段參數(shù)見下表)以及野外實地采樣的樣點數(shù)據(jù)。樣點數(shù)據(jù)的由野外實地采樣獲取,采樣時間為2016年下半年,樣地的地理位置由使用手持GPS獲得的樣地中心經(jīng)緯度確定。

圖1 研究區(qū)位置示意圖(左圖取自谷歌地球)Fig.1 Schematic diagram of the location of the study area (the left picture is taken from Google earth)

表1 WorldView-2數(shù)據(jù)參數(shù)Tab.1 Brief introduction about satellite data of WorldView-2 imagery
遙感數(shù)據(jù)的預處理主要包括輻射定標、大氣校正、幾何校正、正射校正等過程。輻射定標將遙感影像的數(shù)字量化值(DN)轉化為大氣表觀輻射亮度值等物理量。大氣校正消除大氣影響造成的輻射誤差,反演地物真實的地表反射率,將表觀輻射亮度數(shù)據(jù)轉換為地表反射率數(shù)據(jù)。正射校正是幾何校正的最高級別,一般所說的幾何校正是消除因大氣傳輸、傳感器本身、地球曲率等因素造成的幾何畸變,主要糾正或者賦予影像平面坐標。正射校正除了進行常規(guī)的幾何校正的功能外,還要根據(jù) DEM 來糾正影像因地形起伏而產(chǎn)生的畸變,會給圖像加上高程信息。本文所使用的 WorldView-2遙感影像數(shù)據(jù)主要進行了輻射校正、幾何校正等預處理工作,均利用ENVI5.3中預處理工具進行。
本研究選用了人工神經(jīng)網(wǎng)絡、支持向量機和隨機森林三種分類方法對 WorldView-2遙感影像數(shù)據(jù)進行分類處理(均使用ENVI5.3軟件進行處理)。
人工神經(jīng)網(wǎng)絡,簡稱為神經(jīng)網(wǎng)絡(NNs),它模仿人腦的神經(jīng)網(wǎng)絡,進行分布式并行信息處理。這種網(wǎng)絡靠著系統(tǒng)的復雜程度,通過多層的神經(jīng)網(wǎng)絡,無限逼近真實的對應函數(shù),進而處理信息、模擬數(shù)據(jù)之間的真實關系。滕駿華等[7]通過人工神經(jīng)網(wǎng)絡分類方法將紅樹林群落信息分類并繪成專題圖。梁益同等[8]應用神經(jīng)網(wǎng)絡對NOAA衛(wèi)星圖像進行分類的基本原理和方法,并進行了實例分析,結果證明了該方法的有效性。李四海等[9]為了探討中巴資源衛(wèi)星數(shù)據(jù)在紅樹林資源調查中的應用能力,采用神經(jīng)網(wǎng)絡分類法進行分類處理,并獲得精度較高的分類結果。劉凱等[10]將TM圖像與SAR圖像相融合,應用神經(jīng)網(wǎng)絡分類法進行分類,并取得較好結果。王祥等[11]用神經(jīng)網(wǎng)絡法對廣西山口紅樹林保護區(qū)的Landsat TM衛(wèi)星圖像進行分類,并最終獲取紅樹林生態(tài)系統(tǒng)的景觀格局指標。
支持向量機,簡稱SVM,由早期工作來自前蘇聯(lián)學者Vladimir N. Vapnik和Alexander Y. Lerner在1963年發(fā)表的研究[12]。支持向量機是以監(jiān)督學習的方式進行二元分類的廣義線性分類器,是對線性分類器的改進,目的是找出最大邊距超平面。其主要思想是通過升維,將線性不可分的情況轉變?yōu)榫€性可分,進而基于結構風險最小化在特征空間中構造超平面。因此,對于高維模式識別、樣本數(shù)據(jù)線性不可分等情況,支持向量機相對于問題的復雜度,需要的樣本較少且結果較優(yōu)[13]。本實驗核函數(shù)選用徑向基函數(shù),是支持向量機最常用的一種核函數(shù)。周磊等[14]基于1990-2016年6個時期Landsat TM/OLI中等分辨率衛(wèi)星遙感影像數(shù)據(jù),采用支持向量機方法的孟加拉國海岸帶紅樹林遙感監(jiān)測,最終給出了 6個時期改區(qū)域紅樹林空間分布狀況,分析了紅樹林30年間的演變趨勢。
隨機森林,簡稱RF,一種將多顆決策樹集成的算法。它由Leo Breiman和Adele Cutler于1995年提出[15]。隨機森林以決策樹為基本單位,通過決策樹的投票來決定最后的分類結果。它重視各個特征在分類問題上的重要性,可以有效減少決策樹過擬合的不足,提升泛化能力,能夠有效地運用在大數(shù)據(jù)集上。不需要對高維特征的輸入樣本進行降維,對部分特征缺失不敏感,且具有極好的準確率。本研究使用了 ENVI拓展隨機森林工具(源碼來源于ENMAP-BOX v2.1.1并對其進行封裝,方便其在ENVI下使用)[16],選用基尼系數(shù)作為節(jié)點特征選取的判定標準,通過計算平方根確定每個節(jié)點備選特征的數(shù)量,設置100棵樹進行投票,確定最終結果。Romie Jhonnerie等[17]曾基于Landsat 5 TM和ALOS PALSAR圖像,采用隨機森林分類法對紅樹林植被進行分類,結果顯示,隨機森林分類器總體精度及Kappa系數(shù)分別為81.1%和0.76,優(yōu)于最大似然分類器分類結果的精度。
下圖為WorldView-2遙感影像數(shù)據(jù)分別使用三種分類方法的分類結果對比。對群落分布結果進行目視解譯,可以發(fā)現(xiàn)神經(jīng)網(wǎng)絡、支持向量機與隨機森林分類法的群落分布狀況基本相同。秋茄和桐花樹分布最為廣泛,幾乎遍布整個研究區(qū);海桑集中分布于研究區(qū)西北角以及沿海區(qū)域;老鼠簕與白骨壤分布較為隨機,并且十分分散。就無瓣海桑而言,神經(jīng)網(wǎng)絡分類法(圖 2(a))與隨機森林分類法(圖 2(b))的結果較為一致:集中分布于中部;而與隨機森林分類法(圖2(c))呈現(xiàn)的結果則顯示研究區(qū)內存在更多的無瓣海桑與海桑的混生群落,幾乎無無瓣海桑的單一群落。

圖2 三種分類方法的分類結果Fig.2 Classification results of the three classification methods
結果顯示(表2),隨機森林分類法的分類結果中,總體精度為73.6842%,高出神經(jīng)網(wǎng)絡分類法5.26個百分點,高出支持向量機分類法6.3個百分點;Kappa系數(shù)為0.6780,高出神經(jīng)網(wǎng)絡分類法0.064,高出支持向量機分類法0.083。說明在基于WorldView-2多光譜遙感影像數(shù)據(jù)的紅樹林樹種分類實驗中,隨機森林分類法較神經(jīng)網(wǎng)絡和支持向量機分類法能夠有效地提高分類精度。

表2 三種分類方法的混淆矩陣Tab.2 Confusion matrix of the three classification methods
從上表可以看出,使用神經(jīng)網(wǎng)絡分類法時(表2(a)),桐花樹的生產(chǎn)者精度最佳,老鼠簕的用戶精度最佳,但是存在較多的老鼠簕被誤分為桐花樹。使用支持向量機分類法時(表2(b)),桐花樹的生產(chǎn)者精度最佳,白骨壤和無瓣海桑的用戶精度最佳。使用隨機森林分類法時(表2(c)),桐花樹的生產(chǎn)者精度最佳,秋茄的用戶精度最佳。而三種方法中白骨壤的用戶精度和生產(chǎn)者精度均為最低。由于研究區(qū)內存在大量兩種以及兩種以上紅樹林樹種的混生群落,生長邊界不清晰,極大地增大了識別的難度,而由于采樣條件的限制,不同樹種的樣本數(shù)量有較大差別,這些因素在一定程度上都會對分類結果造成影響。
本研究以深圳灣的深圳福田自然保護區(qū)和香港米埔自然保護區(qū)為研究區(qū)域,以該地區(qū)的紅樹林為研究對象,通過梳理國內外關于樹種分類相關研究內容,借助ENVI5.3、ArcGIS10.2軟件,分別分析了三種分類方法紅樹林種間分類中的適用性。結果顯示:神經(jīng)網(wǎng)絡、支持向量機與隨機森林分類法的群落分布狀況基本相同,但隨機森林分類法的總體精度和Kappa系數(shù)明顯高于神經(jīng)網(wǎng)絡分類法和支持向量機分類法,即在基于 WorldView-2多光譜遙感影像數(shù)據(jù)的紅樹林樹種分類實驗中,隨機森林分類法較神經(jīng)網(wǎng)絡和支持向量機分類法能夠有效地提高分類精度。
本研究還存在一些不足,需要后續(xù)進一步完善:本文選取的分類方法對于混生群落的分類精度偏低,對過于分散的零星樹種識別度較差。樣本數(shù)量不均衡可能會給分類結果帶來偏差,后續(xù)有條件可新增實地采樣樣點以進一步完善實驗內容。