穆亞南, 丁麗霞, 李 楠, 陸琳瑩, 吳 明
(1.浙江農林大學 省部共建亞熱帶森林培育國家重點實驗室,浙江 杭州,311300;2.浙江農林大學 浙江省森林生態系統碳循環與固碳減排重點實驗室,浙江 杭州 311300;3.浙江農林大學 環境與資源學院,浙江 杭州311300;4.南京林業大學 生物與環境學院,江蘇 南京210037;5.中國林業科學研究院亞熱帶林業研究所,浙江杭州311400)
濕地為全球三大生態系統之一,因其穩定環境、保護物種基因和提供資源等功能而被稱為 “地球之腎” “生物基因庫”和 “人類搖籃”[1]。濕地植被作為濕地的重要組成部分,在濕地生態系統中發揮著促淤、凈化水環境、為鳥類和魚類提供食物等關鍵性作用[2],其分布狀況反映出濕地的水質、土壤等分布特征和健康信息[2]。杭州灣是中國濱海濕地的南北分界線,物種、群落和生境多樣性豐富,代表了中北亞熱帶過渡濕地類型的動植物區系[3]。因此,詳細了解和掌握該區濕地植被的分布狀況有助于正確認識并發揮濕地的資源優勢和生態屏障作用,同時,也可為濕地植被恢復技術和區域生物多樣性及其形成機制研究提供數據支持。傳統的實地調查方法耗時費力、更新速度慢且無法實現大范圍動態監測。基于遙感技術提取濕地植被信息逐漸成為濕地研究的熱點。在遙感分類方法方面,面向對象、支持向量機、決策樹模型、神經網絡等方法被廣泛應用,如WANG等[4]通過北京1號小衛星數據提取時間序列歸一化植被指數(normalized difference vegetation index,NDVI)和植被水分指數(vegetation-water index,VWI), 采用可支持向量機(support vector machine,SVM)實現了鄱陽湖濕地植被功能型分類。在濕地植被的提取結果方面,植被劃分大多不精細或是只提取單一植被類型,如張雪紅[5]基于Landsat-8數據構建決策樹模型,有效提取出紅樹林的分布信息。近年來,隨著高分辨率和高光譜影像普及,越來越多高質量的遙感影像被用于濕地植被信息提取,如DECHKA等[6]基于IKONOS影像進行紋理特征和NDVI分析,通過線性判別和無監督ISODATA算法獲取濕地植被群落信息。徐菲楠等[7]基于QuickBird影像,利用地物光譜、植被指數、紋理特征通過模糊分類法提取額濟納綠洲的主要植被覆蓋類型。李明澤等[8]基于高光譜數據用光譜角制圖(spectral angle mapping,SAM)方法得到扎龍濕地的6種典型植被分布狀況。ZHANG等[9]利用面向對象方法分析Hyperion數據并經過機器學習分類,識別出南佛羅里達州Kissimmee河谷濕地的14種植被群落。總體來看,隨著遙感數據日益多樣化,濕地植被提取研究日趨深化,研究方法逐漸由基于像元向面向對象轉變、植被分類提取也更加精細。高分辨率影像與面向對象分析方法結合不僅在較大程度上解決了基于像元的傳統方法難以克服的光譜混淆、混合像元等問題,而且能充分挖掘影像的紋理與形狀信息,有利于提高分類精度[10-12]。而隨機森林算法是基于決策樹的新型機器學習算法,因其分類精度優、運算速度快和算法穩定等特點而被廣泛應用[13-14]。目前,基于高分影像將2種方法結合應用到濱海濕地植被分類上的研究鮮有報道。本研究以杭州灣南岸QuickBird影像和野外調查數據為數據源,在QuickBird影像最優分割尺度的基礎上將面向對象分析與隨機森林模型相結合,高精度地提取濕地植被信息。
杭州灣濱海濕地類型以淺海水域和潮間淤泥海灘為主。研究區(30°16′32.98″N~30°21′59.99″N,121°4′36.91″E~121°10′52.05″E)是杭州灣南岸灘涂淤漲最快的區段之一, 也是圍墾利用最為突出的區段之一。該區域濕地具有調節氣候、凈化環境、調蓄洪水、保護海岸線和維護生物多樣性等多種生態功能[15](圖1)。研究區主要土地利用類型有耕地、水體、不透水地表、田埂等;濕地植被主要有蘆葦Phragmites communis,海三棱藨草Scirpus mariqueter,互花米草Spartina alterniflora,南方堿蓬Suaeda australis等[16]。

圖1 研究區地理位置Figure 1 Location of the study area
2.1.1 數據來源與預處理 遙感數據為2013年9月4日9:29的QuickBird影像,云量為0.7%,為退潮時刻,潮高僅145 cm,空間分辨率高(全色波段0.6 m)。由于遙感數據獲取時存在誤差,對所采用的影像進行輻射校正,主要是輻射定標和大氣校正,來消除依附于輻射亮度的各種失真。為增強圖像分辨率,選用Gram-schmidt方法對全色波段與多光譜波段進行了融合,較好地保持影像的紋理和光譜信息。
2.1.2 樣本數據 通過野外實地考察,建立影像判讀標志,運用目視解譯方法在最優分割結果的圖像上,隨機選擇對象作為訓練樣本。為便于植被信息提取,結合中國科學院土地利用遙感監測分類系統[17],將研究區土地覆蓋分為蘆葦、海三棱藨草、互花米草、南方堿蓬、人工植被、光灘、耕地、水體、不透水地表、田埂、其他等共11類地物,各地物樣本個數分別為56,82,15,8,71,188,143,555,76, 29, 13個。
2.2.1 圖像分割 在圖像預處理的基礎上,借助eCognition Developer 8.9軟件對QuickBird影像進行分割,對比自上而下的棋盤分割和四叉樹分割易產生正方形對象,選用符合實際且被廣泛應用的多尺度分割。多尺度分割算法是一種自下而上的分割算法,從單個像元開始向上逐漸合并成較大的對象,直到滿足所設置的異質性閾值為止。異質性閾值是由用戶設定以衡量形狀/顏色和緊致度/平滑度的權重參數??紤]到光譜在植被信息提取中重要作用以及緊致度的不敏感性,定義形狀顏色權重參數分別為0.1和0.9,緊致度和平滑度均為0.5,分割尺度的范圍為[20,200],并以步長10進行多次分割。對19次的多尺度分割的結果分別計算并導出每個對象的光譜均值、方差及面積,便于下一步評價最優分割尺度。
2.2.2 最優分割尺度計算模型 目前評價最優尺度的方法主要有3種:一是憑借經驗,這種方法具有一定的主觀性;二是選取尺度鑒別指標,但往往會強調某個因素的作用;三是構建最優分割尺度計算模型,這種方法是從對象內的同質性和對象間的異質性來判斷分割的質量,是一種全局最優判斷方法[18]。故本研究根據JOHNSON等[19]研究理論,利用近紅外、紅、綠3個波段對研究區QuickBird影像多尺度分割的結果進行定量化計算,得到度量對象內差異性的加權方差(weighted variance,wVar)和度量對象間整體相似度的全局Moran指數(Moran’s index,MI),全局評分(global score,GS)以及平均全局評分(average global score,AGS)。JOHNSON等[19]證明了平均全局評分最低的分割尺度是加權方差和空間自相關的最低組合,可被定義為最優分割尺度。

表1 對象的光譜、形狀、紋理特征匯總說明Table 1 Spectral,shape and texture features of the object

表2 對象各種指數說明Table 2 Object of a variety of index instructions
光譜、紋理、形狀、位置等特征值是區分不同地物的重要變量。通過eCognition Developer 8.9導出最優分割尺度下對象層中每個對象的各類特征值變量(表1~2),組成一個數據集。光譜特征是遙感圖像分類的最主要特征,除利用對象的各個波段均值和標準差這2個變量以外,還考慮近紅外和紅外波段是植被光譜特征的敏感波段,藍、綠和紅波段在提取水體上具有較好的效果,故在濱海濕地植被分類中多基于上述波段構建特征變量, 如歸一化植被指數(NDVI)[20], 歸一化差值濕度指數(NDWI)[21], 比值植被指數(RVI)[22]和土壤調整植被指數(SAVI)等[23-24]。 紋理提取的方法主要有基于統計描述、 基于小波變換、基于應用分形理論以及基于地統計學4種方法[25]。其中,基于統計描述的灰度共生矩陣(grey-level cooccurrence matrix,GLCM)被證明在植被分類中發揮著重要作用[26-27]。故選取灰度共生矩陣算法來提取對象的紋理信息。幾何屬性主要描述對象的形狀和大小,研究區內覆蓋著大量幾何特征較規則的水產養殖塘和耕地,提取幾何特征變量將有助于分類精度的提高。位置屬性是指對象的中心點坐標以及到圖像邊框的距離,研究區內的地物類型大多與海岸線的位置相關,故提取對象的位置信息。
隨機森林模型是基于決策樹的新型機器學習算法。先從原始數據集中有放回地抽取N個新訓練集,抽取數量約為原始數據集的2/3,并在新訓練集中隨機抽取K個屬性生產決策樹。最后,集合N棵決策樹的預測結果,采用投票的方式決定新樣本的類別,利用每次抽樣未被抽到的1/3數據可估計內部誤差[31]。在許多機器學習算法中,隨機森林具有以下3個特點和優勢:一是分類表現優異,能在未做特征選取和刪除的條件下處理大數據;二是人工干預很少,通常不需要做數據預處理,能根據數據自行確定所用特征;三是運算速度快,易于做并行化處理。將最優分割尺度下提取的數據集和準備好的樣本對象在 WEKA(Waikato environment for knowledge analysis)[32]軟件中進行基于隨機森林模型分類。 張曉羽等[33]研究證明:隨機森林參數設置對分類精度影響不敏感,故本研究使用默認參數建立隨機森林模型。
在ArcMap10.2中對每種類型分層創建至少30個隨機點并在原始QuickBird圖像上目視解譯生成420個驗證點。將驗證結果與分類結果對比分析,由此得出混淆矩陣,并計算出制圖精度、用戶精度、總體精度和Kappa系數來評價此分類方法在濱海濕地植被分類中的精度。
從圖2可以看出:同一區域,隨著分割尺度的增大,分割的對象數量越來越少,而對象的數量直接影響運算速度和分類精度。當分割尺度太低時,對象數量大幅度增加,運算的速度將大大減慢。相反,當分割尺度太高時,對象數量減少,易造成不同地物分割為一個對象,從而降低分類精度。因此,對多尺度分割結果進行定量評價,找到最優分割尺度尤為重要。

圖2 研究區局部不同尺度的分割結果對比Figure 2 Comparison of the segmentation results of different scales in the study area
從圖3A和圖3B可知:隨著分割尺度的增加,加權方差愈來愈大而全局Moran指數呈遞減趨勢。這說明隨著分割尺度的不斷增大,對象內部將增加更多不相似的像素(即對象內的同質性愈?。?,而對象間的差異性越來越顯著(即對象間的異質性愈大)。在這種異質性更大的情況下,隨著分割尺度的增加,方差將繼續增加,全局Moran指數將繼續減小,直到對象變得足夠大以至于包含許多不同土地覆蓋類型。比較所有多尺度分割的平均全局評分(圖3C)可知,分割尺度為170的圖像層具有最低的平均全局評分(0.999 2)。此圖像層在紅波段和近紅外的全局評分也較低(圖3D)。結果表明:分割尺度為170時,對象內部最均勻的同時,相鄰對象的差異性最大,符合被廣泛接受的最優分割尺度選擇原則,所以170為研究區最優分割尺度。
在170分割尺度的圖像層上將QuickBird影像的光譜、紋理、形狀、位置等信息融合成數據集后進行隨機森林分類,最終根據分類系統將研究區內的地物類型分成5類濱海濕地植被和6類土地利用類型(圖4)。在整個研究區內分層隨機選取420個點驗證得到混淆矩陣和精度評價結果,從表3中可以看出:分類總體精度為86.90%,Kappa系數為0.85。就濱海濕地植被而言,海三棱藨草的制圖精度最高,達到100%,分類結果最好,蘆葦次之。制圖精度較差的為南方堿蓬和互花米草,其中南方堿蓬的精度只有63.33%。這主要是由于南方堿蓬大多分布在田埂或水體旁,不易與田埂、水體及光灘區分。5類濱海濕地植被的用戶精度均達到85.00%以上。由此可以看出,在面向對象分析的基礎上對濱海濕地植被進行隨機森林模型分類的方法是可行的。

圖3 各分割尺度的加權方差(A),全局Moran指數(B),全局評分(C)以及平均全局評分(D)Figure 3 Weighted varianc e(A),Moran’s inde x(B),average global score s(C) and global scores values(D) for all single-scale segmentations
在面向對象分類中,圖像分割是基礎步驟,分割質量的好壞直接影響著分類精度的高低,因此評價圖像分割的質量在面向對象分析中起到至關重要的作用。本研究在最優分割尺度選擇時采用JOHNSON等[19]提出的平均全局評分。這一指標綜合考慮了各個波段的對象內的同質性和對象間的異質性,能夠有效地克服主觀性而達到客觀、定量評價的目的。JOHNSON等[19]得出的最優分割尺度為70,研究區大小為150 m×150 m的市區;而本研究得出最優的分割尺度為170,研究區面積擴大近萬倍、地物類型較多且植被較復雜的濱海濕地地區??梢姡顑灧指畛叨葧S研究區域的土地覆蓋特點不同而產生明顯變化。因此,在面向對象分類過程中,快速定量確定最優的圖像分割尺度是十分必要的。本研究的分類結果也說明了用平均全局評分法定量確定圖像分割尺度是高效的,對高分辨率遙感影像進行影像分割評價具有借鑒意義。
為了充分利用高分辨率遙感數據的信息,基于最優分割尺度的對象層采取了多種特征數據融合,用于隨機森林模型分類。數據融合時提取對象的特征共有53個,包括21個光譜特征、17個紋理、4個幾何、4個形狀、4個位置。這53個特征參數均作為變量參與隨機森林模型分類,充分挖掘和利用了原始圖像的信息,有效地提高濕地植被分類的精度。井然等[11]利用航片影像一系列植被指數建立決策樹對公園人工濕地植被分類,總體精度達到91.7%;喬婷等[34]應用SPOT-5結合隸屬度和閾值提取東洞庭湖濕地植被信息,總體精度為87.69%。雖然這些研究都是運用的面向對象分析方法,但是分類方法與過程有很大的差異。本研究所采用的多種特征參與的隨機森林分類方法提取濱海濕地植被,在研究區內分類類型多且地類混雜的情況下分類精度不低。這種將多特征融合與隨機森林模型結合的面向對象分類方法適于高分辨遙感數據的濱海濕地植被分類。

圖4 研究區分類結果圖Figure 4 Results of classification

表3 基于面向對象和隨機森林模型分類結果的混淆矩陣Table 3 Error matrix and accuracy assessment for object-based classification based on the classification tree
耕地的用戶精度較低,主要有2個原因:一是研究區內耕地上主要種植的是玉米Zea mays,蔬菜等農作物,這些作物的光譜特征和蘆葦、南方堿蓬、人工植被在原始波段的藍、綠波段光譜特征相似,分類時導致耕地易與蘆葦、南方堿蓬、人工植被混淆;二是研究所用遙感圖像拍攝于9月,恰好是一部分農作物收割的時候,所以其裸露地表和不透水地表不易區分。應加強位置特征的比例或數量,因為耕地集中分布于研究區東南部,與位于圍墾區蘆葦和南方堿蓬具有顯著的位置差異。對于互花米草、南方堿蓬制圖精度不夠理想的問題,可能因其分布面積過小,選取的訓練樣本偏少造成,可以考慮增加訓練樣本數量。
研究區內典型的濱海濕地植被有海三棱藨草、蘆葦、互花米草、南方堿蓬4類。海三棱藨草主要集中分布于潮間帶,呈與海平面平行的條帶狀,面積為38.13 km2,分別占全區總面積的13.61%和濕地植被總面積的47.94%,為研究區面積最大的濕地植被。研究區域的灘涂是由杭州灣南岸海涂快速淤積而新生的鹽沼濕地,處于自然狀態,受人為影響較小,為海三棱藨草的發育和繁衍提供了良好的棲息環境。濕地植被中蘆葦主要分布在離海岸較近的圍墾區域,面積較大為16.93 km2,占濕地植被總面積的21.29%,僅次于海三棱藨草,其中杭州灣濕地公園有較大面積的蘆葦。這一區域灘涂利用以水產養殖為主,土壤鹽度下降,適宜蘆葦大面積生長。南方堿蓬主要分布在田埂上或道路兩旁,面積僅為11.95km2,占濕地植被總面積的15.03%。而互花米草則零星分布且面積較小。
濱海濕地植被隨著離海岸線距離遠近依次呈現海三棱藨草-互花米草-蘆葦-人工植被的空間分布特點,反映了人們利用濱海灘涂時,所引起的生態環境變化對植被分布的影響。海三棱藨草主要分布在新生灘涂形成的潮間帶,土壤含鹽量和含水量較高,它作為先鋒物種,具有促淤和防浪的功能,這對灘涂生態環境的改造具有重要作用。互花米草緊隨著海三棱藨草出現,顯示了灘涂的抬升使土壤含鹽量和含水量發生了變化。但由于近年來人類把互花米草作為入侵物種進行治理,研究區內互花米草的面積較少。隨著向內陸延伸,蘆葦面積逐漸增加,并伴隨有南方堿蓬出現。人工植被的出現反映人類開始對濕地進行干預,改變植被的自然演替格局。這說明灘涂隨著自然演變與人為開發利用,濱海濕地生態環境發生較大變化,濕地生態環境在空間的分異引起了適生植被在空間分布上的差異。由此,我們可以根據濱海濕地植被的分布特征推斷其生長環境特征,達到對濕地生態環境監測和保護的目的。
以QuickBird數據和野外考察數據為數據源,運用面向對象的思想,綜合圖像最優分割、特征融合以及隨機森林模型分類方法,對杭州灣南岸部分區域的濱海濕地植被進行了分類與精度評價,得出以下結論:①運用全局最優評分法是獲得圖像最優分割尺度的客觀高效的方法,對提高分類精度具有重要作用。②綜合運用面向對象的特征融合、隨機森林算法等方法,對高分辨率遙感影像,能有效精確提取濕地植被。③植被的空間分布反映了濱海濕地的開發利用程度、生態環境特征和健康狀況,故可將濱海植被在海岸帶的空間分布圖作為評價濱海濕地的生態環境的重要信息。