郭瑞霞,李崇貴,劉思涵,馬 婷,全青青
(西安科技大學 測繪科學與技術學院,陜西 西安710054)
落葉松Larix gmelini是中國大部分林區常見的一種寒溫帶及溫帶樹種,因其具有速生、材質好、抗性強、適應性廣等特點,已成為中國北方主要的造林樹種。落葉松人工林能夠在一定程度上減輕天然林木材供給需求的壓力。隨著中國落葉松人工林造林面積的逐年加大,林業重點工程建設的穩步推進,對落葉松人工林資源的調查成為林業調查領域一項新需求,特別是對落葉松人工林空間位置分布的快速提取。落葉松人工林分布范圍廣,地勢復雜,野外調查工作困難,工作量大,費用高,用傳統的資源調查方法難以準確定位和勾繪,而遙感技術因其快速、易獲取、覆蓋范圍廣等特點,已經廣泛應用于林業資源調查。國外學者很早對植被的季相和物候特性進行了研究,并對其在植被類型分類中的作用進行了探討和分析。BADHWA[1]運用多時相影像進行植被類型分類,結果表明:植被生物物候學信息能有效改善分類效果。在對針葉林樹種識別方面,McDONALD等[2]基于Landsat TM數據對森林光譜植被指數的森林信息含量進行了調查,結果表明:當植被覆蓋率較低時,全球環境監測植被指數(GEMI)是最有利于針葉林信息提取的指標,當植被覆蓋度較高時,土壤調整植被指數(SAVI)和轉換型土壤調整植被指數(TSAVI)是最有利于針葉林信息提取的指標。NEMANI等[3]利用NOAA/AVHRR影像的紅(R)波段、近紅外(NIR)波段、熱紅外(TIR)波段,通過歸一化植被指數的季相特性區分常綠林和落葉林以及用NIR波段反射率的不同來識別闊葉林和針葉林。中國林業遙感分類技術的研究晚于發達國家,從20世紀70年代開始,遙感技術被引入到森林類型分類的研究中。40 a來,遙感技術在不斷成熟、更新和發展,而且獲得了大量的研究成果。趙東方[4]利用 SPOT 5遙感影像和外業調查數據,運用最大似然、神經網絡、馬氏距離等分類法對針葉林信息進行提取和精度評價,結果表明:最大似然法在保證針葉林分類精度的同時,其他類型森林分類精度也比較高,能達到較為理想的效果。王敏等[5]基于大比例尺航片分別用監督分類、專家分類和子像元分類的方法對針葉樹種進行分類,并用固定樣地數據分別對分類結果進行精度評價和對比分析,得到監督分類、專家分類和子像元分類的精度分別為82%、88%和91%。子像元分類精度較監督分類和專家分類高,且操作比專家分類簡單,不需要其他先驗知識的參與,尤其適用于對先驗知識較少的原始針葉林樹種進行分類。馬延輝[6]利用單時相和時間序列數據針對針葉林遙感信息開展了較為系統的研究,用決策樹分類實現了多源數據之間的混合使用,并得到滿意的分類結果。但迄今為止,國內外針對落葉松人工林的研究文獻多集中于生物量模型[7]、土壤肥力[8-11]、經營狀況、落葉松落葉病[12]以及苗圃培育等方面,利用遙感圖像分類算法提取落葉松人工林空間位置分布的研究鮮有報道。因此,利用遙感手段研究中國落葉松人工林的分布情況在理論研究和實際應用上都有十分重要的意義。本研究以黑龍江省孟家崗林場的落葉松人工林為研究對象,利用多時相Landsat 8影像、數字高程模型(DEM)數據,借助地面樣地調查資料,結合落葉松人工林在不同季相條件下所呈現的規律特性,進行基于多時相特征的落葉松人工林分類方法研究,提取研究區落葉松人工林的空間位置分布。
研究區為黑龍江省佳木斯市樺南縣東北部的孟家崗林場(46°20′16″~46°30′50″N, 130°32′42″~130°52′36″E),林場屬東亞大陸性季風氣候,年平均氣溫2.7℃,年平均降水量550.0 mm。地處完達山西麓余脈,以低山丘陵為主,坡度較為平緩,地勢東北高,西南低,海拔為168~575 m。土壤以暗棕壤為主,林分以人工林為主,占森林面積72.5%,其中落葉松人工林為優勢樹種,是以經營落葉松樹種為主的人工林基地。
落葉松屬落葉喬木,夏天繁茂、冬季落葉,與其他常綠樹種相比,季相特征明顯,反映在遙感影像上,表現為樹種間的光譜差異,這對森林植被類型的識別有一定的指導作用。Landsat 8影像空間分辨率較低,但其時間連續性較好、光譜信息豐富、獲取成本低,有利于森林植被類型的識別。因此本研究選取3景多時相的Landsat 8影像數據為遙感信息源,用于研究落葉松人工林的季相和物候特性。此外,還使用了2014年全國森林資源二類調查數據和2017年典型森林類型樣地補充調查數據用于落葉松人工林分類和分類結果驗證,以及地理空間數據云(Geospatial Data Cloud)提供的30 m分辨率數字高程模型(DEM)數據用于輔助布設解譯樣地。遙感影像參數如表1所示。

表1 遙感影像基本參數Table 1 The basic parameters of remote sensing image
利用ENVI 5.3軟件對Landsat 8影像進行輻射定標、FLAASH大氣校正,并通過G-S變換方法對15 m全色波段和30 m多光譜波段進行融合處理,最終得到15 m分辨率的ETM+多光譜數據。對DEM數據進行預處理,提取研究區3類坡向(陰坡、陽坡、無坡向)信息。
1.3.1 森林類別光譜特征分析 研究利用選擇的解譯樣本統計各森林類別在影像上的光譜均值,繪制各森林類別光譜曲線圖,通過分析各森林類別在多時相遙感影像上的光譜差異和可分性,研究各森林類別特別是落葉松人工林的季相特性,找出能最好區別落葉松人工林的光譜特征波段,并且為保證原始影像的完整性(指Landsat 8影像第1~7波段的完整性),選擇其中一個時相的影像作為基礎影像,然后在其基礎上擴充特征波段。基礎影像的選擇依據影像NIR波段上各地類的區分能力來定,因為在NIR波段內,植物的光譜特征取決于葉片內部的細胞結構,而植物類別間葉子內部結構差異較大,植物在近紅外譜段的反射差異比在可見光區域大,因此對不同時相的NIR波段的地類光譜單獨進行研究[13]。
1.3.2 分類模型 不同的分類算法對不同植被的分類效果可能存在一定差異。為探索不同監督分類方法提取落葉松人工林的效果,本研究采用最大似然法、支持向量機法、光譜角法和k最近鄰法等。最大似然分類在2類或多類判別中,用統計方法根據貝葉斯判別準則建立非線性判別函數集,假定各類分布函數為正態分布,選擇訓練區,計算待分類樣本的歸屬概率,把待分像元分到歸屬概率最大的分類類別中,是一種常用的監督分類方法[14-15]。最大似然分類法對呈正態分布的類別判別函數易于建立,綜合應用了每個類別在各波段中的均值、方差以及各波段之間的協方差,有較好的統計特性,被認為是一種穩定性和魯棒性都比較好的分類方法。支持向量機(SVM)是一種基于統計學習理論的計算機學習方法,將多維特征輸入映射到高維的核空間,使原本不可分的數據獲得新的特征,更加有利于分類。SVM的關鍵在于如何選擇核函數和設置不同的參數。在特征空間中,待分模式對決策面的可偏離程度由懲罰系數C的變化大小來決定[16-18]。支持向量機在解決小樣本、非線性及高維模式識別中表現出許多特有的優勢。光譜角分類是一種基于相關/匹配濾波器的分類方法,能充分利用光譜維的信息,強調光譜的形狀特征,極大減少特征信息,是目前超光譜圖像分類中較常用的方法。其原理是把光譜作為矢量投影到N維空間上,其N維數為試驗時選取的所有波段數。在N維空間中,各光譜曲線被看作是有長度和方向的矢量,而各光譜之間形成的夾角為光譜角。光譜角分類的核心思想是同一種地類波譜向量方向應該一致,夾角越小待估計像元與樣本類別相似度越大[19-20]。具體計算公式如下:

式(1)中:Xp表示待分像元P的光譜向量,Xj表示類別j的平均光譜向量,αpj為像元P與類別j之間的夾角。k最近鄰法(k-NN)分類的判別函數建立在地物光譜特征在特征空間中是按集群方式分布的前提下。它是設法計算某隨機特征點X到各樣本的距離,取前k個最近的樣本,統計這k個最近的樣本所屬類別,按照眾數法確定隨機特征點的類別。k-NN方法對于類域的交叉或重疊較多的待分樣本集來說,較其他方法更為適合,但當樣本不平均時,如一個類別的樣本容量很大,而其他類別樣本容量卻很小時,有可能導致當輸入一個新樣本時,該樣本的k個鄰居中大容量類別的樣本占多數。另外,k-NN方法計算量較大,因為對每一個待分類的樣本都要計算它到全體已知樣本的距離,才能求得它的k個最近鄰點[21]。
1.3.3 精度評價 遙感圖像分類通常使用混淆矩陣來進行分類精度評價,主要采用總體分類精度和Kappa系數2種評價指標,對于單個地物類別的提取效果,可用制圖精度和用戶精度進行評價,但是在實際分類中,制圖精度和用戶精度又相互制衡,不能準確判斷分類方法和數據的優劣,因此,本研究引入數據挖掘中不平衡樣本的F度量整體評價遙感圖像中落葉松人工林的提取結果。F計算公式為:

式(2)中:A表示制圖精度,U表示用戶精度。
依據森林資源二類調查數據和典型森林類型樣地補充調查數據,確定研究區域的樣本類型為紅松Pinus koraiensis人工林、落葉松人工林、云杉Picea asperat人工林、樟子松Pinus sylvestris var.mongolica人工林、天然林、無林地等6類。對于整個研究區而言,典型森林類型樣地數據分布不夠均勻,因此將二類小班數據按不同齡組(幼齡林、中齡林和成熟林)、不同林種(紅松人工林、落葉松人工林、云杉人工林、樟子松人工林、天然林和無林地)渲染分類,與由DEM數據得到的3類坡向圖(陰坡、陽坡、無坡向)疊加,綜合考慮地形信息和樹種信息,根據各森林類型面積權重增加布設樣地。樣地大小為28.28 m×28.28 m的正方形樣地,共計565塊,按7∶3比例抽取監督樣本和驗證樣本,用于森林類型分類和精度驗證。樣地類別及各類別的樣本數量見表2。

表2 樣地類別及各類別樣地的數量Table 2 The category of sample plot and the numbers of each category of sample plot
對各森林類別在不同時相影像上的光譜均值變化進行統計,森林類別光譜曲線如圖1所示。在2017年6月16日獲取的影像上,無林地光譜均值變化規律與有林地之間差異明顯。通過目視解譯遙感影像可以看出:此時段內,無林地處于裸露狀態,無植被或農作物生長。對有林地而言,各樹種處于夏季生長季,光譜變化趨勢相似,在近紅外波段各有林地類別間區分度明顯,天然林光譜均值最高,與人工林光譜差異顯著,落葉松人工林此時間段長勢較好,光譜均值次之,與其他人工林區分明顯。
在2017年8月19日獲取的影像上,由于正值初秋季節,研究區以玉米Zea mays、蘭花豆Vicia faba為主的田間農作物正處于成熟季,綠色植被豐富,因此無林地光譜變化規律與有林地大致一致,而落葉松人工林葉綠素含量下降,葉片開始變黃。在TM1、TM2、TM3、TM4波段上,各類別區分度都較弱,很難區分。在近紅外波段,無林地光譜均值最高,天然林次之,落葉松人工林與其他人工林區分明顯,紅松人工林和云杉人工林的光譜均值較接近,TM6波段次之,TM7波段較好。
在2017年10月22日獲取的影像上,農作物收割,無林地光譜變化規律與有林地明顯不同,落葉松人工林和天然林大范圍落葉,光譜變化規律較一致,其他人工林屬常綠樹種,變化規律相對一致,落葉松人工林在TM1~TM7波段與其他森林類別分離度都較好,天然林在TM4、TM5、TM6、TM7波段與除落葉松人工林外的其他人工林分離度最好。

圖1 不同時相影像上地類的光譜變化Figure 1 Terrestrial spectral variation of different phase images
對比分析不同時相近紅外波段的地類光譜變化,3期影像均以近紅外波段各森林類別區別最大。在2017年6月16日獲取的影像上,植被葉片生長狀況最好,內部結構豐富,各森林類別間區分最明顯。在8月19日獲取的影像上,各地類區分能力次之,此時正值初秋時節,田間玉米、大豆等農作物成熟,無林地光譜均值升高,而落葉松人工林開始逐漸變黃,各樹種類別光譜均值降低。在10月22日獲取的影像上,各森林類別區分能力最低,此時落葉松人工林和天然林大范圍落葉,光譜均值最低,與其他常綠人工林光譜均值差距較大。
分析不同地類在Landsat 8多時相數據上地類光譜變化規律,以2017年6月16日獲取的影像作為基準數據,擴展波段為2017年8月19日獲取影像TM5、TM6波段,2017年10月22日獲取影像TM3、TM4、TM5、TM6波段,進行多時相特征數據組合。利用ENVI軟件對多時相特征數據進行最大似然法和支持向量機法分類,其中支持向量機采用線性函數進行分類;利用C#語言實現光譜角分類法和k最近鄰法分類,提取研究區落葉松人工林的空間分布,其中,k最近鄰法中k值的確定需要多次訓練。研究對k分別從1~10取值進行分類,得到當k=5時,分類效果最好。因為本研究主要針對落葉松人工林信息提取進行研究,因此將除落葉松人工林以外的其他類別進行合并,得到凸出顯示落葉松人工林的空間位置分布的分類圖,分類結果如圖2和表3所示。同時,為凸顯本研究實驗方法的可行性,采用最大似然分類法對單時相遙感影像進行分類,分類結果精度如表4所示。

圖2 基于多時相特征的分類結果Figure 2 Classification results based on multi-temporal remote sensing data

表3 基于多時相遙感數據的分類精度Table 3 Classification accuracy based on multi-temporal remote sensing data

表4 基于單時相遙感數據分類精度Table 4 Classification accuracy based on single phase remote sensing data
利用多時相Landsat 8影像,采用最大似然法、支持向量機法、光譜角法和k最近鄰法對研究區落葉松人工林信息進行提取,并與基于單時相數據的分類結果做比較,可以得到:①落葉松人工林具有明顯的植被光譜特征,與裸地等地物區分明顯,與其他樹種類別變化規律相似。在近紅外波段,各樹種類別光譜可分性最好,落葉松人工林區分明顯,對于不同時相遙感數據,森林長勢較好的夏季樹種類別的光譜差異最大。②落葉松人工林的信息提取受數據源特征信息量的影響,在秋季,落葉松開始落葉,與其他常綠樹種光譜差異明顯。因此,在單時相影像分類結果中,秋季影像對落葉松人工林信息提取效果較好,F精度為84.513 9%。多時相特征數據綜合了落葉松夏季茂盛、冬季落葉的季相特性,其落葉松人工林提取結果明顯優于單時相遙感數據提取結果,落葉松人工林F精度提高到87.979 3%。③各分類方法中,光譜角法和k最近鄰法的制圖精度相同,為91.14%,但最近鄰法的用戶精度為84.71%,低于光譜角法的用戶精度85.71%,因為k最近鄰法是計算某隨機特征點X到各樣本的距離按眾數法判別待估計樣本類別,樣本數量的不平衡及位置分布不均勻使其較光譜角法存在 “過提取”現象。同樣,最大似然法和支持向量機法的制圖精度相同,為86.02%,但支持向量機法的用戶精度為87.12%,低于最大似然法的用戶精度90.03%。這是由于最大似然法以訓練樣本作為中心,而支持向量機以訓練樣本分析分類邊界,導致以相同樣本進行落葉松人工林信息提取時,最大似然法存在 “欠提取”現象,支持向量機法存在 “過提取”現象。利用F精度整體評價各方法的落葉松人工林提取精度,光譜角法最好,F精度為88.346 3%,最大似然法次之,精度為87.979 3%,k最近鄰法的提取精度為87.807 4%,支持向量機法最低為86.566 5%。
通過實驗與分析可以得出:①落葉松人工林有著明顯的植被季相特征,利用多時相Landsat 8影像提取落葉松人工林信息的效果相比于單時相影像提取效果好,其提取精度大大提高,精度提高范圍為[3.465 4,18.098 6];②本研究所采用的4種分類方法中,光譜角法對落葉松人工林的空間位置分布提取較好,F精度為88.346 3%,即利用多時相遙感影像采用光譜角法可以較好地提取研究區落葉松人工林空間位置分布。本研究對大面積獲取落葉松人工林的空間位置分布具有一定的參考價值,對掌握中國落葉松人工林分布并促進落葉松人工林合理種植具有現實意義。