陳朋弟,黃亮,2,夏炎,楊澤楠
(1. 昆明理工大學 國土資源工程學院,云南 昆明 650093;2. 云南省高校高原山區空間信息測繪技術應用工程研究中心,云南 昆明 650093)
林地作為森林的重要組成部分,在參與全球大氣循環、城市生態建設、水土保護以及國家經濟發展等方面占有舉足輕重的地位,而近年來隨著我國對生態農林保護力度的加大,尤其是習近平主席提出“綠水青山就是金山銀山”[1]理念后,中國的植被覆蓋度得到了大幅度提升,根據德國衛星拍攝的2019年數據顯示中國的森林覆蓋率從40年前的12%上升到如今的22.96%,而且整個森林蓄積量增加了85億立方米,說明了我國在林地擴充與保護方面取得了驕人成績.為此,如何快速而準確地對林地信息進行提取是目前林業方面研究的熱點.隨著遙感技術的發展,特別是航空攝影以及各種遙感衛星的發射,使得以遙感影像作為基礎數據應用于林業研究成為趨勢.
與多光譜影像相比,高光譜影像波段數多,可以同時獲得地表信息和光譜信息,因此在植被信息提取方面得到了大量的應用與研究[2-5].但由于高光譜影像維度高、信息量大以及信息冗余度高等問題,使得其在數據處理上難度增大[6-7].目前在植被信息提取與高光譜影像分類上用到的方法有:支持向量機(SVM)與其他方法相結合[8-11]、卷積神經網絡(CNN)[12-13]、極限學習機(ELM)[14]、K最近鄰(KNN)算法[15]等.如于寧鋒等[16]提出了一種改進多類支持向量機(PSO-SVM)算法,通過該方法對高光譜遙感影像進行分類,其精度相比于傳統的SVM提高了8.8%;王利軍等[17]通過將決策樹與SVM相結合的方法對河南省濮陽縣的秋季作物進行了分類提取,結果表明其分類精度優于單獨使用最大似然法和SVM方法.王傳立等[18]采用多核極限學習機(MK-ELM)對遙感影像的林地信息進行提取,其精度可達89.1%,相比于單核極限學習機有了較大的提升.韋瑋等[19]通過歸一化植被指數(NDVI)與高光譜影像進行融合,然后采用波譜角填圖方法(SAM)對青海省隆寶灘濕地植被類型進行了提取,其精度可達92.23%.
上述方法大多都是先通過選擇樣本,然后再利用監督或半監督的方式對林地或植被信息進行提取,雖然整體精度都很高,但是在樣本選擇方面會加入人為的主觀因素,同時時間消耗比較大,為此本文提出了一種結合多特征的HSV變換方法,通過設置相應的色彩值范圍對林地進行色彩分割提取.
研究區位于廣東省珠海市西南部,地處21°48′N~22°27′N、113°03′E~114°19′E,該地區屬于典型的南亞熱帶季風海洋性氣候,年平均溫度22.3℃,年降雨量為1770~2300 mm,年平均相對濕度是79%.地勢由西北向東南傾斜,以山地、海洋、丘陵和平原為主.林區包括城市中心區森林、西部城市發展區森林、東部沿海島區森林,植被類型主要以亞熱帶雨林型的常綠季雨林為主[20].
本文所使用的影像來源于珠海一號高光譜衛星組,現由7顆衛星組成,空間分辨率為10 m,離地高度500 km,衛星質量67 kg,成像范圍150 km×2500 km,波譜數32個,光譜分辨率2.5 nm,波譜范圍為400~1000 nm,運行軌道98°.本文的研究區大小為2900像素×3300像素,如圖1(a)所示,該區域主要包括林地、耕地、綠地、建成區、水體以及裸地,地物構成復雜.圖1(b)為研究區林地的參考圖,該圖是通過目視解譯和人工手工繪制而成.

圖1 研究區位置示意圖及其林地區域參考圖
為了更好地對該區域林地信息進行提取,本文提出了一種基于HSV變換的色彩分割林地提取方法.首先對原影像進行輻射定標、大氣校正和正射校正,得到校正后的影像;然后對校正后的影像進行PCA降維,并選取第一主成分和第二主成分與NDVI進行合成,得到合成后的影像;接著再進行HSV變換并進行色彩分割得到該區域林地提取二值圖,進行小對象刪除以及空洞填充,得到最終林地提取圖;最后與林地區域的參考圖進行精度評價.具體的林地提取流程圖如圖2所示,合成后影像的相關信息如表1所示.

圖2 林地提取流程

表1 合成影像統計結果
本文選取對植被計算較好的NDVI[21]方法,利用近紅外和紅光兩個波段進行計算,主要是因為近紅外波段有較高的反射峰,而紅光波段有較強的吸收帶.本文中選取的近紅外為28波段(880 nm)、紅光為14波段(670 nm),計算公式如下.
(1)
式中:NIR880表示近紅外波段;RED670表示紅光波段;NDVI取值范圍在[-1,1].
由于高光譜影像波段數多,造成影像的數據維度大,這給林地信息提取帶來了諸多不便,為此需要對數據進行降維處理.PCA是一種最基本的數據降維方法,在高光譜數據壓縮、去相關、去噪和特征提取中發揮了巨大的作用.它主要是對數據的協方差矩陣進行特征值分解,特征值分解后的特征向量對應數據的主成分,特征值對應數據在各個主成分上的權重,本文選取了第一主成分和第二主成分.假設高光譜圖像空間維大小為M×N,波段個數為P“,其實現步驟如下:
1)圖像向量化.將高光譜數據表示成矩陣
X=(x1,…,xp)T∈RP×(M×N),
(2)
式中,xp(p=1,2,…,P)表示將第i個波段的圖像按先列后行(或者先行后列)順序重新排列的(M×N)×1維的列向量.
2)向量中心化.將向量組的每個向量減去向量組的均值向量,即

(3)

(4)

3)將中心化后的向量排列成矩陣Z=(z1,…,zp),計算協方差矩陣

(5)

4)對協方差矩陣進行特征值分解,得到變換矩陣V:
Σ=VΛVT.
(6)
5)進行主成分變換后得到數據
S=VTZ,
(7)
將S表示為S=(s1,…,sp),則si對應第i個主成分分量,采用步驟1)中同樣的順序將si重新排列成大小為M×N的矩陣即第i個主成分圖像.
1)HSV變換
通過RGB到HSV的轉換,可以有效地對影像中的地物進行區分,H、S、V分別表示色調、飽和度和亮度,其轉換公式如

(8)
(9)
Δ=Cmax-Cmin,
(10)

(11)

(12)
V=Cmax.
(13)
式中:Cmax表示C(x,y)處(R′,G′,B′)的最大值;Cmin表示C(x,y)處(R′,G′,B′)的最小值;Δ表示最大值與最小值的變化量.
2) 色彩分割
本文利用HSV變換得到的影像通過設置林地色彩值范圍對林地進行快速提取,是一種簡單高效的提取方法.主要思想是:首先通過設置色彩值范圍得到粗提取的林地二值圖,然后對該區域進行空洞填充以及小對象刪除,得到處理后的林地二值圖,最后再對影像進行裁剪得到林地區域.
本文中提取結果的精度是通過錯檢率(Faer)、漏檢率(Foer)以及總錯誤率(Foaler)進行評價的,通過對提取的林地二值圖與林地參考二值圖做對比,得出本文方法的提取精度,其公式如下:
Faer=Fp/Ts,
(14)
Foer=Fn/Ts,
(15)
Foaler=Faer+Foer.
(16)
式中:Fp表示錯檢的林地數;Fn表示漏檢的林地數;Ts表示真實林地數.
由于所選影像地物復雜,通過對原影像做相關處理可以很好地回避同譜異物和同物異譜對林地提取的影響.從圖3(a)可以看出,部分水體的顏色與林地的顏色極為相似,如果用原影像對林地進行提取,將造成林地中混合水體的現象出現.為此,通過將NDVI和PCA進行組合,得到的影像可以很好地避免這一情況的出現,如圖3(b)所示,再通過HSV變換可以更加清晰地對地物進行區分,有利于林地的提取,如圖3(c)所示.

(a)校正后影像 (b)NDVI與PCA組合影像 (c)HSV變換影像
為了對提取的林地信息進行評價,本文使用的參考圖是通過目視解譯和人工手工繪制的,這導致參考精度會受到人為主觀因素的影響,但在繪制過程中盡可能地將所有林地包含進去,其參考價值還是非常大的.圖4(b)為本文方法得到的林地二值圖,圖4(c)為利用SVM得到的林地二值圖.通過對比可以看出,利用本文方法可以將大部分林地進行精細提取,但也存在將少數耕地誤識別為林地的現象,這主要是因為耕地中種植的相關作物與林地非常相似的緣故.而使用SVM的方法得到的林地結果較差,如圖4(c)中紅色框所示,將原本水體部分誤提取為林地,且從提取結果來看非林地噪聲較多.通過使用本文方法對林地進行提取,其總體精度能達到96.29%,如表2所示,錯檢率、漏檢率以及總錯誤率都很低,說明了本文方法在林地提取方面的有效性.

(a)林地參考圖 (b)本文方法提取的林地二值圖 (c)SVM提取的林地二值圖

表2 精度評價
本文以珠海一號衛星拍攝的高光譜影像為數據源,使用一種結合多特征的HSV變換通過設置色彩值范圍對影像進行色彩分割提取林地信息,對得到林地的分布信息進行了精度評價分析,得到如下結論:
1)由于原始影像存在同譜異物和同物異譜現象,很難對林地信息進行精確提取,通過對原影像做相關校正、NDVI、 PCA和HSV變換處理,進而再利用色彩分割對林地進行提取,可以在很大程度上提高林地提取的精確性.
2)本文通過一種結合多特征的HSV變換方法對林地進行色彩分割提取,可以較為精確地提取到林地信息,但也存在少量耕地識別為林地的現象,主要原因是耕地中種植的作物信息與林地非常相似,造成在色彩分割中難以區分的緣故.
3)本文的林地參考圖是通過目視解譯和人工手工繪制的,這樣的參考圖會存在一定的主觀性,但為了提高參考圖的準確性,在繪制方面力求盡可能地將所有林地包含進去,并通過小組進行檢查細化.
4)利用本文方法對林地進行提取中,無論是從提取精度上還是在效率上都優于SVM的方法,說明利用該方法在保證精度的前提下可對林地進行大面積提取,提高了林地資源統計效率,同時減少了人力、物力和財力的消耗.