陳元鵬 鄖文聚 周 旭 彭軍還 李少帥 周 妍
(1.中國地質大學(北京)土地科學技術學院,北京100083;2.國土資源部土地整治中心,北京100035)
基于MESMA和RF的山丘區土地利用信息分類提取
陳元鵬1,2鄖文聚2周 旭2彭軍還1李少帥1,2周 妍2
(1.中國地質大學(北京)土地科學技術學院,北京100083;2.國土資源部土地整治中心,北京100035)
探討了基于多端元混合像元分解(Multiple endmember spectralmixture analysis,MESMA)和隨機森林(Random forest,RF)相結合的土地利用信息分類提取方法。以Landsat-8 OLI衛星遙感影像為主要數據,基于植被-不透水面-裸土(Vegetation-impervious surface-soil,VIS)模型,利用MESMA將影像分解為植被、不透水面和裸土3類組分,將生成的3類組分變量和基于光譜、紋理信息計算選取的20個特征變量組合后開展RF分類實驗,將分類結果與相同特征變量下的支持向量機(Support vectormachine,SVM)、最大似然(Maximum likelihood classification,MLC)分類結果進行比較分析。結果表明:MESMA可以獲得較為精確的組分豐度信息;RF分類結果優于相同特征變量下的SVM和MLC分類結果;在MESMA生成的組分信息變量參與分類后,3種方法的分類精度均有所改善,分別達90.50%、88.85%、86.35%,其中RF的分類精度改善最為顯著;MESMA與線性混合分解(Linear spectral mixture analysis,LSMA)生成的組分信息變量相比,前者對于改善分類精度效果更為明顯。MESMA對于提高影像分類精度起到一定積極作用,基于MESMA和RF的方法對中等空間分辨率影像山丘區土地利用信息分類提取精度較高,利用該方法開展遙感影像解譯可為大尺度的土地利用監測和管理工作提供技術支持和理論參考。
土地利用分類;中等空間分辨率;多端元混合像元分解;隨機森林;山丘區
準確掌握國家土地資源利用信息是國家相關部門調整土地利用結構、合理開發土地資源、動態監測土地利用狀況等工作的基礎[1]。土地資源與遙感數據在時空特性方面具有高度一致性,對土地資源的研究成為遙感技術應用的主要領域之一。過去數十年,國內外開展了大量研究,促使了遙感技術在土地資源領域的長足發展。現今遙感技術已為土地利用的信息提取與分類識別提供了豐富的信息源和多元的實現手段[2],為準確掌握國家土地利用信息貢獻了巨大力量。
在大尺度的土地資源遙感研究應用中,兼顧經濟、效率的同時,中等空間分辨率數據往往成為較佳選擇,但在地物異質性和傳感器空間分辨率影響下,中等空間分辨率數據普遍存在混合像元,尤其在我國山地丘陵區,地形起伏大、地物分布破碎,導致影像數據中混合像元占比更高,這一定程度上影響了地物識別和分類精度。為此,充分利用混合像元分解技術,并與目前應用范圍較廣的機器學習分類方法有效結合[3],對基于中等空間分辨率影像的山丘區土地利用信息提取精度的提高很有幫助。
多端元混合像元分解是在線性混合分解基礎上發展而來的一種混合像元分解方法,MESMA在引入地物端元波譜庫的基礎上,充分考慮了像元內地物的不同組合方式及光譜變化性,利用不同類型和數量的地物端元組合模擬每個像元,它針對每一類地物選取多個端元光譜參與混合像元分解,可以有效解決“同物異譜”問題[4-6]。隨機森林分類方法目前在基于機器學習的遙感影像分類方法中精度相對較高,處理大數據集時運行速度更快,不容易過擬合,處理多維變量能力強,可生成變量重要性估計,所以該算法在多維數據分類回歸中被廣泛應用,并取得較好的效果[7]。但與其它的機器學習分類算法相比,國內對于隨機森林算法在遙感影像分類中的研究和應用相對較少,已有的研究區域主要集中在平原區[8-10],在山丘區的研究應用不多。
本文提出一種MESMA和RF相結合的遙感影像分類方法,利用該方法對四川省古藺縣域內的土地利用信息進行分類提取研究;以中等空間分辨率Landsat-8 OLI影像為唯一數據源,不使用輔助數據參與分類;利用MESMA方法解混生成植被、不透水面和裸土3種組分信息,將組分信息作為特征變量和基于光譜、紋理信息計算選取的20個特征變量進行組合,構建3種變量組合模型開展RF分類實驗;對精度最高的模型3分類結果進行變量重要性估計,分析各變量的重要性成因;將精度最高的模型3分類結果與相同特征變量下的SVM、MLC分類結果,基于LSMA和RF相結合方法的分類結果進行比較分析。
研究區位于四川省瀘州市古藺縣,地理坐標為27°59'43″~28°7'24″N、105°55'41″~106°4'47″E,區域內海拔在340~1 207m之間,中亞熱帶氣候,年平均氣溫 17.1~18.5℃、平均降水量 748.4~1 184.2mm[11-13]。參照 GB/T 21010—2007《土地利用現狀分類》,研究區內主要土地利用類型為耕地、有林地、工礦倉儲用地(簡稱“工礦用地”)、住宅用地、交通運輸用地、水域及水利設施用地(簡稱“水域”)。本文在信息提取分類體系構建中,將住宅用地與交通運輸用地歸并為一類簡稱建設用地,為支撐工礦用地復墾利用管理工作,工礦用地作為一種單獨地類進行提取實驗,而未歸并至建設用地類。研究區地理區位及遙感影像數據如圖1所示。
本研究中使用的主要數據為Landsat-8 OLI衛星遙感影像,參考數據包括:瀘州市工礦廢棄地現狀數據、無人機航拍影像、地面實測數據、Google Earth數據。其中,Landsat-8 OLI衛星遙感影像用于土地利用信息分類提取;4類參考數據用于樣點采集參考和精度評價驗證。
2.1 Landsat-8 OLI衛星遙感影像
Landsat-8是Landsat系列衛星中的一員,發射于2013年,它搭載了2個主要載荷:陸地成像儀(OLI)和熱紅外傳感器(TIRS)。OLI包含9個波段,其中多光譜波段的空間分辨率為30 m,全色波段的分辨率為15m,成像寬幅為185 km×185 km。本文選用的Landsat-8 OLI遙感數據為30 m分辨率多光譜波段數據1景,波段數為7,分別為C、B、G、R、NIR、SWIR1、SWIR2,獲取日期為2016年4月3日(該時間窗口內植被與裸土可分性較好),研究區域內無云量。影像的預處理在ENVI 5.3軟件平臺中完成,對多光譜數據的預處理包括波段篩選(去除了Coastal波段)、輻射定標、FLAASH模塊大氣校正、裁剪生成研究區影像數據。

圖1 研究區地理位置和3D遙感影像Fig.1 Location of study area and 3D representation of remote sensing image
2.2 參考數據
參考數據中,瀘州市工礦廢棄地現狀數據為1∶200 000現狀圖,由瀘州市政府于2012年編制完成;航拍影像由UV-II型無人機搭載的Pentax-645D型相機拍攝,拍攝時間為2016年11月,空間分辨率為0.2m;地面實測數據的采集在無人機航拍過程中同步開展,實測儀器采用天寶手持式GPS,水平精度優于1m(Trimble geoexplorer 2008 Series GeoXH,trimble navigation limited,USA)。
2.3 樣點選取
根據瀘州市工礦廢棄地現狀數據、地面實測數據、航拍影像的目視解譯分類結果以及Google Earth影像數據,在Landsat-8 OLI影像上選取了訓練與驗證樣點,其中訓練樣點706個,占比22%;驗證樣點2 495個,占比78%。各類地物樣點數量如表1所示。

表1 各地物類型樣點數量Tab.1 Numbers of samp les for each class
3.1 技術方法
采用MESMA和RF相結合的方法進行土地利用信息提取分類,技術流程主要為:影像預處理;利用MESMA進行混合像元分解;利用RF方法進行影像土地利用信息提取分類;精度評價。如圖2所示。

圖2 技術流程Fig.2 Flow chart of research technique
具體步驟為:對Landsat-8 OLI多光譜影像進行預處理,將航拍影像與衛星影像進行配準、裁剪;基于植被、不透水面、裸土模型[14],利用MESMA方法解混生成3種組分豐度數據(植被、不透水面、裸土);結合影像的光譜、紋理信息進行特征變量的計算、選取;將組分豐度數據與各類型特征變量組合后進行 RF分類(利用網格搜索法進行參數尋優)[15-16];對分類結果進行精度評價,利用特征變量重要性估計評價各特征變量的重要程度并探討原因;與SVM和MLC分類方法進行比較,評估隨機森林分類方法的性能。
3.2 MESMA方法的混合像元分解
MESMA是在LSMA基礎上發展而來的一種混合像元分解方法,該方法針對每一類地物選取多條光譜,并以此生成多個端元組合(每個端元組合由不同地物中的某一條光譜組成),并對每個像元尋找最小二乘法誤差最小的端元組合,進而求出每個像元的端元比例,通常采用均方根誤差(RMSE)指標來評價模型的擬合優度[17],公式為

式中 S——遙感影像波段數
λ——波段 ελ——λ的殘差
3.2.1 光譜庫建立和端元選取
端元光譜的選擇對于生成高精度的組分豐度數據至關重要,本文基于無人機影像和地面實測數據,按照VIS建模原則,在影像上選取了植被、不透水面、裸土3種地物類型的端元,數量分別為植被端元606個、不透水面端元209個、裸土端元271個,總計1 086個,將這些端元的光譜收集并建立光譜庫,利用“Viper Tools”計算影像光譜庫每條光譜的端元平均均方根誤差(Endmember average root mean square error,EAR)[18-19]和 最 小 平 均光 譜 角(Minimum average spectral angle,MASA)[20],選擇EAR、MASA值較低的端元為最優端元。通過比選,最終從1 086條端元光譜中選取了18條作為最優端元光譜。光譜曲線如圖3所示。

圖3 端元光譜曲線Fig.3 Spectral curves of endmember
3.2.2 端元組合模型
文獻[21]研究表明,2端元模型適合自然地物景觀的模擬分解,3端元模型適合人為擾動下的地物景觀模擬分解,4端元模型適合城鎮建設區的模擬分解。研究區域內地形起伏、土地利用覆被狀況較為復雜、人為擾動因素大,所以本文主要測試了3端元、4端元的組合模型。約束條件分別為:非陰影組分豐度范圍在-0.05~1.05之間;最大允許陰影組分為0.8;最大RMSE為0.025。各端元模型的評價如表2所示。

表2 端元組合模型評價Tab.2 Assessment of combinations of endmember model
通過表2的解混比例和RMSE的比較結果可知,3端元組合模型中雖然“植被+不透水面+陰影”組合與4端元模型組合的解混比例相同為91.0%,但RMSE相對較高為0.006 9,而3端元組合模型中“不透水面+裸土+陰影”的組合模型雖然RMSE最低為0.002 2,但解混比例也最低,只有18.8%,所以相比較下4端元組合模型的解混效果更優,因此本研究選取4端元組合模型進行MESMA混合像元的分解,通過陰影歸一化后生成植被、不透水面、裸土3種組分豐度圖像。
3.3 特征變量計算與選取
研究基于影像的光譜、紋理信息進行特征變量的計算、選取。光譜特征變量主要包括波段變量(B、G、R、NIR、SWIR1、SWIR2),光譜指數變量包括NDVI(Normalized difference vegetation index)、BCI (Biophysical composition index)[22-23]、 EVI (Enhanced vegetation index)、MNDWI(Modified normalized difference water index)、MNLI(Modified non-linear index)、SAVI(Soil adjusted vegetation index),共12個光譜特征變量。
紋理特征變量選取時,經多次試驗對比分析,選用3×3大小的移動窗口,利用灰度共生矩陣(GLCM)分別計算影像6個光譜波段變量的8種紋理特征[24]:均值(Mean)、方差(Variance)、同質性(Homogeneity)、對 比 度 (Contrast)、差 異 性(Dissimilarity)、熵 (Entropy)、二 階矩 (Second moment)、相關性(Correlation),計算后得到48個紋理特征變量,因48個變量之間相關性較高,利用主成分變換(PCA)對其進行降維,以標準差值7為閾值正向排序擇優選取了前8個主成分變量(PC1~PC8)參與影像分類,合計8個紋理特征變量。
結合前述的MESMA解混生成的植被、不透水面、裸土組分特征變量,總計23個特征變量參與RF影像分類,所有的特征變量如表3所示。

表3 特征變量統計Tab.3 Statistic of feature variables
3.4 隨機森林分類算法
隨機森林分類算法是由決策樹組合構成的機器學習算法,該算法適用于處理高維數據且運行速度相對較快[25],其執行過程如下:首先采用隨機Bootstrap方法從原始數據中有放回的抽取N組訓練集,每組訓練集的大小約為訓練數據集的2/3,這一過程稱為 Bagging;然后利用 N組訓練集構建N棵決策樹,在每棵樹生長過程中,從全部M個特征變量中隨機抽選m個(m≤M)進行內部節點劃分;最后,集合N棵決策樹的預測結果,采用投票的方式決定新樣本的類別。在訓練數據抽取過程中,約1/3的數據未被抽中,這些數據稱為袋外數據(OOB),OOB可用于類別錯分的誤差評估和變量重要性估計,在變量選取過程中采用了Gini系數測量變量的不純度。參數設置中通常樹的默認數量(ntree)為100,變量默認數量(mtry)為影像波段總數的平方根[26-29]。
本文通過特征變量選取構建了3種不同的特征變量組合模型進行隨機森林分類實驗,模型1:多光譜特征模型(記為MS);模型2:多光譜、紋理特征組合模型(記為MS+TXT);模型3:多光譜、紋理、組分特征組合模型(記為MS+TXT+EM),測評各類型特征變量對影像分類的貢獻度,選出最佳的分類方案。隨機森林ntree和mtry的參數尋優采用了基于OOB誤差值的網格搜索法,隨機森林分類算法與網格搜索算法均在IDL8.5語言平臺實現。
4.1 多端元混合像元分解結果

圖4 MESMA組分豐度圖Fig.4 MESMA fraction maps
由MESMA方法生成的植被、不透水面、裸土組分豐度圖如圖4所示,組分豐度范圍在 -0.05~1.05之間,豐度越高越接近該類地物。可以看出,與真彩色影像(圖4a)相比較,植被(圖4b)、不透水面(圖4c)和裸土(圖4d)的組分豐度分布邊界清晰,與研究區實際情況基本一致,如圖4位置①中的植被、位置②中的不透水面和位置③中的裸土等。
4.2 隨機森林分類結果與精度評價
利用基于OOB誤差值的網格搜索法在ntree范圍1~600內對3個模型進行參數尋優,3個模型的mtry和ntree最優參數分別為(3,102)、(4,188)和 (5,126)[30-31],利用以上參數分別執行隨機森林分類算法得到分類結果,3個模型分類總體精度分別為85.36%、89.48%和90.50%。由變化幅度看,多光譜特征模型在增加了紋理變量后,精度提升幅度最大為4.12%,而在加入組分特征變量后分類精度得以進一步提高。各模型分類圖的局部效果如圖5所示。

圖5 分類結果局部效果對比Fig.5 Comparisons of local classification result
從圖5視覺效果看,圖5a中模型2的分類結果明顯優于模型1,模型1位置①、③中錯分為工礦用地的像素、位置②中錯分為水域的像素,相應的在模型2中都得到了較好改善;模型1結果椒鹽效果較為明顯,而在模型2中增加了紋理特征變量后,椒鹽效果消除顯著,各地類的分布更加均勻連片。模型3與模型2結果相比較,分類精度進一步提高,如圖5b所示,模型2中標記位置的錯分像素點相應在模型3結果中有所改善,椒鹽效果得以進一步消除,圖面更加整潔美觀。
3個模型中,模型3分類精度最高達90.50%,混淆矩陣見表4,其中精度在80%以下的為工礦用地和建設用地,分別為79.41%和67.97%,與林地、耕地、水域相比精度相對較低,說明實驗方法在區分工礦和建設用地中還存在一定局限性,但較之模型1的 51.84%和 51.63%,分別提高 27.57%和16.34%,可知在隨機森林分類方法框架下,增加了紋理變量和組分變量后,影像的分類精度提高顯著。

表4 模型3精度評價Tab.4 Accuracy assessm ent ofm odel 3 %
4.3 特征變量重要性估計
如前所述,隨機森林分類方法的優勢之一是可以評估特征變量的重要性和貢獻度。圖6表示根據OOB誤差得出的模型3的特征變量重要性排序,由圖可知排序靠前的特征變量主要為原始光譜特征變量和光譜指數變量,其中R、SWIR2、MNDWI、B 4個特征變量重要性值均大于0.8,排序最為靠前,原因是研究區域內林地植被面積所占比重最高達55.58%,而植被在紅光波段具有強吸收的特性,所以R變量在研究區域內對于大范圍的植被信息提取貢獻度最高;SWIR2重要性高是因為土壤在短波紅外區有強反射的特性,而研究區內耕地土壤面積占比24.01%,僅次于植被林地,所以在分類過程中SWIR2對土壤信息的提取起到了重要作用;MNDWI重要性較高的原因可能是因為研究區域內包含了赤水河的一部分和若干水域,雖然面積占比不高,但分布較為集中易于識別,所以使得MNDWI重要性較高;而Landsat-8 OLI的藍光波段在水體制圖、土壤和植被之間的區分時作用較大,所以B變量的重要性排序也較為靠前。重要性值在0.5~0.8之間的特征變量為SWIR1、SAVI、NDVI、BCI、PC8、PC4,其中3個光譜指數分別適用于提取土壤(SAVI)、植被(NDVI)和不透水面(BCI),由此看出這3個光譜指數可有效增強影像類間的可分性。組分特征變量的重要性值在0.2以下,原因是組分變量是基于原始影像數據線性變換生成,與原始數據的相關性相對較高,且信息量的豐富程度上也不及原始數據,所以在排序中相對靠后,而各變量中紋理特征變量中的PC3、PC5重要性最低。以上結果說明雖然組分、紋理特征變量的融合可以提高隨機森林分類方法的精度,但在變量的重要程度上,還是原始光譜特征變量與其相應光譜指數變量對分類的貢獻度更高,這也與一些學者的研究結論一致。

圖6 模型3特征變量重要性Fig.6 Feature variables importance value ofmodel 3
4.4 不同方法分類結果比較
為評估本文方法在眾多分類方法中的表現,將模型3(記為RF_MESMA)、模型2(記為RF)的分類結果分別與基于LSMA和RF方法的分類結果、目前應用范圍較廣的SVM和MLC方法分類結果進行了比較。其中,LSMA與MESMA采用相同的端元進行混合像元分解,生成植被、土壤、不透水面3種組分數據,與RF方法相結合進行影像分類(記為RF_ LSMA);SVM和MLC分成2種情況,即組分特征變量參與分類和未參與分類,以相同的訓練和驗證樣點,構建了4種模型進行實驗,模型分別為:組分特征變量參與分類的SVM模型(記為SVM_MESMA),組分特征變量未參與分類的 SVM模型(記為SVM);組分特征變量參與分類的MLC模型(記為MLC_MESMA),組分特征變量未參與分類的MLC模型(記為MLC)。通過比較各方法的特征變量數、分類總體精度和Kappa系數,分析各組合、分類方法對山丘區土地利用信息分類提取的適用性,比較結果如表5所示。

表5 不同方法精度評價Tab.5 Accuracy assessment of classification result based on differentmethods
對照結果可知,RF、SVM、MLC 3種方法相比較,RF結果精度最優達89.48%。各分類方法在加入MESMA生成的組分特征變量后,分類精度都有不同程度的提高,分別提高1.02個百分點、0.06個百分點、0.63個百分點,其中RF_MESMA方法模型的分類結果精度最高為90.50%,與SVM_MESMA、MLC_MESMA相比精度分別高1.65個百分點和4.15個百分點,說明MESMA方法生成的組分信息數據作為特征變量參與分類后可在一定程度上提高影像的分類精度。
RF_MESMA與RF_LSMA方法相比較,前者精度為90.50%,后者精度為89.96%,說明MESMA方法對于提高信息分類提取精度作用更為明顯。
模型3(RF_MESMA)分類結果如圖7b所示,與原始影像圖7a相比可看出,影像中主要地類信息都得到了有效的提取。
MESMA可以獲得較為精確的組分豐度信息; RF分類結果優于相同特征變量下的SVM和MLC分類結果;在MESMA生成的組分信息變量參與分類后,3種方法的分類精度均有所改善,分別達到90.50%、88.85%、86.35%,其中RF的分類精度改善最為顯著;MESMA與LSMA生成的組分信息變量相比,前者對于改善分類精度效果更為明顯。MESMA對于提高影像分類精度起到一定積極作用,基于MESMA和RF的方法對中等空間分辨率影像山丘區土地利用信息分類提取的精度較高,利用該方法開展遙感影像解譯可為大尺度的土地利用、復墾監測和管理工作提供技術支持和理論參考。

圖7 影像分類圖Fig.7 Classification results of image
1 林楠,姜琦剛,楊佳佳,等.基于資源一號02C高分辨率數據的農業區土地利用分類[J/OL].農業機械學報,2015,46(1): 278-284.http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?flag=1&file_no=20150139&journal_id=jcsam.DOI:10.6041/j.issn.1000-1298.2015.01.039.LIN Nan,JIANG Qigang,YANG Jiajia,et al.Classifications of agricultural land use based on high-spatial ZY1-02C remote sensing images[J/OL].Transactions of the Chinese Society for Agricultural Machinery,2015,46(1):278-284.(in Chinese)
2 張增祥,汪瀟,溫慶可,等.土地資源遙感應用研究進展[J].遙感學報,2016,20(5):1243-1258.ZHANG Zengxiang,WANG Xiao,WEN Qingke,et al.Research progress of remote sensing application in land resources[J].Journal of Remote Sensing,2016,20(5):1243-1258.(in Chinese)
3 FENG Quanlong,GONG Jianhua,LIU Jiantao,et al.Flood mapping based on multiple endmember spectralmixture analysis and random forest classifier—the case of Yuyao,China[J].Remote Sensing,2015,7(9):12539-12562.
4 馬孟莉,朱艷,李文龍,等.基于分層多端元混合像元分解的水稻面積信息提取[J].農業工程學報,2012,28(2):154-159.MA Mengli,ZHU Yan,LIWenlong,et al.Extracting area information of paddy rice based on stratified multiple endmember spectralmixture analysis[J].Transactions of the CSAE,2012,28(2):154-159.(in Chinese)
5 王浩,吳炳方,李曉松,等.流域尺度的不透水面遙感提取[J].遙感學報,2011,15(2):388-400.WANG Hao,WU Bingfang,LIXiaosong,etal.Extraction of impervious surface in Hai Basin using remote sensing[J].Journal of Remote Sensing,2011,15(2):388-400.(in Chinese)
6 繆春華,張顯峰,劉羽.基于多端元光譜分解的干旱區植被覆蓋度遙感反演[J].應用生態學報,2012,23(12):3243-3249.MIU Chunhua,ZHANG Xianfeng,LIU Yu.Remote sensing retrieval of vegetation coverage in arid areas based on multiple endmember spectral unmixing[J].Chinese Journal of Applied Ecology,2012,23(12):3243-3249.(in Chinese)
7 馬玥,姜琦剛,孟治國,等.基于隨機森林算法的農耕區土地利用分類研究[J/OL].農業機械學報,2016,47(1):297-303.http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?flag=1&file_no=20160140&journal_id=jcsam.DOI:10.6041/ j.issn.1000-1298.2016.01.040.MA Yue,JIANG Qigang,MENG Zhiguo,et al.Classification of land use in farming area based on random forest algorithm[J/OL].Transactions of the Chinese Society for Agricultural Machinery,2016,47(1):297-303.(in Chinese)
8 郭玉寶,池天河,彭玲,等.利用隨機森林的高分一號遙感數據進行城市用地分類[J].測繪通報,2016(5):73-76.
9 楊珺雯,張錦水,朱秀芳,等.隨機森林在高光譜遙感數據中降維與分類的應用[J].北京師范大學學報:自然科學版,2015,51(1):82-88.YANG Junwen,ZHANG Jinshui,ZHU Xiufang,et al.Random forest applied for dimension reduction and classification in hyperspectral data[J].Journal of Beijing Normal University:Natural Science,2015,51(1):82-88.(in Chinese)
10 王書玉,張羽威,于振華.基于隨機森林的洪河濕地遙感影像分類研究[J].測繪與空間地理信息,2014,37(4):83-85.WANG Shuyu,ZHANG Yuwei,YU Zhenhua.Classification of Honghe Wetland remote sensing image based on random forests[J].Geomatics&Spatial Information Technology,2014,37(4):83-85.(in Chinese)
11 張玉芳,龐艷梅,劉琰琰,等.近50年四川省水稻生產潛力變化特征分析[J].中國生態農業學報,2014,22(7):813-820.ZHANG Yufang,PANG Yanmei,LIU Yanyan,et al.Potential productivity of rice in Sichuan Province in recent five decades[J].Chinese Journal of Eco-Agriculture,2014,22(7):813-820.(in Chinese)
12 孫園園,徐富賢,孫永健,等.四川稻作區優質稻生產氣候生態條件適宜性評價及空間分布[J].中國生態農業學報,2015,23(4):506-513.SUN Yuanyuan,XU Fuxian,SUN Yongjian,etal.Suitability evaluation of eco-climatic conditions for high quality rice production in Sichuan Province[J].Chinese Journal of Eco-Agriculture,2015,23(4):506-513.(in Chinese)
13 肖科.瀘州市土地整理效益分析與評價[D].雅安:四川農業大學,2009.
14 劉正春,曾永年,何麗麗,等.基于光譜歸一化的變組分光譜混合分析(NMESAM)方法及其應用[J].遙感技術與應用,2012,27(2):159-167.LIU Zhengchun,ZENG Yongnian,HE Lili,et al.Method of normalized multiple endmember spectralmixture analysis and its application[J].Remote Sensing Technology and Application,2012,27(2):159-167.(in Chinese)
15 MAXWELL A E,WARNER T A.Differentiating mine-reclaimed grasslands from spectrally similar land cover using terrain variables and object-basedmachine learning classification[J].International Journal of Remote Sensing,2015,36(17):4384-4410.
16 WU Chaofan,DENG Jinsong,WANG Ke,et al.Object-based classification approach for greenhouse mapping using Landsat-8 imagery[J].International Journal of Agricultural&Biological Engineering,2016,9(1):79-88.
17 丁建麗,姚遠.干旱區綠洲典型地物MESMA模擬分解與驗證[J].地球信息科學學報,2013,15(3):452-460.DING Jianli,YAO Yuan.Research on pixel un-mixing of typical surface features in oasis based on the MESMA model[J].Journal of Geo-information Science,2013,15(3):452-460.(in Chinese)
18 POWELL R L,ROBERTS D A,DENNISON P E,et al.Sub-pixel mapping of urban land cover using multiple endmember spectralmixture analysis:Manaus,Brazil[J].Remote Sensing of Environment,2007,106(2):253-267.
19 DENNISON P E,ROBERTS D A.Endmember selection for multiple endmember spectral mixture analysis using endmember average RMSE[J].Remote Sensing of Environment,2003,87(2):123-135.
20 DENNISON P E,HALLIGAN K Q,ROBERTS D A.A comparison of error metrics and constraints for multiple endmember spectralmixture analysis and spectral anglemapper[J].Remote Sensing of Environment,2004,93(3):359-367.
21 LIU Jiantao,FENG Quanlong,GONG Jianhua,et al.Land-cover classification of the Yellow River Delta wetland based on multiple endmember spectralmixture analysis and a random forest classifier[J].International Journal of Remote Sensing,2016,37(8):1845-1867.
22 徐涵秋,王美雅.地表不透水面信息遙感的主要方法分析[J].遙感學報,2016,20(5):1270-1289.XU Hanqiu,WANGMeiya.Remote sensing-based retrievalofground impervious surfaces[J].Journal of Remote Sensing,2016,20(5):1270-1289.(in Chinese)
23 DENG Chengbin,WU Changshan.BCI:a biophysical composition index for remote sensing of urban environments[J].Remote Sensing of Environment,2012,127(5):247-259.
24 王文靜,張霞,趙銀娣,等.綜合多特征的Landsat 8時序遙感圖像棉花分類方法[J].遙感學報,2017,21(1):115-124.WANGWenjing,ZHANG Xia,ZHAO Yindi,etal.Cotton extractionmethod of integratedmulti-features based onmulti-temporal Landsat8 images[J].Journal of Remote Sensing,2017,21(1):115-124.(in Chinese)
25 BREIMAN L.Random forest[J].Machine Learning,2001,45(1):5-32.
26 趙玉,王紅,張珍珍.基于遙感光譜和空間變量隨機森林的黃河三角洲刺槐林健康等級分類[J].遙感技術與應用,2016,31(2):359-367.ZHAO Yu,WANG Hong,ZHANG Zhenzhen.Forest healthy classification of Robinia pseudoacacia in the Yellow River Delta,China based on spectral and spatial remote sensing variables using random forest[J].Remote Sensing Technology and Application,2016,31(2):359-367.(in Chinese)
27 EISAVIV,HOMAYOUNIS,YAZDI A M,et al.Land cover mapping based on random forest classification ofmultitemporal spectral and thermal images[J].Environmental Monitoring and Assessment,2015,187(5):291.
28 GHOSH A,SHARMA R,JOSHIPK.Random forest classification of urban landscape using Landsat archive and ancillary data: combining seasonalmapswith decision level fusion[J].Applied Geography,2014,48(2):31-41.
29 雷震.隨機森林及其在遙感影像處理中應用研究[D].上海:上海交通大學,2012.
30 王興玲,李占斌.基于網格搜索的支持向量機核函數參數的確定[J].中國海洋大學學報,2005,35(5):859-862.WANG Xingling,LI Zhanbin.Identifying the parameters of the kernel function in support vector machines based on the gridsearchmethod[J].Periodical of Ocean University of China,2005,35(5):859-862.(in Chinese)
31 劉穎.基于機器學習的遙感影像分類方法研究[M].北京:清華大學出版社,2014.
Classification and Extraction of Land Use Information in Hilly Area Based on MESMA and RF Classifier
CHEN Yuanpeng1,2YUNWenju2ZHOU Xu2PENG Junhuan1LIShaoshuai1,2ZHOU Yan2
(1.School of Land Science and Technology,China University of Geosciences(Beijing),Beijing 100083,China 2.Land Consolidation and Rehabilitation Center,Ministry of Land and Resource,Beijing 100035,China)
Due to the factors such as sensor spatial resolution and heterogeneity of surface features,the mixed-pixels were commonly found in medium-spatial resolution remote sensing data,especially in hilly areas,strong topographic relief,diversity,breakage,mixed distribution and scattered layout of the surface features and other factors constituted the difficulties of remote-sensing image classification mapping.In order to improve the classification accuracy for land use in hilly areas and provide data support for land use monitoring,a combined approach ofmultiple endmember spectralmixture analysis (MESMA)and random forest(RF)was explored.Based on data source of Landsat-8 operational land imager(OLI)sensor data,the fractional abundance of vegetation,impervious surface and soilwas firstly extracted through MESMA.Secondly,totally 20 feature variables were figured out and three combined modelswere constructed on the basis of data image spectrum,texture and fraction variables to carry out random forest classification experiment.Through comparing between the optimal result from the experiment and SVM and MLC classification results,including the same number of variables,the results indicated that MESMA can derive accurate fraction information.The inclusion of fraction information could help to improve themapping accuracy of all classification methods(RF,SVM and MLC),which can be up to 90.50%,88.85%and 86.35%,respectively,the gain of RF classification accuracy was most significant.Comparing with LSMA,the fraction variable generated by MESMA wasmore useful for improving the accuracy.The combinedmethod ofMESMA and RF can achieve the comparatively accurate classification map in the multi-feature variables.The accuracy was better than those of SVM and MLCclassification results with the same feature variables.Therefore,the proposed method can obtain high precision in land use classification in hilly area.Based on this method,remote sensing image interpretation of large scales can provide technical support and rational reference for land reclamation monitoring.
classification of land use;medium-spatial resolution;multiple endmember spectralmixture analysis;random forest;hilly area
TP79;S127
A
1000-1298(2017)07-0136-09
2017-04-28
2017-05-18
國土資源部公益性行業科研專項(201511010-02)
陳元鵬(1988—),男,博士生,國土資源部土地整治中心工程師,主要從事遙感技術和土地復墾研究,E-mail:cyp520918@163.com
10.6041/j.issn.1000-1298.2017.07.017