999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于網(wǎng)格搜索隨機森林算法的工礦復墾區(qū)土地利用分類

2017-11-24 06:07:40陳元鵬彭軍還李少帥
農(nóng)業(yè)工程學報 2017年14期
關(guān)鍵詞:分類特征方法

陳元鵬,羅 明,彭軍還,王 軍,周 旭,李少帥

(1. 中國地質(zhì)大學(北京)土地科學技術(shù)學院,北京 100083;2. 國土資源部土地整治中心,北京 100035)

基于網(wǎng)格搜索隨機森林算法的工礦復墾區(qū)土地利用分類

陳元鵬1,2,羅 明1,彭軍還2,王 軍1,周 旭1,李少帥1,2

(1. 中國地質(zhì)大學(北京)土地科學技術(shù)學院,北京 100083;2. 國土資源部土地整治中心,北京 100035)

為提高工礦復墾區(qū)遙感影像土地利用分類精度,為土地復墾監(jiān)測工作提供數(shù)據(jù)支持,該文探討了基于網(wǎng)格搜索(Grid-Search)的隨機森林(random forest)復墾區(qū)土地利用分類方法。研究利用GF-1影像、DEM(digital elevation model)和野外調(diào)查等數(shù)據(jù),以隨機森林分類算法為框架,采用基于OOB(Out-of-Bag)誤差的網(wǎng)格搜索法對算法進行參數(shù)尋優(yōu),結(jié)合影像光譜、地形、紋理、空間信息,計算選取了33個特征變量,構(gòu)建了4種變量組合模型開展隨機森林分類試驗,4個組合模型的分類精度分別達到82.79%、84.91%、86.75%、88.16%。為去除33個特征變量中的冗余信息、降低影像波段變量維度、縮短分類執(zhí)行時間并保證影像分類精度,試驗分別利用變量重要性估計和Relief F方法進行特征選擇后再次執(zhí)行隨機森林分類,將分類結(jié)果與不同組合模型、不同分類方法進行比較,結(jié)果表明:基于網(wǎng)格搜索參數(shù)尋優(yōu)的隨機森林算法在多特征變量的影像分類中可以達到88.16%的分類精度,在利用不同方法降維后依然可以將分類精度保持在85%以上,精度優(yōu)于相同特征變量下的SVM(support vector machine)和MLC(maximum likelihood classification)分類方法;在效率方面,隨機森林分類方法執(zhí)行時間優(yōu)于SVM,并且在處理多維特征變量時能力更強。由此可見,采用基于網(wǎng)格搜索的隨機森林方法對工礦復墾區(qū)土地利用信息進行分類提取可以得到較高的精度,基于該方法開展遙感影像解譯可為土地復墾監(jiān)測工作提供技術(shù)支持和理論參考。

土地復墾;土地利用;工礦;復墾區(qū);隨機森林;網(wǎng)格搜索;多特征變量;特征選擇

0 引 言

中國是一個礦業(yè)大國,礦產(chǎn)資源開發(fā)為國家社會經(jīng)濟發(fā)展做出了巨大的貢獻,但礦產(chǎn)資源開采對一些區(qū)域土地資源和生態(tài)環(huán)境造成了嚴重的負面影響[1],對此,土地復墾與生態(tài)重建成為統(tǒng)籌礦產(chǎn)資源開發(fā)和土地資源保護、推動生態(tài)文明建設(shè)的重要措施。利用遙感技術(shù)手段開展復墾區(qū)土地利用信息的識別、提取與分類成為驗證、評估土地復墾工作成效,持續(xù)跟蹤復墾土地后期管護情況的重要手段之一。

隨機森林(RF,random forest)分類方法目前在基于機器學習的遙感影像分類方法中精度相對較高,在處理大數(shù)據(jù)集時運行速度更快,不容易過擬合,處理多維變量能力強,可生成變量重要性估計,所以該方法在多維數(shù)據(jù)分類回歸中被廣泛應(yīng)用,并取得較好效果[2]。

在國外,RF方法應(yīng)用于遙感影像分類的研究開展較早,如Pal等利用其對土地覆被進行分類,并與迭代、支持向量機、決策樹等方法在精度及效率方面進行比較,驗證了方法的優(yōu)越性[3-4]。近些年,國內(nèi)亦有研究人員將RF方法應(yīng)用于遙感影像的分類研究,如馬玥、郭玉寶等分別應(yīng)用該方法對農(nóng)耕區(qū)和城市區(qū)土地利用信息進行了分類提取,并取得較高精度[5-7]。但國內(nèi)對于 RF方法的研究與應(yīng)用仍有待深入和加強,如對方法本身而言,存在一定缺陷,封裝性強、運行過程不可控,只能通過參數(shù)調(diào)節(jié)完善模型;對研究應(yīng)用而言,以中等分辨率影像和平原區(qū)的研究居多,基于高分辨率影像的山地丘陵區(qū)研究較少。

工礦復墾區(qū)域,多位于山地丘陵區(qū),域內(nèi)地形起伏大、地物分布破碎,項目區(qū)較小、布局分散,利用中等分辨率影像開展地物信息提取的精度難以滿足土地復墾管理需求。因此采用高分辨影像開展工礦復墾區(qū)土地利用分類研究很有必要,同時利用參數(shù)尋優(yōu)與RF結(jié)合可彌補方法本身不足,有助于提高分類精度。

本文使用高分辨率影像,采用基于 RF袋外數(shù)據(jù)(OOB,Out-of-Bag)誤差網(wǎng)格搜索(Grid-Search)參數(shù)尋優(yōu)的分類方法對工礦復墾區(qū)土地利用信息進行分類提取,分析不同特征變量對分類結(jié)果的影響與重要性,并根據(jù)特征變量重要性和 Relief F方法分別對高維數(shù)據(jù)降維,通過與支持向量機(SVM,support vector machine)和最大似然(MLC,maximum likelihood classification)分類方法進行比較,評估RF分類方法的性能和在工礦復墾區(qū)土地利用分類中的適用性,為土地復墾監(jiān)測工作提供理論參考和技術(shù)支持。

1 研究區(qū)概況

研究區(qū)位于四川省瀘州市古藺縣石屏鄉(xiāng),地理坐標為 28°0′55′~28°3′26′N,105°59′32′~106°2′13′E,區(qū)域內(nèi)海拔410~1 025 m,中亞熱帶氣候,年平均氣溫17.1~18.5 ℃、平均降雨量748.4~1 184.2 mm。區(qū)域內(nèi)分布有若干硫磺廠與工業(yè)區(qū),堆積有廢棄磺渣堆,對周邊土地造成了一定污染[8-10],參照《土地利用現(xiàn)狀分類標準(GB/T 21010-2007)》,研究區(qū)內(nèi)土地利用類型劃分為有林地、灌木林地、旱地、工礦用地(工業(yè)用地、采礦用地)、農(nóng)村宅基地、道路(公路、農(nóng)村道路)和坑塘水面等,地理區(qū)位、樣點分布及遙感影像數(shù)據(jù)如圖1所示。

圖1 研究區(qū)地理位置、樣點分布和3D遙感影像Fig.1 Location of study area, sampling points distribution and 3D of remote sensing image

2 數(shù)據(jù)選取及預處理

本研究中采用的主要數(shù)據(jù)為GF-1衛(wèi)星遙感影像,輔助數(shù)據(jù)包括無人機航拍影像、DEM數(shù)據(jù)、地面實測數(shù)據(jù)、Google Earth數(shù)據(jù)。其中,GF-1衛(wèi)星遙感影像用于復墾區(qū)土地利用信息分類提取;DEM數(shù)據(jù)作為輔助數(shù)據(jù),提取坡度、坡向信息,參與影像分類并用于提高影像分類精度;無人機航拍影像與Google Earth數(shù)據(jù)用于樣點采集和精度評價。

2.1 GF-1衛(wèi)星遙感影像

GF-1號衛(wèi)星發(fā)射于2013年,搭載了兩臺2 m分辨率全色/8m分辨率多光譜相機(PMS),四臺16 m分辨率多光譜相機(WFV)[11]。本文選用的GF-1遙感數(shù)據(jù)為2 m分辨率全色/8 m分辨率多光譜波段數(shù)據(jù)1景,波段數(shù)為5,分別為 B、G、R、NIR、PAN,獲取日期為 2016年 10月9日,域內(nèi)無云量。影像的預處理在ENVI5.3軟件平臺中完成,對多光譜數(shù)據(jù)的預處理包括輻射定標、FLAASH模塊大氣校正、正射校正,后對全色數(shù)據(jù)進行輻射定標、正射校正,再將全色和多光譜數(shù)據(jù)利用Gram-Schmidt 方法融合后裁剪生成研究區(qū)影像數(shù)據(jù)[12]。

2.2 輔助數(shù)據(jù)

輔助數(shù)據(jù)中,航拍影像為 UV-II型無人機搭載的Pentax-645D相機拍攝,拍攝時間為2016年11月,空間分辨率為0.2 m;DEM數(shù)據(jù)基于無人機航拍影像的畸變校正、自由網(wǎng)空三加密后生成,空間分辨率2 m。

2.3 地面實測與樣點數(shù)據(jù)

地面實測數(shù)據(jù)的采集在無人機航拍過程中同步開展,地面實測儀器采用天寶手持式 GPS,水平精度優(yōu)于1m(Trimble geoexplorer 2008 Series GeoXH,trimble navigation limited,USA);此外,還應(yīng)用Google Earth影像數(shù)據(jù)用以輔助航拍影像選取訓練與驗證樣點,其中訓練樣點48 279個像素,占比20%;驗證樣點209 691個像素,占比80%。

3 研究方法

3.1 技術(shù)方法

本文方法流程:1)對全色和多光譜影像進行預處理和融合,對航拍影像、DEM影像與衛(wèi)星影像進行配準、裁剪,利用Nearest Neighbor方法將航拍影像空間分辨率重采樣至1 m以提高影像處理速度;2)結(jié)合數(shù)據(jù)的光譜、地形、紋理、空間信息進行特征變量的計算、選取;3)建立了4種不同的特征變量組合模型:模型1(光譜特征,SPE),模型 2(光譜、地形特征組合,SPE+DEM),模型3(光譜、地形和紋理特征組合,SPE+DEM+TXT),模型4(光譜、地形、紋理和空間特征組合,SPE+DEM+TXT+SPA),評測各特征變量對影像分類的貢獻度,選出最佳的分類方案;4)通過基于 OOB誤差的網(wǎng)格搜索法進行RF分類算法參數(shù)尋優(yōu),對4種模型執(zhí)行分類并對結(jié)果進行精度評價[13-14];5)利用特征變量重要性估計和Relief F方法分別擇優(yōu)選取波段變量,再次執(zhí)行RF分類算法,通過與SVM和MLC分類方法進行比較,評估RF分類方法的性能,技術(shù)路線如圖2。

圖2 技術(shù)路線Fig.2 Work flow of this study

其中,影像的特征變量計算包括基于光譜信息計算的適于提取植被的NDVI(normalized difference vegetation index)、適于提取不透水面的BCI(biophysical composition index)[15-16];基于地形數(shù)據(jù)計算的坡度、坡向、曲率;基于紋理信息計算的均值、方差、同質(zhì)性、熵與二階距等;反映空間信息的 Local Moran’I和 Local Getis Ord Gi[17]。

3.2 特征變量計算與選取

影像獲取月份為10月,該時段部分旱地植被覆蓋度較低,其目視特征與工礦用地十分相似。GF-1影像沒有中紅外、熱紅外波段,無法構(gòu)建NDISI、NDII等提取不透水層較為有效的光譜指數(shù)[18],因此本文利用三指數(shù)法構(gòu)建了 BCI指數(shù),用以增強分類算法識別低覆蓋度植被區(qū)與工礦區(qū)的能力。

BCI的計算過程如下[19-20]

式中B、G、R、NIR分別為藍、綠、紅光和近紅外波段,TC1、TC2、TC3為纓帽變換后的前3個分量,H、V、L為歸一化后的TC1、TC2、TC3。

地形信息特征變量包括DEM,基于DEM計算的坡度(slope)、坡向(aspect)、曲率(curvature);紋理信息特征變量中,經(jīng)多次試驗對比分析,選用 3×3大小的移動窗口,利用灰度共生矩陣分別計算影像 4個波段變量的8種紋理特征[21]:均值(mean)、方差(variance)、同質(zhì)性(homogeneity)、對比度(contrast)、差異性(dissimilarity)、熵(entropy)、二階矩(second moment)、相關(guān)性(correlation)[22],總計32個變量,因32個變量之間相關(guān)性較高,利用主成分變換(PCA)對其進行降維,以標準差值0.3為閾值正向排序擇優(yōu)選取了前12個變量(PC1~PC12)參與影像分類;空間信息特征變量是基于全部光譜、地形、紋理信息計算的Local Moran’I和Local Getis Ord Gi,以標準差值0.6為閾值正向排序最后選擇了10個變量參與分類。所有特征變量如表1所示。

表1 特征變量統(tǒng)計Table 1 Statistic of feature variables

3.3 RF分類方法

RF分類方法是由決策樹組合構(gòu)成的機器學習算法,該算法適用于處理高維數(shù)據(jù)且運行速度相對較快[23],它的執(zhí)行過程如下:首先采用隨機Bootstrap方法從原始數(shù)據(jù)中有放回的抽取N組訓練集,每組訓練集的大小約為訓練數(shù)據(jù)集的 2/3,這一過程稱為Bagging;然后利用N組訓練集構(gòu)建N棵決策樹,在每棵樹生長過程中,從全部M個特征變量中隨機抽選m個(m≤M)進行內(nèi)部節(jié)點劃分;最后,集合N棵決策樹的預測結(jié)果,采用投票的方式?jīng)Q定新樣本的類別。在訓練數(shù)據(jù)抽取過程中,約1/3的數(shù)據(jù)未被抽中,這些數(shù)據(jù)稱為袋外數(shù)據(jù)(OOB),OOB可用于類別錯分的誤差評估和變量重要性估計,在變量選取過程中采用了Gini系數(shù)測量變量的不純度。通常樹的默認數(shù)量(ntree)為100,變量默認數(shù)量(mtry)為影像波段總數(shù)的平方根[24-26],為進一步提高分類精度,本文采用了基于 OOB誤差值的網(wǎng)格搜索法[27]進行ntree和mtry的參數(shù)尋優(yōu)。

網(wǎng)格搜索法(Grid-Search)是ntree和mtry分別取M和N個值,用M×N個(ntree,mtry)的組合分別訓練不同的RF分類器,再根據(jù)OOB誤差值估計其學習精度,進而在若干個組合中得到學習精度最高的一個組合作為最優(yōu)參數(shù),其優(yōu)點是可以保證所得的搜索解是劃定網(wǎng)格中的全局最優(yōu)解,避免重大誤差[28]。RF分類算法與網(wǎng)格搜索算法均在Matlab 2012b語言平臺實現(xiàn)。

3.4 訓練與驗證樣點

參照無人機航拍影像、地面實測數(shù)據(jù)和Google Earth高分辨率影像,選取訓練與驗證樣點,其中訓練樣點48 279個像素,占比20%;驗證樣點209 691個像素,占比80%。各類地物樣點數(shù)量與分布如表2。

表2 各地物類型樣點數(shù)量Table 2 Numbers of samples for each class

4 結(jié)果與分析

4.1 分類結(jié)果與精度

利用網(wǎng)格搜索法分別對4個模型的RF算法進行參數(shù)尋優(yōu),模型1的mtry參數(shù)尋優(yōu)范圍是(2、3、4、5),模型2的mtry參數(shù)尋優(yōu)范圍是(3、5、7、9),模型3的mtry參數(shù)尋優(yōu)范圍是(5、10、15),模型 4的mtry參數(shù)尋優(yōu)范圍是(6、12、18);ntree參數(shù)尋優(yōu)范圍統(tǒng)一為(25、50、75、100)。4個模型的mtry和ntree最優(yōu)參數(shù)分別為(4,100)(7,100)(10,100)(12,100),利用以上參數(shù)分別執(zhí)行RF分類算法得到分類結(jié)果,分類圖局部效果如圖 3。4個模型分類總體精度分別為82.79%、84.91%、86.75%、88.16%,由變化幅度看,增加了地形特征變量后,精度提升幅度最大為2.12%,加入紋理特征變量和空間特征變量也能夠相應(yīng)提高分類精度。

通過圖3比較,模型2的分類結(jié)果明顯優(yōu)于模型1,模型1結(jié)果:灌木林地錯分為有林地為32%,村莊錯分為耕地為32.4%(灌木林地和村莊的錯分如位置①),因為灌木林地和有林地具有相似的光譜特性,而在該低山丘陵區(qū)部分村莊和耕地混合分布,所以單純利用光譜信息進行分類效果不佳,而在加入地形數(shù)據(jù)變量后,效果得以改善、精度有所提高、椒鹽現(xiàn)象消除顯著。

模型2結(jié)果相較與模型1:灌木林地、道路、耕地的誤分結(jié)果較模型 1結(jié)果有所改善(位置①),但有林地與耕地誤分增加;的灌木林地與耕地誤分結(jié)果與模型 1比較得以改善(位置②);工礦用地與村莊的區(qū)分效果更優(yōu)(位置③),線狀地物的提取效果更明顯,但部分道路混分到村莊和工礦用地中(位置④)。

圖3 分類結(jié)果局部效果對比Fig.3 Comparison of local classification result

模型3結(jié)果相較于模型2:有林地與耕地的誤分得以進一步改善(位置①),灌木林地錯分為耕地比率有所減少(位置②),村莊和工礦用地中混分的道路得到進一步去除(位置④)。

模型4與模型3結(jié)果比較:引入Local Getis Ord Gi變量后,空間集聚效應(yīng)更優(yōu),細碎的分類地物得到有效歸并(位置②),分類精度進一步提高。

4個模型中,模型4分類精度最高達88.16%,混淆矩陣見下表 3,其中精度在 80%以下的有灌木林地和村莊,分別為76.75%和68.61%,雖然精度相對較低,但較之模型1的56.89%和54.31%,分別提高19.86%和14.3%,可知在多特征變量下分類精度提高顯著。各地物類型的錯分和漏分誤差如下圖4,由圖4知加入地形信息變量后,各地物的錯分漏分誤差都有不同程度降低,尤其灌木林地、村莊、道路的漏分誤差下降顯著,可知地形數(shù)據(jù)變量對于提取建設(shè)用地信息較為有效。加入紋理信息變量和空間信息變量后,各類地物錯分漏分誤差總體呈現(xiàn)下降趨勢,雖然部分地物如道路錯分誤差有所提高,但漏分誤差下降,總體看仍提高了分類精度。

表3 模型4精度評價表Table 3 Accuracy assessment of model 4 %

圖4 分類結(jié)果錯分與漏分誤差圖Fig.4 Commission and omission errors of the classification results

4.2 特征變量重要性與降維

如圖5所示,根據(jù)OOB誤差得出4個模型的特征變量重要性排序,由圖5可知在前個3模型中R、DEM、NDVI、BCI、NIR、PC9、PC5、Slope 重要性較高,B、G、Cur等波段重要性相對較低,而在模型4中加入了空間統(tǒng)計變量Local Getis Ord Gi后,Gi相關(guān)波段變量在分類的重要性中排序較為靠前,其中Gi R變量重要性值最高。在參與分類的變量增多時,冗余變量信息也逐漸增多,B、G、Cur、PC7、PC6等重要性排序相對靠后的變量參與分類后延長了算法執(zhí)行時間,降低了工作效率,如模型1~4的分類執(zhí)行時間分別為6、11、19、26 min,所以雖然模型4的分類精度最高達到88.16%,但相對的分類算法執(zhí)行時間也最長26 min。為此,為在保證分類精度的同時提高分類效率,試驗進行了進一步的特征變量選擇,對影像波段進行降維。主要應(yīng)用了 2種方法進行比較分析。

1)根據(jù)變量重要性估計進行選擇。按照模型4的特征變量重要性排序,利用前向選擇方法抽取了模型 4的前11個特征變量(Gi R、R、DEM、Gi DEM、Gi NDVI、NDVI、slope、PC9、Gi NIR、PC5、BCI),構(gòu)建了與模型2特征變量數(shù)目相同的由11個波段組成的模型,記為模型RF_FS。

2)利用Relief F算法對模型4的變量進行降維。Relief F 算法是一種考慮了多變量和特征互相依賴作用的過濾式(Filter)特征選擇算法[29-30],算法通過“假設(shè)間隔”對特征的分類能力進行評價,綜合考慮類間距與類內(nèi)距,若類間距大于類內(nèi)距,則增加其權(quán)值,若類間距小于類內(nèi)距,則降低其權(quán)值,通過類間距與類內(nèi)距不斷更新其權(quán)值,并根據(jù)計算的最終權(quán)值進行特征選擇,權(quán)值更新公式見(8),假設(shè)間隔θ是指當保持樣本類別不變時分類決策面可移動的最大距離,公式見(9)。

式中,diff()是不同樣本間的距離,n是樣本數(shù)量,f是評價的特征,i是隨機抽中的樣本,H(x)、M(x)分別是樣本x的同類和異類最近鄰樣本點。

利用Relief F算法對模型4的33個特征變量進行選擇,保留了與目標類相關(guān)性較大的前11個變量(Gi R、Gi B、Gi R、R、G、B、PC1、PC3、PC6、PC2、Gi NIR),構(gòu)建了與模型 2特征變量數(shù)目相同的模型,記為RF_Relief F。

4.3 不同方法分類結(jié)果比較

將基于Relief F算法降維的變量組合模型RF_Relief F、基于變量重要性估計降維的變量組合模型RF_FS進行基于網(wǎng)格搜索的 RF算法分類,將分類結(jié)果分別與模型4RF分類(Model 4)、模型2 RF分類(Model 2)、基于變量重要性估計降維后的支持向量機分類(SVM_FS)、基于變量重要性估計降維后的最大似然分類(MLC_FS)結(jié)果進行比較,比較算法執(zhí)行時間、分類總體精度和Kappa 系數(shù),分析各組合、分類方法對復墾區(qū)土地利用信息分類提取的適用性,比較結(jié)果如表4。

對照結(jié)果可知,RF_Relief F和RF_FS的總體精度分別為86.26%、85.24%,與Model 4相比精度分別下降1.9%和2.92%,但與同是11個特征變量的Model 2相比,分類總體精度分別提高1.35%和0.33%,說明雖然特征變量的減少對分類總體精度有負面影響,但對于同等數(shù)量的特征變量而言,特征變量的優(yōu)選對于RF分類總體精度改善有著不同程度的正面影響。RF_Relief F和RF_FS相比,前者總體精度略高,說明總體上看Relief F算法和基于變量重要性估計降維方法相比較,Relief F算法的變量尋優(yōu)效果更佳。但兩者的灌木林地分類精度為分別為59.33%和 75.26%,耕地分類精度分別為 87.59%和 81.59%,道路分類精度分別為86.48%和97.15%,說明基于地形信息的特征變量對于該區(qū)域的灌木林地和道路等的分類精度影響較大,比較結(jié)果見表5。從圖6a、b比較也可看出,位置①②③④差異顯著,主要是道路、工礦和灌木林地的差別。

圖5 模型1~4變量重要性Fig.5 Variable importance value of model 1-4

表4 不同方法精度評價表Table 4 Accuracy assessment of result based on different method

如表5,RF_FS與SVM_FS、MLC_FS相比較,RF_FS分類結(jié)果總體精度分別提高4.1%和5.57%。MLC方法運行時間最短,但精度最低為79.67%,其中工礦用地的分類精度只有52.63%,可知該方法對復墾區(qū)內(nèi)工礦用地信息的提取效果不理想,但其余各地類分類精度均在 70%以上,其中有林地 95.14%、道路 93.32%、灌木林地84.30%。SVM方法分類結(jié)果總體精度較MLC方法稍有提高,但村莊的分類精度只有46.30%、灌木林地65.86%、工礦用地62.97%,算法執(zhí)行時間在四種方法中時間較長達22分鐘,所以本實驗中SVM與MLC分類方法相比,對于工礦復墾區(qū)土地利用信息的分類提取適用性更低。分類結(jié)果及差異如圖6c、d示。

表5 不同方法類間精度評價表Table5 Accuracy assessment of classification result based on different method %

圖6 不同組合、分類方法結(jié)果對比Fig.6 Comparison of different model and classification results

5 結(jié) 論

基于網(wǎng)格搜索參數(shù)尋優(yōu)的 RF方法在多特征變量的影像分類中可以達到88.16%的分類精度,利用不同方法降維后分類精度依然保持在 85%以上,精度優(yōu)于相同特征變量下的SVM和MLC分類方法;在效率方面,隨機森林分類方法執(zhí)行時間優(yōu)于SVM,并且在處理多維特征變量時能力更強。可見采用基于網(wǎng)格搜索的RF方法對工礦復墾區(qū)土地利用信息進行分類提取可以得到較高的精度,基于該方法開展遙感影像解譯可為土地復墾監(jiān)測工作提供技術(shù)支持和理論參考。但研究試驗中仍存在一些有待改進的環(huán)節(jié):如參數(shù)尋優(yōu)過程中的參數(shù)預設(shè)范圍有待進一步擴大;導致各地類分類精度變化的相關(guān)性影響因素有待進一步驗證等,不足之處將在未來的學習研究中逐步完善。

[1] 國土資源部土地整治中心. 《中國土地整治發(fā)展研究報告NO.3》[M]. 北京:社會科學文獻出版社,2016.

[2] 馬玥,姜琦剛,孟治國,等. 基于隨機森林算法的農(nóng)耕區(qū)土地利用分類研究[J]. 農(nóng)業(yè)機械學報,2016,47(1):297-303.Ma Yue, Jiang Qigang, Meng Zhiguo, et al. Classification of land use in farming area based on random forest algorithm[J].Transactions of the Chinese Society for Agricultural Machinery,2016, 47(1): 297-303. (in Chinese with English abstract)

[3] Pal M. Random forest classifier for remote sensing classification[J]. International Journal of Remote Sensing,2005, 26(1): 217-222

[4] Pall Oskar Gislason, Jon Atli Benediktsson, Johannes R Sveinsson. Random forests for land cover classification[J].Pattern Recognition Letters, 2006, 27(4): 294-300

[5] 郭玉寶,池天河,彭玲,等. 利用隨機森林的高分一號遙感數(shù)據(jù)進行城市用地分類[J]. 測繪通報,2016(5):73-76.Guo Yubao, Chi Tianhe, Peng Ling, et al. Classification of GF-1 remote sensing image based on random forests for urban land-use[J]. Bulletin of Surveying and Mapping,2016(5): 73-76. (in Chinese with English abstract)

[6] 楊珺雯,張錦水,朱秀芳,等. 隨機森林在高光譜遙感數(shù)據(jù)中降維與分類的應(yīng)用[J]. 北京師范大學學報(自然科學版),2015,51(1):82-88.Yang Junwen, Zhang Jinshui, Zhu Xiufang, et al. Random forest applied for dimension reduction and classification in hyperspectral data[J]. Journal of Beijing Normal University(Natural Science), 2015, 51(1): 82-88.

[7] 王書玉,張羽威,于振華. 基于隨機森林的洪河濕地遙感影像分類研究[J]. 測繪與空間地理信息,2014,37(4):83-85.Wang Shuyu, Zhang Yuwei, Yu Zhenhua. Classification of Honghe wetland remote sensing image based on random forests[J]. Geomatics & Spatial Information Technology,2014, 37(4): 83-85. (in Chinese with English abstract)

[8] 張玉芳,龐艷梅,劉琰琰,等. 近50年四川省水稻生產(chǎn)潛力變化特征分析[J]. 中國生態(tài)農(nóng)業(yè)學報,2014,22(7):813-820.Zhang Yufang, Pang Yanmei, Liu Yanyan, et al. Potential productivity of rice in Sichuan Province in recent five decades[J]. Chinese Journal of Eco-Agriculture, 2014, 22(7):813-820. (in Chinese with English abstract)

[9] 孫園園,徐富賢,孫永健,等. 四川稻作區(qū)優(yōu)質(zhì)稻生產(chǎn)氣候生態(tài)條件適宜性評價及空間分布[J]. 中國生態(tài)農(nóng)業(yè)學報,2015,23(4):506-513.Sun Yuanyuan, Xu Fuxian, Sun Yongjian, et al. Suitability evaluation of eco-climatic conditions for high quality rice production in Sichuan Province[J]. Chinese Journal of Eco-Agriculture, 2015, 23(4): 506-513. (in Chinese with English abstract)

[10] 肖科. 瀘州市土地整理效益分析與評價[D]. 四川:四川農(nóng)業(yè)大學,2009.Xiao Ke. Land Consolidation Benefit Analyzation and Evaluation in Lu Zhou[D]. Sichuan: Sichuan Agricultural University, 2009.

[11] 王利民,劉佳,楊福剛,等. 基于GF-1衛(wèi)星遙感的冬小麥面積早期識別[J]. 農(nóng)業(yè)工程學報,2015,31(11):194-201.Wang Limin, Liu Jia, Yang Fugang, et al. Early recognition of winter wheat area based on GF-1 satellite[J]. Transactions of the Chinese Society of Agricultural Engineering(Transactions of the CSAE), 2015, 31(11): 194-201. (in Chinese with English abstract)

[12] 賈玉秋,李冰,程永政,等. 基于GF-1與Landsat-8多光譜遙感影像的玉米LAI反演比較[J]. 農(nóng)業(yè)工程學報,2015,31(9):173-179.Jia Yuqiu, Li Bing, Cheng Yongzheng, et al. Comparison between GF-1 images and Landsat-8 images in monitoring maize LAI[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2015,31(9): 173-179. (in Chinese with English abstract)

[13] Aaron E Maxwell, Timothy A Warner. Differentiating mine-reclaimed grasslands from spectrally similar land cover using terrain variables and object-based machine learning classification[J]. International Journal of Remote Sensing,2015, 36(17): 4384-4410.

[14] Wu Chaofan, Deng Jinsong, Wang Ke, et al. Object-based classification approach for greenhouse mapping using Landsat-8 imagery[J]. International Journal of Agricultural &Biological Engineering, 2016, 9(1): 79-88.

[15] 徐涵秋,王美雅. 地表不透水面信息遙感的主要方法分析[J]. 遙感學報,2016,20(5):1270-1289.Xu Hanqiu, Wang Meiya. Remote sensing-based retrieval of ground impervious surfaces[J]. Journal of Remote Sensing,2016, 20(5): 1270-1289. (in Chinese with English abstract)[16] Chengbin Deng, Changshan Wu, et al. BCI: A biophysical composition index for remote sensing of urban environments[J]. Remote Sensing of Environment, 2012, 127:247–259.

[17] 趙玉,王紅,張珍珍. 基于遙感光譜和空間變量隨機森林的黃河三角洲刺槐林健康等級分類[J]. 遙感技術(shù)與應(yīng)用,2016,31(2):359-367.Zhao Yu, Wang Hong, Zhang Zhenzhen. Forest healthy classification of robinia pseudoacacia in the Yellow River Delta, China based on Spectral and spatial remote sensing variables using random forest[J]. Remote Sensing Technology and Application, 2016, 31(2): 359-367. (in Chinese with English abstract)

[18] Xu Hanqiu. Analysis of impervious surface and its impact on urban heat environment using the normalized difference impervious surface index (NDISI)[J]. Photogrammetric Engineering and Remote Sensing, 2010, 76(5): 557-565.

[19] 楊文治,張友靜,尹新沆,等. 面向 GF-1影像的比值建筑用地指數(shù)構(gòu)建[J]. 國土資源遙感,2016,28(1):35-42.Yang Wenzhi, Zhang Youjing, Yin Xinhang, et al.Construction of ratio build-up index for GF-1 image[J].Remote Sensing for Land & Resources, 2016, 28(1): 35-42.(in Chinese with English abstract)

[20] Horne J H. A tasseled cap transformation for IKONOS images[C]. ASPRS 2003 Annual Conference Proceedings.2003: 60-70.

[21] 王文靜,張霞,趙銀娣,等. 綜合多特征的Landsat 8時序遙感圖像棉花分類方法[J]. 遙感學報,2017,21(1):115-124.Wang Wenjing, Zhang Xia, Zhao Yindi, et al. Cotton extraction method of integrated multi-features based on multi-temporal Landsat 8 images[J]. Journal of Remote Sensing, 2017, 21(1): 115–124. (in Chinese with English abstract)

[22] 王書志,張建華,馮全. 基于紋理和顏色特征的甜瓜缺陷識別[J]. 農(nóng)業(yè)機械學報,2011,42(3):175-179.Wang Shuzhi, Zhang Jianhua, Feng Quan. Defect detection of muskmelon based on texture features and color features[J].Transactions of the Chinese Society for Agricultural Machinery, 2011, 42(3): 175-179. (in Chinese with English abstract)

[23] Breiman L. Random forest[J]. Machine Learning, 2001, 45(1):5-32.

[24] Vahid Eisavi, Saeid Homayouni, Ahmad Maleknezhad Yazdi,et al. Land cover mapping based on random forest classification of multitemporal spectral and thermal images[J]. Environ Monit Assess , 2015, 187: 291.

[25] Ghosh A, Sharma R, Joshi P K. Random forest classification of urban landscape using Landsat archive and ancillary data:Combining seasonal maps with decision level fusion[J].Applied Geography, 2014, 48: 31–41.

[26] 雷震. 隨機森林及其在遙感影像處理中應(yīng)用研究[D]. 上海:上海交通大學,2012.Lei Zhen. Random Forest and Its Application in Remote Sensing[D]. Shang Hai: Shanghai Jiao Tong University,2012.

[27] 王興玲,李占斌. 基于網(wǎng)格搜索的支持向量機核函數(shù)參數(shù)的確定[J]. 中國海洋大學學報,2005,35(5):859-862.Wang Xingling, Li Zhanbin. Identifying the parameters of the kernel function in support vector machines based on the Grid-search method[J]. Periodical of Ocean University of China, 2005, 35(5): 859-862.

[28] 劉穎. 《基于機器學習的遙感影像分類方法研究》[M]. 北京:清華大學出版社,2014.

[29] Liu Jiantao, Feng Quanlong, Gong Jianhua, et al. Land-cover classification of the Yellow River Delta wetland based on multiple endmember spectral mixture analysis and a Random Forest classifier[J]. International Journal of Remote Sensing,2016, 37(8): 1845-1867.

[30] 王永吉,孟慶巖,楊健,等. 一種基于特征選擇的面向?qū)ο筮b感影像分類方法[J]. 科學技術(shù)與工程,2016,16(32):1671-1815.Wang Yongji, Meng Qingyan, Yang Jian, et al. Object based remote sensing image classification based on feature selection method[J]. Science Technology and Engineering,2016, 16(32): 1671-1815. (in Chinese with English abstract)

Classification of land use in industrial and mining reclamation area based grid-search and random forest classifier

Chen Yuanpeng1,2, Luo Ming1, Peng Junhuan2, Wang Jun1, Zhou Xu1, Li Shaoshuai1,2
(1. China University of Geosciences (Beijing), School of Land Science and Technology, Beijing100083, China;2.Land Consolidation and Rehabilitation Center, Ministry of Land and Resource, Beijing100035, China)

In the industrial and mining land reclamation area, the strong topographic relief, the diversity, breakage, mixed distribution and scattered layout of the surface features and other factors cause the difficulties for remote-sensing image classification mapping. In order to improve the classification accuracy for land use of industrial and mining reclamation area and provide data support for land reclamation monitoring and supervision, this article explored the classification method based on grid-search and random forest algorithm for the reclamation area. Satellite and auxiliary dataset including GF-1 images,DEM (digital elevation model) and field investigation data were acquired in October 2016. The study area was Gulin County,Luzhou City, Sichuan Province. In order to obtain the real surface reflectance and reduce the atmospheric and environmental effects from the satellite images in this study, FLAASH atmospheric correction and geometric correction were used in the satellite image pre-processing with ENVI 5.3 software. A machine learning algorithm, random forest algorithm, was used because the method facilitated the use of ancillary data in classification. Feature selection was an important preprocessing step in many machine learning applications, which selected the smallest subset of relevant features that built robust learning models.In the paper, spectrum, topography, texture and space variables were included in feature selection, in order to differentiate the built-up areas and farmlands, and BCI (biophysical composition index) was calculated in spectrum features. Texture feature processing comprised principal component analysis. Local Moran’ I reflecting spatial autocorrelation feature and Local Getis Ord Gi reflecting hotspot feature were selected to improve the result of classification further. The grid-search method based on OOB (Out-of-Bag) error was used to optimize parameter. Based on data image spectrum, topography, texture, space and other information, 33 feature variables were figured out from the feature selection step, and 4 combined models were constructed to carry out random forest classification experiment; and the precision was 82.79%, 84.91%, 86.75% and 88.16% respectively.To eliminate the redundant information in the 33 feature variables and reduce the image band dimensionality, the study adopted variable importance estimation and Relief F algorithm to select the principle feature variables to conduct classification according to random forest algorithm. Through the comparison between the Model 2, Model 4, SVM (support vector machine)and MLC (maximum likelihood classification) classification result respectively, the study indicates that the random forest algorithm based on grid-search parameter optimization can achieve the classification accuracy of 88.16% in the multi-feature variables frame. After different methods are used to reduce the dimension of variables, the classification accuracy can also be kept above 85%, and the accuracy is higher than SVM and MLC classification results under the same number of feature variables. The random forest classifier is superior to SVM and more capable of dealing with multidimensional characteristic variables. The random forest method based on grid-search can obtain high precision in land use classification applied in reclamation area. Based on this method, remote sensing image interpretation can well provide the technical support and rational reference for land reclamation monitoring and supervision.

land reclamation; land use; mines; reclamation area; random forest; grid-search; multi-feature variables; feature selection

10.11975/j.issn.1002-6819.2017.14.034

TP79;S127

A

1002-6819(2017)-14-0250-08

陳元鵬,羅 明,彭軍還,王 軍,周 旭,李少帥. 基于網(wǎng)格搜索隨機森林算法的工礦復墾區(qū)土地利用分類[J]. 農(nóng)業(yè)工程學報,2017,33(14):250-257.

10.11975/j.issn.1002-6819.2017.14.034 http://www.tcsae.org

Chen Yuanpeng, Luo Ming, Peng Junhuan, Wang Jun, Zhou Xu, Li Shaoshuai. Classification of land use in industrial and mining reclamation area based grid-search and random forest classifier[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2017, 33(14): 250-257. (in Chinese with English abstract)

doi:10.11975/j.issn.1002-6819.2017.14.034 http://www.tcsae.org

2017-02-26

2017-07-05

公益性行業(yè)科研專項(201411017)

陳元鵬,男,遼寧人,博士生,主要從事遙感技術(shù)在土地利用與復墾中的應(yīng)用研究。北京 國土資源部土地整治中心,100035;中國地質(zhì)大學(北京),100083。Email:cyp520918@163.com

猜你喜歡
分類特征方法
分類算一算
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
分類討論求坐標
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
抓住特征巧觀察
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
主站蜘蛛池模板: 五月天香蕉视频国产亚| 国产白浆在线| 在线色国产| 蜜桃臀无码内射一区二区三区 | 真人高潮娇喘嗯啊在线观看| 日韩成人免费网站| 伊人中文网| 草草影院国产第一页| 久草热视频在线| 色综合久久综合网| 亚洲AⅤ波多系列中文字幕| 国产精品亚洲天堂| 男女性色大片免费网站| 亚洲人成色在线观看| 国产精品成人第一区| 一级一级一片免费| 国产精品自在拍首页视频8| 国产毛片一区| 婷婷午夜影院| 91福利片| 老色鬼久久亚洲AV综合| 精品一区二区无码av| AV在线天堂进入| 久久久亚洲国产美女国产盗摄| 四虎亚洲国产成人久久精品| 国产一区亚洲一区| 免费一级成人毛片| 自拍偷拍欧美| 久久精品中文无码资源站| 伊人久久婷婷五月综合97色| 亚洲午夜福利精品无码不卡| 国产成人超碰无码| 亚洲av片在线免费观看| 国产内射一区亚洲| 在线a视频免费观看| 中文字幕人妻av一区二区| 国产在线观看91精品亚瑟| 成人国产精品网站在线看| 亚洲人成亚洲精品| 免费高清毛片| 玖玖精品在线| 国产高潮流白浆视频| 国国产a国产片免费麻豆| 东京热av无码电影一区二区| 成人中文在线| 亚洲成人黄色在线| 国产成人AV男人的天堂| 中日无码在线观看| 99免费在线观看视频| 欧美a级完整在线观看| 婷婷午夜天| 欧美国产在线精品17p| av一区二区三区高清久久| 69av免费视频| 国产精品毛片一区视频播| 国产欧美日韩一区二区视频在线| 67194亚洲无码| 青青草一区| 欧美一级大片在线观看| 福利视频一区| 久久香蕉国产线| 97视频免费在线观看| 国产福利一区在线| 国产成人高清精品免费| 在线a视频免费观看| 精品国产网| 欧美亚洲香蕉| 日本精品中文字幕在线不卡| 美女无遮挡免费视频网站| 日本少妇又色又爽又高潮| 玖玖精品视频在线观看| 中文无码日韩精品| 国内精品自在欧美一区| 久久久久人妻一区精品色奶水| 国产亚洲视频在线观看| 亚洲区欧美区| 日韩在线影院| 强奷白丝美女在线观看| 伊人色在线视频| 欧美日韩高清| 99在线视频免费| 欧美福利在线播放|