999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

機載多光譜LiDAR的隨機森林地物分類

2019-12-03 01:45:08潘鎖艷管海燕
測繪通報 2019年11期
關鍵詞:分類特征

曹 爽,潘鎖艷,管海燕

(1. 南京信息工程大學遙感與測繪工程學院,江蘇 南京 210044; 2. 南京信息工程大學地理科學學院,江蘇 南京 210044)

機載LiDAR技術可以迅速地獲取地面目標物體的三維空間坐標信息及激光反射強度信息,但由于硬件條件和數據獲取方式的限制,其掃描覆蓋范圍有限,無法提供目標對象的光譜信息[1]。文獻[2]提出將機載激光LiDAR數據與多光譜遙感影像融合,同時結合各種植被指數及光譜特征和紋理特征,從而實現對地物的識別和分類,但是LiDAR數據與影像數據融合使用存在一定的數據配準問題。目前的多光譜LiDAR系統可以在同一時刻獲得多個波段下的獨立激光點云數據,不僅提供了LiDAR的幾何信息,而且提供了多個波段的強度信息。因此,探討多光譜LiDAR數據的智能解譯與目標識別具有重要的應用價值。

國內外已經對LiDAR數據的地物分類方法進行了各種研究,比如決策樹法[3]、貝葉斯網絡法[4]、支持向量機法[5](SVM)、ISODATA[6]等各種分類方法。但是傳統的分類模型容易出現過擬合問題而且分類效果也不理想,文獻[7]將多個分類模型組合起來以提高分類精度。

文獻[8]在2001年提出了一種全新的集成學習技術—隨機森林算法(random forest,RF)。國內外很多學者利用隨機森林算法對多種遙感數據進行了地物分類研究。文獻[9]利用隨機森林對Landsat數據和其他輔助地理數據組合成的多源數據影像進行土地覆蓋分類研究。文獻[10]也討論了隨機森林在LiDAR數據與多光譜影像融合的地物覆蓋研究,并分析了隨機森林變量的重要性。文獻[11]以Landsat ETM+多光譜影像數據作為研究對象,討論了隨機森林、Boosting、Bagging和CART幾種分類方法在精度上的差異,試驗結果表明隨機森林的分類精度與CART相比有明顯的提高,與Boosting和Bagging分類精度相當。大量的理論與試驗證明:隨機森林算法在各種數據源影像的分類處理問題中均有著優良的表現,分類精度較高。因此,本文提出基于隨機森林算法的多光譜LiDAR數據地物分類研究。

1 試驗數據

本文試驗數據是由加拿大Optech公司的多光譜LiDAR系統Optech Titan提供。該系統包括3個波段的激光脈沖通道(分別為:532 nm波段(GREEN)、1064 nm波段(NIR)和1550 nm波段(MIR)),能夠提供地面目標物體的激光反射強度信息和高程信息。試驗數據包括該系統提供的3個獨立的激光點云,每個波段的平均點密度近似為3.6點/m2。本文研究區域是加拿大安大略省惠特徹奇-史托維爾的一個小鎮,圖1為該區域的Google高空間分辨率遙感影像, 研究區域面積約為1990 m×1603 m,主要有建筑物、草地、樹木、道路、水體和裸地6類地物。

首先采用文獻[12]中的方法將3個獨立點云數據集合并成單一點云數據,其中每個激光點包含這3個波段的地物反射信息。為了提高融合后點云數據的處理效率,按照距離加權平均插值法對離散多光譜LiDAR點云數據進行插值處理[13],將包含3個波段信息和高程信息的多光譜LiDAR點云分別內插為3個單獨波段的強度影像、高程影像和多光譜影像,如圖2所示。根據每個波段平均點密度3.6點/m2,二維影像的分辨率設置為0.5 m。本文根據內插的二維多光譜影像和高程影像進行地物分類研究。

2 基于隨機森林的多光譜LiDAR地物分類

2.1 隨機森林

隨機森林算法(random forest,RF)包括大量的決策樹、分類樹和回歸樹,既能夠應用于分類研究,也能夠處理回歸分析問題。隨機森林算法實現過程如下:①從原始的樣本數據集中隨機選取n個bootstrap樣本作為訓練數據,未被抽到的樣本集作為測試數據。②建立每一個bootstrap隨機樣本的決策樹模型。在每棵決策樹的節點處隨機地從總特征中選取mtry個特征(mtry≤n,其中n為特征變量總數)。③每棵決策樹都會產生一個預測結果,將所有決策樹的預測綜合再通過多數投票表決的方法得到最終的分類結果。一般來說,在構建隨機森林模型時,2/3的訓練數據(稱為袋內(in bag)數據)被用于構造決策樹,其余1/3的訓練數據(稱為袋外(out of bag,OOB)數據)用于測試決策樹,以便對其分類性能進行評估,稱為OOB誤差估計。隨機森林模型中的每一棵決策樹都會產生一個OOB誤差,綜合所有決策樹的預測得到的平均錯誤分類稱為袋外誤差。文獻[8]通過大量的研究和試驗證明了利用袋外誤差預測隨機森林模型的內部性能時是無偏的,因此不需要再使用單獨的測試數據集驗證模型的泛化誤差。

2.2 特征提取

特征提取就是選擇可以參與分類運算的多個特征,它對分類結果的精度和可靠性影響很大。本文使用多光譜LiDAR的強度影像和高程影像作為數據源,提取其光譜特征、紋理特征和植被指數一共39個特征來進行隨機森林分類分析。

2.3 訓練樣本

根據本文研究區域的6類主要地物類型,以與研究區域對應的Google高分辨率遙感影像(如圖1所示)作為參照,結合提取的特征,人工直接從融合的多光譜影像上選取一定數量的樣本。隨機森林算法對訓練樣本的數量很敏感,為了研究樣本數量對分類結果精度的影響,對每個地物類型選取了3組不同數量的訓練樣本,分別記為sample1(1000個像元)、sample2(500個像元)、sample3(200個像元),每個地物類別的樣本數量逐漸減少。

3 試驗與分析

本文利用R語言編程對多光譜LiDAR數據進行隨機森林分類。分為3個試驗:①為了研究樣本大小對分類結果的影響,對所選取的3組樣本sample1、sample2、sample3分別進行隨機森林分類,根據分類精度分析隨機森林分類器的分類性能。②為了選擇分類性能最佳的特征,通過后向特征選擇消除不重要的特征再重新分類,迭代直到模型誤差最小,然后通過分類精度分析隨機森林的特征選擇性能。以sample1的隨機森林分類為例,根據OOB誤差計算分類結果的特征貢獻度。③為了分析隨機森林在多光譜LiDAR數據地物分類中的性能,與支持向量機分類方法進行對比試驗。

3.1 隨機森林的多光譜LiDAR地物分類結果

構建隨機森林模型時需要人為地設置兩個重要參數的取值:①森林中的樹數ntree(number of trees),該值與隨機森林模型的收斂性及運行時間成正比,由于隨機森林算法計算速度快且不會出現過擬合問題,因此ntree的值應該盡可能的大,但是由于計算機的內存限制,ntree的值通常設置為幾百,本文ntree的值設定為100。②決策樹中每個節點處使用的特征變量個數為mtry,該值大小與隨機森林模型中每棵決策樹的強度以及決策樹之間的相關系數成正比。經過大量的試驗證明,當mtry值設定為總特征數的平方根時分類效果最好,本文共使用39個特征,mtry值應設為6。按以上設置的參數對3組樣本數據sample1、sample2、sample3分別進行隨機森林地物分類試驗,試驗結果如圖3所示。為了定量地分析隨機森林分類精度,以sample1的分類結果為例,分類混淆矩陣見表1。由表1可知,樹木類幾乎完全被正確分類,分類的精度非常高。而容易與建筑物產生分類混淆的地物類別主要是草地、裸地和道路,容易與草地產生分類混淆的地物類別主要是建筑物和道路,容易與道路產生分類混淆的地物類別主要是水體和建筑物,容易與水體產生分類混淆的地物類別主要是草地和裸地,容易與裸地產生分類混淆的地物類別主要是建筑物和道路。

像元

表2為利用混淆矩陣分別計算sample1、sample2、sample3的隨機森林地物分類精度。由表2可知,隨著訓練樣本數量的減少,隨機森林分類的精度也隨之降低,表明隨機森林算法更適用于大樣本分類的情況,但是隨著訓練樣本數量的增多,雖然分類精度有所提高,但相應的運行時間也會增加。因此,分類時選擇合適的樣本大小對分類精度的影響很大,需要根據精度要求和數據特點選取適當的樣本數量。

表2 不同訓練樣本下的隨機森林分類精度

3.2 變量重要性分析

分類特征數量與分類結果精度和分類模型的結構復雜度一般成正比。但是,當分類特征數量過多時,不僅使得分類器的結構復雜,難以實現,分類精度也可能不理想。因此,有必要確定分類特征的類型和數量。隨機森林算法可以計算特征變量對分類結果包括分類模型和每個樣本類別的重要性,還可以根據OOB誤差計算特征變量對一般分類模型的影響程度。依據OOB進行誤差估計后可知,對分類結果貢獻比較大的前6個特征變量分別為高程(Elevation)、532 nm波段(GREEN)均值(mean_GREEN)、高程均值(mean_ele)、1550 nm波段(MIR)均值(mean_MIR)、高程自相關(correlation_ele)和1064 nm波段(NIR)均值(mean_NIR)特征。

為了選擇分類性能最佳和不相關的特征以獲得較高的分類精度,采用后向特征選擇方法[14]通過迭代逐個消除不必要的或部分相關的特征。首先根據OOB誤差計算特征重要性并按數值大小從高到低進行特征變量排序,對最不重要的特征變量進行迭代消除。每次迭代,消除后20%的特征變量。然后利用消除后的新特征變量重新進行隨機森林分類,根據OOB誤差計算新特征變量對分類結果的重要性并進行排序。該迭代過程一直執行到獲得最高分類精度的特征集為止。本文一共進行5次迭代, 第1次和第5次迭代的隨機森林分類結果如圖4所示。表3為利用后向特征選擇的隨機森林分類結果的總體精度和Kappa系數,由表3可知,隨著特征數量的減少,隨機森林分類結果的總體精度和Kappa系數均有所提升,直到分類特征數量為16時,分類精度達到最高。但是當特征數量減少到13時,總體精度和Kappa系數開始減小,說明過多地去除特征會使精度下降。經過5次迭代,分類特征數量逐漸從39減少到13,同樣根據OOB誤差計算13個特征變量對最終分類結果的貢獻度可知,對分類地物目標貢獻度比較大的幾個特征分別為:均值、高程和自相關特征,這與利用后向特征選擇之前的特征貢獻度排序結果類似。試驗表明,本文采用的后向特征選擇法比較可靠,即利用后向迭代消除的特征確實是不重要或部分相關冗余特征。

表3 隨機森林分類總體精度和Kappa系數

3.3 對比試驗

為了進一步證明隨機森林分類方法在多光譜LiDAR數據地物分類中的適用性,將它與支持向量機(SVM)分類進行對比試驗。利用3組訓練樣本sample1、sample2、sample3分別進行支持向量機多光譜LiDAR地物分類,分類結果如圖5所示。分別計算三組訓練樣本支持向量機下的分類精度,見表4。比較表4與表2可知,隨機森林分類方法相比于支持向量機分類方法,在總體精度和Kappa系數上均有不同程度的提高,只是在某些類別上,隨機森林的生產者精度和用戶精度不如支持向量機方法。同時也可以看出,當樣本數量逐漸減少時,支持向量機分類的精度反而呈上升趨勢,這表明支持向量機在小樣本分類上具有優勢。因此,當樣本數量較少時,應該綜合多種因素,選擇合適的分類方法處理多光譜LiDAR數據,以獲得最佳地物分類結果。

類別Sample1Sample2Sample3用戶精度/(%)生產者精度/(%)用戶精度/(%)生產者精度/(%)用戶精度/(%)生產者精度/(%)建筑物82.4377.2976.5871.6070.8085.92樹木98.6397.2094.8995.2598.0797.60草地83.0588.4696.6689.0489.5994.74道路93.3285.9171.6881.8570.8382.93水體82.9694.6590.9982.5193.3097.66裸地87.1585.4075.7782.6898.4856.03總體精度/(%)87.8883.8985.32Kappa系數0.85450.80670.8241

4 結 語

本文提出了基于隨機森林的多光譜LiDAR地物分類方法,利用加拿大Optech公司的Titan多光譜LiDAR系統提供的數據,將研究區域內的地物分為建筑物、樹木、草地、道路、水體和裸地6類。研究發現:①隨機森林算法對樣本數量很敏感,且隨著樣本數量的減少分類精度呈下降趨勢。這說明隨機森林算法適用于大樣本分類,但隨著樣本數量的增加,相應的運行時間會增長,在實際分類工作中,應該根據需要選擇適當的訓練樣本數量。②利用隨機森林算法特征貢獻度特性,本文采用后向特征消除方法可在一定程度上消除部分冗余和相關性大的特征,從而可以有效地提高分類精度。③通過與支持向量機分類法對比,隨機森林對多光譜LiDAR數據地物分類的精度更高,且進一步驗證了隨機森林方法進行特征選擇的有效性。后續工作將進一步研究如何根據研究區域和精度目標選擇適當的決策樹個數、節點的特征變量數和最小分裂條件等隨機森林模型參數,提高隨機森林在多光譜LiDAR數據的解譯精度和效率。

猜你喜歡
分類特征
抓住特征巧觀察
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
新型冠狀病毒及其流行病學特征認識
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
抓住特征巧觀察
主站蜘蛛池模板: 国产一区成人| 国产乱码精品一区二区三区中文| 2048国产精品原创综合在线| 亚洲日韩精品欧美中文字幕| 久久大香香蕉国产免费网站| 人人看人人鲁狠狠高清| 精品国产免费第一区二区三区日韩| 亚洲三级视频在线观看| 成人伊人色一区二区三区| 亚洲VA中文字幕| 2021天堂在线亚洲精品专区| 午夜不卡视频| 成年人久久黄色网站| 国产精品尤物铁牛tv| 成人国产免费| 欧美午夜在线观看| 久久婷婷六月| 大香网伊人久久综合网2020| 呦视频在线一区二区三区| 91小视频版在线观看www| 亚洲日韩第九十九页| 精品国产一区二区三区在线观看 | 国产精品福利社| 亚洲 成人国产| 9啪在线视频| 色噜噜在线观看| 国产欧美日韩专区发布| 欧美成人看片一区二区三区| 精品视频福利| 超碰精品无码一区二区| 女人18毛片久久| 亚洲国产成人精品无码区性色| 日本欧美一二三区色视频| 日本成人不卡视频| 国产在线自揄拍揄视频网站| 亚洲天堂777| 欧美乱妇高清无乱码免费| 无码日韩视频| 成人亚洲视频| 欧美午夜网| 99久久国产自偷自偷免费一区| 亚洲视频四区| 欧美不卡二区| 日韩在线永久免费播放| 久久精品人妻中文视频| 国产精品美女免费视频大全| 国产激情无码一区二区三区免费| 黄色免费在线网址| 亚洲第一黄色网址| 97se亚洲综合在线韩国专区福利| 日韩亚洲高清一区二区| 欧美激情,国产精品| 91精品久久久久久无码人妻| 国产特级毛片aaaaaaa高清| 精品国产一区二区三区在线观看| 欧美成在线视频| 无码有码中文字幕| 国产高颜值露脸在线观看| 91系列在线观看| 呦视频在线一区二区三区| 国产原创演绎剧情有字幕的| 美女国产在线| 国产99视频在线| 99视频在线免费看| 亚洲精品成人7777在线观看| 国产熟睡乱子伦视频网站| 亚洲精品桃花岛av在线| 国产精品自拍露脸视频| 亚洲视频二| 99国产精品免费观看视频| 这里只有精品国产| AV不卡在线永久免费观看| 成人综合网址| AV不卡无码免费一区二区三区| 青青草一区| 亚洲无码精品在线播放| 波多野结衣无码中文字幕在线观看一区二区 | 国产区成人精品视频| 国产精品无码AⅤ在线观看播放| 亚洲精品中文字幕无乱码| 国产日本一区二区三区| 日韩精品免费一线在线观看|