杜曉川, 婁德波, 徐林剛, 范瑩琳, 張琳, 李婉悅
(1.中國(guó)地質(zhì)大學(xué)(北京)地球科學(xué)與資源學(xué)院,北京 100083; 2.中國(guó)地質(zhì)科學(xué)院礦產(chǎn)資源研究所,自然資源部成礦作用與資源評(píng)價(jià)重點(diǎn)實(shí)驗(yàn)室,北京 100037)
隨著近年來(lái)新能源、新興材料的發(fā)展,鋰等關(guān)鍵金屬越來(lái)越受到重視[1],金屬鋰由于其特殊的物理化學(xué)性質(zhì),被廣泛應(yīng)用到諸如電池、玻璃、陶瓷等各個(gè)工業(yè)領(lǐng)域,具有極高的戰(zhàn)略?xún)r(jià)值,其不僅是高科技產(chǎn)業(yè)必需材料,也逐漸成為日常生活中廣泛使用的常規(guī)材料。當(dāng)前我國(guó)國(guó)內(nèi)鋰業(yè)發(fā)展高度依賴(lài)礦物型鋰礦特別是花崗偉晶巖型鋰礦的供應(yīng)[2],此類(lèi)型鋰礦床通常位于大型花崗巖侵入體邊緣,受地質(zhì)構(gòu)造控制明顯,通常以偉晶巖脈集群的形式產(chǎn)出,總體呈帶狀分布,單條偉晶巖脈形態(tài)多為脈狀或板狀[3],因此基于高分辨率影像的遙感技術(shù)是尋找和發(fā)現(xiàn)偉晶巖脈的有效方法[4]。
遙感領(lǐng)域相關(guān)技術(shù)不斷發(fā)展成熟,使得遙感技術(shù)在地質(zhì)信息提取的研究中得到了廣泛應(yīng)用,有許多利用遙感技術(shù)進(jìn)行含鋰偉晶巖探測(cè)的實(shí)例。如代晶晶等[5-6]在川西甲基卡地區(qū)進(jìn)行了鋰輝石等偉晶巖稀有金屬礦床相關(guān)礦石礦物的波譜測(cè)試研究和偉晶巖遙感地質(zhì)填圖; Cardoso-Fernandes等[7]利用多源遙感影像數(shù)據(jù),采用RGB彩色合成、波段比值分析、主成分分析等方法識(shí)別含鋰偉晶巖的相關(guān)異常,完成蝕變填圖; 姚佛軍等[4]通過(guò)增強(qiáng)ASTER遙感圖像中的差異來(lái)增強(qiáng)地質(zhì)體的巖性差異,并突出含鋰偉晶巖的遙感特征; 王海宇[8]以WorldView-3為數(shù)據(jù)源,并基于全卷積網(wǎng)絡(luò)(fully convolutional networks, FCN)網(wǎng)絡(luò)和U-net網(wǎng)絡(luò)2種深度學(xué)習(xí)語(yǔ)義分割模型識(shí)別偉晶巖脈信息。前人通過(guò)遙感影像數(shù)據(jù)在含鋰偉晶巖提取方面開(kāi)展了大量的理論研究和實(shí)踐,但大多數(shù)研究者側(cè)重于使用低空間分辨影像數(shù)據(jù),提取方法也較為傳統(tǒng),盡管已有基于高空間分辨率影像數(shù)據(jù)與深度學(xué)習(xí)網(wǎng)絡(luò)模型提取偉晶巖巖脈的先例,但該方法耗時(shí)較長(zhǎng),效率較低,且對(duì)樣本數(shù)量有一定要求。因此本文在眾多機(jī)器學(xué)習(xí)算法中選用隨機(jī)森林算法,其算法具有如下優(yōu)點(diǎn): ①數(shù)據(jù)兼容性強(qiáng),數(shù)據(jù)集無(wú)須規(guī)范化,且可以直接處理高維數(shù)據(jù); ②抗噪聲能力強(qiáng),受異常值影響較小; ③魯棒性強(qiáng),不容易發(fā)生過(guò)擬合現(xiàn)象; ④計(jì)算效率高、速度快、泛化能力強(qiáng)[9-11],且該方法結(jié)合高空間分辨率影像數(shù)據(jù)在提取復(fù)雜地物的效果較好。
據(jù)此,以青海省海西蒙古族藏族自治州天峻縣扎卡東南部區(qū)域?yàn)檠芯繀^(qū),提取預(yù)處理后的GF-2高空間分辨率影像數(shù)據(jù)中各類(lèi)型地物的光譜特征、紋理特征、指數(shù)特征、地形特征及邊緣特征等25個(gè)特征變量構(gòu)建特征子集,對(duì)子集中的特征變量進(jìn)行特征重要性分析,依據(jù)特征重要性得分進(jìn)行特征優(yōu)選,確定最優(yōu)的提取花崗偉晶巖的特征組合,并進(jìn)行隨機(jī)森林分類(lèi),對(duì)分類(lèi)結(jié)果進(jìn)行精度評(píng)定,為后續(xù)該地區(qū)的含鋰花崗偉晶巖找礦勘查工作提供依據(jù)。
研究區(qū)位于青海省海西蒙古族藏族自治州天峻縣扎卡東南部,地理坐標(biāo)為E99°27′16″~99°30′32″, N36°53′36″~36°54′43″(圖1)。天峻縣地處青海省東北部,青海湖西側(cè)、祁連山南麓,柴達(dá)木盆地東部。境內(nèi)高山縱橫,山脈呈東南西北走向,地形以山地為主,高山、中低山、山谷和山間盆地相間分布。平均海拔在4 000 m以上,地處高原寒帶氣候,年平均氣溫-1.5 ℃,年降水量360 mm,干旱少雨,多風(fēng)沙。

圖1 研究區(qū)遙感影像
GF-2衛(wèi)星于2014年8月19日發(fā)射,是我國(guó)自主研制的首顆空間分辨率優(yōu)于1 m的民用光學(xué)遙感衛(wèi)星。搭載有2臺(tái)高分辨率的1 m全色與4 m多光譜相機(jī),傳感器的波段參數(shù)如表1所示。對(duì)大氣校正后的多光譜影像以及定標(biāo)后的全色影像做正射校正處理及融合處理,獲得空間分辨率為1 m的彩色合成影像,再通過(guò)研究區(qū)域的矢量范圍對(duì)影像數(shù)據(jù)進(jìn)行裁剪,得到研究區(qū)遙感影像數(shù)據(jù)。

表1 GF-2全色多光譜相機(jī)波段參數(shù)
花崗偉晶巖(圖2(a))在分布位置及產(chǎn)出形態(tài)上受構(gòu)造控制作用明顯,研究區(qū)內(nèi)斷裂沿NW-SE向分布,因此花崗偉晶巖大多沿NW-SE向展布,呈條狀、脈狀產(chǎn)出; 在影像色調(diào)上,其多呈灰白色或略帶土黃色; 由于研究區(qū)內(nèi)海拔較高、風(fēng)沙較多、風(fēng)化能力較強(qiáng),且花崗偉晶巖晶體較大,具有較強(qiáng)的抗風(fēng)化性,因而在高度上要突出于周?chē)匚?并且其表面紋理粗糙,邊界較明顯。研究區(qū)內(nèi)其他地物類(lèi)型主要分為道路(圖2(b))、干涸河流(圖2(c))、冰雪(圖2(d))、陽(yáng)坡裸地(圖2(e))、陰坡裸地(圖2(f))5類(lèi),其中陽(yáng)坡裸地與陰坡裸地以研究區(qū)內(nèi)最高海拔線(xiàn)為界線(xiàn)(圖1),海拔沿界線(xiàn)南北兩側(cè)逐漸降低,加上衛(wèi)星拍攝角度影響,使得二者地物的色調(diào)差別較大。陽(yáng)坡裸地坡向朝南,色調(diào)以土黃色、棕色為主; 陰坡裸地坡向朝北,色調(diào)以棕黑色為主; 干涸河流的形狀與邊界較為明顯,寬度較窄; 冰雪主要分布在雪線(xiàn)較低的陰坡裸地上,色調(diào)以亮白色為主,形狀為長(zhǎng)條狀,展布大多為南北向; 道路色調(diào)為墨青色、邊界明顯。基于不同地物的特點(diǎn),本文選擇提取地物的光譜特征、紋理特征、指數(shù)特征、地形特征、邊緣特征作為隨機(jī)森林分類(lèi)所需的特征變量。光譜特征包括GF-2高空間分辨率影像數(shù)據(jù)4個(gè)波段的灰度特征(B,G,R,NIR)、影像灰度平均值特征(Img Mean)、影像灰度標(biāo)準(zhǔn)差特征(Img Std),以及對(duì)影像原始4個(gè)波段進(jìn)行限制對(duì)比度自適應(yīng)直方圖均衡化的CLAHE特征(CLAHE B,CLAHE G,CLAHE R,CLAHE NIR)。

(a) 花崗偉晶巖樣本 (b) 道路樣本 (c) 干涸河流樣本 (d) 冰雪樣本 (e) 陽(yáng)坡裸地樣本 (f) 陰坡裸地樣本
紋理特征是一種全局特征,對(duì)噪聲具有較強(qiáng)抵御能力,能刻畫(huà)出圖像區(qū)域所對(duì)應(yīng)地物表面的性質(zhì),具有旋轉(zhuǎn)不變的特性[12],且已有研究表明紋理特征有助于改善地表信息提取的精度[13-16]。本文在提取紋理特征前先對(duì)影像數(shù)據(jù)進(jìn)行主成分分析變換,該方法通過(guò)應(yīng)用正交變換減少相關(guān)數(shù)據(jù)的冗余,減少各組分間的相關(guān)性,盡可能將有用信息集中到新的組分中,且各新組分間互不相關(guān),達(dá)到信息增強(qiáng)、降維及減少計(jì)算量的目的[17]。其中影像數(shù)據(jù)的第一主成分(PC1)包含所有波段中98.5%的特征信息,因此將PC1作為影像的光譜特征的同時(shí),僅對(duì)PC1采用灰度共生矩陣方法提取紋理特征,選取均值(Mean)、方差(Variance)、均質(zhì)性(Homogeneity)、對(duì)比度(Contrast)、相異性(Dissimilarity)、熵(Entropy)、相關(guān)性(Correlation)、角二階矩(angular second moment,ASM)等8種彼此相關(guān)性弱的紋理信息特征統(tǒng)計(jì)量作為紋理特征。
指數(shù)特征是通過(guò)一定公式的波段運(yùn)算所獲取的灰度影像。指數(shù)特征可以消除地形差異影響,突出地物特征[18]。基于陰坡裸地存在陰影的特點(diǎn),本文提取用于突出陰影區(qū)域與明亮區(qū)域?qū)Ρ鹊年幱爸笖?shù)(shadow index,SI)特征,其計(jì)算公式為:
SI=(B+G+R+NIR)/4
,
(1)
式中B,G,R,NIR分別為藍(lán)光、綠光、紅光及近紅外波段的反射率。基于研究區(qū)內(nèi)裸地范圍較大,本文提取突出裸地區(qū)域亮度的裸地區(qū)域指數(shù)(bare area index,BAI)特征,其計(jì)算公式為:
BAI=(B-NIR)/(B+NIR)
。
(2)
地形特征是描述地勢(shì)變化的特征,由于研究區(qū)內(nèi)地勢(shì)起伏較大,且地物與地形因素有一定關(guān)聯(lián),因此有必要提取坡度(Slope)、坡向(Aspect)、高程等地形特征。本文從美國(guó)地質(zhì)調(diào)查局獲取研究區(qū)30 m空間分辨率的ASTER GDEM數(shù)字高程模型(digital elevation model,DEM)數(shù)據(jù),并分別提取坡度、坡向,DEM地形特征。
邊緣特征是影像中特性(如像素灰度、紋理等)分布不連續(xù)處,影像周?chē)匦杂须A躍變化的像素集合,其中研究區(qū)內(nèi)花崗偉晶巖、干涸河流、冰雪、道路的邊緣特征較明顯,邊緣灰度梯度變化較大。Canny邊緣檢測(cè)能較精確估算出圖像邊緣的強(qiáng)度、梯度方向,具有定位準(zhǔn)確、單邊響應(yīng)和信噪比高等優(yōu)勢(shì)[19]。將從GF-2高空間分辨率影像中提取出的光譜特征、紋理特征、指數(shù)特征、地形特征與邊緣特征等25個(gè)特征變量構(gòu)成初始特征空間。
各類(lèi)型地物選取25個(gè)影像樣本構(gòu)成訓(xùn)練樣本集,圖2為32像素×32像素的影像樣本塊展示。為提高分類(lèi)檢測(cè)精確度,選取原則依據(jù)樣本要盡可能包含各個(gè)類(lèi)別地物的各種不同類(lèi)型特征,且單個(gè)樣本盡量?jī)H包含單個(gè)類(lèi)別地物。根據(jù)隨機(jī)森林實(shí)驗(yàn)需求,將樣本集按照2∶8的比例隨機(jī)劃分為測(cè)試集和訓(xùn)練集。
隨機(jī)森林算法最早是由Breiman[20]提出的一種機(jī)器學(xué)習(xí)算法,本文依據(jù)Gini系數(shù)最小原則構(gòu)建分類(lèi)和決策樹(shù)(classification and regression tree,CART),并基于多棵決策樹(shù)對(duì)樣本進(jìn)行訓(xùn)練,根據(jù)訓(xùn)練得到的模型,對(duì)未知待測(cè)樣本類(lèi)別進(jìn)行預(yù)測(cè)的一種監(jiān)督學(xué)習(xí)分類(lèi)算法[21]。
本文使用Python語(yǔ)言編程調(diào)用sklearn庫(kù)進(jìn)行隨機(jī)森林模型訓(xùn)練,采用隨機(jī)搜索交叉驗(yàn)證(RandomizedSearchCV)與網(wǎng)格搜索交叉驗(yàn)證(GridSearchCV)[22]的雙重方式進(jìn)行參數(shù)優(yōu)化。單一的GridSearchCV是對(duì)每一組排列組合的參數(shù)進(jìn)行遍歷,最后選取出最好的一組參數(shù),但由于參數(shù)排列組合數(shù)量過(guò)多,逐個(gè)遍歷面臨相當(dāng)耗時(shí)與維度災(zāi)難等問(wèn)題,因此在進(jìn)行GridSearchCV前先通過(guò)RandomizedSearchCV(設(shè)置隨機(jī)搭配超參數(shù)組合次數(shù)(n_iter)為200次,交叉驗(yàn)證折數(shù)(cv)為5次)對(duì)取值范圍內(nèi)的參數(shù)進(jìn)行有限次的隨機(jī)排列組合,并對(duì)其進(jìn)行遍歷,從中選取出一組較優(yōu)參數(shù)組合,再通過(guò)進(jìn)行10折的GridSearchCV遍歷選取出最優(yōu)參數(shù)組合。本文最優(yōu)參數(shù)組合設(shè)置如表2所示。

表2 最優(yōu)參數(shù)組合
特征集中包含著不同屬性、不同尺度的多樣化的眾多特征變量,過(guò)多的特征變量會(huì)造成數(shù)據(jù)的冗余、分類(lèi)時(shí)間過(guò)長(zhǎng)、以及分類(lèi)精度下降等問(wèn)題[23],因此需要通過(guò)特征選擇篩選出對(duì)模型結(jié)果影響較大的特征變量構(gòu)成新的特征子集。特征選擇主要是通過(guò)一定的準(zhǔn)則對(duì)特征重要性排序,或者在分類(lèi)精度保證的情況下選擇一組數(shù)量最小,且最具有代表性的特征子集[24]。本文先通過(guò)調(diào)用sklearn庫(kù)中基于Gini 系數(shù)原理進(jìn)行特征重要性計(jì)算的feature_importances參數(shù)對(duì)每個(gè)特征進(jìn)行重要性評(píng)估,對(duì)得到的特征重要性得分按降序排列(圖3),然后采用順序前向特征選擇法[25],在每一次迭代中選擇當(dāng)前特征集中特征重要性得分最高的特征變量進(jìn)行模型訓(xùn)練,并獲取相應(yīng)模型的測(cè)試集精度,依次增加特征變量數(shù)量直至全部納入,從中選取出測(cè)試集精度最高、特征變量數(shù)量相對(duì)最少的特征組合。

圖3 特征重要性排序
基于最佳參數(shù)組合與最優(yōu)特征變量組合的隨機(jī)森林模型對(duì)研究區(qū)各地物類(lèi)型進(jìn)行分類(lèi),對(duì)分類(lèi)結(jié)果進(jìn)行先膨脹后腐蝕的形態(tài)學(xué)閉運(yùn)算操作,閉運(yùn)算在填充同類(lèi)型地物間的細(xì)微裂隙,使地物間更連接且更平滑的同時(shí),還可以消除孤立噪聲點(diǎn)的影響。
分別對(duì)特征空間中的25個(gè)特征變量通過(guò)順序向前特征選擇法逐一訓(xùn)練后的結(jié)果進(jìn)行評(píng)估,生成特征變量個(gè)數(shù)與測(cè)試集精度關(guān)系圖(圖4),由圖4可知: ①由首個(gè)特征變量逐個(gè)增加至16個(gè)特征變量參與模型訓(xùn)練期間,測(cè)試集精度整體呈現(xiàn)迅速上升至平穩(wěn)上升趨勢(shì),由最初的84.01%上升至96.24%; ②特征變量數(shù)量在17~25個(gè)期間,由于特征變量數(shù)量過(guò)多,產(chǎn)生數(shù)據(jù)冗余、訓(xùn)練耗時(shí)增加等問(wèn)題,導(dǎo)致分類(lèi)器出現(xiàn)一定的過(guò)擬合現(xiàn)象,造成測(cè)試集精度有些許下降,由96.24%下降至95.94%,由此可知并不是特征變量數(shù)量越多測(cè)試集精度就越高。根據(jù)測(cè)試集精度結(jié)果,選取前16個(gè)特征變量組合作為最優(yōu)特征集,并基于該特征集進(jìn)行隨機(jī)森林分類(lèi)。

圖4 特征變量個(gè)數(shù)與測(cè)試集精度關(guān)系
遙感影像中不同波段對(duì)于分類(lèi)不同地物具有重要意義[24],波段間反射率值的差異有助于區(qū)分不同類(lèi)型地物,通過(guò)計(jì)算不同特征變量在不同類(lèi)型地物的反射率值,并對(duì)反射率值進(jìn)行歸一化處理,得到各類(lèi)型地物波譜曲線(xiàn)(圖5)。光譜特征(圖5(a))中的NIR波段的地物波譜曲線(xiàn)反射率值差異較大,可以很好地區(qū)分各類(lèi)型地物,并且NIR波段的特征重要性得分最高; 紋理特征(圖5(b))中Mean波段的各類(lèi)型地物反射率值有所差異,具有區(qū)分地物的能力,花崗偉晶巖的紋理特征在大多數(shù)波段反射率值都較高,原因?yàn)轱L(fēng)化剝蝕等作用使得花崗偉晶巖巖石表面產(chǎn)生較多紋理; 指數(shù)特征(圖5(c))中陰坡裸地的陰影指數(shù)反射率值較低,與其他類(lèi)型地物有明顯區(qū)分; 地形特征(圖5(d))中,由于研究區(qū)內(nèi)高程起伏較大,高程范圍由3 671~4 029 m,高差相差358 m,使得DEM波段中不同類(lèi)型地物反射率值差異較大。

(a) 光譜特征波譜曲線(xiàn) (b) 紋理特征波譜曲線(xiàn)
3.3.1 隨機(jī)森林分類(lèi)結(jié)果與精度分析
基于隨機(jī)森林算法對(duì)研究區(qū)的GF-2高空間分辨率影像數(shù)據(jù)進(jìn)行花崗偉晶巖提取,其各類(lèi)型地物分類(lèi)結(jié)果如圖6所示。此次實(shí)驗(yàn)結(jié)果共提取出84處花崗偉晶巖,其形狀大小不一,以脈狀產(chǎn)出為主,成群出現(xiàn),且輪廓較為明顯,與其他類(lèi)型地物區(qū)分較好。在研究區(qū)內(nèi)隨機(jī)均勻生成1 000個(gè)地面驗(yàn)證點(diǎn),其中花崗偉晶巖驗(yàn)證點(diǎn)104個(gè),道路驗(yàn)證點(diǎn)19個(gè),冰雪驗(yàn)證點(diǎn)51個(gè),陽(yáng)坡裸地驗(yàn)證點(diǎn)414個(gè),干涸河流驗(yàn)證點(diǎn)87個(gè),陰坡裸地驗(yàn)證點(diǎn)325個(gè),通過(guò)計(jì)算地面驗(yàn)證點(diǎn)與真實(shí)地物類(lèi)型之間的混淆矩陣獲得分類(lèi)結(jié)果的精度統(tǒng)計(jì)(表3)評(píng)價(jià),其中總體精度達(dá)到93.1%; Kappa系數(shù)達(dá)到0.902; 花崗偉晶巖、冰雪、陽(yáng)坡裸地及陰坡裸地共4種地物的用戶(hù)精度和生產(chǎn)者精度都高于93%、道路高于81%、干涸河流高于73%。花崗偉晶巖由于其自身的色調(diào)、紋理,以及分布地形海拔都較高等優(yōu)勢(shì),在分類(lèi)結(jié)果上效果較好,用戶(hù)精度高達(dá)94.24%、生產(chǎn)者精度高達(dá)98%,以上結(jié)果說(shuō)明基于多特征的隨機(jī)森林算法在提取花崗偉晶巖信息中有較好的適用性。

表3 分類(lèi)結(jié)果的精度統(tǒng)計(jì)

圖6 研究區(qū)地物分類(lèi)結(jié)果
3.3.2 CLAHE特征層討論
本文新引入的4個(gè)CLAHE特征層中,CLAHE B與CLAHE R作為特征變量參與了隨機(jī)森林分類(lèi),為驗(yàn)證CLAHE B和CLAHE R對(duì)分類(lèi)結(jié)果產(chǎn)生的影響,故對(duì)優(yōu)選的16個(gè)特征變量中去除CLAHE B和CLAHE R這2個(gè)特征變量,只保留余下的14個(gè)特征變量參與隨機(jī)森林分類(lèi),并通過(guò)計(jì)算驗(yàn)證相同的1 000個(gè)地面驗(yàn)證點(diǎn)與真實(shí)地物類(lèi)型之間的混淆矩陣,并獲得分類(lèi)結(jié)果的精度(表4)評(píng)價(jià),其中總體精度為90.4%,較最佳分類(lèi)結(jié)果的總體精度下降2.7百分點(diǎn); Kappa系數(shù)為0.864,較最佳分類(lèi)結(jié)果的Kappa系數(shù)下降0.038; 各地物類(lèi)型的用戶(hù)精度與生產(chǎn)者精度都有不同程度的下降。

表4 14個(gè)特征的分類(lèi)結(jié)果精度統(tǒng)計(jì)
CLAHE方法的優(yōu)越性在于可以通過(guò)改變不同地物間的對(duì)比度,以突出色調(diào)上的差異,相比普通的直方圖均衡化方法只增強(qiáng)全局影像對(duì)比度,CLAHE方法在此基礎(chǔ)上引入了自適應(yīng)性與限制性,自適應(yīng)性改進(jìn)了增強(qiáng)全局對(duì)比度中只考慮整體影像區(qū)域,而忽略局部影像區(qū)域的情況,進(jìn)而注重影像的局部像素差異,在突出局部影像對(duì)比度的同時(shí)獲得更多細(xì)節(jié)特征; 限制性是在自適應(yīng)性基礎(chǔ)上的進(jìn)一步改進(jìn),目的是為了避免均衡化過(guò)程中產(chǎn)生的色調(diào)不連續(xù)與對(duì)比度過(guò)度增強(qiáng)等問(wèn)題。以精度下降最為明顯的干涸河流為例,且為了效果更加直觀,故采用真彩色的方式展示(圖7),CLAHE真彩色樣本影像中(圖7(b)),干涸河流的亮度要明顯亮于陽(yáng)坡裸地,且對(duì)比度更加突出,邊緣輪廓更加清晰,2類(lèi)地物在色調(diào)上有明顯差異,有利于分類(lèi)精度的提升,證實(shí)了CLAHE方法在區(qū)分色調(diào)較為相近地物時(shí)的有效性,同時(shí)CLAHE特征增強(qiáng)了花崗偉晶巖與其他類(lèi)型地物間亮度與對(duì)比度的差異,有助于提升花崗偉晶巖的提取效果,使其用戶(hù)精度和生產(chǎn)者精度分別上升0.97百分點(diǎn)與1百分點(diǎn)。

(a) 真彩色影像 (b) CLAHE真彩色影像
1)本文基于GF-2高空間分辨率影像數(shù)據(jù)結(jié)合特征優(yōu)選的隨機(jī)森林算法提出花崗偉晶巖的提取方法。地物分類(lèi)結(jié)果總體精度為93.10%,Kappa系數(shù)為0.902; 花崗偉晶巖的用戶(hù)精度及生產(chǎn)者精度分別為94.24%和98.00%,證實(shí)了該方法的有效性。
2)特征變量個(gè)數(shù)持續(xù)增多會(huì)產(chǎn)生數(shù)據(jù)冗余及計(jì)算量過(guò)大等問(wèn)題,導(dǎo)致過(guò)擬合現(xiàn)象發(fā)生。此次研究在特征優(yōu)化中確定特征變量個(gè)數(shù)為16個(gè)時(shí)分類(lèi)精度最高。
3)本文新引入的限制對(duì)比度自適應(yīng)直方圖均衡化(CLAHE)特征層中的CLAHE B和CLAHE R的特征重要性得分較高,并參與隨機(jī)森林分類(lèi)。CLAHE特征變量具有提升影像對(duì)比度、突出不同類(lèi)型地物間色調(diào)差異等優(yōu)勢(shì),有助于區(qū)分色調(diào)相近的地物,有利于地物分類(lèi)精度的提升。