宋恩澤, 張 穎, 邵光成, 劉 杰, 王 羿, 朱雪穎
(1.河海大學(xué)農(nóng)業(yè)科學(xué)與工程學(xué)院,江蘇 南京 210098; 2.南京市江寧區(qū)水務(wù)局,江蘇 南京 211100; 3.天津市灌溉排水中心,天津 300074; 4.西安理工大學(xué)水利水電學(xué)院,陜西 西安 710048)
隨著鄉(xiāng)村振興戰(zhàn)略的提出,農(nóng)業(yè)產(chǎn)業(yè)園得到了快速的發(fā)展。農(nóng)業(yè)產(chǎn)業(yè)園在農(nóng)業(yè)技術(shù)推廣、種植結(jié)構(gòu)調(diào)整、項目孵化和企業(yè)孵化、農(nóng)業(yè)知識譜及等方面具有重要的引領(lǐng)和示范功能[1]。通常情況下,農(nóng)業(yè)產(chǎn)業(yè)園區(qū)面積較小,但土地利用類型多樣,地形結(jié)構(gòu)復(fù)雜,采用傳統(tǒng)的實地走訪測量會浪費大量的人力、物力資源[2]??旖轀蚀_的農(nóng)業(yè)園區(qū)土地利用類型調(diào)查對園區(qū)合理的種植規(guī)劃、復(fù)雜地物的分類監(jiān)測具有重要作用。
遙感技術(shù)是通過衛(wèi)星等飛行器收集地物目標的光譜信息,對地物進行判斷識別的技術(shù)。其中,衛(wèi)星遙感技術(shù)以人造衛(wèi)星為平臺,因其覆蓋面大,探測周期短,可在大范圍內(nèi)進行地物分類及監(jiān)測,但是相對于航空遙感攝影,其分辨率相對較低。同時,中高分辨率的衛(wèi)星遙感影像受天氣和云量影響明顯,在大比例尺制圖方面應(yīng)用有限[3-4]。無人機遙感具有作業(yè)靈活、實時性強、成本低及分辨率高等特點,在土地利用調(diào)查中得到越來越多的應(yīng)用[5]。早期的無人機通常搭載RGB成像相機,得到的RGB影像僅含紅(R)、綠(G)、藍(B)等可見光波段,這些波段對部分地物的敏感性較低,且構(gòu)建的植被指數(shù)類型較少,算法的適用性較差,只能通過目視解譯的方法進行地物分類[6]。近年來隨著多光譜和高光譜相機的應(yīng)用,無人機得到的遙感波段信息更為豐富,為利用ENVI等專業(yè)軟件進行自動化地物識別提供了可能[7]。
目前,利用無人機高光譜及多光譜影像進行地物分類的方法主要有傳統(tǒng)的監(jiān)督分類及非監(jiān)督分類[8]、面向?qū)ο笥跋穹诸怺9]、機器學(xué)習(xí)分類[10]及深度學(xué)習(xí)分類[11]等。Bryson等[12]基于無人機可見光影像,將地物紋理顏色作為分類特征用于大規(guī)模地形分類;楊蜀秦等[13]基于無人機多光譜影像,采用深度語義分割算法對Deeplab V3+進行優(yōu)化并用于大田作物分類,比支持向量機法的分類精度提高了17.75%;楊紅艷等[14]基于無人機遙感和隨機森林法對荒漠草原的植被進行分類,總體分類精度達到了91.06%,取得了較為優(yōu)良的效果;Lou等[15]基于面向?qū)ο蟮碾S機森林算法對沼澤植被進行分類,總體分類精度可達70.26%以上。目前,將無人機遙感技術(shù)應(yīng)用于中小型農(nóng)業(yè)園區(qū)的地物分類尚不多見,且對分類后圖像的精度優(yōu)化研究鮮有報道。
鑒于此,本試驗以河海大學(xué)農(nóng)業(yè)科學(xué)與工程學(xué)院節(jié)水園為研究對象,利用無人機采集研究地塊多光譜遙感圖像,將遙感圖像經(jīng)過主成分分析增強各波段光譜信息;在樣方調(diào)查的基礎(chǔ)上,分別利用支持向量機模型(SVM)、人工神經(jīng)網(wǎng)絡(luò)模型(ANN)、隨機森林模型(RF)等算法進行地物分類,篩選最佳分類方法;進一步對影響分類精度的復(fù)雜地塊做裁剪處理,并使用TensorFlow算法對最優(yōu)分類結(jié)果進行深度學(xué)習(xí),優(yōu)化分類效果。
河海大學(xué)農(nóng)業(yè)科學(xué)與工程學(xué)院節(jié)水園(118°47′E,31°54′N)位于江蘇省南京市江寧區(qū),占地面積19 300 m2,海拔12 m。園區(qū)地處亞熱帶季風(fēng)氣候區(qū),四季分明,氣候溫和,無霜期長,光照充足。園區(qū)內(nèi)主要地物類別包括林/草地、耕地、水體、道路及房屋等,研究區(qū)地理位置及地物影像圖如圖1A所示。
無人機多光譜影像采集時間為2022年4月21日中午11:00-13:00,天氣狀況良好,晴朗無風(fēng),能見度好。采用大疆精靈4無人機(深圳市大疆創(chuàng)新科技有限公司產(chǎn)品)搭載P4 Multispectral多光譜相機(深圳市前海雅棋科技有限公司產(chǎn)品)。無人機沿著規(guī)劃布置的11條主航線采集多光譜數(shù)據(jù),航線長度為1 671 m,飛行高度50 m,飛行速度5 m/s,航向重疊率及旁向重疊率分別設(shè)置為80%、 70%,主航線角度177°。
將無人機采集的圖像按照藍光、綠光、紅光、紅邊及近紅外波段圖像分別導(dǎo)入Agisoft Metashape Professional軟件,依次進行密集點云、網(wǎng)格和紋理處理,進行圖像拼接,并生成正射影像及DEM(數(shù)字高程模型)影像。將獲得的正射影像導(dǎo)出至ArcMap10.5,以藍光正射影像為基準,通過地理配準功能對另外4幅正射影像進行圖像配準。在ENVI Classic 5.5.3軟件中使用layer stacking功能將5個波段的正射影像進行波段合成,由于無人機飛行高度較低,可不進行大氣校正[16],直接使用Quick Atmospheric Correction功能進行快速輻射校正,再通過裁剪處理,得到待分類圖像。

A:原始影像;B:主成分分析后的影像。圖1 研究區(qū)地物原始影像及主成分分析后影像Fig.1 Original and post principal component analysis images of features in the study area
1.4.1 分類標準 根據(jù)試驗區(qū)地物實地調(diào)查,結(jié)合中國土地利用現(xiàn)狀圖[17],將研究區(qū)地物分為農(nóng)村道路、空閑地、林/草地、裸土地、溝渠、設(shè)施農(nóng)用地、坑塘水面、塑料實驗器材、建筑垃圾、農(nóng)村宅基地、工業(yè)倉儲用地和陰影,具體分類標準如表1。在實地調(diào)查的基礎(chǔ)上選取了1 185個訓(xùn)練樣本,390個驗證樣本。

表1 地物類型及影像特征
1.4.2 數(shù)據(jù)優(yōu)化 由于分類地物較為復(fù)雜,因此需對多波段圖像進行圖像增強處理。主成分分析(PCA)是一種廣泛使用的圖像增強與數(shù)據(jù)降維算法,它將n維特征映射到k維上,在原有的n維特征基礎(chǔ)上重新構(gòu)造出全新的正交特征。利用PCA可對多波段圖像進行降維,提高目標研究區(qū)內(nèi)地物的植被指數(shù)、紋理特征和反射率[18],主成分分析后研究區(qū)影像如圖1B所示。
1.4.3 植被指數(shù)獲取 歸一化植被指數(shù)(NDVI)在植被生長狀態(tài)和植被覆蓋度研究中展現(xiàn)出良好的效果[19],本研究中將NDVI作為指標用于植被提取。
(1)
其中,ρNIR為近紅外波段反射值;ρR為紅光波段反射值。
1.4.4 分類模型選擇 隨機森林(RF)是一種基于學(xué)習(xí)理論的組合分類智能算法[20]。RF利用Bootstrap重抽樣方法從原始數(shù)據(jù)中抽取若干樣本,構(gòu)建全體Bootstrap樣本的決策樹,并對所有決策樹的預(yù)測結(jié)果進行組合,并投票選出最終結(jié)果[21]。在對圖像進行分類的過程中,每一個決策樹分別對像元進行分類,而像元最終的類別由決策樹投票決定。因此,RF分類器能夠克服傳統(tǒng)分類器對多光譜數(shù)據(jù)進行分類時存在的數(shù)據(jù)量大、訓(xùn)練樣本少且計算速度慢的問題[22]。同時RF處理多維數(shù)據(jù)時不會出現(xiàn)過擬合現(xiàn)象[23]。
人工神經(jīng)網(wǎng)絡(luò)(ANN)是由大量簡單的處理單元連接成的復(fù)雜網(wǎng)絡(luò),通過模仿人腦對數(shù)據(jù)進行識別、接受、處理及傳輸,是以模擬人類神經(jīng)系統(tǒng)的結(jié)構(gòu)和功能為基礎(chǔ)而建立的一種信息處理系統(tǒng)[24]。各單元之間的作用函數(shù)如式(2)、式(3)。
(2)
(3)
其中,yj為神經(jīng)元j的輸入;xi為上一層第i神經(jīng)元值;wij為權(quán)系數(shù);θi為閾值;f為非線性激勵函數(shù)[25]。
支持向量機(SVM)[26]是目前被廣泛使用的一種監(jiān)督分類器,建立在統(tǒng)計學(xué)理論和結(jié)構(gòu)風(fēng)險最小原理基礎(chǔ)上,可解決樣本量少的缺陷,實現(xiàn)高緯度模式識別[27]。
1.4.5 模型優(yōu)化 TensorFlow是一個將復(fù)雜的數(shù)據(jù)結(jié)構(gòu)體傳遞輸入至人工智能神經(jīng)網(wǎng)絡(luò)中并進行分析和處理的新一代人工智能學(xué)習(xí)系統(tǒng)。TensorFlow包含了兩層含義: Tensor代表N維數(shù)組,Flow表示基于數(shù)據(jù)流圖的計算。TensorFlow表示數(shù)據(jù)流圖中數(shù)組在兩端點之間流動的計算過程,在語音及圖像識別等機器學(xué)習(xí)與深度學(xué)習(xí)領(lǐng)域應(yīng)用較廣[28]。自2015年首次發(fā)布以來,被廣泛用于改善機器學(xué)習(xí)中,但其在地物遙感分類方面的應(yīng)用較少。
1.4.6 評價指標 對于不同分類模型輸出的結(jié)果,構(gòu)建驗證樣本的混淆矩陣,并進行下列指標的計算,進而進行算法的比較。
總體分類精度(Overall accuracy):正確分類的地物像元與試驗區(qū)總像元之比。
用戶精度(User accuracy):正確分類到i類的像元總數(shù)與分類器將整個影像的像元分為i類的像元總數(shù)比率。
Kappa系數(shù)[29](Kappa coefficient):通過將真實像元總數(shù)(N)乘以混淆矩陣的對角線之和,減去某個地物真實像元總數(shù)和該類中被分類像元的乘積,再除以總像元數(shù)的平方減去某一類地物真實像元與該類中被分類像元總數(shù)之積求和。
生產(chǎn)者精度(Producer accuracy):整個影像的像元正確分為i類的像元數(shù)與該類實際像元總數(shù)的比率。
本研究采用的技術(shù)路線如圖2所示。
利用SVM、RF、ANN模型對主成分變換后影像及SVM模型對未經(jīng)過主成分變換的原始影像進行分類,結(jié)果如圖3所示。從圖3中可以看出,大部分情況下分類結(jié)果一致,局部地區(qū)存在一些差異,將3種分類模型各自分類結(jié)果與試驗區(qū)RGB圖像目視比較,SVM、RF、ANN分類模型對植被及非植被地物的分類匹配度較高。樹木植被環(huán)繞試驗區(qū)四周分布,農(nóng)田植被與裸土地邊界較為清晰,對于種植作物的設(shè)施農(nóng)用地,識別度也較高;對于工業(yè)倉儲用地、農(nóng)村道路、坑塘水面等地物,3種分類模型均能較為準確的分類。在分類其他地物時,3種分類模型差距較大。RF、ANN分類模型將工業(yè)倉儲用地附近空閑地錯分為裸土地; ANN分類模型在分類建筑垃圾時,常錯分為工業(yè)倉儲用地,分類效果不如SVM、RF分類模型。綜上所述,3種分類模型對林/草地、工業(yè)倉儲用地、農(nóng)村道路等反射率及形狀與周邊差距較大的地物分類效果較好,RF分類模型對坑塘水面的分類效果較好。從整體來說,SVM分類模型對農(nóng)業(yè)園區(qū)地物的分類效果最好。
根據(jù)不同分類模型得到的分類結(jié)果混淆矩陣(圖4),可得出不同分類模型的總體分類精度、用戶精度、Kappa系數(shù)及生產(chǎn)者精度,如表2和表3所示。

PCA降維:主成分分析降維;SVM分類模型:支持向量機分類模型;RF分類模型:隨機森林分類模型;ANN分類模型:人工神經(jīng)網(wǎng)絡(luò)分類模型。圖2 技術(shù)路線圖Fig.2 Technical flow chart

PCA降維、SVM分類模型、RF分類模型、ANN分類模型見圖2注。圖3 分類結(jié)果Fig.3 Classification results

a:空閑地;b:實驗器材;c:設(shè)施農(nóng)用地;d:陰影;e:農(nóng)村宅基地;f:建筑垃圾;g:溝渠;h:坑塘水面;i:工業(yè)倉儲用地;j:農(nóng)村道路;k:裸土地;l:林/草地。SVM:支持向量機分類模型;RF:隨機森林分類模型;ANN:人工神經(jīng)網(wǎng)絡(luò)分類模型。圖4 不同分類模型分類結(jié)果的混淆矩陣圖Fig.4 Confusion matrix of classification results of different classification models

表2 不同分類模型的分類精度

表3 不同分類模型分類的總體精度和Kappa系數(shù)
SVM分類模型對PCA降維前后的影像總體分類精度及Kappa系數(shù)分別為95.1%、97.40%和0.75、0.96。從PCA使用前后精度來看,主成分分析技術(shù)的應(yīng)用使總體分類精度和Kappa系數(shù)分別提高了2.30個百分點、0.21;從生產(chǎn)者精度來看,SVM分類模型對林/草地、坑塘水面、農(nóng)村道路、陰影、設(shè)施農(nóng)用地和建筑垃圾的分類效果最好,均超過99%;其次對于工業(yè)倉儲用地、裸土地、溝渠和空閑地的分類精度也達到了90%以上;但是對農(nóng)村宅基地和塑料實驗器材存在一定錯分現(xiàn)象??赡茉蚴且驗樗芰掀鞑亩啻嬗诼阃恋丶爸脖粎仓?表面被泥土覆蓋或植被遮擋,使其部分像元分類為林/草地和裸土地。農(nóng)村宅基地組成多為表面刷漆石板結(jié)構(gòu),在顏色上與工業(yè)倉儲用地極為相似,漆塊脫落后石板易被誤分為農(nóng)村道路。
RF分類模型總體分類精度及Kappa系數(shù)分別為95.95%、0.95。從生產(chǎn)者精度來看,林/草地、裸土地、農(nóng)村道路、工業(yè)倉儲用地、坑塘水面、農(nóng)村宅基地、陰影和設(shè)施農(nóng)用地的分類精度較高,均能達到90%以上;但是,RF分類模型對溝渠和塑料實驗器材有部分錯分現(xiàn)象。溝渠由石料堆砌而成,其表面與工業(yè)倉儲用地和農(nóng)村道路有一定相似性,從而導(dǎo)致實際溝渠被錯分為工業(yè)倉儲用地或農(nóng)村道路。
ANN分類模型總體分類精度和Kappa系數(shù)為87.17%及0.84,低于SVM、RF分類模型。但其對林/草地、裸土地、農(nóng)村道路、工業(yè)倉儲用地、坑塘水面、陰影和設(shè)施農(nóng)用地等仍有較高的分類精度;對于建筑垃圾錯分誤差為100%,對農(nóng)村宅基地、溝渠和塑料實驗器材分類精度也較低。分析其原因是神經(jīng)網(wǎng)絡(luò)模型相比于其他模型,需要更多的訓(xùn)練樣本及數(shù)據(jù),建筑垃圾、農(nóng)村宅基地和塑料實驗器材在試驗區(qū)數(shù)據(jù)較少,無法做出較為準確的分類。
從3個分類模型整體分類情況來看,SVM、RF、ANN分類模型的總體分類精度分別為97.40%、95.95%、87.17%,均超過80%,Kappa系數(shù)為分別為0.96、0.95、0.84,表現(xiàn)出較高的適用性。其中,SVM分類模型的表現(xiàn)最優(yōu),即SVM為最佳分類模型,因此,將SVM分類模型作為最優(yōu)分類模型進行TensorFlow深度學(xué)習(xí),進一步優(yōu)化分類模型。
對試驗場地原始偽彩色圖像和SVM分類模型分類后圖像比較得出,試驗區(qū)設(shè)施農(nóng)用地右側(cè)為透明薄膜棚區(qū),由于無人機多光譜圖像分辨率較高,棚內(nèi)裸土地和林/草地等由于薄膜遮蓋,部分地物被錯分為農(nóng)村道路、工業(yè)倉儲用地等,將其進行深度學(xué)習(xí)訓(xùn)練,會影響整個試驗區(qū)地物分類,不利于精細分類,如圖3A。因此,考慮將試驗區(qū)圖像裁剪為a、b兩區(qū)分別進行分類,裁剪結(jié)果如圖5。
對a、b兩區(qū)分別使用SVM分類模型分類后進行深度學(xué)習(xí)優(yōu)化,得到分類結(jié)果如圖6。
經(jīng)TensorFlow深度學(xué)習(xí)優(yōu)化后的分類精度和混淆矩陣如表4及圖7所示。a、b兩區(qū)的分類精度分別為97.54%和99.12%,總體分類精度和Kappa系數(shù)分別為98.36%和0.98。與原始SVM分類結(jié)果相比,分區(qū)后的分類精度均有較大提高,但仍有部分農(nóng)村宅基地被錯分為農(nóng)村道路,其原因在于園區(qū)內(nèi)農(nóng)村宅基地大多較矮小且與農(nóng)村道路材料組成相同,容易產(chǎn)生錯分現(xiàn)象??傮w來看,TensorFlow優(yōu)化能融合SVM分類模型與神經(jīng)網(wǎng)絡(luò)分類模型的優(yōu)點,對樣本較少的地物也能保持極高的分類精度。
本研究將無人機多光譜影像應(yīng)用于農(nóng)業(yè)園區(qū)地物分類中,利用植被信息及光譜信息構(gòu)建模型,對比分析SVM、RF、ANN分類模型,篩選出了適用于中小型農(nóng)業(yè)園區(qū)地物分類的SVM分類模型。同時,利用篩選出的模型通過TensorFlow訓(xùn)練深度學(xué)習(xí)樣本,提升了局部地區(qū)分類精度。研究結(jié)果對農(nóng)業(yè)園區(qū)地物分類有一定的參考價值。
篩選最優(yōu)分類方法過程中,SVM分類模型總體分類精度最高,達到了97.40%;其次是RF分類模型,總體分類精度為95.95%,但ANN分類模型僅為87.17%。綜合對比,SVM分類模型作為一種二分類模型,能夠很好地解決訓(xùn)練樣本較少的地物分類[30]。本研究區(qū)占地面積1.93 hm2,部分地物如塑料實驗器材等樣本較少,而ANN分類模型雖然作為較智能的模型,但其需要大量的訓(xùn)練樣本進行學(xué)習(xí),對于訓(xùn)練樣本較少的地物容易產(chǎn)生錯分及漏分現(xiàn)象。同時,ANN分類模型分類時存在隱藏層,使其分類過程中需要更多的計算量[31],運算時間超過SVM分類模型及RF分類模型,在地物分類中適用性比SVM分類模型和RF分類模型低。

圖5 研究區(qū)裁剪圖Fig.5 Cutting map of the study area

圖6 裁剪分區(qū)圖的TensorFlow優(yōu)化分類結(jié)果Fig.6 The TensorFlow optimized classification resutls of the cutting maps

表4 SVM分類模型分類結(jié)果經(jīng)TensorFlow深度學(xué)習(xí)優(yōu)化后的分類精度

a:空閑地;b:實驗器材;c:設(shè)施農(nóng)用地;d:陰影;e:農(nóng)村宅基地;f:建筑垃圾;g:溝渠;h:坑塘水面;i:工業(yè)倉儲用地;j:農(nóng)村道路;k:裸土地;l:林草地。圖7 TensorFlow深度學(xué)習(xí)優(yōu)化后SVM分類模型的分類混淆矩陣Fig.7 Classification confusion matrix of SVM classification model optimized by TensorFlow deep leaming
在使用TensorFlow對最優(yōu)分類模型優(yōu)化時,a、b 2個分區(qū)及完整園區(qū)總體分類精度分別為97.54%、99.12%、98.36%,與原始SVM分類模型的分類結(jié)果保持一致,但溝渠的分類結(jié)果明顯優(yōu)于原始分類結(jié)果,達到了98.00%,分析原因SVM分類模型作為一種傳統(tǒng)的機器學(xué)習(xí)分類模型,通過分離超平面來完成分類[32],溝渠由于未及時除草,和林/草地混雜從而影響SVM分類模型的分類;TensorFlow訓(xùn)練深度學(xué)習(xí)模型通過訓(xùn)練原始模型在待分類圖像中尋找相似特征,在SVM分類模型分類的結(jié)果上,使用深度學(xué)習(xí)算法,能夠更為準確地實現(xiàn)溝渠分類。
圖像增強處理技術(shù)能夠有效提高地物分類結(jié)果,經(jīng)過PCA處理的圖像采用SVM分類模型的分類結(jié)果的總體分類精度及Kappa系數(shù)為97.40%、0.96,相比于應(yīng)用原始圖像總體分類精度和Kappa系數(shù)分別提高了2.30個百分點和0.21。
SVM、RF、ANN分類模型的總體分類精度,均超過了87%,表現(xiàn)出一定的適用性。考慮分類耗費時間及部分地物分類精度,SVM分類模型在樣本較少的地物分類中保持較高的準確性,耗費時間短,較為穩(wěn)定。
對分類好的圖像,可通過TensorFlow訓(xùn)練深度學(xué)習(xí)優(yōu)化,提高部分分類不佳的地物分類精度。經(jīng)過優(yōu)化后的a、b兩研究區(qū)總體分類精度分別為97.54%及99.12%,整個園區(qū)總體分類精度為98.36%,均比未經(jīng)TensorFlow處理的分類結(jié)果有所提高。
在復(fù)雜地物的分類中,反射率或形狀相似的地物會影響彼此的分類精度,造成錯分、漏分等現(xiàn)象,通過裁剪將地物分別進行分類能夠提高整個圖像總體分類精度。