張 鵬,胡守庚
·農業信息與電氣技術·
地塊尺度的復雜種植區作物遙感精細分類
張 鵬,胡守庚※
(1. 中國地質大學(武漢)公共管理學院,武漢 430074; 2. 國土資源部法律評價工程重點實驗室,武漢 430074)
實現復雜農區作物種植信息的精準、動態監測是中國農業精細化管理面臨的迫切需求,而作物種植碎片化和異質性給作物遙感精細分類帶來了諸多挑戰,該文旨在探索基于高分辨率影像的地塊尺度多種作物同步識別方法,以滿足實時獲取復雜農區作物詳細分布信息需要。研究選取武漢市新洲北部為典型區,以WorldView-2影像為數據源,利用ReliefF-Pearson方法優選作物遙感特征,采用人工神經網絡、K最近鄰和隨機森林算法進行作物分類,并對比分析其精度。研究發現:1)RVI、NDVI、相關性和邊界長度等12個特征構成了地塊尺度作物分類的相對較優特征,可在充分表征影像信息同時降低數據冗余;2)相比于人工神經網絡和K最近鄰算法,隨機森林算法分類精度最高,其總體精度達79.07%;3)以光譜特征差異為作物區分基礎,形狀和紋理特征的使用能有效改善地塊尺度作物分類精度,總體精度可提高4%左右;4)研究所采用的方法體系能有效提升復雜種植區地物分類精度,水稻、棉花、荷等主要作物以及裸旱地、裸水田等地物分類精度均達到了80%以上。研究成果可為復雜種植區作物遙感精細分類提供新的思路和方法借鑒,亦可為作物種植信息精準普查、土地利用精細化管理以及農業產業結構調整動態監測等提供參考。
遙感;作物;分類;地塊尺度;復雜種植區;隨機森林;特征選擇;高分辨率影像
作物種植結構是地區主要農作物種植類型、面積及空間分布的綜合反映,是表征農業生產資源利用科學性、合理性的重要指標[1]。及時、準確地獲取作物種植結構信息對農情監測、作物產量預估、農業結構調整、糧食政策制定等具有重要意義[2-3]。近年來,農業現代化建設的大力推進進一步加速了農業生產要素的合理流動和有效配置,促進了農業生產向規模化、專業化和智能化方向發展[4]。而實現農業生產的種植精準化、管理可視化和決策智能化,不僅需要大尺度農業監測支撐,更需要獲取村級乃至地塊級等精細尺度作物種植信息[5-6]。與此同時,遙感技術的高速發展促使農業生產和研究愈發趨向于精細化和定量化,尤其是高分辨率數據可獲得性的日益提高使得地物詳細分類和精準監測成為可能[7-8]。在此發展態勢下,如何因地制宜地構建作物遙感精細分類方法,獲取復雜農區作物種植詳細信息,以服務于中國農業現代化建設和國家糧食安全保障成為學術界關注的焦點[6-7]。
光譜、時相和空間特征是作物種植結構遙感提取的主要理論基礎[1]。近年來,隨著RS和GIS技術的飛速進步以及影像數據源的不斷豐富,國內外學者從區域、國家乃至全球尺度出發,圍繞多源影像數據融合[9-10]、特征變量優選[11-12]、分類器選擇與參數優化[13-14]等關鍵技術,對作物種植面積提取[15-16]、空間分布制圖[8,10]開展了廣泛且卓有成效的研究。雖然已有研究在作物遙感的理論、方法和應用方面取得了長足進展,但不可忽視的是,中國農業區的耕地經營分散、農業景觀破碎和作物種植結構復雜等特點[17-18],給精細尺度作物遙感分類帶來了持續性挑戰[6,16-17]。種植景觀的破碎化和異質性,使得中低分辨率影像難以有效捕捉以田塊為單元的作物對象,增加了作物的錯誤分類可能。傳統以AVHRR、MODIS、TM/ETM、HJ等影像為數據源,采用植被指數時間序列分析并結合作物物候信息的分類方法,難以在復雜種植區取得可靠的作物制圖精度[10-11,18],小尺度、高精度的作物遙感精細分類方法仍有待進一步探索[19-20]。值得注意的是,高分辨率影像能夠以米級甚至亞米級的分辨率提供地物對象的精細形狀和紋理,在捕捉地塊空間信息方面具有較大優勢[7,21],為復雜農區小尺度作物精細分類帶來了可能[21-23]。部分學者利用GF-1、RapidEye等高分辨影像[24-25],進行了小麥、玉米等大宗作物的提取與制圖,但多以區域尺度上單一作物遙感提取為主,利用高分辨率數據精細到地塊尺度并同步識別多種作物的研究并不多見[26]。
鑒于此,本文以遙感信息“圖-譜”認知理論為基礎,利用高分辨率WorldView-2影像,通過提取并篩選影像光譜、形狀和紋理特征,對比隨機森林、人工神經網絡和K最近鄰等分類算法,選取武漢市新洲復雜種植區為典型區,探索復雜農區的作物精細分類方法,以期獲得地塊尺度多種作物同步識別的相對較優特征和方法模型,為作物遙感精準監測以及農業精細化管理等提供參考。
研究區位于湖北省武漢市新洲區,東經114°56′10″~114°58′00″,北緯30°54′31″~30°55′57″,如圖1所示。該地區地處江漢平原北緣、大別山余脈南端,地勢北高南低,平均海拔約46 m;夏季高溫多雨,冬季寒冷干燥,屬于典型亞熱帶季風氣候。研究區年平均氣溫16.6 ℃,年平均日照時長2018.6 h,無霜期226~278 d,年平均降水量848.5~2165.4 mm;四季明顯,光照充足,雨水充沛,嚴寒期短,無霜期長,適合多種作物生長。研究區耕地細碎化現象嚴重,地塊平均面積約500 m2;6至8月份主要種植有水稻、棉花、蓮藕(荷)、花生、芝麻、紅薯和大豆等作物。

注:圖中影像由紅、綠、藍波段的真彩色合成;為確保地塊邊界完整性,研究選取紅線劃定的區域為作物分類感興趣區。
研究使用覆蓋感興趣區的WorldView-2影像進行作物分類,該數據采集于2013年7月13日,域內無云量,大小范圍為2.9 km×2.6 km。WorldView-2衛星發射于2009年,提供了0.5 m分辨率的全色圖像和2 m的多光譜圖像,包括海岸藍(0.40~0.45m)、藍(0.45~0.51m)、綠(0.51~0.58m)、黃(0.59~0.63m)、紅(0.63~0.69m)、紅邊(0.71~0.75m)、近紅外1(0.77~0.90m)和近紅外2(0.86~1.04m)8個波段[27]。影像預處理在ENVI5.3軟件平臺完成,對全色和多光譜數據分別進行輻射定標、大氣校正,而后采用PC光譜銳化方法對二者進行融合,利用地面實測控制點和二次多項式方法對融合影像進行幾何精校正,校正后RMS(root mean squared)誤差小于0.5個像元,滿足影像分析要求。
為掌握研究區主要作物種植類型及分布,研究于2015年8月對感興趣區進行野外實地調查。調查時測量了特征地塊經緯度坐標,并準確記錄了地塊耕作情況及植被類型。為避免地面采樣數據與獲取的遙感影像時間滯后影響,在采樣過程中,以2013年遙感影像為基準期,采集2015年同期土地利用類型未發生變化的地塊作為樣本點。此次調查共獲取樣本點1242個,參考已有研究,按照1:1劃分比例[7],將其隨機分為兩部分,分別用作模型訓練和精度驗證。

表1 訓練樣本及驗證樣本個數
研究所識別地物類型有棉花、水稻、荷、花生、裸水田、裸旱地、撂荒農田和其他作物共8種(圖2)。實地調查發現,研究區內有少量農田被撂荒,且存在部分土壤裸露的旱地,以及被少量水體覆蓋但幾乎無作物生長的裸水田;考慮到地塊尺度耕地利用分類完整性,將撂荒農田、裸旱地以及裸水田納入本次地物分類系統。此外,研究區內芝麻、紅薯、大豆等作物雖有零星種植,但面積較小,為保證樣本數量有效性,研究將其歸為一類,統稱為其他作物。圖2表示RGB色彩模式下各地物影像特征,影像的亮度、色相及紋理差異可為后續分類所用的特征變量選取提供參考。

圖2 真彩色影像下的典型樣本
研究基于面向對象分類思想,通過提取地塊級別影像光譜、形狀和紋理信息,選取隨機森林(random forest, RF)算法對目標地物進行監督分類。具體方法流程:1)對WorldView-2影像進行目視解譯,獲取研究區農田/非農田分布,掩膜掉影像中的非農田信息;2)利用人工矢量化獲取的地塊邊界數據分割預處理后影像,提取影像光譜、形狀和紋理特征;3)采用ReliefF-Pearson方法剔除特征冗余,獲得優選特征集;4)使用優選特征和實地采樣數據執行RF分類,并對結果進行精度評價,通過與人工神經網絡(artificial neural network, ANN)和K最近鄰(K-nearest neighbor, KNN)算法比較,驗證RF算法有效性;5)基于優選特征選取并構建4種特征組合集(①光譜特征集,②光譜、形狀特征集,③光譜、紋理特征集,④光譜、形狀和紋理特征集),再次執行RF分類,對比分析4種特征組合下作物分類精度,測評形狀、紋理特征對作物分類貢獻,技術路線如圖3。

圖3 分類流程圖
有效選用多種特征變量是提高作物分類精度的關鍵[12],WorldView-2影像的形狀、紋理等空間信息豐富[27],為地塊尺度作物精細分類提供了便利。研究使用eCongnition9.0軟件,在影像分割基礎上,提取對象的光譜、形狀和紋理信息參與分類。光譜特征包括影像對象的各波段均值、最大差分、亮度值以及歸一化植被指數(normalized difference vegetation index, NDVI)、比值植被指數(ratio vegetation index, RVI)、增強型植被指數(enhanced vegetation index, EVI)和歸一化水體指數(normalized difference water index, NDWI)。形狀特征以構成影像對象的像素的空間分布統計為理論基礎,基于像素坐標的協方差矩陣提取,包括面積、邊界長度、長度、長寬比、寬度、主方向、緊湊性、密度、形狀指數和圓度。紋理特征基于全方位(all dir.)灰度共生矩陣(gray-level co-occurrence matrix, GLCM)提取,包括均值、標準差、熵、同質度、對比度、相異性、角二階矩、相關性。光譜特征中RVI、NDVI、EVI和NDWI的計算公式如下:




式中NIR1為近紅外1波段反射率,R為紅波段反射率,B為藍波段反射率,G為綠波段反射率;為土壤調節參數,這里取1。
為盡可能消除冗余信息對分類精度干擾,以獲得類內聚合性強和類間可分性高的特征變量,研究選取ReliefF算法對所提取影像特征進行優選。ReliefF算法源自對Relief擴展[28],主要用于多類別分類時特征降維及缺失數據處理,已被廣泛應用于土地利用遙感分類中的特征變量優選[29]。它通過計算樣本“假設間隔”給特征賦予分類能力權重,特征權值越大,表示其分類能力越強。假設間隔是指當保持樣本分類不變時分類決策面可以移動的最大距離[29],計算公式如下:

式中()、()分別表示與樣本同類和異類最鄰近樣本點。
研究使用ReliefF算法對32個初始特征進行篩選,保留對目標類貢獻較大的23個,并利用Pearson相關系數剔除冗余,得到12個優選特征。ReliefF特征選擇借助Weka3.6軟件實現,使用ReliefF主函數執行核心算法并計算初始特征分類權重,保留權值大于0.02的23個(圖4)。根據“相關性越強信息冗余越大、權值越低分類能力越弱”原則,剔除同保留特征相關性強(相關系數絕對值大于0.8)但自身權值相對較低的NIR1、G-diss、Length等11個特征(圖4中白色柱);例外的是,雖然NDVI與RVI相關性較強,但考慮到二者分類權值遠高于其他特征,故均予以保留;最終保留RVI、NDVI、Max diff.、G-cor、Width等12個(圖4中灰色柱)作為優選特征參與分類,特征權重如圖4所示。
2.4.1 RF、ANN和KNN分類
研究選用RF算法進行作物分類,其對樣本容錯能力較強且訓練效率較高[30],已被廣泛用于作物遙感分類[11,13-14]。為驗證RF算法有效性,同時使用12個優選特征構建ANN和KNN分類模型,并將RF與ANN、KNN算法進行分類精度對比分析。
1)隨機森林分類
RF是一種由多顆決策樹組合而成的集成學習算法[30]。它通過自助法重采樣,從原始訓練樣本集中有放回地抽取組訓練集,每組大小約為原始訓練集的2/3;然后,利用組訓練集使用完全分裂方式建立棵決策樹,在每顆樹生長過程中,從全部個特征中隨機抽取(<<)個進行內部節點劃分;最后,集合顆決策樹預測結果,采用投票方式決定新樣本類別。在訓練集抽取過程中,約1/3的數據未被抽中,這些數據稱為袋外數據(OOB),它可用于類別錯分誤差評估和變量重要性估計。已有研究表明,關于參數和的確定,模型默認值可提供良好的結果[13,30],即取500、取輸入特征數目的二次方根。

注:RVI、NDVI和NDWI分別代表比值植被指數、歸一化植被指數和歸一化水體指;Max diff. 和Bri 分別代表最大差分和亮度值;Coastal、Blue、Green、Yellow、Red、Red edge、NIR1和NIR2分別代表海岸藍、藍、綠、黃、紅、紅邊、近紅外1和近紅外2波段光譜反射率均值;G-cor、G-diss、G-con、G-ent、G-SD、G-ASM和G-hom分別代表基于灰度共生矩陣計算的相關性、相異性、對比度、熵、標準差、角二階矩和同質性;Bor. len.、Width和Length分別代表邊界長度、寬度和長度。下同。
2)人工神經網絡分類
研究選用BP(back propagation)神經網絡作為ANN的實現,它是一種按誤差反向傳播算法訓練的多層前饋網絡,是目前最具代表性和廣泛應用的人工神經網絡之一。BP神經網絡能學習和存貯大量的輸入-輸出模式映射關系,而無需事前描述這種映射。根據分類需要,研究將BP-ANN設計為3層結構,輸入層、中間隱藏層和輸出層各1個,分別由12個、8個和1個節點組成。BP-ANN最優參數設定借助于訓練樣本交叉驗證優化實現,采用logistic激活函數,權值遞減值為0.05,最大迭代訓練500次。
3)K最近鄰分類
KNN是一種基于統計的機器學習算法。它通過計算各樣本到待分類對象距離,尋找待分類對象的K個近鄰對象;而后,根據最大所屬原則,在K個近鄰對象中,將擁有最多個近鄰對象的類別分配給該待分類對象。由于它不需要其他輔助數據來對分類規則進行描述,且分類效果較好、訓練過程迅速,目前在影像分類中已得到廣泛運用。KNN最優參數設定同樣借助于訓練樣本交叉驗證優化實現,采用歐氏距離、triangular函數,最近鄰K值為10。
2.4.2 不同特征組合下的分類
為檢測形狀、紋理特征的使用對作物分類精度影響,研究基于12個優選特征,通過特征組合構建了4種不同的特征變量集,并將其分別導入RF算法生成4個分類模型,模型1:僅使用光譜特征的RF分類;模型2:使用光譜和形狀特征組合的RF分類;模型3:使用光譜和紋理特征組合的RF分類;模型4:使用光譜、形狀和紋理特征組合的RF分類。研究將對比這些分類模型的精度,以測評形狀、紋理特征對作物分類貢獻。
2.4.3 特征重要性評估
特征重要性使用RF算法自帶的平均精度減少(mean decrease in accuracy, MDA)指標評估,MDA定義為特征變量值發生輕微擾動后與擾動前所對應的分類正確率的平均減少量[30]。MDA值越大表示該特征越重要,它通過OBB錯誤率計算得到:在RF每棵樹中,使用隨機抽取的訓練自助樣本建樹,并計算OBB的預測錯誤率;然后,隨機置換特征變量的觀測值后再次建樹并計算OBB預測錯誤率;最后,計算兩次OBB錯誤率的差值經過標準化處理后在所有樹中的平均值,即為該特征的置換重要性,也即是MDA得分。
研究基于地面采樣數據,使用混淆矩陣精度評價方法計算分類結果的用戶精度、制圖精度、總體精度和Kappa系數,相關定義見文獻[31]。為檢測不同算法之間的分類精度差異,研究對兩兩算法分類結果進行McNemar’s檢驗,它是基于兩個分類算法的誤差矩陣計算的非參數檢驗,具體公式[32]如下

式中12表示被算法1錯分類但被算法2正確分類的樣本數目,而21表示被算法1正確分類但被算法2錯分類的樣本數目;若Z值大于1.96,則表明在0.05檢驗水平下,兩個算法的分類精度差異性顯著[32]。
對地塊面積描述性分析發現,研究區內耕地細碎化現象明顯,地塊面積的頻率分布近似呈對數正態分布(圖5)。通過實地調查結合專家知識,對感興趣區內WorldView-2影像人工矢量化,得到地塊7 441個;地塊面積的平均值為483.23 m2,中值為368.00 m2,上下四分位數分別為225.25、615.81 m2。感興趣區內78.50%的地塊面積小于666.67 m2,說明研究區耕地細碎化嚴重;也間接說明,在類似破碎景觀區開展地塊級作物分類,高空間分辨影像相比中低分辨率影像將更有優勢。

圖5 地塊面積的頻率分布直方圖
研究使用12個優選特征,基于同一實地采樣數據,分別采用ANN、KNN和RF算法進行作物分類。目視評估來看,ANN、KNN分類(圖6)與RF分類結果(圖7d)差異并不顯著,均能從整體上呈現目標地物空間分布特征。
對比不同算法分類精度可知(表2),RF算法精度顯著高于ANN和KNN算法。與ANN、KNN相比,RF的總體精度提高了2.58%和4.51%、Kappa系數提高了0.03和0.06。從單個地物分類精度來看,相比于ANN和KNN,RF提高了裸旱地、棉花、花生以及撂荒農田的用戶精度,提高0.16%至11.6%不等;同時,RF提高了荷、其他作物和水稻的制圖精度,提高1.22%至12.20%不等。此外,研究利用式(6)進行RF與ANN、KNN的分類結果McNemar’s檢驗,Z值分別為3.77、4.80且大于1.96,表明在0.05檢驗水平下,RF與ANN、KNN的分類精度差異性顯著。綜上,相比于ANN和KNN,RF有助于提高研究區地物分類精度,究其原因,RF算法能夠通過構建多棵決策樹進行投票決定最終分類結果,在一定程度上避免了ANN、KNN算法的一次分類帶來的誤差。

圖6 基于優選特征的ANN和KNN分類結果

表2 基于優選特征的ANN, KNN和RF分類精度
Note:BPF: Bare paddy field; BUF: Bare upland field; OC: Other crops; AC: Abandoned cropland; OA: Overall accuracy; KC: Kappa coefficient; UA: User’s accuracy; PA: Producer’s accuracy. The same below.
研究使用4種特征組合下的RF模型分別進行作物分類,將分類結果(圖7)與驗證樣本計算混淆矩陣,得到不同特征組合下的作物分類精度(表3)。由表3可知,4種特征組合下的地物總體分類精度都超過了70%;其中使用光譜、形狀及紋理特征組合的分類精度最高,總體精度和Kappa系數分別達79.07%、0.76;僅使用光譜特征的分類精度最低,總體精度和Kappa系數分別為74.24%、0.70。對比不同特征組合的分類精度可知(表3),與單獨使用光譜特征相比,形狀特征的添加可有效提升分類精度,總體精度和Kappa系數分別提高3.86%、0.04;同樣,在光譜特征中添加紋理特征亦可有效改善分類精度,總體精度和Kappa系數分別提高3.05%、0.03。值得一提的是,與單獨添加形狀(或紋理)特征相比,在光譜特征中同時添加形狀和紋理特征,可進一步地改善地物分類精度,但改善較為有限,總體精度和Kappa系數僅增加0.97%(1.78%)、0.02(0.03)。
從單個地物分類精度來看(表3),與僅使用光譜特征相比,形狀和紋理特征的加入大大地改善了荷、花生、水稻和撂荒農田的分類精度,四者的用戶精度和制圖精度分別提高了5.39%至15.88%、5.88%至19.70%不等。7月份荷葉盛展,荷田紋理清晰(圖2),加之田塊尺寸較大(圖7),因此,形狀和紋理特征的加入可有效提升荷的識別精度。相較于其他地物來看,花生地塊明顯較小(圖7),形狀特征的加入有助于將花生與其他地物進行區分。而稻田擁有規整尺寸和均質紋理(圖2和圖7),形狀和紋理特征的使用也有助于水稻的識別。由于長期拋荒,撂荒農田的植被生長復雜多樣,致使地塊間光譜差異較大,僅用單一光譜信息難以對其精準識別,隨著形狀和紋理特征的加入,顯著地增加了識別維度,有效地提高了識別精度。

圖7 基于不同特征組合的RF分類結果

表3 基于不同特征組合的RF分類精度
研究采用“基于RF算法和12個優選特征”的分類模型進行特征重要性評估,平均精度減少(mean decrease in accuracy, MDA)測算結果見圖8。從類別整體的特征重要性來看(圖8a),Max diff.等6個光譜特征變量的MDA均高于0.08,且數倍于形狀和紋理特征的MDA;說明光譜特征是作物遙感分類基礎,其分類重要性顯著高于形狀和紋理特征;進一步來看,光譜特征中Max diff.和Red變量最為重要,兩者MDA顯著高于其余光譜特征。

圖8 基于‘平均精度減少(MDA)’測算的特征重要性
從單一地物的特征重要性來看(圖8b-8i),光譜、紋理和形狀特征的重要性差異顯著,但總體上仍呈現光譜特征高于形狀和紋理特征的趨勢。此外,同一特征對不同類別地物分類貢獻的非均衡性明顯,以Width特征為例,其對荷、花生的重要性較高,MDA均超過了0.04,但對其他地物(例如裸水田、棉花等)的重要性極低,MDA均小于0.01;究其原因,相比其他地物,荷田尺寸極大而花生地塊尺寸極小,Width變量剛好能有效刻畫這一特征,為荷及花生的識別提供了幫助。另外,對于‘其他作物’類,Max diff. 特征的重要性遠高于其余特征(圖8f),這種“一個變量極為重要,其余變量極為不重要”的現象在其余7種地物的特征重要性分析中是沒有的;究其原因,‘其他作物’是混合地類,類內光譜差異性明顯,而Max diff. 變量有效刻畫了這一特征,有助于對‘其他作物’進行識別。此外,對于水稻,有兩個紋理特征(G-SD 和 G-cor)的重要性都超過了0.09(圖8h),這在其余地物的特征重要性分析中也是罕見的;深入分析可知,稻田比較規整,其紋理特征尤為明顯,一定程度上有助于水稻的識別。綜合來看,雖然形狀和紋理特征相較于光譜特征的重要性較低,但它們對于部分作物(例如,荷、水稻等)的識別精度提高是不可或缺的。
研究充分挖掘高分辨率影像光譜、形狀和紋理信息,提取并優化遙感特征參量,在對比分析RF、ANN和KNN等算法基礎上,構建了能夠對復雜種植區地塊尺度多種作物同步識別的相對較優特征及方法模型。該方法體系對于復雜農區作物精準制圖具有參考價值,是農田作物調查的有效補充手段。與鄧劉洋等[16]、黃啟廳等[21]學者的地塊尺度作物遙感分類相比,本研究不僅實現了水稻、棉花等大宗作物分類識別,更嘗試提取了荷、花生等小宗作物以及裸耕地、撂荒農田等常見地物,是地塊尺度多種地物詳細分類的有益探索,這可為作物種植信息精準普查以及土地利用精細化管理提供參考。
然而,基于高分辨率遙感的作物精細分類具有很強挑戰性。研究依據優選特征構建的RF分類模型總體精度約有80%,但對于花生等小宗作物的分類精度僅為60%左右,究其原因有:一是,作物生長狀態不一導致的“同物異征”干擾了分類精度提高,例如,由于播種時間差異,導致同類作物包含多個生長期特征,整體識別度降低[1];二是,對于部分小宗作物,由于作物間作模式導致地塊內作物種類不一,同一地塊上處在相同生長期內的花生、紅薯、芝麻等存在間作種植,這對地塊尺度的作物精準識別造成了干擾。針對以上問題,下一步努力的方向為:其一,借助無人機影像或激光掃描儀獲取作物三維空間信息(如點云、株高等),并將其作為特征變量參與分類,以提高作物分類精度;其二,對于作物間作模式,可借助于高空間分辨率衛星影像或者無人機影像進行地塊內物種級別的作物制圖,并進一步提取作物間作結構。
研究采用人工矢量化獲取地塊邊界信息,這是在對比eCongnition等軟件自動化地分割影像并提取地物邊界的精度后做出的選擇。通過影像分割試驗發現,使用軟件自帶的多尺度分割算法分割影像,生成的影像對象并不能很好地匹配現實地物,尤其在細碎化種植區,存在影像對象與地塊邊界不吻合、部分對象包含多個地塊的現象,這將對地塊尺度作物精準分類造成干擾,同時,這也是現階段研究采用人工矢量化獲取地塊邊界的原因。未來進一步研究影像分割技術,盡可能保證分割對象與地理實體的一致性,或者發展新的地塊邊界檢測技術[33],將會大大提高地塊尺度作物遙感分類的準確性和自動性。
隨著越來越多的地塊數據作為普查成果實現共享[26],研究所構建的方法體系有望助推地塊尺度作物種植信息大范圍監測的實現。這不僅有助于大區域土地利用精細化管理水平的提高,更有助于精準農業和智慧的農業建設。與此同時,隨著中國高分專項穩步推進,增加了在復雜農區大面積獲取高分辨率衛星數據的能力,這也將有助于所構建方法體系在大區域的推廣應用。但值得說明的是,研究所采用的衛星遙感數據從獲取到傳輸至地面有一定滯后性,這會在一定程度上影響作物種植信息監測的實時性。隨著互聯網、大數據、云計算等相關信息技術發展,將通信、導航和遙感等技術進行集成,開發能在軌實時處理與傳輸的智能化、自動化天基信息網絡,并構建天空地一體化農業遙感信息獲取技術體系,將是快速獲取農田信息的有效手段,是實現實時監測作物種植信息的重要研究方向。
研究以高分辨率WorldView-2影像為數據源,提取地塊級作物光譜、形狀和紋理信息,采用ReliefF-Pearson方法優選作物遙感特征,對比分析人工神經網絡ANN、K最近鄰算法KNN和隨機森林分類算法RF,構建了地塊尺度多種作物同步識別的相對較優特征和方法體系,實現了復雜種植區作物遙感精細分類。主要結論如下:
1)RF算法整體分類效果優于ANN和KNN分類。McNemar’s檢驗顯示,RF與ANN、KNN的分類精度差異性顯著;結合精度評價結果來看,RF算法分類精度最高,總體精度可達79.07%、分別高出ANN和KNN算法2.58%和4.51%。
2)與僅使用光譜特征相比,形狀或紋理特征的添加均能有效改善地塊尺度作物分類精度,總體精度分別提高了3.86%、3.05%。此外,與單獨添加形狀或紋理特征之一相比,同時添加二者可進一步改善作物分類精度,但改善較為有限,總體精度僅分別增加了0.97%、1.78%。因此,實際應用過程中應綜合考慮模型精度和特征變量數目增加帶來的執行效率。
3)研究所構建的方法體系能有效改善復雜種植區地物分類精度,對水稻、棉花、荷等主要作物以及裸旱地、裸水田等常見地物的分類效果較好,其分類精度均達到了80%以上。該方法體系可為復雜種植區作物分布信息的實時獲取提供參考,未來可結合多時相高分辨率無人機影像進一步提升分類精度。
[1]胡瓊,吳文斌,宋茜,等. 農作物種植結構遙感提取研究進展[J]. 中國農業科學,2015,48(10):1900-1914.
Hu Qiong, Wu Wenbin, Song Qian, et al. Recent progresses in research of crop patterns mapping by using remote sensing[J]. Scientia Agricultura Sinica, 2015, 48(10): 1900-1914. (in Chinese with English abstract)
[2]Salmon J M, Friedl M A, Frolking S, et al. Global rain-fed, irrigated, and paddy croplands: A new high resolution map derived from remote sensing, crop inventories and climate data[J]. International Journal of Applied Earth Observation & Geoinformation, 2015, 38: 321-334.
[3]陳仲新,任建強,唐華俊,等. 農業遙感研究應用進展與展望[J]. 遙感學報,2016,20(5):748-767.
Chen Zhongxin, Ren Jianqiang, Tang Huajun, et al. Progress and perspectives on agricultural remote sensing research and applications in China[J]. Journal of Remote Sensing, 2016, 20(5): 748-767. (in Chinese with English abstract)
[4]隋斌,張慶東,張正堯. 論鄉村振興戰略背景下農業工程科技創新[J]. 農業工程學報,2019,35(4):1-10.
Sui Bin, Zhang Qingdong, Zhang Zhengyao. Science and technology innovation in agricultural engineering under background of rural revitalization strategy[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2019, 35(4): 1-10. (in Chinese with English abstract)
[5]劉煥軍,邱政超,孟令華,等. 黑土區田塊尺度遙感精準管理分區[J]. 遙感學報,2017,21(3):470-478.
Liu Huanjun, Qiu Zhengchao, Meng Linghua, et al. Site-specific management zone of field scale based on remote sensing image in a black soil area[J]. Journal of Remote Sensing, 2017, 21(3): 470-478. (in Chinese with English abstract)
[6]劉哲,劉帝佑,朱德海,等. 作物遙感精細識別與自動制圖研究進展與展望[J]. 農業機械學報,2018,49(12):1-12.
Liu Zhe, Liu Diyou, Zhu Dehai, et al. Review on crop type fine identification and automatic mapping using remote sensing[J]. Transactions of the Chinese Society for Agricultural Machinery, 2018, 49(12): 1-12. (in Chinese with English abstract)
[7]Wu M, Huang W, Niu Z, et al. Fine crop mapping by combining high spectral and high spatial resolution remote sensing data in complex heterogeneous areas[J]. Computers and Electronics in Agriculture, 2017, 139: 1-9.
[8]Yu B, Shang S. Multi-year mapping of maize and sunflower in Hetao irrigation district of China with high spatial and temporal resolution vegetation index series[J]. Remote Sensing, 2017, 9(8): 855.
[9]Zheng Y, Wu B, Zhang M, et al. Crop phenology detection using high spatio-temporal resolution data fused from SPOT5 and MODIS products[J]. Sensors, 2016, 16(12): 2099.
[10]Gao F, Anderson M C, Zhang X, et al. Toward mapping crop progress at field scales through fusion of Landsat and MODIS imagery[J]. Remote Sensing of Environment, 2017, 188: 9-25.
[11]Hao P, Zhan Y, Wang L, et al. Feature selection of time series MODIS data for early crop classification using random forest: A case study in Kansas, USA[J]. Remote Sensing, 2015, 7(5): 5347-5369.
[12]王娜,李強子,杜鑫,等. 單變量特征選擇的蘇北地區主要農作物遙感識別[J]. 遙感學報,2017,21(4):519-530.
Wang Na, Li Qiangzi, Du Xin, et al. Identification of main crops based on the univariate feature selection in Subei[J]. Journal of Remote Sensing, 2017, 21(4): 519-530. (in Chinese with English abstract)
[13]Sonobe R, Tani H, Wang X, et al. Parameter tuning in the support vector machine and random forest and their performances in cross-and same-year crop classification using TerraSAR-X[J]. International Journal of Remote Sensing, 2014, 35(23): 7898-7909.
[14]Pelletier C, Valero S, Inglada J, et al. Assessing the robustness of Random Forests to map land cover with high resolution satellite image time series over large areas[J]. Remote Sensing of Environment, 2016, 187: 156-168.
[15]Dong J, Xiao X, Menarguez M A, et al. Mapping paddy rice planting area in northeastern Asia with Landsat 8 images, phenology-based algorithm and Google Earth Engine[J]. Remote Sensing of Environment, 2016, 185: 142-154.
[16]鄧劉洋,沈占鋒,柯映明,等. 基于地塊尺度多時相遙感影像的冬小麥種植面積提取[J]. 農業工程學報,2018,34(21):157-164.
Deng Liuyang, Shen Zhanfeng, Ke Yingming, et al. Winter wheat planting area extraction using multi-temporal remote sensing images based on field parcel [J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(21): 157-164. (in Chinese with English abstract)
[17]田海峰,鄔明權,牛錚,等. 基于Radarsat-2影像的復雜種植結構下旱地作物識別[J]. 農業工程學報,2015,31(23):154-159.
Tian Haifeng, Wu Mingquan, Niu Zheng, et al. Dryland crops recognition under complex planting structure based on Radarsat-2 images[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2015, 31(23): 154-159. (in Chinese with English abstract)
[18]Wang J, Huang J, Zhang K, et al. Rice fields mapping in fragmented area using multi-temporal HJ-1A/B CCD images[J]. Remote Sensing, 2015, 7(4): 3467-3488.
[19]Lebourgeois V, Dupuy S, Vintrou é, et al. A combined random forest and OBIA classification scheme for mapping smallholder agriculture at different nomenclature levels using multisource data (simulated Sentinel-2 time series, VHRS and DEM)[J]. Remote Sensing, 2017, 9(3): 259.
[20]Kussul N, Lemoine G, Gallego F J, et al. Parcel-based crop classification in Ukraine using Landsat-8 data and Sentinel-1A data[J]. IEEE Journal of Selected Topics in Applied Earth Observations & Remote Sensing, 2016, 9(6): 2500-2508.
[21]黃啟廳,覃澤林,曾志康. 多星數據協同的地塊尺度作物分類與面積估算方法研究[J]. 地球信息科學學報,2016,18(5):708-717.
Huang Qiting, Qin Zelin, Zeng Zhikang. Study on the crop classification and planting area estimation at land parcel scale using multi-sources satellite data[J]. Journal of Geo-Information Science, 2016, 18(5): 708-717. (in Chinese with English abstract)
[22]Inglada J, Arias M, Tardy B, et al. Assessment of an operational system for crop type map production using high temporal and spatial resolution satellite optical imagery[J]. Remote Sensing, 2015, 7(9): 12356-12379.
[23]Vaudour E, Noirot-Cosson P E, Membrive O. Early-season mapping of crops and cultural operations using very high spatial resolution Pléiades images[J]. International Journal of Applied Earth Observation and Geoinformation, 2015, 42: 128-141.
[24]王利民,劉佳,楊福剛,等. 基于GF-1衛星遙感的冬小麥面積早期識別[J]. 農業工程學報,2015,31(11):194-201.
Wang Limin, Liu Jia, Yang Fugang, et al. Early recognition of winter wheat area based on GF-1 satellite[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2015, 31(11): 194-201. (in Chinese with English abstract)
[25]劉佳,王利民,滕飛,等. RapidEye衛星紅邊波段對農作物面積提取精度的影響[J]. 農業工程學報,2016,32(13):140-148.
Liu Jia, Wang Limin, Teng Fei, et al. Impact of red-edge waveband of RapidEye satellite on estimation accuracy of crop planting area [J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2016, 32(13): 140-148. (in Chinese with English abstract)
[26]韓衍欣,蒙繼華. 面向地塊的農作物遙感分類研究進展[J]. 國土資源遙感,2019,31(2):1-9.
Han Yanxin, Meng Jihua. A review of per-field crop classification using remote sensing[J]. Remote Sensing for Land and Resources, 2019, 31(2):1-9. (in Chinese with English abstract)
[27]Chellasamy M, Zielinski R T, Greve M H. A multievidence approach for crop discrimination using multitemporal worldview-2 imagery[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2014, 7(8): 3491-3501.
[28]Kononenko I. Estimating attributes: Analysis and extensions of RELIEF[C]//European conference on machine learning. Springer, Berlin, Heidelberg, 1994: 171-182.
[29]肖艷,姜琦剛,王斌,等. 基于ReliefF和PSO混合特征選擇的面向對象土地利用分類[J]. 農業工程學報,2016,32(4):211-216.
Xiao Yan, Jiang Qigang, Wang Bin, et al. Object based land-use classification based on hybrid feature selection method of combining Relief F and PSO[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2016, 32(4): 211-216. (in Chinese with English abstract)
[30]Breiman L. Random forests[J]. Machine Learning, 2001, 45(1): 5-32.
[31]Congalton R G. A review of assessing the accuracy of classifications of remotely sensed data[J]. Remote Sensing of Environment, 1991, 37(1): 35-46.
[32]Foody G M. Classification accuracy comparison: hypothesis tests and the use of confidence intervals in evaluations of difference, equivalence and non-inferiority[J]. Remote Sensing of Environment, 2009, 113(8): 1658-1663.
[33]Debats S R, Luo D, Estes L D, et al. A generalized computer vision approach to mapping crop fields in heterogeneous agricultural landscapes[J]. Remote Sensing of Environment, 2016, 179: 210-221.
Fine crop classification by remote sensing in complex planting areas based on field parcel
Zhang Peng, Hu Shougeng※
(1.,,430074,;2.,430074,)
Timely and accurate information of crop planting structure is of great significance for monitoring agricultural conditions, estimating crop yield, adjusting agricultural structure and formulating food policies. However, currently only little explicit information about spatial crop patterns is known, especially in China where the farmland landscapes are extremely fragmented and heterogeneous. At present, techniques for quantifying crop spatial patterns may be insufficient to map crops in complex planting areas, the plot sizes of which are smaller than the spatial resolution of ready-to-use satellite data. In order to achieve the fine mapping of crops in complex planting areas,this study aimed to explore approaches that simultaneously mapping multiple crops on parcel scales with high spatial resolution images. A 2.9 km×2.6 km complex heterogeneous planting area in the suburb of Wuhan, Hubei Province was selected as the typical study area. Combined with high spatial resolution images, an improved method of fine crop mapping based on geo-parcels was presented. Using the spectral, shape and texture information of images, combined with random forest (RF), artificial neural network (ANN), and K-nearest neighbor (KNN) algorithms, WorldView-2 images were accurately classified through the following steps. First, Worldview-2 images were visually interpreted to obtain the distribution of cropland and non-cropland in this study area, so as to mask out non-cropland information in remote sensing images. Second, the pre-processed WorldView-2 images were segmented by using the land parcel boundary vector data obtained from manual visual interpretation, and32 feature variables of the image object were extracted, including NDVI, area, GLCM-correlation, etc. Third, the ReliefF-Pearson feature dimension reduction method was adopted to remove redundant features with high correlation and weak classification ability. Then, RF classification was performed with optimal features and field sampling data, and the accuracy of the classification results was evaluated.Subsequently, the accuracy of RF classification was compared with that of ANN and KNN to verify the effectiveness of RF algorithm.Finally, four feature combination sets were constructed based on optimal features, and RF classification accuracy was compared under four feature combinations to evaluate the contribution of shape and texture features to crop classification. The results showed that 1) The12 feature variables, such as RVI, NDVI, GLCM-correlation and border length, were the optimal features of parcel-level crop classification based on high spatial resolution images, which can fully characterize image features and reduce data redundancy;2) The RF method had the highest classification accuracy, with an overall accuracy of 79.07%, kappa coefficient of 0.76, and the overall accuracy of KNN and ANN method was above 70%; 3) Compared with the method of only using spectral features, adding shape or texture information could effectively improve the accuracy of crop classification, and the overall accuracy could be improved by 3.86% and 3.05%, respectively;4)Based on the optimal features and RF classification method, the classification accuracy of rice, cotton, lotus, bare upland field and bare paddy field was over 80%, while that of abandoned cropland, peanut and ‘other crops’was only about 60%.This study provides new ideas, methods and technical means for realizing the fine classification of crops by remote sensing in complex planting areas, and can provide references for accurate survey of crop planting information, refined management of rural land use and dynamic monitoring of agricultural industrial structure adjustment.In the future, the image segmentation technology will be further studied to ensure the consistency between segmentation objects and geographical entities as much as possible, and improve the accuracy and automaticity of crop remote sensing classification on parcel scales.
remote sensing; crops; classification; parcel scale; complex planting area; random forest; feature selection; high resolution image
張 鵬,胡守庚. 地塊尺度的復雜種植區作物遙感精細分類[J]. 農業工程學報,2019,35(20):125-134.doi:10.11975/j.issn.1002-6819.2019.20.016 http://www.tcsae.org
Zhang Peng, Hu Shougeng. Fine crop classification by remote sensing in complex planting areas based on field parcel[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2019, 35(20): 125-134. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2019.20.016 http://www.tcsae.org
2019-05-13
2019-08-14
國家社科基金重大項目(18ZDA053);國家自然科學基金項目(41671518);教育部人文社科基金項目(16YJAZH018,14YJCZH192)
張 鵬,博士生,主要從事土地利用時空信息分析與模擬研究。Email:zhangpeng_cug@163.com
胡守庚,博士,教授,博士生導師,主要從事土地利用與城鄉發展研究。Email:husg2009@gmail.com
10.11975/j.issn.1002-6819.2019.20.016
Tp79; S127
A
1002-6819(2019)-20-0125-10