解文歡,張有智,吳 黎,張海峰,張 宇,張效霏
(黑龍江省農業科學院 農業遙感與信息研究所,150086,黑龍江哈爾濱)
高分衛星數據是國家的戰略資源,其應用已深入到國家經濟和社會發展、生態建設、民生保障、國家安全等方面。在農業農村領域,高分衛星數據得到了廣泛應用,通過有效監測農業生產情況,科學預測作物長勢、面積、產量等情況,對農業生產災害能做到快速反應和評估,為客觀掌握宏觀農業生產形勢、制定和實施精準的政策措施等提供了高效的技術手段。
趙璐等以館陶縣為研究區,基于國產高分二號衛星影像數據,采用面向對象的最近鄰方法提取研究區農業大棚信息,提取精度為95.65%[1]。張彥等利用GF-6 WFV數據構建溫度植被干旱指數,最大相關系數為0.85,花生干旱等級監測總體準確率為91.98%[2]。郭燕等利用高分一號衛星數據,結合Landsat-8 和RapidEye 數據,對比支持向量機法和光譜角法提取鄢陵縣玉米面積,支持向量機法的分類精度優于光譜角法的分類精度[3]。葛皓使用國產高分一號衛星WFV 影像提取了江蘇省鹽城市東臺市條子泥條北水稻墾區的紅、綠、藍及近紅外波段的反射率,比較了22 個常用植被指數診斷大田水稻氮素營養水平的能力與估產的能力[4]。王婷等基于GF-1 WFV 衛星遙感數據,應用歸一化植被指數,對盤錦2020 年水稻長勢進行多時相動態遙感監測,結果顯示:2020 年盤錦水稻長勢前期較好,中期變差,后期恢復[5]。
GF-6 衛星具有高分辨率、寬覆蓋、多波段、高質量和高效率成像等特點,為作物識別提供更豐富的信息。GF-6 衛星遙感數據的使用,擴大了遙感監測范圍,提高了遙感監測頻率,提升了遙感識別精度,降低了農業資源調查成本。由于GF-6 衛星可獲取紅邊波段,打破了RapidEye 衛星對于紅邊波段遙感影像的壟斷,在農作物面積監測中將替代50%的國外衛星數據(Landsat8_OLI),提高了國產衛星影像應用能力。GF-6 衛星的發射成功標志著我國農業遙感的研究工作開啟了以GF-6 衛星數據為主要數據源的新局面。本文以拜泉縣為研究區域,基于GF-6 WFV 遙感數據,采用隨機森林算法對研究區的玉米、大豆和水稻進行分類,通過實地采集GPS 地面驗證點進行分類精度評價,探究采用隨機森林算法對GF-6 WFV 影像提取農作物種植結構精度,為農作物面積和種植結構提取提供數據參考。
拜泉縣位于黑龍江省中西部地區,地處小興安嶺余脈與松嫩平原過渡地帶,東經125.5°~126.5°,北緯47.3°~47.9°,面積為3 599 km2,地勢呈東高西低、南高北低,由東向西逐漸平緩,地理位置如圖1 所示。地形漫川漫崗,丘陵起伏,溝谷切割強烈。研究區屬于溫帶大陸性氣候區,年均氣溫在1.2 ℃,無霜期為122 d,年平均降水量為490 mm,降水多集中在夏季。研究區的土壤類型主要為黑土、黑鈣土和草甸土,土質肥沃,有利于農作物生長,主要農作物類型為玉米和大豆,其他為馬鈴薯、中草藥和蕓豆等。

圖1 拜泉縣地理位置示意圖
1.2.1 遙感數據及預處理
本研究選用2020 年8 月26 日的GF-6 WFV 數據為數據源。GF-6 WFV 衛星2018 年6 月2 日發射成功,具有窄幅(PMS)和寬幅(WFV)2 種不同空間分辨率,GF-6 WFV 數據分辨率為16 m,衛星波段信息包括藍(0.45~0.52 μm)、綠(0.52~0.59 μm)、紅(0.63~0.69 μm)、近紅外(0.77~0.89 μm)、紅邊1(0.69~0.73 μm)、紅邊2(0.73~0.77 μm)、紫邊(0.40~0.45 μm)、黃邊(0.59~0.63 μm)8 個波段[6]。GF-6 WFV 衛星與GF-1 衛星組網運行,GF-6 WFV 影像與GF-1 WFV影像預處理流程相似,在ENVI5.3 中對獲取的GF-6 WFV 衛星數據進行輻射定標、大氣校正和幾何精校正等預處理工作[7]。
1.2.2 解譯標志點和驗證點獲取
2020 年7 月5—7 日進行野外調查,使用手持GPS 野外實地采集解譯標志點200 個和驗證點120個,涉及玉米、水稻、大豆和蔬菜等同一時期農作物。
1.3.1 農作物生長發育時期
農作物類型判讀的最佳時相要選擇農作物生長茂盛、影像反映明顯的時期。根據研究區內各農作物的生長發育時間(如表1 所示),確定各類農作物的最佳識別期,對影像進行判讀。因此選擇8 月26 日農作物處于生長旺盛期(玉米的乳熟期、大豆的結莢期、水稻的抽穗期)的影像進行農作物識別,如圖2 所示。

表1 拜泉縣主要作物的發育期

圖2 8 月26 日GF-6 WFV 衛星影像圖
1.3.2 分類方法
采用單模型分類方法的模型往往精度不高,容易出現過擬合問題,隨機森林算法是為了解決單個決策樹模型過擬合問題而提出的算法。隨機森林算法由BREIMAN L[8]提出,他通過bootstrap 重抽樣技術,從原始訓練樣本集N 中有放回地重復隨機抽取k 個樣本生成新的訓練樣本集合,然后對每個bootstrap 樣本進行決策樹建模,把分類樹組合成隨機森林,在變量(列)的使用和數據(行)的使用上進行隨機化,生成很多分類樹,然后組合成多棵決策樹進行預測,再匯總分類樹的結果。
(1)每棵決策樹由樣本量為K 的訓練樣本X 和隨機向量θk生成。
(2)隨機向量序列{θk,k=1,2,…,K}獨立同分布。
(3)隨機森林即所有決策樹的集合{h (X,θk),k=1,2,…,K }
(4)每個決策樹模型h(X,θk)都有一票投票權來選擇輸入變量x 的分類結果。
式中:H(x)表示隨機森林分類結果;hi(x)是單個決策樹分類結果;Y 表示分類目標;I(.)為示性函數。RF分類模型使用簡單的投票策略來完成最終的分類。
隨機森林算法的優點是:具有極高的準確率;隨機性的引入,使得隨機森林不容易過擬合,有很好的抗噪聲能力;能處理很高維度的數據,并且不用做特征選擇;既能處理離散型數據,又能處理連續型數據,數據集無需規范化;訓練速度快,可以得到變量重要性排序,容易實現并行化。隨機森林算法在運算量沒有顯著提高的前提下提高了預測精度。
在ENVI5.3 軟件中,基于GF-6 WFV 遙感數據,利用GPS 采集的解譯標志點建立訓練樣本,在隨機森林樹設為100 的情況下進行隨機森林分類,提取大豆、水稻和玉米的種植結構并計算面積(如圖3 所示)。分類結果數據與GPS 采集的120 個地面驗證點進行精度驗證,kappa 系數為0.893 72,總分類精度達92.5%。2020 年拜泉縣種植水稻0.796 萬hm2,玉米7.839 萬hm2,大豆17.122 萬hm2。

圖3 2020 年基于GF-6WFV 影像的拜泉縣主要農作物種植結構圖
本文基于GF-6 WFV 遙感數據利用隨機森林算法對拜泉縣主要農作物玉米、大豆和水稻種植結構進行提取研究。采用隨機森林算法,隨機森林樹為100 的情況下進行分類,總體分類精度達到了92.5%。采用隨機森林算法對GF-6 WFV 衛星數據進行識別分類,能夠準確提取農作物空間分布,實現對農作物種植范圍的更新與變化范圍的監測,能夠極大降低人工目視解譯的工作量,提高更新效率。研究過程中也存在一些問題,本研究僅從光譜特征角度進行了分類,后續研究中可以根據不同波段和紋理特征的結合,分析對農作物識別精度的影響,將波段和紋理特征結合,以提高對農作物的識別精度。GF-6 WFV 衛星數據已成為農業遙感業務運行系統的主要數據源之一,在農業生產和管理中得到了規模化應用,為各農業部門提供了科學客觀的信息支持。