路 穎,劉玉鋒,宋 婷,湯 鶴
(1.滁州學院 地理信息與旅游學院,安徽 滁州 239000;2.東北農業大學 經濟管理學院,哈爾濱 150030)
農作物類型的識別是農業遙感的基礎,如何實時、準確地獲取農作物類型分布信息對糧食安全、社會經濟、政策制定以及生態功能等都有重要的影響[1]。目前,國內遙感影像分類方法包括目視解譯和計算機自動分類兩種,計算機自動分類又分成基于像元分類與基于面向對象分類的方法[2]。
就目前已完成的研究發現,目視解譯法分類效率與精度都較低,且基于像元分類方法在進行農作物分類時會出現分類結果破碎、分類精度較低等問題。近年來,許多學者采用面向對象的分類方法來進行地物識別,雖然此方法在中國起步較晚,但發展速度較快,已廣泛應用到各個領域。面向對象方法是根據影像特征對圖像進行分割,使同質像元組成大小不同的對象,并以其為基本單元,即可考慮影像光譜特征,又可結合形狀、紋理、尺寸等空間特征,制定目標物提取的規則集,實現較高層次的目標地物提取,提取結果可避免斑點噪聲,提高分類精度[3-4]。宋茜等圍繞高分一號遙感數據基于面向對象的方法進行農作物種植結構的研究,總體精度較高[5]。鄭利娟等基于高分一號與高分六號衛星,根據不同分辨率在影像中作物所表現的特征,利用面向對象的方法進行農作物識別,效果顯著[6]。
高分辨遙感影像如GF1-PMS影像紋理特征較為豐富,但覆蓋周期較長,難以反映作物在不同時期內的生長特征;時序中分影像覆蓋周期短,時序特征較為豐富,但分辨率較低。因此,可將中分遙感影像與高分遙感影像相結合,提取兩種影像所包含的特征進行耦合用來參與作物識別。Liu等曾研究通過高時間分辨率與高空間分辨率的結合對作物進行識別,較現有普遍的單一時相作物識別精度提高20%[7]。
本研究采用2018年10月至2019年9月共11景GF1-WFV(16 m)中分辨率影像與2019年3月GF1-PMS(2 m)高分辨率影像作為基礎數據,在分析滁州市全椒縣內水稻、小麥、玉米、油菜4種作物的空間分布特點的基礎上,利用中分影像基于對象分析作物的時序變化特征,構建時序變化曲線;并結合高分影像的紋理、形狀等特征,將兩種影像包含的特征進行有機結合,構建隨機森林分類模型進行面向對象分類,從而獲取研究區農作物類型的分布情況。
本研究選擇安徽省滁州市全椒縣作為研究區,位于31°51′~32°15′N,117°49′~118°25′E之間。研究區地處安徽省東部,屬于丘陵地區,地勢呈東南-西北走向,最高點海拔393 m。屬于亞熱帶季風性氣候,年平均氣溫15.8~16.8 ℃;年平均日照時數達到1 756.4~1 984.4 h;近10 a降水量1 073.7~1 294.1 mm。全縣總面積1 568 km2, 農作物總播種面積889.76 km2。全椒縣作物以水稻和小麥為主,其余為油料、豆類、棉花等作物。研究區如圖1所示。

圖1 研究區所在位置
1.2.1 影像數據
選擇2019年3月的GF1衛星PMS相機的全色影像和2018年10月至2019年9月共計11個覆蓋周期的GF1-WFV 影像,數據的具體參數如表1所示。

表1 遙感數據參數
在ENVI5.3軟件中,對GF1-WFV、GF1-PMS 數據分別進行輻射定標、大氣校正、正射校正。根據中國資源衛星應用中心發布的輻射定標系數進行輻射定標,采用ENVI中的Flassh模塊對影像進行大氣校正,并通過查看典型地物波譜曲線特征來判斷正確性。正射校正選擇15 m空間分辨率的Landsat-8/OLI衛星影像經Google Earth的系統校準形成的基礎影像作為控制底圖,基于RPC修正的有理函數模型,采用小面元微分糾正方法進行幾何配準,控制點采用均勻布設,以每景影像25個左右為宜。
1.2.2 野外采集數據
以手持GPS為采集設備,高分衛星遙感影像作為底圖,隨機采集典型地物樣本,區域包括平原地區、丘陵地區以及低山地區。在全椒縣采集150個冬小麥點、120個水稻點、90個油菜點、75個玉米點、65個其他建筑用地、裸地、水域和林地,共采集樣本約500個,把它們隨機分為訓練樣本和用來檢測分類結果的檢驗樣本。
在采集滁州全椒縣地物樣本外業數據后,又通過查詢農作物生長日志了解作物的生長、分布情況,制作出4種作物的物候周期表,為實驗區作物的精確分類提供支持,如表2所示。

表2 研究區作物生長狀況
1.2.3 其他數據
為了提高作物分類精度,本研究基于第二次全國土地調查的結果數據,從中提取出全椒縣的耕地范圍,以實現在分類的過程中排除其他非耕地的地類干擾作用,如圖2所示。

圖2 全椒縣耕地矢量
本研究結合野外實地觀測數據,計算各個農作物的NDVI值時序曲線并分析其變化特點作為識別研究區作物的物候特征;通過可分性比較分析獲得最佳時相的中分影像,并分析其波段時差特征;基于高分影像進行多尺度分割獲得最優分割尺度,分析其紋理特征,將中分與高分衛星遙感影像數據中所包含的特征信息進行結合,運用面向對象方法提取作物分布信息。總體技術流程如圖3所示。
將高分影像數據載入eCognition后,采用多尺度分割算法。設定其波段權重、分割尺度參數、異質性相關因子的值。在多尺度分割時有兩個原則:一是盡可能設置較大的光譜因子值;二是對于邊界不很光滑但聚集度較高的影像對象使用盡可能大的形狀因子[8]。
此次研究實驗中,在全椒縣研究區選取具有典型代表性的GF1-PMS局部圖,如圖4所示,對尺度因子、形狀因子、緊湊度經過多次試值,最終得出不同尺度分割結果。研究表明,分割尺度以及形狀因子權重設置越大,獲取對象越完整,反之,得到的對象越“破碎”[9]。

圖3 技術流程
當分割尺度為30時,地物被分割得十分密集,使農田和其它地物變得破碎且復雜,出現混合狀態,如圖5所示;當分割尺度為150時,地物的形狀被分割得不夠完善,一些大的地物中包含著中小型地物,地物對象沒有被完全分割開,如圖6所示;當分割尺度為70時,對地物的形狀特征分割得相對適當,總體上能夠完整地體現地物的形態,如圖7所示。因此,此次實驗區選擇如下數值作為多尺度分割參數:尺度因子Scale為70,形狀因子Shape為0.4,緊湊度權重值為0.3。為了更精確地驗證多尺度分割的效果,按照上述試值數據采用面向對象的分類方法進行分類,可以看出分類效果較好,因此,采用此分割尺度數值進行分類可以達到預期的效果,如圖8所示。

圖6 尺度因子Scale 150

圖7 尺度因子Scale 70

圖8 多尺度分割結果檢驗
構建NDVI值不僅能對植被光合作用的輻射吸收情況進行有效地呈現,而且可以體現作物在不同時期的生長情況。利用樣本數據獲取不同作物歸一化植被指數均值并形成歸一化植被指數時序特征曲線,如圖9所示。如此能夠直觀地反映作物在整個生長期內的 NDVI 變化過程。計算公式為
NDVI=(NIR-RED)/(NIR+RED).
(1)

圖9 典型地物 NDVI 時間序列曲線
根據式(1)分別提取11景影像的歸一化差值植被指數(NDVI)。冬小麥和油菜在10月中上旬開始播種出苗,在原先與之相對應的地塊呈現裸地狀態;出苗后進入冬季,因而在2018年12月至2019年3月期間,NDVI值相對穩定;開春之后,小麥、油菜返青,NDVI值上升;進入3月,油菜逐漸開花,光譜開始出現變化,在NDVI 值上表現卻稍微有所下降。
水稻生育周期較短,在4月中下旬開始播種插秧,6月份返青,NDVI值快速增高,7月中旬進入分藥、拔節時期,8月份NDVI值達到最高值,9月份水稻即將成熟,NDVI曲線逐漸下降,水稻一般在10月基本收割結束,NDVI降到一個較低值。
玉米在2019年5月至8月期間,經歷播種、拔節、抽穗等生長過程,植被覆蓋度逐步增加,NDVI 值隨日期變化也逐漸增加;到9月份,隨著玉米成熟收獲,大部分的地塊呈現裸地的狀態,NDVI值降至低點。
各類農作物隨著日期的變化,其NDVI值也在不斷變化,這種變化很大程度上反映了作物在不同時相上光譜特征的差別。因此,可以說NDVI值的變化特征為作物識別提供了途徑和依據。
2.3.2 作物分類的最佳時相分析
多時相遙感影像景數過多會造成數據的冗余,導致處理過程復雜,故遙感影像時相、景數的選取直接影響作物識別的效率和精度[10]。J-M(Jeffries-Matusita)距離通常用于度量兩類別間特征子集的可分性,具有對數據的分布形式要求低、通用性好的特點,其取值在0~2之間,值越大,可分性越好[11]。本研究區內水稻、油菜和玉米3類地物的GF1-WFV時相影像光譜特征區分難度較大,因此,僅選擇3種作物來計算J-M距離,各作物間J-M距離如表3所示。
J-M 距離計算公式為
Jij=2×(1-exp(-Bij)).
(2)

表3 典型地物特征J-M距離時間序列數據
經過計算可知,典型地物特征J-M距離GF1-WFV影像數據的分離度大于1.8以上且數量較多的時相為2019-04-25、2019-05-23、2019-08-02,因此,研究區選用上述3種時相作為農作物識別的基礎。
2.3.3 紋理特征分析
紋理是地物的物理形態所表達出的灰度空間相關特性,紋理特征的核心問題是紋理區域的一致性和相鄰區域邊界的準確性[12]。為分析關于作物的方向、相鄰間隔、變化幅度的綜合信息,計算待分類影像和樣本的灰度共生矩陣,然后根據灰度共生矩陣進行特征值的計算,形成特征矩陣[13-14]。在eCognition中選用熵(ENT)、相關性(COR)和不相似性(DIS)來描述研究區內作物的紋理特征。
1)熵ENT:衡量圖像的無序性,紋理越不均勻,熵值越大,當影像特征為完全隨機性紋理時達到最大值。
2)相關性COR:用來衡量鄰域灰度線性依賴性,相關性越高則紋理一致性程度越高。
3)不相似DIS:用來度量相似性,局部對比度越高值越大。
通過反復實驗,對影像各個波段的3個紋理特征進行計算分析,得出各個波段的紋理特征值,通過對比其差值能夠更直觀地表示出各個作物在紋理特征之間的差異,如表4所示。

表4 各波段的紋理特征值
2.3.4 波段時差特征分析
波段時差特征是指不同時相影像相同波段間的差值[15]。由于小麥和水稻在5月至8月期間影像的波段差值相近,難以進行區分,因此,文中選用2019-05-23和2019-08-02兩種作物分類最佳時相上的小麥和水稻的波段時差,如圖10、圖11所示,兩個時相上的圓形標注和方形標注內的農作物分別是小麥和水稻。
依此計算兩個時相中的小麥和水稻紅、綠、藍、近紅外波段的輻射亮度均值與均值差值,最終得出2019-05-23和2019-08-02時相上小麥和水稻的波段時差特征,如圖12所示。4個波段上小麥和水稻在紅和近紅外兩個波段中的差異較為明顯,由此可以將波段時差特征作為區分小麥和水稻的特征之一。

圖10 2019-05-23與2019-08-02時相的小麥

圖11 2019-05-23與2019-08-02時相的水稻

圖12 不同時相中小麥、水稻波段時差
在GF-1 PMS影像的光譜信息和紋理信息與3種GF-1 WFV時相數據中,對基于對象的反射率的農作物時間變化特征和波段時差特征相結合進行特征選擇。
利用隨機森林分類模型對作物的物候特征、紋理特征、波段時差特征進行組合分類,構建特征集合,并按照順序對特征集合中影響效果最小的特征依次淘汰,以尋求優選特征子集。隨機森林作為機器學習的重要方法擁有廣泛的應用前景。其實質就是利用多種分類器投票決定分類結果,對于一個輸入樣本,N棵樹會有N個分類結果[16]。
根據表5所示,將各種特征依次輸入隨機森林模型中,采取交叉驗證的方式,去除對分類貢獻最低的特征,重復執行并取其中的平均值,計算每次分類結果的精度,最后選擇最高的分類精度所對應的優選特征子集。

表5 特征集情景參數
針對研究區優選特征子集提取農作物種植結構,基于面向對象的方法對高分辨率遙感影像進行農作物類型識別,并利用野外收集的訓練樣本驗證識別的結果。面向對象分類結果混淆矩陣如表6所示。分類識別的總體精度為88.38%,Kappa系數為0.841 5,達到較高的一致性。從用戶精度和制圖精度上來看,玉米分類精度最高,油菜次之,水稻的分類精度最低。分類結果如圖13所示。

表6 面向對象分類結果混淆矩陣

圖13 農作物類型識別結果
由圖13可以看出,全椒縣研究區的水稻種植區域較大,分布在研究區各個范圍內,其中,大部分分布在東南部區域,此處灌溉條件好,地力等級較高;小麥大多分布在中部與西南部地區,范圍較為集中;油菜的種植范圍較小且分散成塊狀;玉米主要分布在中北部地區,與油菜分布相似,比較分散。農作物識別的結果與野外實地調查的情況相符合。使用面向對象的方法不僅可以防止分類結果的“椒鹽效應”、識別不精確等問題,而且能夠提高作物識別的效率,減少錯分、漏分的現象。
經過上述研究,得出以下結論,同時也存在諸多不足:
1)在進行農作物類型識別工作之前,必須先進行野外樣本采集和調查,這是作物分類和檢驗識別精度最重要的一環。采集樣本時應盡量使樣本均勻分布在研究區內,以免影響分類的精度。
2)利用高分辨率衛星遙感影像豐富的紋理特性進行最優化多尺度分割,多時相中分辨率遙感影像制作NDVI時間變化曲線,能夠體現出農作物在不同生長期的特征差異。將高分辨率衛星遙感影像豐富的紋理信息與多時相中分辨率遙感影像農作物不同生長期的特征相互耦合,構建隨機森林模型組建分類規則進行面向對象分類,可以非常清晰地呈現出各個農作物的生長趨勢,從而防止出現單時相數據由于農作物在不同時期的生長狀況不一而導致的分類不精或漏分的現象,很大程度上提高了分類精度,分類的效果較為理想。
3)多尺度分割需要經過多次試值才能達到較好效果,但難以確定最優分割尺度值,存在著一定的主觀判斷。且由于各地區氣候地形等差異影響,此法在一定程度上普適性較低,未來還需要不斷調整改進以期推廣到全國的農業種植區,達到運用遙感技術來促進農業發展的目的。