張 超 喬 敏 劉 哲 劉帝佑 金虹杉 朱德海
(1.中國農業大學信息與電氣工程學院, 北京 100083; 2.國土資源部農用地質量與監控重點實驗室, 北京 100035)
種子產量數據的準確性和時效性直接關系到國家對種植結構、播種面積的宏觀調控,目前農作物種子生產面積通常采用行業統計和抽樣調查兩種方法獲取。這兩種方法各有它們自身的局限性,因此僅僅依靠傳統調查統計的模式已無法滿足管理機構對數據準確性和時效性的要求。遙感技術能夠結合制種作物的種植方式、物候歷特征、生物學特性、背景環境的區域性差異等地學信息,以及光譜特點、紋理結構、空間位置及鄰近關系、時間序列及發展規律等影像信息,客觀、及時地獲取作物種植的面積及空間分布信息。新疆是我國玉米制種重點區域,準確、及時地掌握玉米制種面積,可以為政府加強種子質量監管、保障種子供給安全、控制種子總量與結構平衡等提供強有力的支撐。
國內外已有大量的研究將多時相分析法運用在農作物識別中[1-4],在光譜特征提取中常采用的單一植被指數難以表達作物間多維度的光譜差異,近幾年,國內外研究人員開始將多種植被指數同時運用到植被和作物提取中[5-7],但在現有的制種玉米識別研究中,大多只考慮了單一植被指數[8-9]。
針對光譜信息相近的同種作物,如制種玉米與大田玉米,可利用它們在高分辨率遙感影像上反映出不同紋理信息作為經過光譜特征提取制種玉米種植田識別結果后的輔助信息,實現高精度的制種玉米田識別[8-9]。近年來國內外出現了很多關于紋理特征算法在圖像分類應用中的研究[10-11]。

圖1 研究區域和遙感數據示意圖Fig.1 Map of study area and remote sensing data
由于灰度共生矩陣是基于統計學原理,根據灰度圖像中各個像素間的距離和方向而構成的,本文中的制種玉米條狀紋理信息的方向性突出,因此紋理特征提取之前首先需要考慮影像中紋理的方向性問題。目前國內外研究學者針對紋理灰度共生矩陣在旋轉不變性方面已進行了較多的研究[12-15]。
分類器選擇上,采用決策樹[8-9]設立規則的分類方法,在規則設定閾值過程中人為干擾太大。隨機森林算法是BREIMAN[16]提出的一種基于分類與回歸決策樹(Classification and regression tree,CART)的組合算法,HAM等[17]將隨機森林用于高光譜遙感數據的土地利用類型分類中,并比較隨機森林相對于傳統分類方法存在的優越性;在土地覆被分類研究中,GUO等[18]利用隨機森林對多時相C波段SAR數據進行土地覆被的分類研究,實驗結果表明利用隨機森林對多時相數據進行分析,可以得到準確度較高的分類結果。
本文利用多源遙感數據:高分一號WFV多光譜影像、Landsat8 OLI影像和高分二號PMS全色影像,根據制種玉米與大田玉米田塊間存在的光譜和紋理差異,通過實地調研的作物樣本點,利用隨機森林分類器提取制種玉米田,以期為我國雜交玉米制種監測提供方法支撐。
選取新疆維吾爾自治區伊犁州霍城縣為研究區,如圖1所示?;舫强h是新疆伊犁的直屬縣,地理范圍為東經80°11′~81°24′,北緯43°39′~44°50′,地處伊犁河谷西北部的開闊地帶。縣域地勢東北高西南低,北部山區是天然林區、河流發源地和高山草場,具有沿邊、沿路、沿河、沿山的獨特地緣優勢。霍城縣總面積5 460 km2,土地資源豐富,地屬溫帶半干旱氣候,全年光照充足,冬夏冷熱懸殊,春溫不穩定,秋溫下降快,晝夜溫差大,干旱少雨,為玉米、水稻、棉花、葡萄、小麥、甜菜等主要農作物提供了良好的種植環境,也是伊犁州制種玉米最主要的種植區。
1.2.1衛星數據
考慮到新疆地區作物類型簡單,種植田塊較大,以及制種玉米獨特的物候歷和種植特征,本文選用覆蓋制種玉米生育期(2016年3—9月)多時相國產GF- 1衛星WFV多光譜影像數據,影像空間分辨率16 m,掃描幅寬800 km;由于云層以及衛星軌道設定和天氣等因素的影響,作為補充部分Landsat8衛星搭載的OLI數據,多光譜波段空間分辨率為30 m,成像幅寬為185 km;以及7月下旬砍除父本行后的國產GF- 2全色(PAN)影像數據,影像分辨率1 m,掃描幅寬45 km,衛星影像數據參數如表1所示。

表1 研究區衛星影像數據參數Tab.1 Satellite image data parameters in study area
1.2.2外業調查數據和土地利用分類數據
野外樣本數據為遙感影像分類提供了基本的參考數據,也為本文后面的機器分類提供了學習樣本,根據研究區范圍大小,主要作物分布情況以及實際交通情況,進行適當的隨機樣點布設,共采集162樣點,其中制種玉米106個,大田玉米13個,其他作物包括水稻、棉花、葡萄、小麥、甜菜等主要農作物共43個。其中隨機抽取70%實測樣點作為影像分類器構建的訓練樣本,30%樣點作為對分類結果的驗證樣本。
根據國家對制種玉米規范化的種植和管理,其田塊地理位置短時間內不易發生變動;同時為縮小研究區范圍,避免林地草地等其他利用地類型的干擾,因此利用2014年霍城縣16 m土地利用分類數據作為耕地提取的輔助數據,得到研究區耕地遙感影像數據集,研究區耕地及樣點分布情況如圖2所示。
利用多源遙感數據,構建了多時相光譜特征和高空間分辨率遙感影像LBP- GLCM紋理特征的制種玉米田識別方法體系。首先利用玉米生育期GF- 1 WFV和Landsat8 OLI數據,構建了多時相植被指數體系,利用隨機森林分類器,實現制種玉米田的初步識別結果;接著利用去雄時相的GF- 2 PAN影像,根據LBP- GLCM紋理特征檢測方法,實現制種玉米田的再次識別,具體流程圖如圖3所示。

圖2 霍城縣樣點及耕地分布圖Fig.2 Samples and land distribution in Huocheng County
植被指數(Vegetable index,VI)主要反映植被在可見光、近紅外波段的反射情況與土壤背景之間的差異,根據波段間的組合、運算,在一定條件下可以用來定量說明植被生長狀況的指標[19-21]。本文考慮到作物物候歷、季相差異以及不同植被指數的意義和抗飽和性程度,構建的植被指數體系包括NDVI、EVI、RVI、GNDVI、TVI、DVI、SAVI、NDWI 8個植被指數,彌補了單一植被指數無法全面反映作物光譜特征和過飽和的缺陷。

圖3 制種玉米田識別技術路線圖Fig.3 Technology roadmap for identification of seed maize field
(1)歸一化差值植被指數(Normalized difference vegetation index,NDVI),是應用最為廣泛的植被指數,主要用于檢測植被生物量的多少以及植被的覆蓋度,即
NDVI=(NIR-R)/(NIR+R)
(1)
(2)增強型植被指數(Enhance vegetable index,EVI),有效地反映植被覆蓋量和消除了大氣的影像,與植被覆蓋度相關性較好,不易達到飽和,即
EVI=2.5(NIR-R)/(NIR+6R-7.5B+1)
(2)
(3)比值植被指數(Ratio vegetable index,RVI),綠色植物的靈敏指示參數,與植被覆蓋度、生物量、葉綠素含量相關性高,即
RVI=NIR/R
(3)
(4)綠色歸一化差值植被指數(Green normalized difference vegetation index,GNDVI),利用近紅外和綠波段不同反射程度,對植被葉綠素含量極為敏感,有效表達植被的綠度和覆蓋度,即
GNDVI=(NIR-G)/(NIR+G)
(4)
(5)三角植被指數(Triangle vegetation index,TVI),能夠較好地反映作物葉綠素含量,抗飽和性能較強,即
TVI=60(NIR-G)-100(R-G)
(5)
(6)差值植被指數(Difference vegetation index,DVI),對土壤背景的變化極為敏感,當植被覆蓋度低時效果較好,即
DVI=NIR-R
(6)
(7)土壤調節植被指數(Soil-adjusted vegetation index,SAVI),用于調整土壤亮度,消除土壤反射率,即
SAVI=(1+L)(NIR-R)/(NIR+R+L)
(7)
(8)歸一化差值水指數(Normalized difference water index,NDWI),能夠有效地提取植被冠層的水分含量,即
NDWI=(G-NIR)/(G+NIR)
(8)
式中B——藍色波段反射率
G——綠色波段反射率
R——紅色波段反射率
NIR——近紅外波段反射率
L——土壤調節參數,取0.5

(9)
LBP均勻模式的計算公式為

(10)
式中P——算法作用的圓形鄰域所取的像素個數
R——鄰域半徑
gc——圓形鄰域中心像元的灰度
gp——圍繞gc,以R為半徑的像素點的灰度
隨機森林分類器由多棵Cart樹組成,每棵決策樹之間是沒有關聯的,每一棵Cart樹是由原始訓練樣本集N中有放回的隨機抽取K個訓練樣本,通過一定的分類規則生成,在得到森林之后,當有一個新數據輸入時,森林中的每一棵Cart樹分別對其應該屬于哪一類別進行投票,統計得票數最高的類型作為新數據的類別。在建立每一顆決策樹的過程中,最為重要的兩個環節分別是采樣與分裂規則判斷,其中主要通過基尼指數和信息增益兩個參考指數進行分類純度度量,一般選擇具有最小基尼分裂指數的屬性值作為分裂屬性值、選擇具有最大信息增益的屬性作為分裂屬性。

圖4 多時相植被指數體系時序曲線Fig.4 Time series curves of multi-temporal vegetation index system
采用多景遙感數據,由于影像成像過程中的輻射失真和幾何畸變,所以每景影像都需要進行輻射校正、大氣校正和正射校正等預處理操作;另外,由于不同傳感器不同時間獲取的遙感影像具有一定的位置偏差,地理位置不能完全準確契合,因此,需要進行影像配準;其次,為了建立遙感影像時序數據集,便于采集相同地理位置不同時相的光譜反射值,需要對多時相影像進行圖層疊加處理,合成時序影像數據集;此外與耕地數據套合,提取出主要作物研究區。
對于某一植被指數時序曲線的構建,主要利用ENVI spectrum library工具提取實測樣本對應的多時相植被指數,根據作物物候歷和同一作物類型曲線聚集點和走勢,判斷并刪除異常樣本,并以時相為橫坐標,植被指數值為縱坐標,得到多時相植被指數時序曲線,重復以上步驟,得到8種植被指數的時序曲線,如圖4所示。
以制種玉米為監測目標,只對制種玉米田的分類結果進行精度評價,大田玉米、甜菜、小麥、葡萄、水稻、棉花被歸為其他作物。精度評價利用ENVI confusion matrix工具,錯分率、精度和Kappa系數等都是從混淆矩陣中得到的實際值,如表2所示。
利用隨機森林進行分類,需要設置Cart樹的數量,本文選擇3—9月玉米全生育期內植被指數影像集進行Cart樹數量參數測試,分別在10~200區間內梯度增加(10、30、50、70、100、120、150、170、200)。結果顯示,隨著Cart樹數量的增加,制圖精度相對穩定,用戶精度和總體精度逐漸提高,在Cart樹為150時趨于穩定,如表2所示。故本文選擇Cart樹為150作為后期實驗中隨機森林分類器的決策樹個數,進行制種玉米田的識別。
將野外調查的研究區樣本點,隨機抽取70%作為影像分類器構建的訓練樣本,放入隨機森林分類器進行學習,得到研究區制種玉米田的光譜分類結果,如圖5所示。

表2 不同Cart樹數量的分類精度評價Tab.2 Evaluation of classification accuracy useddifferent Cart tree numbers

圖5 “光譜”分析制種玉米田分類結果Fig.5 Spectral analysis classification results of seed maize field
由于多時相多指數光譜分析后的制種玉米種植田存在一些被錯分為制種玉米田的其他作物類型,因此本文采用制種玉米抽穗期間的高分辨率遙感影像上的紋理信息作為輔助特征,以刪除被誤分的作物來提高識別精度。
利用LBP- GLCM方法進行影像紋理分析,對比未經LBP旋轉不變處理和計算LBP旋轉不變量后在0°、45°、90°、135°方向上GLCM的均值、對比度、熵3個紋理特征量,發現原始影像在不同方向上的GLCM同一紋理特征量相差較大,無法作為分類特征;而經過旋轉不變性的LBP轉換后的影像,分別計算不同方向上的GLCM 3個紋理特征量,同一特征量在不同方向上的量化值差異相對較小,可以作為反映其紋理結構的分類特征,如圖6所示。

圖6 4個方向上的GLCM與LBP- GLCM紋理特征值Fig.6 Texture features of GLCM and LBP- GLCM in four directions
由圖6可知,經過LBP- GLCM處理得到的紋理特征量基本消除了方向變量的影響,0°、45°、90°和135°這4個紋理方向上的紋理特征均可以作為本次實驗中的作物分類特征,同時由于研究區制種玉米種植田紋理結構統一,在構建GLCM中的步長距離固定,因此本文對LBP變換后的影像以0°方向、1個像素距離生成GLCM,計算均值、對比度、熵3個特征量分別表征紋理的不同結構特征,并將3個特征影像合成具有3個波段的紋理特征影像集,作為后續分類的影像基礎。
把覆蓋圖5制種玉米田分布區域的高分二號亞米級空間分辨率的遙感影像放入已通過紋理特征量訓練的隨機森林分類器中,通過隨機森林Cart樹的投票判斷,進一步識別制種玉米種植田塊,最終結果如圖7所示。

圖7 “光譜+紋理”分析制種玉米田分類結果Fig.7 Spectral and texture analysis classification results of seed maize field
通過比較3—9月多時相遙感數據集僅利用光譜分析(簡稱“光譜”)和利用光譜結合高分二號全色影像紋理分析(簡稱“光譜+紋理”)進行制種玉米田識別的兩種方法,如表3所示,由表3可得:①根據有限的精度驗證樣本得出的精度評價結果顯示,兩種方法識別出制種玉米種植田的總體精度和Kappa系數幾乎相等,“光譜+紋理”的識別方法略高于“光譜”的識別方法。②其中,“光譜+紋理”得到的制種玉米田識別結果錯分率趨于0,明顯低于“光譜”得到的識別結果,其漏分率近似且略高于“光譜”識別結果,為了滿足實際應用中制種玉米識別“宜漏不宜錯”的原則,兩種方法具有近似漏分率的前提下,錯分率更低的“光譜+紋理”的遙感識別方法準確性明顯更高。③“光譜+紋理”是在“光譜”基礎上對識別結果的進一步提煉,通過圖5、7中兩種方法得到的分布情況,“光譜+紋理”刪除了僅依靠“光譜”中其他作物誤分的種植田塊,同時減少了一定的椒鹽點,可以刪除部分面積小且分散的種植田,識別出的制種玉米田更為連片集中。但是由于部分制種玉米田塊種植制度或影像質量等原因,紋理結構較為模糊,因此部分制種玉米田產生了被漏分的情況。

表3 “光譜”和“光譜+紋理”精度評價Tab.3 Accuracy evaluation between “spectrum” and “spectrum and texture” classification ways
(1)依據研究區作物類型與種植制度差異,從生物量、土壤背景反射率、冠層含水量3個角度選擇了8個植被指數:EVI、NDVI、TVI、GNDVI、RVI、SAVI、DVI、NDWI,通過多個植被指數反映作物光譜特征,有效防止了單一植被指數的易飽和性,增加了不同作物分類屬性特征,更易識別出作物類型。最終以全生育期3—9月的多時相光譜分析作物總體分類精度達到90.57%,制種玉米田分類用戶精度為95.98%,制圖精度87.02%。
(2)對亞米級空間分辨率的高分二號全色影像計算LBP旋轉不變量,有效減弱了相同紋理結構的作物田GLCM方向變量的影響,在實際應用中則可選擇固定的方向參數進行紋理特征提取。最終由隨機森林對均值、對比度、熵特征集影像分類,得到的作物分類總體精度為91.51%,制種玉米田分類結果用戶精度為99.20%,制圖精度為86.68%。由于水稻、棉花等其他幾種作物之間的混淆,使得分類結果總體精度并未顯著提高,但是經過紋理特征提取進一步分類后得到的制種玉米種植田識別結果錯分率為0.4%,更能夠保證制種玉米田識別的準確性。
1 YOUNG S S, WANG C Y. Land-cover changes analysis of China using global-scale Pathfinder AVHRR Landcover (PAL) data [J]. International Journal of Remote Sensing, 2001, 22(2): 1457-1477.
2 馬麗, 徐新剛, 賈建華, 等. 利用多時相TM影像進行作物分類方法[J]. 農業工程學報, 2008, 24(增刊2): 191-195.
MA Li, XU Xin’gang, JIA Jianhua, et al. Crop classification method using multi-temporal TM images [J]. Transactions of the CSAE, 2008, 24(Supp.2): 191-195. (in Chinese)
3 劉佳, 王利民, 楊福剛, 等. 基于HJ時間序列數據的農作物種植面積估算[J]. 農業工程學報, 2015, 31(3): 199-206.
LIU Jia, WANG Limin, YANG Fugang, et al. Remote sensing estimation of crop planting area based on HJ time-series images[J]. Transactions of the CSAE, 2015, 31(3): 199-206. (in Chinese)
4 黃健熙, 牛文豪, 馬鴻元, 等. 基于時間序列HJ- 1 A/B衛星數據的冬小麥成熟期預測[J/OL]. 農業機械學報, 2016, 47(11): 278-284. http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx? file_no=20161138&flag=1. DOI: 10.6041 /j.issn. 1000-1298. 2016.11.038.
HUANG Jianxi, NIU Wenhao, MA Hongyuan, et al. Prediction of maturity data for winter wheat based on time series of HJ- 1 A/B CCD images [J/OL]. Transactions of the Chinese Society for Agricultural Machinery, 2016, 47(11): 278-284. (in Chinese)
5 PENA-BARRAGAN J M, NGUGI M K, PIANT R E, et al. Object-based crop identification using multiple vegetation indices, textural features and crop phenology [J]. Remote Sensing of Environment, 2011, 115(6): 1301-1316.
6 李映雪, 朱艷, 戴廷波,等. 小麥葉面積指數與冠層反射光譜的定量關系[J]. 應用生態學報, 2006, 17(8): 1443-1447.
LI Yingxue, ZHU Yan, DAI Tingbo, et al. Quantitative relationship between leaf area index and canopy reflection spectra of wheat [J]. Chinese Journal of Applied Ecology, 2006, 17(8): 1443-1447. (in Chinese)
7 蘇岫, 耿杰, 馬曉瑞, 等. 基于多種植被指數信息與聯合稀疏表示的紅樹林種類識別[J]. 海洋環境科學, 2017, 36(1): 114-120.
SU Xiu, GENG Jie, MA Xiaorui, et al, Mangrove species classification based on multiple vegetation index extraction and joint sparse representation[J]. Marine Environmental Science, 2017, 36(1): 114-120. (in Chinese)
8 劉哲, 李智曉, 張延寬, 等. 基于時序EVI決策樹分類與高分紋理的制種玉米識別[J/OL]. 農業機械學報, 2015, 46(10): 321-327. http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx? file_no=20151043&flag=1. DOI: 10.6041 /j. issn.1000-1298.2015.10.043.
LIU Zhe, LI Zhixiao, ZHANG Yankuan, et al. Seed maize identification based on time-series EVI decision tree classification and high resolution remote sensing texture analysis [J/OL]. Transactions of the Chinese Society for Agricultural Machinery, 2015, 46(10): 321-327. (in Chinese)
9 張超, 金虹杉, 劉哲, 等. 基于GF遙感數據紋理分析識別制種玉米[J]. 農業工程學報, 2016, 32(21): 183-188.
ZHANG Chao, JIN Hongshan, LIU Zhe, et al. Seed maize identification based on texture analysis of GF remote sensing data [J]. Transactions of the CSAE, 2016, 32(21): 183-188. (in Chinese)
10 白雪冰, 王克奇, 王輝. 基于灰度共生矩陣的木材紋理分類方法的研究[J]. 哈爾濱工業大學學報, 2005, 37(12): 1667-1670.
BAI Xuebing, WANG Keqi, WANG Hui. Research on the classification of wood texture based on gray level co-occurrence matrix [J]. Transactions of Journal of Harbin Institute of Technology, 2005, 37(12): 1667-1670. (in Chinese)
11 ZHANG Gong, JAYAS D S, JIANG Deyun, et al. Grain classification with combined texture model [J]. Transactions of the CSAE, 2001, 17(1): 149-153.
12 商立群 ,杜亞娟. Hu矩和Zernike矩在圖象識別中的應用[J]. 西安科技學院學報, 2000, 20(1): 53-56.
SHANG Liqun, DU Yajuan. On application of Hu moments and Zernike moments in images identification [J]. Journal of Xi’an University of Science & Technology, 2000, 20(1): 53-56. (in Chinese)
13 OJALA T, PIETIKAINEN M, MAENPAA T. Multiresolution gray-scale and rotation invariant texture classification with local binary patterns [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002, 24(7): 971-987.
14 楊龍飛. 基于局部二值模式和灰度共生矩陣的紋理特征提取技術研究[D]. 蘭州:蘭州大學, 2016.
YANG Longfei. The study on texture feature extraction method based on LBP and GLCM [D]. Lanzhou: Lanzhou University, 2016. (in Chinese)
15 王國德, 張培林, 任國全, 等. 融合LBP與GLCM的紋理特征提取方法[J]. 計算機工程, 2012, 38(11): 199-201.
WANG Guode, ZHANG Peilin, REN Guoquan, et al. Texture feature extraction method fused with LBP and GLCM [J]. Computer Engineering, 2012, 38(11): 199-201. (in Chinese)
16 BREIMA L. Random forests[J]. Machine Learning, 2001, 45(1): 5-32.
17 HAM J, CHEN Y C, GRAWFORD M M, et al. Investigation of the random forest framework for classification of hyperspectral data[J]. IEEE Transactions on Geoscience and Remote Sensing, 2005, 43(3): 492-501.
18 GUO L, CHEHATA N, MALLET C, et al. Relevance of airborne lidar and multispectral image data for urban scene classification using random forests[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2011, 66(1): 56-66.
19 姜海玲, 楊杭, 陳小平, 等. 利用光譜指數反演植被葉綠素含量的精度及穩定性研究[J]. 光譜學與光譜分析, 2015, 35(4): 975-981.
JIANG Hailing, YANG Hang, CHEN Xiaoping, et al. Research on accuracy and stability of inversing vegetation chlorophyll content by spectral index method [J]. Spectroscopy and Spectral Analysis, 2015, 35(4): 975-981. (in Chinese)
20 王玉. 基于時序光譜庫的棉花種植面積信息提取研究[D]. 北京:中國地質大學(北京), 2013.
WANG Yu. Research on cotton planting areas extraction based on MODIS- EVI time-series data base[D]. Beijing: China University of Geosciences(Beijing), 2013.(in Chinese)
21 張喜旺, 秦耀辰, 秦奮. 綜合季相節律和特征光譜的冬小麥種植面積遙感估算[J]. 農業工程學報, 2013, 29(8): 154-163.
ZHANG Xiwang, QIN Yaochen, QIN Fen. Remote sensing estimation of planting area for winter wheat by integrating seasonal rhythms and spectral characteristics[J]. Transactions of the CSAE, 2013, 29(8): 154-163. (in Chinese)