張東東,周刊社,戴 睿,袁 雷,王佳銳,邊 多
(1西藏自治區氣候中心,拉薩 850000;2農業農村部規劃設計研究院,北京 100125)
玉米是中國重要的糧食作物,快速、有效地提取玉米相關生長參數對于中國玉米產業發展具有重要的意義。植被覆蓋度(Fractional vegetation cover,FVC)是控制植被蒸騰作用、光合作用和其他陸地生物物理過程的一個重要變量[1],通常定義為植被葉、莖、枝在單位面積內的垂直投影面積所占的百分比[2-3]。植被覆蓋度可作為作物生長模型一個輸入參數,常用于作物地上生物量、植被蒸散發及營養狀況的估算,同時也反映了植被進行光合作用的面積及植被生長的茂盛程度,可以在一定程度上反映植被長勢狀況[4-6]。因此快速、準確的估算玉米覆蓋度對于指導精細化大田管理及研究農田生態系統具有重要的意義。
關于植被覆蓋度的測量或估算,有關學者已經開展了大量的研究。目前,估算植被覆蓋度比較常用的方法有地面實測法、遙感估算方法[3,6-7]。地面實測方法優點是需要實地進行觀測、測量,估算的精度相對較高,缺點是這種估算方法往往費時、費力,或對觀測對象進行破壞性采樣,或受觀測人員的主觀性影響大。常用的地面觀測方法主要有目估法、采樣法、儀器法、統計模型法[8],地面測量方法常常作為遙感等現代測量方法的輔助及相關模型的驗證。隨著衛星遙感技術的產生與發展,使植被大面積、實時、動態監測成為了可能[9-11],通過遙感方法提取植被覆蓋度也存在許多局限,如影像受天氣條件影響大[12-13],空間分辨率不高,往往不能滿足精細化農業的需求。
隨著計算機技術、圖像處理技術的發展,基于圖像信息提取技術獲取植被覆蓋度的方法被越來越多的學者采用[14]。數碼攝影獲取的照片中包含了植被覆蓋和生長條件信息,機器視覺技術逐漸應用于數字圖像分析,以分離綠色植被和土壤背景。早期為了利用圖像將作物從背景中分離出來,前人提出了許多顏色指數,這種方法主要是利用不同觀測對象的顏色特征差異,根據顏色指數制定閾值,從而達到圖像分割的目的[15-17]。目前應用比較廣泛的顏色指數有歸一化指數(NDI)、超綠算子(ExG)、超紅算子(ExR)、超綠減超紅(ExG-ExR)、Vegetative(VEG)、作物提取顏色算子(CIVE)、綠 減 紅(G-B)、紅 減 綠(R-G)、(G-B)/|R-G|等[18-21]。賈建華等[22]通過分析青藏高原地表垂直照片的顏色特征,利用超綠算法實現了綠色植被與背景的分離。相對于國外研究而言,國內關于這方面的研究較晚,章文波等[23]利用照相法獲取了小區植被的覆蓋度,并與目估法進行了對比,結果表明照相法得出的結果更加客觀、最大絕對誤差也相對較小。
上述學者所提出的方法雖然取得了不錯的效果,但是在處理過程中,難免需要人工參與(如設置各種紋理參數、監督分類、圖像分割閾值制定),針對實時拍攝農田實景圖像的處理仍存在一些問題。本研究利用玉米田間實景圖像,結合玉米覆蓋度參考值,建立了以顏色指數為變量的覆蓋度估算模型,旨在提出一種快速、高效的玉米覆蓋度估算方法,以期為農田小氣候實景圖像在監測作物覆蓋度方向的定量應用提供依據。
本文研究的觀測地點位于山東省泰安市,地理坐標為36°6.6′N,117°4.8′E。自動實景觀測站位于觀測玉米田塊的中央,玉米圖像由江蘇省無線電科學研究所自主研發的圖像采集裝置獲取,該裝置集成在農業氣象自動觀測站中。自動觀測站功能涵蓋農田小氣候,包括大氣層、土壤層和作物層中各種要素的測量,具有災害自動識別,如霜凍、冷害、高溫、干旱等自然災害預警功能,可為現代化農業的生產管理決策提供基礎數據。圖像采集裝置主要由數碼相機(或CCD攝像機)、與采集分配器相連的無線路由器、遠程計算機三部分構成,示意圖如圖1。數碼相機拍攝或CCD攝像機拍攝作物的圖像,然后圖像數據傳輸到采集分配器,最后通過無線發射器利用3G網絡發送到遠程計算機。

圖1 圖像采集裝置示意圖
研究中使用的圖像采集時間為2013年6月19日—9月27日,覆蓋當年玉米整個生長季。圖像由OlympusE450整點拍攝獲取,拍攝時間為9:00、10:00和16:00。所有的數字照片均以24位真彩色格式存儲,圖像分辨率為3648×2736。由于系統故障和斷電,所獲取的圖像可能存在缺失,最終獲取到玉米正下視圖圖像166張,其中9:00拍攝的圖像43張,10:00拍攝的圖像74張,16:00拍攝的圖像49張。
研究用到的覆蓋度的參考值是通過計算圖像中所有作物像素數與圖像所有像素數量的比值得到。首先要對獲取的圖像數據進行分割,根據Hamuda等[24]研究表明,太陽高度角、土壤背景、天氣條件(多云、強光)對圖像分割精度都會產生影響。因此,本研究利用Ye等[25]2015年提出的PFMRF對玉米圖像進行分割。Ye等的研究表明PFMRF分割算法即基于馬爾科夫隨機場的超像素分割算法,該方法可以抵抗強烈的光照對圖像分割的影響,并且還可從陰影中正確的分離出作物。用PFMRF法對原始圖像分割,分割圖像上會帶有一部分非玉米植株的連通域,這些非玉米連通域大多是一些小斑塊,主要是由圖像的噪聲引起。為了提高分割的精度,需要對分割后的圖像進行小面積噪聲去除。經過實驗分析,將連通域面積小于60像素的區域刪除。然后計算去噪后圖像中所有作物像素數與圖像所有像素數量的比值,得到作物的覆蓋度。利用PFMRF法對玉米圖像進行分割及閾值法對分割圖像去噪結果如圖2。


圖2 PFMRF法對玉米圖像進行分割及閾值法對分割圖像去噪結果
國內外學者提出了多種顏色指數,這些顏色指數大多被用來分離綠色植被與背景。表1列舉了比較常用的9種顏色指數。利用Matlab進行編程,計算每天9:00、10:00、16:00拍攝圖像的9種顏色指數。為了研究一天之中太陽高度角的變化對計算結果的影響,將每種顏色指數按照圖像獲取時間分為4組(如表2所示)。

表1 本研究使用的顏色指數

表2 基于圖像獲取時間的顏色指數分組
1.5.1 擬合模型 本研究玉米覆蓋度估算模型是基于圖像顏色指數建立的,研究中使用5種擬合模型(線性函數模型、對數函數模型、一元二次函數模型、指數函數模型、冪函數模型)對數據進行擬合。
1.5.2 精度評價 采用決定系數(R2),均方根誤差(RMSE)和平均絕對誤差(MAE)3個指標對模型的精度進行評價。決定系數R2是對玉米覆蓋度與顏色指數進行相關分析時用到的參考指標,一般的R2用來解釋回歸模型中自變量的變異在因變量的變異中占的比率,是評價模型擬合優度的指標[8]。
平均絕對誤差(MAE)計算公式如(1)所示。

其中yi是實測值,i是模型預測值,n是樣本的數量。
均方根誤差(RMSE)用來檢驗模型的預測精度,RMSE的計算公式如(2)所示。

其中yi、i與n的含義與MAE相同。
由于玉米在不同發育期的覆蓋度會發生變化,因此其圖像的顏色指數也會發生相應變化。為了研究玉米圖像的顏色指數對玉米覆蓋度的變化的響應,利用SPSS軟件對2種變量進行了相關性分析,并進行顯著性檢驗。表3為不同時間分組情況下,玉米覆蓋度和顏色指數之間的相關系數。可以看出,玉米覆蓋度與顏色指數ExR、R-G、CIVE呈極顯著負相關,與G-B/|RG|相關不顯著,與顏色指數G-B、ExG-ExR、ExG、NDI、VEG呈極顯著正相關。除了顏色指數G-B/|R-G|外,玉米覆蓋度與其他8種顏色指數的相關系數(r)均大于0.88且通過了0.01極顯著性檢驗水平。由此可以得出,隨著玉米的生長發育,其覆蓋度會發生變化,相應的顏色指數也會隨之變化,且顏色指數與覆蓋度的相關性較好,因此可以用圖像的顏色指數來估算玉米的覆蓋度。

表3 玉米覆蓋度與顏色指數的相關性
在所有數據中選擇與玉米覆蓋度相關系數(r)達到0.01極顯著性檢驗水平且大于0.88的顏色指數來構建玉米覆蓋度估算模型,即選擇ExR、R-G、CIVE、GB、ExG-ExR、ExG、NDI、VEG 8種顏色指數建模。為了使構建的玉米覆蓋度估算模型更加可靠,把每個時間分組的數據按照等間距抽樣方法分為兩組:一組作為訓練樣本,用于覆蓋度估算模型的構建,另外一組作為驗證樣本,對構建的模型進行精度評價。
利用選出的8種顏色指數與計算的覆蓋度進行線性與非線性擬合,每種顏色指數選擇一種最佳的擬合方式,并用相應的驗證樣本對其精度進行評價。基于以上8種顏色指數的玉米覆蓋度估算模型及其精度驗證結果如表4。從表中可以看出,除了以顏色指數VEG為變量所構建的玉米覆蓋度估算模型以一元二次模型最優外,以其他7種顏色指數為變量構建的玉米覆蓋度估算模型都是以線性模型最優。其中,分別以顏色指數 ExR、R-G、CIVE、ExG-ExR、ExG、NDI、VEG為變量在不同時間分組內所構建的玉米覆蓋度的最佳擬合方程的決定系數R2均大于0.9,在0.9158~0.9893之間,RMSE、MAE均小于0.1,分別在0.0270~0.0984之間和0.0223~0.0876之間。以G-B為變量的玉米覆蓋度估算模型的決定系數R2均小于0.9,RMSE和MAE均大于0.1。總體而言,除了以G-B為變量的玉米覆蓋度估算模型精度較低外,以其他顏色指數為變量構建的覆蓋度估算模型精度均較高。

表4 基于顏色指數的覆蓋度估算模型及精度驗證

續表4
由表4還可以看出,無論在哪個時間分組,估算玉米覆蓋度的最佳顏色指數都是VEG,以VEG為變量的一元二次模型估算精度最高,模型的決定系數R2均大于 0.98,在0.9846~0.9893之間,RMSE、MAE均小于0.05,分別在 0.0270~0.0459之間和 0.0223~0.0326之間。各時間分組采用以VEG為變量的玉米覆蓋度估算模型預測玉米覆蓋度和實測的覆蓋度之間的散點圖如圖3所示。圖3中的散點表示實測覆蓋度與模型預測覆蓋度的分布情況,圖中藍色虛線為1:1線。散點越接近1:1線,表示模型的預測精度越高。結合表4和圖3可知,以VEG為變量的覆蓋度估算模型在不同的時間分組中估算精度不同。其中,在T平均時間分組中,模型估算精度最高,決定系數R2為0.9893,RMSE和MAE均最小,分別為0.0270、0.0223。

圖3 以VEG為變量的覆蓋度估算模型在不同時間分組中實測值與預測值比較
本研究利用農田間小氣候實景站對玉米進行監測,定時獲取玉米實景圖像,采用圖像分割技術對玉米圖像進行分割,計算得到玉米覆蓋度作為覆蓋度真值,通過對圖像顏色指數和覆蓋度真值進行相關性分析,建立了基于圖像顏色指數的玉米覆蓋度估算模型,并對模型進行了精度評價。研究表明:
(1)基于圖像所計算的8種顏色指數ExR、R-G、CIVE、G-B、ExG-ExR、ExG、NDI、VEG與玉米覆蓋度之間具有較好地相關性,玉米在不同發育期,隨著覆蓋度的變化,可以引起上述8種顏色指數相應的變化,因此可以利用這些顏色指數來估算玉米的覆蓋度。
(2)基于不同顏色指數的覆蓋度估算模型預測精度不同,分別以顏色指數ExR、R-G、CIVE、ExG-ExR、ExG、NDI、VEG為變量的覆蓋度估算模型預測效果均較好,其中以VEG為變量的一元二次模型估算精度最高。
(3)以VEG為變量的覆蓋度估算模型中,在T平均時間分組中,模型估算精度最高,預測R2為0.993,RMSE和MAE均最小,分別為0.0270、0.0223。說明對不同時間獲取圖像所計算的顏色指數取平均,可以在一定程度上減小太陽高度角變化對模型估算精度的影響。
雖然利用玉米田間實景圖像建立了基于顏色指數的覆蓋度估算模型,也完成了模型的精度評價,但是在研究過程中也存在一些問題,如圖像采集裝置由于系統原因或者斷電,造成在不同采集時間獲取的照片數量不一致、數據量不夠大,這也是導致玉米覆蓋度估算誤差的原因之一。另外,本研究中所有的覆蓋度估算模型均是基于單一變量構建的,今后研究中可以考慮構建多變量覆蓋度估算模型,通過對比分析,以期得到一個更加優化的玉米覆蓋度估算模型。