陳 偉,馬 蓉
(1.中船重工第七一八研究所,河北 邯鄲 056027;2.石河子大學機械電氣工程學院)
提高農業生產效率的有效方法是根據農田的空間差異性特征建立產量空間分布圖,進而對農田實施變量作業管理[1]。作物產量信息是農業生產效率高低最直接而又具體的反映,依據農田作物產量數據來生成產量空間分布圖是實施精準農業的基礎[2],也是最終制定農田管理和實施變量作業,實現農業生產節本增效、降低污染的基礎[3],所以在實施精準農業變量作業管理措施之前,采集農田作物產量數據,生成高精度的產量空間分布圖是非常重要的[4]。由于田間工作環境中的地塊不平整、灰塵多等多種復雜性因素的影響,以及操作者操作不規范等使得棉花產量數據中帶入誤差,而且在采棉機采收棉花的過程中,Insight棉花產量監測系統只能進行標定,而對其他設置不能更改,造成誤差帶入,從而使得Kriging插值成的棉花產量空間分布圖的精度降低,影響到精準農業變量作業管理實施的整體效果[5]。所以在Kriging插值生成棉花產量空間分布圖之前必須對產量數據誤差分析與處理。
2009年10月,基于采棉機在試驗區地塊內進行棉花在線測產試驗。本試驗使用的Insight棉花產量監測系統集成了DGPS、傳感器和微處理器等技術[6],它主要由Insight產量監視器、行走速度傳感器、風機轉速傳感器、采摘頭高度傳感器、棉花流量傳感器和DGPS等組成。Insight產量監測系統每隔1 s記錄一個棉花產量數據點。本試驗中Insight棉花產量監測系統安裝在美國John Deer 9970采棉機上,為獲取精度相對較高的原始產量數據,必須對Insight棉花產量監測系統進行GPS補償設置、各傳感器設置、采摘頭高度設置和標定等,而標定在整個棉花測產過程中是最為重要的[7]。標定包括質量標定、行駛距離標定、采摘頭停止高度標定和面積標定。各車次棉花產量的測量值與實際值間的相對誤差見表1。產量、距離和面積在標定前后的相對誤差對比見表2。

表1 各車次棉花產量的測量值與實際值間的相對誤差

表2 產量、距離和面積在標定前后的相對誤差(單位:%)
Insight棉花產量監測系統采集到的棉花產量實時數據以.YLD格式存儲,須使用與Insight棉花產量監測系統相配套的美國凱斯公司的專業軟件Advanced Farming Systems來讀取數據,但AFS軟件并不能進行誤差處理。因此首先應用AFS軟件將.YLD格式的棉花產量數據文件輸出轉換成shape格式的文件,進而運用統計學軟件ArcGIS對表達棉花產量數據空間位置的大地坐標系轉換為二維的可直接進行距離和面積計算的UTM WGS84平面直角坐標系,從而為棉花產量數據的誤差處理做好準備。
在棉花產量實時自動測產過程中,會受到使用的儀器、設備情況、所處的自然環境條件以及人員操作的規范等多種因素的影響,使測產結果產生誤差[8]。根據誤差的性質和特點,可將棉花產量數據誤差分為系統誤差、粗大誤差和隨機誤差[9~10]。
系統誤差由按一定周期規律變化的因素造成[11]。消除系統誤差最有效的方法是消除產生系統誤差的來源。在采棉機收獲棉花的過程中,Insight棉花產量監測系統雖然完成了正確的安裝和調試,而且經過了多次標定來減少誤差的帶入,但由于田間地塊不平整等相關因素的影響,使得采棉機在作業過程中輪胎經常打滑,從而造成行走速度傳感器測得的車速偏高,形成系統誤差。為減少系統誤差的帶入,可以剔除采棉機作業平均速度±2倍標準差范圍外的速度數據點。
產量數據中粗大誤差的帶入往往源自于人員操作不規范,造成數據出現異常值,而棉花產量數據的采集是實時在線的,無法進行再來一次的測量,所以可以根據棉田管理情況和種植經驗等來剔除異常值。在采集的棉花產量數據中有小部分的產量值特別高,也有小部分的產量值特別低,而絕大部分數據點的產量值都在5.2 t/hm2左右。由于整個試驗地塊區域內采取的管理方式是一樣的,所以棉花產量值相差不大。依據種植情況、經驗等將棉花產量數據處于1.5~7.4 t/hm2之間的歸為正常值,而剔除掉不在此范圍內的異常值。
隨機誤差的產生因素十分復雜,如果棉花產量數據中沒有系統誤差和粗大誤差,則包含有隨機誤差的數據一般服從正態分布。下圖為5號地棉花產量數據的正態QQPlot圖,它接近一條直線,表明該數據服從正態分布,也進一步說明剔除掉異常值,有效減少了系統誤差和粗大誤差。由于隨機誤差是不能避免產生的,所以采棉機采收棉花的過程中,可適當地增加標定的次數、規范人員操作方法等手段來降低隨機誤差和系統誤差。

圖1 5號地數據的QQPlot圖
處理棉花產量數據點的異常值的方法有許多,一是可以直接剔除掉異常值,二是可以用總體數據的平均值來替代異常值,三是可以用正常值中的最大值來代替異常值等[12]。因為Insight棉花產量監測系統每秒鐘采集一個數據點,所以數據點很龐大,而剔除掉一些點對整個試驗田塊內的棉花產量空間分布情況影響不大,所以可以運用直接剔除異常值的方法。
運用閾值過濾直接剔除異常點的方法。依據種植情況、經驗等將棉花產量數據處于1.5~7.4 t/hm2之間的歸為正常值,而剔除掉不在此范圍內的異常值。針對采棉機作業過程中輪胎經常打滑的現象,剔除掉不在采棉機作業平均速度±2倍標準差范圍內的速度異常數據點。
表3為試驗地內的棉花產量數據誤差處理前后的描述性統計結果對比。從表中可以看到,經過誤差處理,剔除掉棉花產量數據點異常值后,偏度增大并靠近于零,棉花產量數據趨向于正態分布。經誤差處理后,棉花產量數據變異系數CV(%)為19.61%,較處理前的25.18%僅減小了0.0557,這表明,經過誤差處理剔除掉數據點異常值后,余下的棉花產量數據不僅保留了原有的產量變異,而且表明試驗區地塊內的棉花產量數據在空間變異性特征處于中等水平,符合劃分精準農業管理分區的條件和指導變量作業的要求。
對試驗地內的棉花產量數據,在誤差處理前后,分別運用地統計學軟件ArcGIS,進行Kriging插值。通過對比兩棉花產量空間分布圖可以看到,經過誤差處理后的空間分布圖中的異常值數據點大幅度地減少,而且空間分布圖的精度、聚類性和平滑性得到了比較明顯的提升。

表3 棉花產量的描述性統計分析
為了提高經過Kriging插值成的棉花產量空間分布圖的精度,必須對棉花產量數據中的誤差進行細致而深入的分析,找出產生各種誤差的原因,從而采取有效的措施和方法來減少、甚至剔除誤差。本研究以采集的棉花產量實時數據為基礎,分析了產量數據中包含的系統誤差,粗大誤差和隨機誤差,設計的閾值過濾器對棉花產量實時數據進行了誤差處理。依據種植情況、經驗等將棉花產量數據點處于1.5~7.4 t/hm2之間的視為正常值,而剔除掉不在此范圍內的異常值數據點;另一方面針對采棉機作業過程中輪胎經常打滑的現象,剔除掉不在采棉機作業平均速度±2倍標準差范圍內的速度異常數據點。結果表明,經過誤差處理后的棉花產量數據趨于正態分布,不僅保留了原有實際產量數據的變異性,而且試驗區地塊內的棉花產量數據的空間變異性特征處于中等水平,符合劃分精準農業管理分區的條件和指導變量作業的要求。本研究還比較了誤差處理前后建立的棉花產量空間分布圖,發現經誤差處理后Kriging插值成的棉花產量空間分布圖中的異常點顯著減少,分布圖的精度、聚類性和平滑性得到了顯著提升。
[1]王長耀,牛錚,唐華俊等.對地觀測技術與精細農業[M].北京:中國科學出版社,2001.
[2]薛正平,鄧 華,楊星衛等.基于決策樹和圖層疊置的精準農業產量圖分析方法[J].農業工程學報,2006,22(8):140~144.
[3]Panneton1B,Brouillard1M,PiekurowskiT.Integration of yield data from several years into1a1single1map[R].Montpellier,France:Proceedingof the 3rd European Conference on Precision Agriculture,2001.
[4]Missotten B,Strubble G,Baerdemaeker J.Accuracy of grain and straw yield mapping[R].Minnesota:Proceeding of the 3rd international conference on precision agriculture,1996.
[5]Lark R M,Stafford J V.Consistency and change in spatial variability of crop yield over successive seasons,methods of data analysis.In Robert P C,Rust R H,Larson WE(eds)3rd international conference on precision agriculture.ASA,CSS A,SSSA&ASAE,Madison,Wisconsin,USA.1996,141~150.
[6]陳偉,馬蓉,盧帥等.機采棉在線測產技術及其關鍵裝備[J].農機化研究,2011,10:216~219.
[7]陳偉,馬蓉,盧帥等.Insight棉花產量監測系統及應用研究[J].安徽農業科學,2010,38(30):17208~17210.
[8]http://baike.baidu.com/view/40051.htm.
[9]梁晉文,陳林才,何貢.誤差理論與數據處理[M].中國計盈出版社,2006.
[10]賈沛璋.誤差分析與數據處理[M].北京:國防工業出版社,2002.
[11]費業泰.誤差理論與數據處理[M].北京:機械工業出版社,1995.
[12]施斌,王寶軍,周國云.環境地質學中的GIS[M].北京:科學出版社,2006.