楊小兵 楊晨 任重 楊峻



摘要:為分析氣象因子對安徽省油菜(Brassica napus L.)產量的影響,構建適用于油菜單位面積產量預測模型,利用1999—2018年安徽省78個站點的地面氣象觀測資料及2000—2018年78個縣(市、區)的油菜單位面積產量數據,采用決策樹算法對影響油菜產量的氣象因子進行分析,篩選因子基于支持向量機建立油菜產量預測模型。結果表明,影響油菜產量的主要氣象因子是成熟期濕潤指數、蕾薹期平均氣溫、苗期濕潤指數、開花期濕潤指數,預測模型的預測值與實測值的均方根誤差為402 kg/hm2,擬合指數為0.72。
關鍵詞:油菜(Brassica napus L.);氣象;決策樹;支持向量機;預測
中圖分類號:S565.4 文獻標識碼:A
文章編號:0439-8114(2020) 16-0158-03
D0I:10.14088/j.cnki.issn0439-8114.2020.16.036
油菜(Brassica napus L.)是安徽省種植面積最大的油料作物,2017年總產量占全國油菜總產的6%以上,位居全國第五位[1]。安徽省油菜的生育期約220 d,一般10月上中旬開始播種,翌年5月中旬收獲。在油菜生長發育的進程中,受氣象因子影響較大,連陰雨天氣、低溫凍害對其產量的影響尤為顯著,且氣溫與光照在其不同生育期的影響作用存在差異[2-16]。油菜預測模型的研究已取得一定的成果,現有的機理性或半機理性模型有APSIM、EPIC、DSSAT、CROPGRO等,還有學者基于數理統計構建了油菜單產預測模型[17-20]。機理性模型使用時,需要輸入的參數較多,數據獲取不便,并且需對關鍵參數進行本地化調整,而當前構建的統計類模型,因不同地域對油菜單產造成影響的關鍵生育期及氣象因子存在差異而無法直接使用[21,22],因此,對安徽省油菜不同生育期的氣候條件對產量的影響深入研究,以便構建適用于預測模型,為探討油菜經濟效益、應對氣象災害風險管理提供參考。
1資料與方法
1.1資料來源
油菜產量數據,來源于安徽省各市統計局,包含2000-2018年安徽78個縣(市、區)的單位面積產量;氣象數據來源于全國綜合氣象信息共享平臺(CIMISS),包含1999-2018年安徽省78個國家級氣象站的逐日平均氣壓、平均氣溫、平均相對濕度、平均風速、日照時數、降水量、最高氣溫、最低氣溫、經緯度等數據。
1.2 計算方法
將油菜產量分解為趨勢產量、氣象產量。趨勢產量由農業技術水平決定,與時間相關,氣象產量與各生育期的氣溫、日照、干旱、濕漬害、凍害相關。凍害指標選取參照秦鵬程等[23]研究選取冷積溫,其計算公式如式(1)、式(2)。干旱、濕漬害指標的選取參照徐羽等[24]研究選取濕潤指數,其計算公式見式⑶、式(4)。
為便于分析將油菜生育期劃分為4個階段,每個階段對應日期見表1,將產量劃分為5個量級見表2。采用決策樹算法對油菜量級與4個生育期冷積溫平均氣溫(TEM)、平均日照時數(SSH)、冷積溫(CDD)、濕潤指數(W)進行劃分,得出影響油菜產量的關鍵因子,將其作為自變量帶入支持向量機算法,進行產量預測模型的構建。COD = ∑Ni DDi (1)DD={ O,Tmin≥Tthr Tthr-Tmin,Tmin
式中,Tmin為日最低氣溫,Tthr為該生育期凍害指標,N表示該生育期持續日數;P為該生育期降水量,ET為日參考作物蒸散量,△表示飽和水汽壓曲線斜率,R為參考作物表層凈輻射,γ為干濕表常數,T為平均氣溫,u為2 m高度處風速,es為飽和水汽壓,ea為實際水汽壓。
2結果與分析
2.1決策樹分類提取因子
決策樹是解決分類問題的一種常用方法,是一種樹形結構,其中每個內部節點表示一個屬性上的測試,每個分支代表一個測試輸出,每個葉節點代表一種類別。采用C5.0決策樹算法分析油菜產量與年份及各生育期氣象因子之間的關系(總樣本593個),結果如圖1所示。根結點以年份≤2011為判定條件,在2011年之前產量較低,集中在I、II、III量級,延伸細分顯示,產量隨年份變化還存在2003年、2006年兩個節點,2003年之前產量以量級I為主,占50%以上(47個樣本),2004-2006年有所提高,量級I占20%左右(53個樣本),2007-2011年以量級III為主,占比接近60% (130個樣本);在2011年后成熟期濕漬害、蕾薹期氣溫、開花期的濕漬害、苗期的干濕條件對產量影響較大,當成熟期濕潤指數>2.53時產量偏低,且當開花期濕潤指數>2.09時產量進一步降低,其量級I、II占比接近60%(50個樣本),產量最高出現在成熟期濕潤指數≤2.53、蕾薹期平均氣溫>4.89℃、苗期濕潤指數>0.99,其量級IV、V占比接近70%(186個樣本)。
2.2 支持向量機預測模型
支持向量機方法是建立在統計學習理論的VC維理論和結構風險最小原理基礎上,根據有限的樣本信息在模型的復雜性和學習能力之間尋求最佳折中,以獲得最好的推廣能力[25-27]。模型構建時將年份Year、成熟期濕潤指數W4、蕾薹期平均氣溫TEM2、開花期濕潤指數W3、苗期濕潤指數W1作為輸入因子,對油菜單位面積產量進行預測,采用K值交叉驗證,將所有數據分割成10個子樣本,不重復地選取其中一個子樣本作為測試集,其他9個樣本用來訓練,模型評價指標采用均方根誤差以及擬合指數IA,共重復10次,使每個子樣本都參與訓練且被測試,降低泛化誤差。由圖2可以看出,模型得出的預測值與實測值的均方根誤差為402kg/hm2,擬合指數為0.72,具有一定的應用價值。
3小結與討論
利用1999-2018年安徽省78個國家級氣象站的地面氣象觀測資料及相應的油菜產量數據,基于決策樹C5.0算法對影響油菜產量的氣象因子進行分析,篩選出關鍵因子,并采用支持向量機算法構建安徽省油菜單位面積產量預測模型。
1)安徽地區油菜單位面積產量在時間尺度上存在3個增加節點,即2003年、2006年、2011年;
2) 成熟期濕漬害、蕾薹期氣溫、開花期的濕漬害、苗期的干濕條件對單位面積產量影響較大,當成熟期濕潤指數≤2.53、蕾薹期平均氣溫>4.89、苗期濕潤指數> 0.99,單位面積產量最高;
3) 所建立的油菜單位面積產量預測模型,得出的預測值與實測值的均方根誤差為402 kg/hm2,擬合指數為0.72,具有一定的應用價值。
本研究所用的油菜產量數據受抽樣調查等統計方法的影響,存在一定偏差,數據時空跨度較大,但未考慮油菜品種對其的影響,模型構建所需數據樣本不足,有待進一步加強。
參考文獻:
[1 ]中華人民共和國國家統計局.中國統計年鑒-2012[M].北京:中國統計出版社,2012.
[2]劉瑞娜,楊太明,陳金華,等.安徽省春季連陰雨分布特征及其對油菜產量影響評估[J].中國農學通報,2012, 28(34):252-256.
[3] 陳曉藝,岳偉,王曉東,等.安徽省油菜主要發育期預報業務化模型研究[J].中國農學通報,2012, 28(3):75-80.
[4]劉瑞娜,楊太明,王曉東,等.近50年安徽省油菜澇漬災害時空變化分析[J].農學學報,2016, 6(1): 110-116.
[5]陸魁東,彭莉莉,黃晚華,等.氣候變化背景下湖南油菜氣象災害風險評估[J].中國農業氣象,2013, 34(2):191-196.
[6]曹宏鑫,張春雷,李光明,等.油菜生長發育模擬模型研究[J].作物學報,2006,32( 10): 1530-1536.
[7] 黃淑娥,祝必琴,辜曉青,等.鄱陽湖地區油菜生產氣象條件分析與種植氣候區劃[J].江西農業大學學報,2009,31 (5): 167-171.
[8]陸魁東,彭莉莉,黃晚華,等.氣候變化背景下湖南油菜氣象災害風險評估[J].中國農業氣象,2013, 34(2):191-196.
[9]王文軍,童明達,唐繼云.油菜產量的氣象模擬分析[J].作物雜志,2010(3):38-41.
[10] 梁軼,李星敏,周輝,等.陜西油菜生態氣候適宜性分析與精細化區劃[J].中國農業氣象,2013,34(1 ):50-57.
[11] 沈惠聰,江宇.甘藍型油菜種子主要脂肪酸氣象生態效應及數學[J].浙江農業大學學報,1990,16( 1) :69-76.
[12] 董芹,霍焱,蔣駿,等.油菜生育期氣象指數等級及災害預警指標研究[J ].江蘇農業科學,2015,43(10): 84-90.
[13] 孫玉蓮,邊學軍,黃成秀,等.甘肅臨夏高寒區油菜種植氣候區劃與產量預測氣候模型[J].干旱地區農業研究,2013,31(2):53-57.
[14] 宋迎波,王建林,陳暉,等.中國油菜產量動態預報方法研究[J].氣象,2008,34(3):95-101.
[15] 方麗,李涵茂,戴鵬飛,等.湖南省油菜生育期間氣候資源時空變化規律分析[J].氣象科技,2014,42(4):725-730.
[16] 郭翔,王明田,李金建,等.四川盆地區油菜農業氣候適宜性分析與精細化區劃[J].西南農業學報,2015,28(2):408-414.
[17] 蔡承智,王芳,莫洪蘭,等.基于ARIMA模型的我國油菜單產預測分析[J].中國農業資源與區劃,2018,39( 1):71 -76.
[18] 徐飛.灰色預測模型在我國油菜產量預測中的應用[J].安徽農業科學,2011,39(7):3854-3855.
[19] 張曉云,孔祥萍,張海春.高寒地區油菜花期與氣象條件的關系及預測模型[J].中國農學通報,2019,35(13):102-106.
[20] 王占林,張海春.基于多元回歸的高寒地區油菜產量預測模型[J].中國農學通報,2019,35(14):38-41.
[21] 戴清明,呂愛欽,何維君,等.洞庭湖區油菜主要氣象災害發生規律與減災避災對策[J].作物研究,2006,20( 1): 37-42.
[22]余兆海.氣候條件對油菜產量的影響[J].中國農業科學,1981,14(5):64-70.
[23] 秦鵬程,劉志雄,萬素琴,等.基于決策樹和隨機森林模型的湖北油菜產量限制因子分析[J].中國農業氣象,2016, 37(6):691-699.
[24] 徐羽,徐剛,吳艷飛,等.重慶市參考作物蒸散量及濕潤指數變化研究[J].水土保持研究,2015,22(3): 176-181.
[25] 劉柏林.基于電網運行數據集的電力系統運行評估及優化研究[D].北京:華北電力大學,2017.
[26]丁世飛,齊丙娟,譚紅艷.支持向量機理論與算法研究綜述[J].電子科技大學學報,2011( 1) :4-12.
[27] 陶卿,曹進德,孫德敏.基于支持向量機分類的回歸方法[J].軟件學報,2002(5): 156-160.
收稿日期:2019-12 -10
基金項目:安徽省氣象局碩博士工作啟動經費項目(RC201620)
作者簡介:楊小兵(1990-),男,江蘇興化人,工程師,碩士,主要從事應用氣象、數據分析與建模研究,(電話)15256941260(電子信箱)yangxb1990@163.com;通信作者,楊峻(1992-),男,江蘇興化人,碩士,主要從事計算機控制與優化研究,(電子信箱)seahiscuityj@163.com。