劉合兵 王壘 王一飛 席磊







摘要:小麥生產是河南省農業生產中的重要環節,在維持糧食供應和安全方面發揮著重要作用。對小麥產量進行準確預測可以為農業經濟調控、政策制定提供重要性信息。為提高小麥產量預測精度,綜合考慮影響小麥產量的相關因素,基于皮爾遜相關系數分析特征變量與產量之間的相關性。選取支持向量回歸(support vector regression,SVR)模型解決小麥估產中的復雜性、非線性及小樣本等問題。引入粒子群算法(particle swarm optimization,PSO)對SVR模型的懲罰因子(c)和核參數(g)進行優化,提高SVR模型的預測精度。以河南省1978—2019年小麥產量數據及其特征變量數據構建數據集,并與BP、Elman等神經網絡模型及優化模型進行對比仿真試驗。結果表明,PSO對SVR模型的優化效果明顯高于傳統的神經網絡,PSO-SVR模型預測結果的4項評價指標均優于其他模型。其中,PSO-SVR模型的平均絕對百分比誤差MAPE為0.87%,與SVR模型相比誤差降低了57.4%、與PSO-BP模型相比誤差降低了64.8%。PSO-SVR模型能夠提高小麥產量預測精度,穩定性好,可為小麥產量預測提供新的思路與方法,具有較好的應用推廣價值。
關鍵詞:小麥產量預測;粒子群算法;SVR;BP;Elman
中圖分類號:S126 文獻標志碼:A
文章編號:1002-1302(2023)08-0157-07
基金項目:河南省科技攻關計劃(編號:212102110204、222102110234);河南省現代農業產業技術體系(編號:S2010-01-G04);河南省研究生教育改革與質量提升工程項目(編號:YJS2023AL046)。
作者簡介:劉合兵(1972—),男,河南臺前人,碩士,副教授,碩士生導師,主要從事數據挖掘方面的研究。E-mail:liuhebing@henau.edu.cn。
通信作者:席 磊,碩士,教授,主要從事分布計算與智能系統研究。E-mail:hnaustu@126.com。
農業是河南省的基礎產業,小麥是基礎中的核心,關系著河南省的經濟命脈。小麥產量可看成是生育期內氣象條件、土壤條件、地理環境、物候信息、生長發育狀況等多個影響因素相互疊加的結果,具有復雜性、非線性以及小樣本等特性,針對其預測存在一定難度。
現有的小麥產量預測大致可分為以下3類:一是利用歷史特征統計資料建立統計回歸模型;二是利用氣象數據建立氣象因子模型;三是利用遙感數據建立作物模擬模型。作物模擬模型可以提供對生理過程的深入理解并反映作物與環境變量之間的相互關系,但將模型用于產量模擬之前通常需要在局部范圍內對大量的實地觀察數據進行校準和驗證,因此阻礙了它們的大規模應用[1]。氣象因子模型能夠詳細分析各因素在不同生育期對作物產量的影響程度[2],可以為作物生產提供指導性意見。但模型運用前期需要對天氣數據、干旱數據、溫度數據、降水數據等大量氣象數據進行收集與整編,不僅需要投入大量時間而且還需要具備專業的氣象知識。與作物模擬模型和氣象因子模型相比,統計回歸模型[3]具有成本低、數據易收集、易于運用等特點,因此被廣泛應用于作物產量預測。
小麥產量預測一直是國內研究中的熱點,相比于國際上較為流行的氣象因子預測[4-5]、遙感技術預測[6-7]以及作物生長機理模型預測[8-9]等方法,國內關于小麥產量的預測大部分是建立在農業生產統計資料[10-11]基礎上的。林瀅等選擇不同生長階段的數據,基于隨機森林算法采用遙感、土壤、氣候數據進行訓練確定了河南省產量預測的最佳時間段[12]。王來剛等基于隨機森林算法對河南省大尺度多源時空數據進行分析,不僅得出了有關小麥產量的重要影響因素,而且構建了不同生長階段的模型并探討模型的預測精度[13]。劉峻明等基于隨機森林算法結合氣象數據,使用氣象產量、相對氣象產量、單產來預測河南省冬小麥產量[14]。曾妍等建立冬小麥各生育期的條件植被溫度指數(VTCI)、葉面積指數(LAI)與冬小麥產量之間的支持向量回歸模型對陜西省關中平原的5個市進行產量預測[15]。趙桂芝等基于混沌理論對原始數據進行相空間重構,再用PSO算法優化SVM參數,對糧食產量進行仿真試驗并取得了較高的預測精度[16]。高心怡等通過對粒子群算法添加變異交叉機制以及族外競爭機制來優化支持向量回歸模型對我國糧食產量進行預測[17]。李曄等結合灰色模型和馬爾可夫理論,基于新信息優先的思想建立了新維無偏灰色馬爾可夫模型提高了小麥產量預測精度[18]。Ali等開發了一個結合馬爾可夫鏈蒙特卡羅(MCMC)Copula技術的混合遺傳規劃模型,建立了幾種不同類型的GP-MCMC-copula模型,每種模型都具有著名的copula族,以篩選當前研究區域的最佳棉花產量預測模型[19]。馬創等利用馬爾可夫模型,對灰色模型的預測值進行殘差修正,實現了對糧食產量的周期性預測[20]。赫曉慧等利用CNN從多光譜遙感影像中提取空間-光譜特征,結合GRU從遙感影像中自適應學習冬小麥生育期的時間依賴對其產量進行回歸預測[21]。劉鵬等將歷史產量和氣候因素相結合,使用LSTM模型以固定年份為單位對下一年農作物產量進行預測[22]。胡程磊等以粒子群為基礎,引入繁殖和變異機制優化神經網絡的權值閾值,提高了產量預測的精度[23]。
支持向量回歸模型是一種專門針對小樣本問題的非線性回歸模型[24],可以歸結為求解凸二次規劃問題,理論上可以得到全局最優解。本研究為提高小麥產量預測精度,在支持向量回歸模型中引入粒子群優化算法,利用河南省小麥產量數據及其特征變量數據進行仿真試驗。
1 材料與方法
1.1 數據來源
本研究數據來源于河南省統計年鑒及國家統計局年度數據。以河南省1978—2019年小麥產量數據構建輸出指標,以小麥播種面積、糧食播種面積、耕地面積、農用機械總動力、灌溉面積、化肥施用折純量、農村用電量、小麥單位面積產量、受災面積、成災面積、農業總產值11個特征變量構建輸入指標體系,河南省小麥產量走勢見圖1。由圖1可知,河南省小麥產量整體呈上升趨勢,個別年份呈下降趨勢且具有一定的波動性。
1.2 原始數據預處理
1.2.1 歸一化處理
對數據進行歸一化處理,轉化為[-1,1]之間的數值,保證所有數據都在同一量綱內。歸一化公式如下:
式中:Y為已處理的數據;X為未處理的數據;Xmax、Xmin為X的最大值與最小值。
1.2.2 特征分析
采用皮爾遜相關系數分析特征變量與產量之間的相關性。皮爾遜相關系數為介于[-1,1]之間的數值,可以判斷特征變量與產量之間的線性相關性。絕對值越接近1表示相關度越強;絕對值等于0表示線性無關;絕對值為負值表示線性負相關,相關系數公式如下:
得到的小麥產量與特征變量之間的皮爾遜相關系數見圖2。由圖2可知,小麥產量與受災面積、成災面積相關系數為-0.68、-0.62,呈負相關關系,其余變量均呈現高度正相關關系。
1.3 研究方法
1.3.1 BP神經網絡
BP是一種按照誤差反向傳播的多層前饋神經網絡,由輸入層、隱含層、輸出層組成,每個部分之間依靠權值和閾值連接[25]。通常情況下增加隱含層可以降低模型誤差,但也會使網絡結構變復雜,訓練時間變長,甚至出現過擬合現象。單隱含層BP神經網絡在上述矛盾中可實現較好平衡,產生過擬合傾向較小,其拓撲結構見圖3。
BP神經網絡的結構模型,其輸入、輸出關系如式(3)所示:
1.3.2 Elman神經網絡
Elman為4層結構(包括輸入層、承接層、隱含層及輸出層),承接層[26]用來存儲隱含層前一時間的輸出數據,并返回給該網絡輸入,增強了神經網絡的處理能力。其拓撲結構見圖4[27]。
Elman神經網絡的結構模型,其輸入、輸出關系見式(4)~式(6)。
1.3.3 BP、Elman隱含層節點個數的確定
隱含層節點數是導致“過擬合”的直接原因,隱含層節點數與輸入輸出向量維度相關,并且每個模型節點個數都是不一樣的[28]。常用的計算公式如式7所示。
式中:k為隱含層節點數,p為輸入層節點數,b為輸出層節點數,n為1~10之間的常數。利用整個節點空間中的每1個節點進行驗證計算,具體結果見表1所示。
由表1可知,Elman神經網絡隱含層節點個數為13時模型平均絕對誤差(MAE)最小為200.36,效果最好。BP神經網絡隱含層節點個數為8時模型平均絕對誤差(MAE)最小為119.14,效果最好。
1.3.4 支持向量回歸模型
為了解決回歸擬合的問題,Cortes等在SVM分類的基礎上引入ε線性不敏感損失函數,得到了SVR模型[29],結構見圖5。
支持向量回歸將高維空間內積運算化簡成了從低維空間進行輸入的核函數計算,核函數的類型決定了SVR的不同特性,從某種程度上直接影響著模型的預測精度[30]。常用的核函數有:
由于PSO尋優時不調整參數、收斂更快、操作更加簡單、精度更高,因此采用粒子群算法優化支持向量回歸模型,提升模型效率。PSO-SVR模型的運行過程見圖6。
模型具體步驟如下:
第1步:劃分數據集,歸一化處理,輸入數據。
第2步:建立初始SVR模型,設置5折交叉驗證。
第3步:使用訓練集數據訓練模型,設置PSO初始參數、目標精度(ε)、最大迭代次數(k)等,生成粒子的速度與位置。
第4步:將每個粒子所尋的最優c(bestc)和最優g(bestg)帶入模型中,得出預測值,確定粒子的適應度值,為預測值與真實值的均方誤差。
第5步:將粒子的適應度值與Pbest的適應度值進行比較,若更好則代替為Pbest,同理更新gbest。
第6步:是否滿足終止條件(適應度值<ε或迭代次數>k)滿足則輸出最優c、最優g,反之,不斷更新粒子的位置和速度,返回步驟4。
第7步:用最優c和最優g代替SVR模型中的c和g。
第8步:對比不同類型核函數的PSO-SVR模型,選擇精度最高的核函數構建PSO-SVR模型。
第9步:將測試集數據帶入訓練好的模型中,計算預測精度。若不滿足回到步驟3,滿足則輸出最終預測結果。
PSO-BP模型[32-33]、PSO-Elman[34-35]模型的具體優化步驟與PSO-SVR模型方式一致,不再進行重復描述。
2 結果與分析
收集河南省1978至2019年共42年的小麥產量數據,以及對應年份的11個影響因素作為本研究的數據集。前37年數據作為訓練數據用于提取知識和生成數學模型,2015—2019年數據作為測試數據用于評估模型性能。
2.1 評價指標的確定
選取平均絕對百分比誤差(MAPE)、均方根誤差(RMSE)、平均絕對誤差(MAE)、決定系數(R2)作為判定模型擬合程度的評價指標,具體公式如下:
2.2 模型預測結果
不同模型的小麥產量預測結果對比數據如表2所示,預測效果見圖7。
由表3可知,Elman、PSO-Elman、BP、PSO-BP模型的特點在于預測結果不穩定,容易陷入局部最小值。SVR模型的穩定性較好,但總體預測效果有待提高。PSO-SVR模型較SVR模型不僅精度有明顯的提高,預測效果也較穩定。
MAPE是一項反映預測方法總體有效性的指標,PSO-SVR模型MAPE為0.87%,遠小于其他模型,說明粒子群優化算法的全局搜索能力對SVR模型參數的優化效果更優。RMSE反映的是誤差分散程度 PSO-SVR模型的RMSE為37.37 遠小于其他模型,說明PSO-SVR模型的擬合效果更穩定。
MAE反映的是預測誤差絕對值的均值,其值反映精度大小,PSO-SVR模型的MAE為31.53,遠小于其他模型,說明PSO-SVR模型的精度最高。R2反映的是回歸擬合曲線的擬合優度,PSO-SVR模型的R2為0.93(表3),大于其他模型,說明粒子群優化算法對SVR模型的回歸擬合效果最優。
3 結論與討論
針對小麥產量預測的復雜性、非線性及小樣本等特性,在選取的SVR模型及傳統的神經網絡模型基礎上,采用PSO優化算法對3種模型參數進行優化,并結合河南省實際小麥產量數據進行仿真試驗。試驗結果表明,SVR模型在小麥產量預測上具有很大的潛力,PSO-SVR模型的預測精度及擬合效果明顯優于其他模型,為小麥產量預測提供了新的思路與方法。
特征變量的選取能影響模型的預測效果。下一步工作將在現有數據集上擴充氣象因素(如日照時間、有效積溫、降水量、溫度等),進一步優化小麥產量預測模型,提高模型預測精度,以期為農業生產提供指導。
參考文獻:
[1]Fayaz A,Kumar Y R,Lone B A,et al. Crop simulation models:a tool for future agricultural research and climate change[J]. Asian Journal of Agricultural Extension,Economics & Sociology,2021:146-154.
[2]Xu X Y,Gao P,Zhu X K,et al. Design of an integrated climatic assessment indicator (ICAI) for wheat production:a case study in Jiangsu Province,China[J]. Ecological Indicators,2019,101:943-953.
[3]Qiming Z,Ali I. Integration of maximum crop response with machine learning regression model to timely estimate crop yield[J]. Geo-spatial Information Science,2021,24(3):474-483.
[4]吳冰潔,王 靖,唐建昭,等. 華北平原冬小麥產量變異的氣象影響因子分析[J]. 中國農業氣象,2018,39(10):623-635.
[5]Ruan G J,Li X Y,Yuan F,et al. Improving wheat yield prediction integrating proximal sensing and weather data with machine learning[J]. Computers and Electronics in Agriculture,2022,195:106852.
[6]王飛龍,王福民,胡景輝,等. 基于相對光譜變量的無人機遙感水稻估產及產量制圖[J]. 遙感技術與應用,2020,35(2):458-468.
[7]Franch B,Vermote E F,Skakun S,et al. Remote sensing based yield monitoring:application to winter wheat in United States and Ukraine[J]. International Journal of Applied Earth Observation and Geoinformation,2019,76:112-127.
[8]余新華,趙維清,朱再春,等. 基于遙感和作物生長模型的多尺度冬小麥估產研究[J]. 光譜學與光譜分析,2021,41(7):2205-2211.
[9]Xie Y,Huang J X. Integration of a crop growth model and deep learning methods to improve satellite-based yield estimation of winter wheat in Henan Province,China[J]. Remote Sensing,2021,13(21):4372.
[10]陳全潤,楊翠紅. 河南省糧食產量預測方法研究[J]. 系統科學與數學,2018,38(7):813-822.
[11]姜 新. 河南省糧食產量影響因素和預測方法研究[J]. 中國農學通報,2019,35(1):154-158.
[12]林 瀅,邵懷勇. 基于隨機森林算法的河南省冬小麥產量預測最佳時間窗和影響因子研究[J]. 麥類作物學報,2020,40(7):874-880.
[13]王來剛,鄭國清,郭 燕,等. 融合多源時空數據的冬小麥產量預測模型研究[J]. 農業機械學報,2022,53(1):198-204,458.
[14]劉峻明,和曉彤,王鵬新,等. 長時間序列氣象數據結合隨機森林法早期預測冬小麥產量[J]. 農業工程學報,2019,35(6):158-166.
[15]曾 妍,王 迪,趙小娟. 基于支持向量回歸的關中平原冬小麥估產研究[J]. 中國農業信息,2019,31(6):10-20.
[16]趙桂芝,趙華洋,李 理,等. 基于混沌-SVM-PSO的糧食產量預測方法研究[J]. 中國農機化學報,2019,40(1):179-183.
[17]高心怡,韓 飛. 基于混合智能算法的支持向量機的糧食產量預測[J]. 江蘇大學學報(自然科學版),2020,41(3):301-306.
[18]李 曄,白 雪. 基于新維無偏灰色馬爾可夫模型的小麥產量預測[J]. 江蘇農業科學,2021,49(15):181-186.
[19]Ali M,Deo R C,Downs N J,et al. Cotton yield prediction with Markov Chain Monte Carlo-based simulation model integrated with genetic programing algorithm:a new hybrid copula-driven approach[J]. Agricultural and Forest Meteorology,2018,263:428-448.
[20]馬 創,袁 野,尤海生. 基于灰色——馬爾可夫模型的農產品產量預測方法[J]. 計算機科學,2020,47(S1):535-539.
[21]赫曉慧,羅浩田,喬夢佳,等. 基于CNN-RNN網絡的中國冬小麥估產[J]. 農業工程學報,2021,37(17):124-132.
[22]劉 鵬,鄭 勇,楊紅軍. 基于改進神經網絡的農作物產量預測方法[J]. 電子技術應用,2019,45(10):88-91,99.
[23]胡程磊,劉永華,高菊玲. 基于IPSO-BP模型的糧食產量預測方法研究[J]. 中國農機化學報,2021,42(3):136-141.
[24]郝曉露,張姍姍,朱家明. 基于模糊時序的SVR模型對空氣質量的預測[J]. 蘭州文理學院學報(自然科學版),2019,33(4):17-23,39.
[25]劉 陽,譚凱旋,郭欽鵬,等. 運用隨機森林和GA-BP神經網絡預測巖石爆破塊度[J]. 礦業研究與開發,2021,41(1):135-140.
[26]Liu B,Wu Q L,Cao Q. An improved Elman network for stock price prediction service[J]. Security and Communication Networks,2020,2020:8824430.
[27]周 鶴. 基于改進Elman神經網絡的水稻生長預測[D]. 揚州:揚州大學,2019.
[28]王嶸冰,徐紅艷,李 波,等. BP神經網絡隱含層節點數確定方法研究[J]. 計算機技術與發展,2018,28(4):31-35.
[29]Cortes C,Vapnik V. Support-vector networks[J]. Machine Learning,1995,20(3):273-297.
[30]杜彥斌,胡言峰,許 磊,等. 基于PSO-SVR的15-5PH合金粉末激光熔覆層稀釋率預測方法[J]. 計算機集成制造系統,2022,28(7):2169-2178.
[31]Kennedy J,Eberhart R. Particle swarm optimization[C]//Proceedings of ICNN95-International Conference on Neural Networks.Perth:IEEE.:1942-1948.
[32]郭亞菲,樊 超,閆洪濤. 基于主成分分析和粒子群優化神經網絡的糧食產量預測[J]. 江蘇農業科學,2019,47(19):241-245.
[33]楊冬梅,李竹一,張健楠,等. 基于PSO-BP神經網絡的工業裝備造型設計研究[J]. 機械設計,2021,38(7):126-132.
[34]趙麗清,段東瑤,殷元元,等. 基于PSO-Elman算法的茶葉烘干含水率預測[J]. 農業工程學報,2021,37(19):284-292.
[35]鄒 浩,竇震海,張 博,等. 基于提升小波和改進PSO-Elman神經網絡的短期負荷預測[J]. 電測與儀表,2020,57(21):119-125.