















摘要:針對農機裝備需求受實際農業生產和其他多種因素影響,需求數據呈現周期性、非線性等特點,難以準確預測農機需求的問題,提出一種集成SARIMA-改進RS-多步LSTM的農機裝備需求預測方法。通過確定參數組合,構建季節性差分自回歸滑動平均(SARIMA)模型。引入完全集合經驗模態分解(CEEMDAN)、改進隨機搜索(RS)算法和多步長短期記憶網絡(LSTM),構建改進RS-多步LSTM模型。將SARIMA模型和改進RS-多步LSTM模型進行最優加權組合,得到組合預測模型。以某型號農機裝備進行實例驗證,結果表明,所提方法能夠有效預測農機裝備需求的時間序列,評價指標MSE、MAE、R2分別為225.45、13.22和0.920 9。
關鍵詞:農機裝備;需求預測;季節性;多步LSTM;模態分解
中圖分類號:F323
文獻標識碼:A
文章編號:2095-5553(2024)12-0305-07收稿日期:2024年1月30日
修回日期:2024年4月15日
*基金項目:國家重點研發計劃項目(2020YFB1713500)
第一作者:呂鋒,男,1980年生,河南商丘人,博士,副教授;研究方向為產品服務系統設計。E-mail: lvfeng1980@haust.edu.cn
Combination prediction model of agricultural machinery equipment demand based on SARIMA-improved RS-multistep LSTM
Lü Feng1, Wang Baosen1, Chu Huili1, Yang Cheng1, Lü Ling2
(1. School of Mechatronics Engineering, Henan University of Science and Technology, Luoyang, 471003, China;2. Highway Business Development Centre, Liangyuan District, Shangqiu, 476000, China)
Abstract: In view of the fact that the demand for agricultural machinery equipment is affected by actual agricultural production and many other factors, and the demand data is cyclical and non-linear, making it difficult to accurately forecast the demand for agricultural machinery, a material demand forecasting method integrating SARIMA-improved RS-multistep LSTM was proposed. The seasonal differential autoregressive moving average (SARIMA) model was constructed by determining the parameter combination. The complete set Empirical Mode decomposition (CEEMDAN), improved random search (RS) algorithm and multistep short term memory network (LSTM) were introduced to construct an improved RS-Multistep LSTM model. The optimal weighted combination of SARIMA model and improved RS multistep LSTM model was used to obtain a combined prediction model. Using a certain model of agricultural machinery equipment as an example for verification. The results have showed that the proposed method can effectively predict the time series of the demand for agricultural machinery equipment, the evaluation indicators MSE, MAE and R2 are 225.45, 13.22 and 0.920 9 respectively.
Keywords: agricultural machinery equipment; demand prediction; seasonal; multistep LSTM; mode decomposition
0 引言
作為農業生產的關鍵性投入要素,農機裝備是現代農業發展的重要支撐。隨著我國農業發展方向和農業生產方式轉型,農機裝備需求也變得多樣化。為了及時滿足市場需求,農機企業如何準確預測農機裝備需求變得至關重要,并將成為企業合理安排生產的依據。
預測模型構建是準確預測農機裝備需求的關鍵環節,常用的需求預測模型主要包括:回歸分析預測模型[1],建立回歸方程進行預測;機器學習預測模型[2, 3],通過對歷史數據的學習,自動發現數據中的規律和模式,做出預測;深度學習預測模型[4],用于處理復雜的時間序列數據,通過從原始數據中學習并提取有用的特征進行預測。
眾多學者對此進行大量的研究,取得了豐碩的研究成果。武慧榮等[5]構建GM(1,1)-MLP神經網絡模型進行糧食產量預測。崔凱等[6]提出了基于Group-BiLSTM-LightGBM的集成預測方法。王海程等[7]研究構建TCG-ODE模型對不同區域間的出租車需求量進行精準預測。黃國興等[8]研究隨機森林回歸模型用于對艦船零部件備件的需求預測。付維方等[9]提出自適應預測框架,實現不同航材需求的多預測決策及同一航材多階段的動態預測。張舜等[10]提出PCA-SVR方法對農機備件需求進行預測。李瓊等[11]考慮歷史需求數據在時間序列上的相鄰關聯性,研究GRU-BP組合神經網絡模型預測未來一段時間內的產品需求量。Chen等[12]針對通用飛機材料需求,建立PSO-BP神經網絡預測模型。
農機裝備需求受多種因素的影響,需求數據呈現周期性、非線性等特點,增加了預測的難度。傳統的預測方法無法有效地捕捉和反饋外界影響因素,在處理具有非線性數據時效果有限。SARIMA模型[13]具有統計性質,有較好的穩定性,能夠捕捉時間序列中的季節性和趨勢性規律。改進RS-多步LSTM模型[14, 15]具有動態適應性,學習能力較強,可以綜合考慮多個影響因素對農機裝備需求的影響,在處理長期依賴關系和非線性關系時表現出色。基于此,通過構建SARIMA-改進RS-多步LSTM組合模型,利用SARIMA模型的穩定性來約束改進RS-多步LSTM模型的動態行為,避免出現過度擬合或數據過適應的問題,以提高農機裝備需求預測的準確性。
1 農機裝備需求影響因素辨識
馮建英等[16]通過研究發現影響農戶購買農機的因素主要有受教育水平、家庭收入、政策因素等。陳旭等[17]構建向后逐步回歸模型,對農機需求特征及影響因素進行研究,發現農戶人均純收入、農業勞動力等對農機需求的影響統計上顯著。張標等[18]研究發現家庭年收入、農業收入占比、示范戶等因素對農戶購買農機具有顯著影響。參考現有研究成果,結合數據可得,提煉出主要農作物價格、燃料價格、第一產業從業人員數量、農村居民人均可支配收入4個影響因素預測農機裝備需求。其中,主要農作物價格和燃料價格取上月月初和月末的平均價格。第一產業從業人員數量為每年年末統計數據,農村居民人均可支配收入為每年季度統計數據,均采用線性插值法充填為月度數據。數據來源為國家統計局、農機360網、國家糧食和物資儲備局、上海石油天然氣交易中心。
2 基于SARIMA-改進RS-多步LSTM的組合模型構建
2.1 SARIMA模型構建
SARIMA(p,d,q)(P,D,Q,s)模型適用于具有季節性時間序列的建模和預測。構建SARIMA模型核心在于相關參數(p,d,q)(P,D,Q,s)的確定,這些參數決定了模型的預測性能。(1)對農機裝備需求原始數據進行時序分解,將數據分解為趨勢、季節性和殘差3個部分。(2)通過季節性曲線確定參數s。(3)通過趨勢曲線判斷原始數據是否需要差分,通過判斷差分次數確定參數d。(4)通過自相關圖(ACF)和偏自相關圖(PACF)確定參數p和參數q。(5)通過構建嵌套循環算法,確定參數P、D、Q。遍歷p,d,q和P,D,Q,s中所有可能的參數組合,輸出不同參數組合下的AIC值(赤池信息量準則)[19],比較AIC值,選擇最小AIC值對應的組合作為模型的參數,構建SARIMA模型。
2.2 改進RS-多步LSTM模型構建
2.2.1 CEEMDAN處理
農機裝備需求數據包含周期性和非線性特性。CEEMDAN作為一種非線性信號處理方法,能夠有效地分解復雜信號,提取數據中的固有模式和特征[20]。本文引入CEEMDAN對需求數據進行處理。
CEEMDAN添加自適應白噪聲序列
Hi(t)=H(t)+α×ω(t) (1)
式中:H(t)——原始時間序列;
Hi(t)——添加噪聲信號;
α——信噪比系數;
ω(t)——服從正態分布的白噪聲序列。
對H(t)進行經驗模態分解得到各個樣本的一階模態分量IMF1(t)和余項r1(t),對余項不斷分解得到各階的IMF(t)分量和余項r(t)。最終原始時間序列數據由一系列IMF(t)分量和余項r(t)構成。
對農機裝備需求、SARIMA殘差和影響因素等數據進行CEEMDAN處理,每組數據經過分解得到Kn個模態分量(IMF)和殘差(res)。其中,數據組數量為M,所有分解的IMF和res構成矩陣X(t)。
提取具有周期性的IMF,與res合并為矩陣X′(t),作為預測模型的輸入端。
2.2.2 改進RS-多步LSTM模型
構建改進RS-多步LSTM模型進行未來多個時間步的預測。多步LSTM預測是將t時刻前d個歷史數據處理后的特征成分作為輸入,在一次預測中輸出L個農機裝備需求預測值。輸入序列為[xt-d+1,…,xt-1,xt],輸出序列[Yt+1,…,Yt+L]為未來多個時間步的預測值。隨著預測窗口向右平移,每次預測輸出未來L個農機裝備需求預測值,如圖1所示。多步LSTM模型的結構包括輸入層、隱藏層和輸出層,如圖2所示。
輸入門
it=σ(Wixt+Wiht-1+bi) (4)
遺忘門
ft=σ(Wfxt+Wfht-1+bf) (5)
輸出門
ot=σ(Woxt+Woht-1+bo) (6)
細胞狀態
ct=ft·ct-1+it·tanh(Wcxt+Wcht-1+bc) (7)
輸出
ht=ot·tanh(ct) (8)
式中:xt——t時刻輸入向量;
ht——t時刻輸出向量;
ct——LSTM模型在t時刻的細胞狀態;
Wi、Wf、Wo、Wc——輸入門、遺忘門、輸出門、候選單元的權重矩陣;
b——偏置項。
超參數[21]是用來控制模型學習過程的參數,對模型的性能有重要影響。為了確定多步LSTM模型最優超參數組合,引入改進RS進行超參數優化。
1) 設定一個超參數空間H,每個超參數hi取值[ai,bi],參數空間可以表示為式(9)。
H={hi|ai≤hi≤bi,i=1,2,…,n} (9)
2) 從超參數空間H中隨機抽樣,得到超參數組合
Hr=(h1,h2,…,hn) (10)
使用Hr訓練LSTM模型并評估性能Pr。
Pr=Evaluate(Hr) (11)
選擇性能最好的超參數為當前最優超參數
hbest=argminh∈HPr(h) (12)
3) 進行算法改進,圍繞當前最優超參數,定義一個新的超參數空間Hnew。從Hnew中隨機抽樣得到新的超參數組合hiter。
hiter=(h1′,h2′,…,hn′) (13)
hi′~Uniform(ai′,bi′) (14)
使用hiter訓練LSTM模型并評估性能,得到新的性能指標Piter。
Piter=Evaluate(hiter) (15)
如果Piter比之前的性能指標更好,更新hbest。
hbest=argminh∈HPiter(hi′) (16)
4)
重復運行上述步驟,直到達到設定的迭代次數。
2.3 基于最優加權的組合預測模型構建
在SARIMA模型和改進RS-多步LSTM模型的基礎上,采用最優加權組合算法構建組合預測模型。
1) 構建偏差矩陣。
式中:N——農機裝備需求采樣數據總數;
e1t、e2t——
SARIMA模型和改進RS-多步LSTM模型在t個采樣數據預測值與真實值的誤差。
2) 確定最優權重。
使R=[1,1]T,通過拉格朗日乘子法求解最優權重
[w1 w2]T=E-1R/RTE-1R (18)
s.t.{RT[w1 w2]T=1
w1+w2=1 (19)
式中:w1、w2——SARIMA模型和改進RS-多步LSTM模型的權重系數。
3) 組合預測模型。模型組合后的農機裝備需求計算公式為
Y=w1y1t+ w2y2t (20)
綜上,SARIMA-改進RS-多步LSTM組合模型流程如圖3所示。
2.4 預測模型評估
為評價組合模型的性能,本文選取均方誤差MSE、平均絕對誤差MAE、決定系數R2作為評價指標。
MSE=1/n∑n/i=1(yi-?i)2 (21)
MAE=1/n∑n/i=1|yi-?i| (22)
R2=1-∑n/i=1(yi-?i)2/∑n/i=1(yi-yi-)2 (23)
式中:n——觀測值的數量;
yi——第i個觀測值的實際值;
?i——第i個觀測值的預測值;
yi-——觀測值的平均值。
3 實例驗證
以LX1504型號農機裝備60個月月度需求為時間序列樣本(數據來源于農機360網)。以月度主要農作物價格、燃料價格、第一產業從業人員數量、農村居民人均可支配收入為影響因素時間序列樣本。
3.1 SARIMA參數選擇
繪制時間序列數據的歷史需求數據曲線,對時間序列進行時序分解,如圖4所示,將原始時間序列分解為趨勢、季節性和殘差三個部分。圖4(b)曲線呈增長趨勢,說明原始時間序列不具有平穩性,需要進行差分處理。圖4(c)曲線呈現規則波動,說明原始時間序列季節性顯著,依據曲線波動情況,確定參數s為12。對圖4(a)原始時間序列進行一階差分得到平穩序列,確定參數d為1。繪制序列自相關圖(ACF)和偏自相關圖(PACF)判斷參數階數,如圖5所示。
由圖5可知,ACF,PACF近似一階截尾,參數p和q分別可以取值0或1。使用兩個嵌套循環遍歷p,d,q和P,D,Q,s中的參數組合,得出不同參數組合下模型的AIC值,如表1所示。(1,1,1)(1,1,1,12)組合對應的AIC值最小,選擇該組合作為SARIMA模型的參數組合,構建模型進行預測。
3.2 改進RS-多步LSTM模型構建
1) 數據CEEMDAN處理結果及分析。對農機裝備需求、SARIMA殘差和主要農作物價格、燃料價格、第一產業從業人員數量、農村居民人均可支配收入4個影響因素數據進行CEEMDAN處理,結果如圖6、圖7所示。各組原始數據被分解成若干個不同頻率和波動的IMF和一個res項,分解后的序列顯示各個序列的復雜性逐漸降低,表明算法成功地分離出了信號中不同尺度和頻率的成分。
圖6、圖7中,農機裝備需求量、SARIMA殘差、主要農作物價格、燃料價格、農村居民人均可支配收入分解結果具有相似性,IMF2、IMF3、IMF4表現出較規則的波動,反映了原始數據的周期特性。res項反映了原始數據的長期趨勢為上升趨勢。
第一產業從業人員數量原始曲線存在微小波動。分解后,IMF2、IMF4呈現出較規則的波動,反映了原始數據的周期特性。res項和原始曲線高度相同,反映了原始數據的趨勢。
將以上具有周期性的IMF及res集成為一個輸入矩陣,作為預測模型的輸入端。
2)改進RS超參數優化。設置多步LSTM的隱藏單元數量、dropout比例、學習率、LSTM層數、是否返回每個時間步的輸出以及是否保存每個時間步的狀態等超參數組合為優化對象。對優化前后的模型損失率進行比較分析,如圖8所示。由圖8可知,改進RS-多步LSTM模型相比未進行優化的平均多步LSTM模型,模型的損失率更低,表示模型預測性能更好。
3.3 預測結果分析及評價
基于SARIMA-改進RS-多步LSTM組合模型進行預測,驗證模型的有效性。圖9為各預測模型預測結果,表2為預測模型效果評價。
由表2可知,SARIMA-改進RS-多步LSTM組合模型的MSE、MAE均小于其他4種模型,決定系數R2大于其他4種模型,達0.920 9。表明對于受季節性、多因素影響的農機裝備需求預測問題,本文構建的組合模型能夠提供更加可靠、準確的預測結果,證明了SARIMA-改進RS-多步LSTM組合模型的可靠性和有效性。
4 結論
構建SARIMA-改進RS-多步LSTM組合模型,對周期性、非線性的某農機裝備制造商LX1504型號農機裝備需求時間序列進行預測。
1) 引入CEEMDAN對數據特征信息進行分解和提取,經CEEMDAN處理后多步LSTM模型的MSE、MAE分別降低15.35%和4.29%,R2由0.828 4增加到0.854 7,預測精度提高3.17%,降低數據非平穩性對預測結果的影響。
2) 設計改進RS算法對多步LSTM模型超參數進行優化,降低模型的損失率。改進RS算法對多步LSTM超參數優化后,MSE、MAE分別降低21.00%和10.03%,R2由0.854 7增加到0.885 2,預測精度提高3.57%。
3) 基于最優加權組合,構建組合預測模型。相比單一SARIMA模型和改進RS-多步LSTM模型,組合模型的MSE、MAE分別降低59.37%、31.06%和32.14%、12.28,R2分別由0.805 3和0.885 2增加到0.920 9,預測精度分別提高14.35%和4.03%。
4) 綜上,SARIMA-改進RS-多步LSTM組合模型相比其他模型MSE、MAE指標均小于其他4種模型,在預測準確性和誤差控制方面表現更好,決定系數R2大于其他4種模型,達0.920 9,有更高的預測精度,能夠更好地擬合數據并反映原始數據的特征,驗證本文所提方法的有效性,能為農機企業的農機裝備需求預測提供參考。
參 考 文 獻
[1] 何登旭, 李艷芳, 劉向虎, 等. 基于泛函網絡的非線性回歸預測模型及學習算法[J]. 計算機工程與應用, 2008, 44(24): 74-77.
He Dengxu, Li Yanfang, Liu Xianghu, et al. Non-linear regression forecast model based on functional networks and learning algorithm [J]. Computer Engineering and Applications, 2008, 44(24): 74-77.
[2] 李之紅, 申天宇, 文琰杰, 等. 基于混合機器學習框架的網約車訂單需求預測與異常點識別[J]. 交通信息與安全, 2023, 41(3): 157-165, 174.
Li Zhihong, Shen Tianyu, Wen Yanjie, et al. Order demand prediction and anomaly-point identification for online car-hailing orders based on hybrid machine learning framework [J]. Journal of Transport Information and Safety, 2023, 41(3): 157-165, 174.
[3] Maulud D, Abdulazeez A M. A review on linear regression comprehensive in machine learning [J]. Journal of Applied Science and Technology Trends, 2020, 1(4): 140-147.
[4] 吳庚奇, 牛東曉, 耿世平, 等. 多價值鏈視角下基于深度學習算法的制造企業產品需求預測[J]. 科學技術與工程, 2021, 21(31): 13413-13420.
Wu Gengqi, Niu Dongxiao, Geng Shiping, et al. Product demand forecasting of manufacturing enterprises based on deep learning algorithm from the perspective of multi-value chains [J]. Science Technology and Engineering, 2021, 21(31): 13413-13420.
[5] 武慧榮, 陳少陽, 崔淑華. 基于GM(1,1)-MLP神經網絡模型的大宗貨物運輸需求預測[J]. 公路交通科技, 2023, 40(10): 233-240.
Wu Huirong, Chen Shaoyang, Cui Shuhua. Transportation demand forecast of bulk cargo based on GM(1,1)-MLP neural network model [J]. Journal of Highway and Transportation Research and Development, 2023, 40(10): 233-240.
[6] 崔凱, 郭宇, 錢偉偉, 等. 基于Group-BiLSTM-LightGBM的物料配送需求量預測[J]. 組合機床與自動化加工術, 2022(8): 164-168.
Cui Kai, Guo Yu, Qian Weiwei, et al. Material distribution demand forecasting method based on Group-BiLSTM-LightGBM [J]. Modular Machine Tool amp; Automatic Manufacturing Technique, 2022(8): 164-168.
[7] 王海程, 馬紀穎, 張苑媛, 等. 融合時序關聯動態圖與常微分方程的區域間出租車需求預測[J]. 計算機應用研究, 2024, 41(3): 794-798, 860.
Wang Haicheng, Ma Jiying, Zhang Yuanyuan, et al. Inter-regional taxi demand forecasting based on time series correlation dynamic graph and ordinary differential equation [J]. Application Research of Computers, 2024, 41(3): 794-798, 860.
[8] 黃國興, 曹先懷, 錢曉飛. 一種基于隨機森林的備件預測模型研究[J]. 運籌與管理, 2021, 30(10): 165-168.
Huang Guoxing, Cao Xianhuai, Qian Xiaofei. Research on spare parts prediction model based on random forest [J]. Operations Research and Management Science, 2021, 30(10): 165-168.
[9] 付維方, 穆彩虹, 劉英杰. 基于機器學習方法的航空消耗件需求自適應預測[J]. 科學技術與工程, 2022, 22(11): 4609-4617.
Fu Weifang, Mu Caihong, Liu Yingjie. Adaptive demand prediction of aviation consumable spare parts based on machine learning method [J]. Science Technology and Engineering, 2022, 22(11): 4609-4617.
[10] 張舜, 楊欣, 魏津瑜. 基于預防性維修的農機備件需求預測問題研究[J]. 中國農機化學報, 2020, 41(6): 225-230.
Zhang Shun, Yang Xin, Wei Jinyu. Research on forecasting of agricultural machinery spare parts demand based on preventive maintenance [J]. Journal of Chinese Agricultural Mechanization, 2020, 41(6): 225-230.
[11] 李瓊, 陳佳, 徐斌. 多產品相互制約條件下的制造業產品需求預測研究[J]. 計算機應用與軟件, 2021, 38(3): 59-69.
Li Qiong, Chen Jia, Xu Bin. Demand forecasting of manufacturing products under the condition of multi product mutual restriction [J]. Computer Applications and Software, 2021, 38(3): 59-69.
[12] Chen X, Wang T, Liang W. General aircraft material demand forecast based on PSO-BP neural network [J]. International Journal of Control and Automation, 2016, 9(5): 407-418.
[13] 李潔, 彭其淵, 楊宇翔. 基于SARIMA模型的廣珠城際鐵路客流量預測[J]. 西南交通大學學報, 2020, 55(1): 41-51.
LiJie, Peng Qiyuan, Yang Yuxiang. Passenger flow prediction for Guangzhou-Zhuhai intercity railway based on SARIMA model [J]. Journal of Southwest Jiaotong University, 2020, 55(1): 41-51.
[14] Hochreiter S, Schmidhuber J. Long short-term memory [J].Neural Computation, 1997, 9(8): 1735-1780.
[15] Yu Y, Si X, Hu C, et al. A review of recurrent neural networks: LSTM cells and network architectures [J]. Neural Computation, 2019, 31(7): 1235-1270.
[16] 馮建英, 穆維松, 張領先, 等. 基于消費者購買意愿的農機市場需求分析[J]. 商業研究, 2008(2): 191-194.
Feng Jianying, Mu Weisong, Zhang Lingxian, et al. An empirical study on consumers’ purchase intention in agricultural machinery Market [J]. Commercial Research, 2008(2): 191-194.
[17] 陳旭, 楊印生, 魏思琳. 基于向后逐步回歸模型的我國農機需求特征及影響因素研究[J]. 數理統計與管理, 2017, 36(5): 774-782.
Chen Xu, Yang Yinsheng, Wei Silin. A study on characteristics and influencing factors of agricultural machinery demand in China based on backward stepwise regression model [J]. Journal of Applied Statistics and Management, 2017, 36(5): 774-782.
[18] 張標, 張領先, 傅澤田, 等. 農戶農機需求及購買行為分析——基于18省的微觀調查數據實證[J]. 中國農業大學學報, 2017, 22(11): 208-223.
Zhang Biao, Zhang Lingxian, Fu Zetian, et al. Analysis on farmers’ requirements for agricultural machinery and purchasing behavior: Based on the survey data of 18 provinces [J]. Journal of China Agricultural University, 2017, 22(11): 208-223.
[19] Kuiper R. AIC-type theory-based model selection for structural equation models [J]. Structural Equation Modeling, 2022, 29(1): 151-158.
[20] Torres M E, Colominas M A, Schlotthauer G, et al. A complete ensemble empirical mode decomposition with adaptive noise [C]. Proceedings of 2011 IEEE International Conference on Acoustics, Speech and Signal Processing, IEEE, 2011: 4144-4147.
[21] 韓惠, 于巧, 祝義. 超參數優化對跨版本缺陷預測影響的實證研究[J]. 計算機科學與探索, 2023, 17(12):3052-3064.
Han Hui, Yu Qiao, Zhu Yi. Impact of hyperparameter optimization on cross-version defect prediction: An empirical study [J]. Journal of Frontiers of Computer Science and Technology, 2023, 17(12): 3052-3064.