摘要:為提升小批量物料生產預測的精確性,文章構建并比較了三種主流時間序列預測模型:ARIMA、Prophet與LSTM。研究基于2019年1月—2022年5月的真實物料需求數據,對三種模型的預測性能進行了實證評估。結果表明:在所選數據集上,LSTM模型在均方根誤差(RMSE=1.495) 上表現最佳,展現了其對復雜非線性模式的強大捕捉能力,但模型訓練與調參成本較高。ARIMA模型(RMSE=1.503) 的預測精度緊隨其后,且模型構建相對高效,展現了統計學模型的穩健性。Prophet模型雖然易于實現,但在本次預測任務中表現最差。研究結論為不同業務場景下的物料需求預測提供了模型選擇依據。
關鍵詞:物料需求量;ARIMA模型;Prophet模型;LSTM模型;預測性能;時間序列預測;比較研究
中圖分類號:TP311" " " 文獻標識碼:A
文章編號:1009-3044(2025)28-0084-04
開放科學(資源服務) 標識碼(OSID)
0 引言
企業的主要目標是通過調整缺貨量和庫存量來降低庫存成本,以使企業利潤最大化。為實現這一目標,持續更新和預測銷售量[1],調整庫存量和生產量對企業至關重要。另一方面,動態規劃物料生產可以通過釋放人力資源來顯著提升生產力,從而將其分配到更具創造性和非重復性的任務中。這還能提高員工士氣和投入度,加快目標實現速度,并通過最小化人為錯誤提高準確性。
因此,本文旨在系統性地比較三種代表性時序預測模型[2]——經典的統計模型ARIMA、Facebook開源的Prophet模型[3]以及深度學習模型LSTM[4]——在真實物料需求預測任務中的表現。通過實證分析,本文將評估各模型的預測精度與應用成本,以期為企業在不同場景下選擇合適的預測工具提供科學依據。
1 數據獲取與預處理
本文所使用的數據來源于2022年高教社杯全國大學生數學建模競賽(https://www.mcm.edu.cn/html_cn/node/388239ded4b057d37b7b8e51e33fe903.html) ,選取2019年1月—2022年5月共2 000余種物料以周為單位的需求量時間序列數據,并從中篩選出6種重點關注物料,利用歷史數據對預測模型進行評價對比。
基于Python 3.6版本的Jupyter Notebook環境設計程序,對附件中的歷史數據進行分析,根據數據中的物料編碼列,統計出共計284種物料在各時間點上需求出現的頻數,并根據結果選擇了6種重點關注物料,如表1所示。
2 研究方法
2.1 ARIMA模型
ARIMA(Autoregressive Integrated Moving Average) 模型[5]是一種經典的時間序列預測方法,由Box和Jenkins在20世紀70年代提出。ARIMA(p,d,q)建模框架通過協同運作自回歸過程(AR,階次p) 、差分變換(I,階次d) 和移動平均過程(MA,階次q) 3個關鍵機制,有效解決了非平穩時間序列的預測難題。其核心優勢在于將序列平穩化處理(I) 與動態模式捕捉(AR/MA) 有機結合。ARIMA(p,d,q)的一般形式為:
[(1-?iBi)(1-B)dXt=c+(1+θiBi)εt]" "(1)
式中:[?i]為自回歸系數,[εt]為白噪聲,[θi]為移動平均系數,B為后移算子。
在ARIMA建模前,需要對時間序列數據進行平穩性檢驗,此處使用kpss()函數進行KPSS檢驗[6],原假設H?為所檢驗的序列是平穩的。具體結果如表2所示。
從輸出的檢驗結果對比表可以看出,序列X?的檢驗p值小于0.05,拒絕數據序列平穩的原假設,認為該列數據是非平穩序列。一階差分后的檢驗p值為0.1,大于0.05,則接受原假設,即序列X?一階差分后為平穩數據,使用KPSS檢驗對序列X?的參數d取值進行預測,d=1。ARIMA(p,d,q)模型中的參數p和q的定階過程可以通過網格搜索算法計算所有可能模型的AIC(Akaike Information Criterion,赤池信息準則) ,根據計算出的AIC值最小的模型作為識別依據,確定最佳模型,其結果如圖1所示。
從圖1可以看出,AIC數值最小時ARIMA最佳模型為ARIMA(2,1,2)。對模型殘差進行檢驗,其模型預測殘差分析圖見圖2。
據Q-Q圖可以看出,殘差檢驗圖基本符合正態分布,且相互獨立,為白噪聲序列,模型擬合有效。說明模型ARIMA(2,1,2)參數選擇合理。
2.2 Prophet模型
Prophet[6]為Facebook Inc.提供的支持Python和R的開源工具。基礎模型將時間序列分解為3個部分:增長(或趨勢) g(t)、季節性趨勢s(t)和節假日h(t),因此時間序列可以分解為:
[y(t)=g(t)+s(t)+h(t)+εt]" " " " (2)
式中:[εt]表示模型未考慮的變異,假設其服從正態分布。Prophet模型可視為加法模式。在此框架下,預測被表述為曲線擬合任務,時間作為唯一回歸變量,因此模型是單變量的。本研究采用的趨勢函數為分段線性函數,使用Laplace先驗進行稀疏約束。
2.3 LSTM模型
LSTM(長短期記憶網絡) [7]本質上是RNN[8]的改良架構,其核心價值在于通過門控單元設計,顯著緩解了傳統循環神經網絡在建模長距離時序依賴時面臨的梯度傳輸失效問題。它在時間序列預測、自然語言處理(NLP) [9]、語音識別等領域表現優異。借助門控機制(包含輸入門、遺忘門、輸出門) 和持續更新的記憶單元(Cell State) ,LSTM網絡能夠建立跨越長時間步的依賴關系模型。其核心結構包括遺忘門、輸入門、記憶單元更新和輸出門,各部分參數包括激活函數、權重矩陣、隱藏狀態等,其結構圖見圖3。
式中:[ht]為當前時刻的隱藏狀態(輸出) 。針對重點物料需求量的預測,在神經網絡模型方面只采用LSTM模型,并與ARIMA模型和Prophet模型進行性能比較。
3 仿真實驗
3.1 模型性能評估指標篩選
建立雙指標評估框架:采用MAE衡量預測偏差絕對值,利用RMSE評估誤差離散程度,以此系統檢驗LSTM和Prophet模型對重點關注物料需求量的預測能力,計算公式詳見式(3) 、式(4) 。
[MAE=1Ni=1Nei=1Ni=1Nyobservedi-ypredictedi]" " (3)
[RMSE=1Ni=1N(yobservedi-ypredictedi)]" " " " " "(4)
符號定義:
[ypredictedi]為三類模型(ARIMA、Prophet、LSTM) 的預測結果;i[?]Z+為預測時域中的日期序號。
3.2 三種模型擬合優度檢驗
ARIMA模型使用Python statsmodels包執行Box-Jenkins方法,通過網格搜索算法確定的ARIMA(p,d,q)最佳模型為ARIMA(2,1,2),選取數據集的前80%為訓練集,20%為測試集。擬合選取的關鍵材料需求數據,該模型的RMSE值為1.503,擬合效果如圖4所示。
Prophet擬合通過fbprophet庫實現Prophet預測框架,參數化配置為:
model = Prophet(interval_width=0.95)
future = model.make_future_dataframe(periods=36, freq='MS')
對重點物料需求時序數據進行模型擬合,計算得均方根誤差RMSE=3.002(式(4)) ,樣本內擬合效果見圖4。可視化結果表明,該模型對歷史數據的擬合軌跡與實際觀測值具有一定的吻合性,表明其具備一定的時序模式捕捉能力。
LSTM模型通過TensorFlow 2.x的Keras API實現,關鍵參數如表3所示。
物料需求序列擬合后,預測集均方根誤差RMSE=1.495(式(4)) ,模型訓練的動態過程見圖4中的點線。
基于圖4的實證分析:訓練集擬合誤差低于閾值(目測MAE<0.8) ,測試集趨勢轉折點匹配度>85%,證實LSTM模型對物料需求時序的預測具有顯著可靠性。
以上三種模型在預測物料需求量數據時,各模型的性能指標MAE和RMSE見表4。
從表4可以看出,對于幾種重點關注物料,使用LSTM的神經網絡實現了較為準確的預測,其MAE和RMSE分別為0.872和1.495,但其訓練和調參所需時間最長、計算成本最高。相比之下,Prophet的表現則不甚理想,但模型調參和數據準備相對較快。ARIMA在準確性和模型選擇與訓練所需時間方面均表現良好。
4 討論
LSTM和ARIMA在該任務中表現優異,可能因為數據隱含的非線性特征與強趨勢性:LSTM通過長短期記憶網絡捕捉復雜時序依賴,而ARIMA的平穩性假設與數據趨勢高度吻合。相反,Prophet對具有明確節假日效應、多周期疊加(如電商銷量數據) 或缺失值較少的數據更有效,其內置的季節性分解與異常點處理機制在結構化時間特征中優勢顯著。若數據強非線性且計算資源充足,LSTM是優選;須平衡解釋性與效率時,ARIMA更普適;Prophet則適合處理含業務規則(如促銷周期) 的標準化數據集。
5 結束語
對小批量物料生產數據的準確預測能夠為微型電商企業物料生產及成本控制提供一定的科學理論指導。為構建物料生產需求預測的理論方法體系,本研究實證檢驗了ARIMA、Prophet與LSTM三種時序模型的適用性。實驗結果表明,ARIMA模型在平均絕對誤差(MAE) 上表現最佳(0.783) ,展現了優良的預測性能(RMSE=1.503) 。預測效能方面ARIMA>LSTM>Prophet,由此可見,經典統計模型在工業需求預測中仍保持競爭優勢。由于本研究僅基于特定數據集和物料種類,未考慮外部變量(如促銷、節假日) 對需求的影響,故結論的普適性有待進一步檢驗。
參考文獻:
[1] MENCULINI L,MARINI A,PROIETTI M,et al.Comparing prophet and deep learning to ARIMA in forecasting wholesale food prices[J].Forecasting,2021,3(3):644-662.
[2] 閆祥祥.使用ARIMA模型預測公園綠地面積[J].計算機科學,2020,47(S2):531-534,556.
[3] 蔡遠航,馮建新,王艷青,等.基于NeuralProphet-LSTM模型的碳價預測研究[J].全球能源互聯網,2025,8(2):239-249.
[4] 侯川川,王歡,關偉,等.基于時序長短期記憶模型的道路路面性能預測[J].浙江大學學報A輯(應用物理與工程)(英文版),2025,26(5):424-438.
[5] 余璽輝,陳堅,喬志坤,等.基于ARIMA模型對集采藥品環孢素口服制劑的科學報量[J].中國現代應用藥學,2025,42(7):1195-1199.
[6] 孫玉林,余本國.Python機器學習算法與實戰[M].北京:電子工業出版社,2021.
[7] 陳永平,王瑾琪,徐曉武,等.基于LSTM模型的風暴增水預報研究[J/OL].河海大學學報(自然科學版),2025:1-16.[2025-06-08]. https://kns.cnki.net/kcms/detail/32.1117.tv.20250527. 1652.012.html.
[8] 田延飛,李知臨,艾萬政,等.基于LSTM-RNN的船舶操縱運動黑箱建模[J].艦船科學技術,2024,46(11):80-84.
[9] 許德龍,林民,王玉榮,等.基于大語言模型的NLP數據增強方法綜述[J].計算機科學與探索,2025,19(6):1395-1413.
【通聯編輯:謝媛媛】