經對比分析,XGBooSt在捕捉非線性關系和應對復雜數據方面更具優勢。
用燃料油逐漸成為市場需求的焦點。舟山作為我國主要的船燃供應中心,其低硫船燃價格波動對航運經濟、能源市場和決策具有重要影響。因此,準確預測舟山低硫船燃的短期價格具有顯著的實際意義。
傳統時間序列模型如ARIMA×在長周期、平穩數據預測中表現良好,但在短期時間序列中,尤其面對復雜的非線性價格波動時,其預測效果存在局限性。近年來,機器學習模型如XGBoost憑借對非線性關系建模的優勢,為短期時間序列預測提供了新的解決方案。本文研究對比了ARIMAX與XGBoost兩種模型在舟山低硫船燃價格預測中的應用。結果表明,XGBoost在捕捉非線性關系和應對復雜數據方面具有優勢,而ARIMAX在解釋性和處理平穩時間序列方面更具優勢。

兩種模型特征進行比較
本文分別對ARIMAX與XGBoost的優勢與局限進行了對比分析,為后續模型選擇與優化提供理論依據和實證支持。
ARIMAX的主要優勢如下:一是只需要較少變量作為載體,即能夠依據歷史數據建模,較少依賴其他變量。二是其適用于趨勢分析,無論線性還是非線性,ARIMAX能夠有效差分數據后建模,對于分析及預測變化特征具有良好優勢。三是其擁有良好的模型檢測能力,能夠識別殘差自相關性,有利于識別和檢測異常結果。盡管ARIMAX在時間序列分析領域有著廣泛的應用,但存在著明顯的局限性。比如面臨高度復雜的時間序列或非線性序列難以捕捉時間序列中的隱含特征,操作層面需要手動調整多個參數,人工風險較大等。
XGBoost的主要優勢如下:一是非線性建模能力強,能夠捕捉時間序列中的非線性信息及特征,提高了模型的精準度和使用范圍。二是能夠識別處理數據中的缺失值,使得在數據不完整時能夠選擇最優擬合。三是能自動識別與評估各變量的重要性并高效篩選出有用的特征,減少了人工處理,使得預測工程更精準與自動化。四是采用并行化計算技術,能夠即時接受最新的數據,并快速更新到模型中,無須從頭訓練模型,極大地提高了模型訓練效率。五是正則化機制能夠自動處理并適應噪聲大的數據,控制擬合程度,魯棒性強,抗噪性高。六是對于非平穩時間序列預測具有更高強適用性。盡管在短期預測中表現優異,但XGBoost也具有一些不足:比如使用模型的成本更高,計算機性能等硬件要求較高、預測結果不能直接解釋變量間的關系等。

總之,在短期時間序列預測中,XGBoost憑借其非線性建模能力、對數據缺失與噪聲的適應性、特征選擇的自動化及快速高效的模型訓練過程,相較于ARIMAX表現出顯著優勢,并成為廣泛使用的理想預測模型。
系統評估兩種模型設計思路
研究采用對比匹配的實驗設計,系統評估ARIMAX和XGBoost對舟山低硫船用燃料油價格的預測效果,研究設計思路如下。
在自變量選取上,研究基于船燃市場的價格形成機制,從國際原油價格、進出口量、船運指數、高低硫價差等維度選取關鍵影響因素作為外生變量。在樣本選取上,選取2021年1月至2024年6月這一政策環境相對穩定、市場波動平緩的時段作為樣本區間。在模型構建上,確保ARIMAX和XGBoost在一致的環境下進行預測。
為全面探究舟山低硫船燃價格的影響因素,在實際市場機制分析的基礎上,研究選取包括能源價格、宏觀經濟、航運供需、區域市場結構以及季節性因素等多個維度的自變量,并對所選變量與舟山低硫船燃價格之間的關系進行了統計顯著性檢驗。檢驗結果顯示,所有自變量均通過顯著性檢驗,表明其對舟山低硫船燃價格存在顯著影響,具備納入后續建模分析的合理性與必要性。
XGBoost模型更適用于價格短期預測
本文通過構建ARIMAX和XGBoost兩種模型,探究其在舟山低硫船燃價格的短期預測中的表現和特性。研究采用了特征選擇、樣本匹配和模型訓練等步驟進行建模,并對比兩種模型的預測精度與誤差。
為評估ARIMAX與XGBoost模型的預測能力,研究以2021年1月至2023年12月的數據作為訓練集,構建包含外生變量的預測模型,并預測2024年1月至2024年6月的舟山低硫船燃價格。將預測價格與實際舟山低硫船燃價格進行對比,計算各期的絕對誤差(AE)和絕對百分比誤差(PE)(如表所示)。
從預測結果來看,ARIMAX在部分月份預測誤差較小,如第2024年2月的預測結果的百分比誤差僅為 1.00% 表現出一定的趨勢跟蹤能力。但在部分月份,如2024年1月和6月,模型出現明顯高估情況,百分比誤差分別達到了 8.75% 和 16.20% ,表明對局部波動的響應相對滯后。XGBoost模型預測表現相對穩定,除2024年1月外,各月份預測的絕對百分比誤差均低于 5% ,說明XGBoost作為一個非線性模型,對常規波動趨勢具有良好的擬合能力。
從整體模型表現來看,XGBoost的平均絕對百分比誤差(MAPE)為 2.78% ,低于ARIMAX的平均絕對百分比誤差 6.74% ,且XGBoost的均方根誤差(RMSE)為22.21,低于ARIMAX均方根誤差49.75,說明XGBoost整體預測誤差更小,擬合效果更好,在控制大幅偏離值方面具有顯著優勢。
綜上所述,兩種模型對于舟山低硫船燃價格均展現出一定的預測能力。XGBoost模型憑借其非線性擬合優勢,在整體誤差控制和趨勢跟蹤方面表現更為優越,更適用于舟山低硫船燃價格的短期預測。