丁紅翔
(云南省水文水資源局 普洱分局,云南 普洱 665000)
河流量的變化是一個水文過程,它直接影響一個地區的環境、生態、生物和氣候特征,并最終影響人類的生產和生活[1-2]。河流量的準確預測是水資源規劃和優化管理的重要內容。隨著社會經濟的發展,生產和生活用水量均逐年增加,水資源優化管理的重要性和必要性也逐漸顯露。因此,可靠的河流量預測方法對于規劃合理利用水資源至關重要。
大多數預報技術是一種模擬河流系統自然和物理狀態的方法。近幾十年來,研究人員在預測河流流量時,研究了多種類型的模型,這些模型通常可分為兩大類,即概念模型和數據驅動模型[3-5]。概念模型需要對影響現象的物理過程有完整的數據和全面的認識,這實際上是非常困難的,而且會給模擬帶來較大的誤差。因此,在實際工作中更傾向于使用數據驅動模型。數據驅動模型僅通過記錄水文氣象變量的數值數據進行模擬,不需要調查和評估各階段控制河流量的物理過程[1, 6]。
研究表明,地表河流的流量往往受到降雨量和蒸發量的顯著影響[7-9]。因此,本文嘗試提出降雨量和蒸發量輔助ARIMA模型,對云南瀾滄江水系靛坑河的月平均流量進行時間序列研究,提升對河流量的預測精度,為水資源的優化管理和利用提供借鑒。
簡單指數平滑法(Simple exponential smoothing,SES)是一種簡單易用的時間序列預測方法,它對于短期內的數據波動有較好的捕捉能力,同時又保留了對長期趨勢的捕捉能力[10]。在簡單指數平滑法中,定義一個平滑因子α,來控制對過去數據的加權程度。對于每個時刻t,可用如下公式計算預測值:
Ft+1=αAt+(1-α)Ft-1
(1)
式中:Ft+1為預測值;α為平滑因子,參數值在0~1之間;At為實際數據;Ft-1為前一個時間段的預測值。
由此可以看出,預測值是先驗值或觀測值的加權平均值,其權重與收集數據的時間成反比。因此,越接近當期時間的數據,對該模型預測結果影響越為顯著。
差分整合移動平均自回歸(Autoregressive integrated moving average,ARIMA)模型是時間序列預測分析的方法之一。ARIMA(p,d,q)是將自回歸模型、移動平均模型和差分法結合,其公式定義為:
(2)
式中:Yi為當前值;μ為常數項;εi為誤差;p、q分別為自回歸模型與移動平均模型的階數;αi、βi分別為兩個模型的相關系數。
通過數據變換,可將一些外部信息作為所研究變量的參考變量。降雨和蒸發過程對地表水體具有顯著的影響,數據表現出一定的內部相關性。因此,將歷年降雨量和蒸發量引入ARIMA模型,提出PEARIMA模型,以提高河流量分析和預測準確性,是一種可預期的有效途徑。
簡單指數平滑模型和ARIMA模型計算均使用SPSS 26軟件實現。為了直觀顯示模型對數值的描述性,采用均方根誤差(RMSE)、平均絕對誤差(MAE)和平均絕對百分比誤差(MAPE)等3種預測誤差度量進行模型評估和比較。公式如下:

(3)
(4)
(5)
云南瀾滄江水系靛坑河2009年1月至2021年12月期間逐月河流量、周邊降雨量和蒸發量等歷史觀測數據見圖1。由圖1可知,河流量年際變化表現出一定的規律性,尤其呈現出具有周期性的季節變化。此外,河流量峰值通常滯后于降雨量和蒸發量,表明河流量與降雨量和蒸發量呈現出一定的內在聯系。需要注意的是,2019-2020年間河流量的驟降,使數據表現出較為強烈的不確定性,這可能會增加時間序列預測的難度。

圖1 靛坑河歷年月平均流量、降雨量和蒸發量趨勢圖
為了驗證PEARIMA在預測靛坑河歷年月平均流量的有效性,對比SES與傳統ARIMA方法的預測結果,見圖2和表1。

表1 擬合結果統計表

圖2 靛坑河歷年月平均流量分析
SES方法擬合結果顯示,RMSE、MAPE和MAE分別為4.9、32.2和3.1,對靛坑河歷年月平均流量的總體擬合程度較好,但對于2019-2020年期間發生的流量驟減現場擬合度欠佳,見圖2(a)。
傳統ARIMA的擬合結果顯示,RMSE、MAPE和MAE分別為5.2、27.5和3.0。其中,2019-2020年期間實測數據和ARIMA擬合數據對比顯示擬合精度有所提高,見圖2(b)。ARIMA模型具有一定跟蹤能力,不僅考慮到過去值對研究變量的影響,還考慮到隨機誤差項的影響,因此ARIMA模型總體預測結果優于SES。但該模型對2016-2017年期間數據的擬合明顯欠佳,這可能是受到前期數年的河流量遞增趨勢的干擾。
PEARIMA模型擬合結果顯示,RMSE、MAPE和MAE均明顯降低,分別為3.7、24.4和2.4。2016-2017年期間數據擬合度相對ARIMA有所提升,擬合數據更為合理。此外,發生河流量驟減現象的2019-2020年數據的擬合度也顯著提升。因此,總體上PEARIMA表現出更好的預測性能。
本文提出結合歷年月平均降雨量和蒸發量數據輔助ARIMA模型,對靛坑河歷年月平均流量的時間序列進行預測。結果顯示,傳統ARIMA模型對靛坑河歷年月平均流量的回歸擬合精度總體優于SES,但容易受到前期數據趨勢性的影響,降低了部分預測精度。而各項評價指標顯示,PEARIMA模型的回歸擬合精度均優于SES與ARIMA模型,表現出令人滿意的擬合結果。因此,結合歷年月平均降雨量和蒸發量數據的PEARIMA模型,可用于河流量分析和預測工作。