金何春,李 林
(上海理工大學管理學院,上海 200093)
進入二十一世紀來,在醫療衛生體制首輪改革的持續深化進程中,衛生事業得到了大的發展。然而,當前衛生總費用不斷增長,這個問題已成為大部分國家聚焦的問題[1]。近年來,國內有學者開始研究衛生費用,丁海峰[2]、陳嘉琳[3]、王高玲[4]、于菲[5]等人通過構建ARIMA 模型、GM(1,1)模型等時間序列的方法,對衛生總費用變化趨勢和構成進行預測分析,如文獻[5]通過對陜西省個人衛生支出的預測,對陜西省居民疾病經濟負擔的變化趨勢進行了指向性分析,為政府調整政策提供了數據支持。從現有文獻看,有關各個省份的政府衛生支出的研究成果較少,此前,劉芹等[6]構建ARIMA 模型預測了未來六年我國政府衛生支出的變化情況,由于其只用單一模型對我國政府衛生支出進行分析,其結果可能參考性不足。
為了提高預測結果的可參考性,借助多個模型進行對比分析是一種有效的途徑。于是本文以遼寧省為例,基于該省2006-2019年政府衛生支出數據,分別對其建立ARIMA模型和DES模型,對遼寧省未來5年政府衛生支出進行預測。希望經過對所得結果的對比分析,可為遼寧省相關部門優化醫療衛生政策提供較為可靠的參考數據。
ARIMA模型預測精度較高,是發展比較成熟的時間序列預測模型,因此被廣泛應用于衛生總費用、衛生人力資源等衛生領域的預測分析[7]。ARIMA(p,d,q)模型的實質是對原序列進行d 階差分后,把Δdyt作為因變量所建立的ARMA(p,q)模型,其中p為自回歸項,q為移動平均項。
ARIMA模型的一般表達式為:

模型的建模流程:①序列平穩性檢驗及平穩序列白噪聲檢驗。②模型定階與確定最優參數。③模型殘差檢驗。④模型預測效果評估。
DES 模型是借助統計學中經常用于基于時間序列觀察值變化趨勢的指數平滑方法建立的模型,適用于中短期趨勢[8]。指數平滑法分為一次、二次和多次指數平滑法,對于不同變化趨勢的數據,要靈活選取進行指數平滑的次數,數據呈線性趨勢時,宜使用二次指數平滑法[9]。二次指數平滑法是在一次指數平滑的基礎上再進行一次指數平滑的方法,其公式為:其中為第t周期的一次指數平滑值為第t周期的二次指數平滑值為第t-1 周期的二次指數平滑值;α為權重系數(0 ≤α≤1)。

在指數平滑法中,關鍵參數“權重系數α”的取值一般情況下會根據經驗取值或者系統自動確定。本文采用“先全局遍歷再局部篩選”的方法,獲得最優α值。
本研究2006-2019年遼寧省政府衛生支出的數據來源于2015-2020年《遼寧統計年鑒》。
2.2.1 序列平穩性檢驗及平穩序列白噪聲檢驗
從圖1 可以看出遼寧省2006-2019 年政府衛生支出序列基本呈線性上升趨勢,可初步判斷原始序列為非平穩序列,由于觀察法具有主觀性,為進一步驗證該判斷,本文借助Python 編程對原始序列進行單位根檢驗,根據檢驗結果可知P 值為0.79338,遠大于0.05的檢驗水平,故原序列為非平穩序列,需要先進行一階差分處理,所得一階差分序列如圖2 所示。進一步檢驗其單位根后,得p 值約為0.00000084,小于0.05 的檢驗水平,說明此時為平穩序列。最終對平穩序列白噪聲檢驗,得P 值為0.0346,小于0.05 的檢驗水平,則一階差分序列為非白噪聲序列,且可以確定d=1。

圖1 政府衛生支出原始序列圖

圖2 一階差分后的政府衛生支出序列圖
2.2.2 模型的定階與最優參數的確定
一階差分序列的自相關圖(ACF)與偏自相關圖(PACF)如圖3、圖4 所示,一般情況下,可以分別觀察兩者的拖尾性與截尾性來選取合適的參數,但為得到較優參數,本文基于AIC、BIC 準則,在Python 下通過建立自動運算程序對ARIMA 模型的所有參數組合進行遍歷,并得到不同參數組合所對應的AIC 值與BIC值,較優參數即為兩者均取最小值所對應的p與q。從結果可知,當AIC 值為113.8432,BIC 值為115.5380時,得較優參數p=0,q=1。

圖3 一階差分序列的自相關圖

圖4 一階差分序列的偏自相關圖
2.2.3 模型殘差檢驗
模型定階完成之后,需要對模型的殘差序列進行白噪聲檢驗,根據結果可知P 值為0.46726,遠大于0.05的檢驗水平,這說明殘差序列為白噪聲,政府衛生支出歷史數據中有效信息被ARIMA(0,1,1)模型充分提取,即該數據適合ARIMA(0,1,1)模型。
2.2.4 模型預測效果評估
模型預測結果如表1所示,本文采用平均絕對誤差(MAE)、均方根誤差(RMSE)、平均相對誤差(MAPE)作為模型預測效果的評價指標。各指標計算公式如下:

表1 ARIMA模型預測結果

其中,為xi實際值為預測值。
經過計算得到該模型的MAE、RMSE、MAPE分別為9.46、15.6175、0.0539,三個指標的值都比較小,則表明ARIMA(0,1,1)模型可以對政府衛生支出作短期預測。
首先運用Excel 對政府衛生支出數據進行回歸分析,從擬合曲線圖可知該數據呈線性上升趨勢,可用DES 模型對政府衛生支出作短期預測,擬合曲線圖如圖5所示。其次是權重系數α的取值,先分別計算α為0.1、0.2、…、0.9時的預測值,根據實際值和預測值求出不同α對應的平均相對誤差,進一步得到最優α的取值在0.4-0.5 之間,接著對0.4-0.5 之間的數依次遍歷,最終得到最優α為0.44。權重系數α為0.44 時的預測結果如表2所示,并經過計算得到MAE、RMSE、MAPE分別為14.7363、25.0486、0.0828。

表2 DES模型預測結果

圖5 政府衛生支出擬合曲線
預測評價結果顯示,ARIMA(0,1,1)模型的MAE、RMSE、MAPE分別為9.46、15.6175、0.0539,DES模型的MAE、RMSE、MAPE 分別為14.7363、25.0486、0.0828。兩個模型的平均相對誤差均低于10%,表明選擇ARIMA(0,1,1)模型與DES 模型對政府衛生支出進行預測具有科學性。但ARIMA(0,1,1)模型各項誤差明顯低于DES 模型,說明ARIMA(0,1,1)模型預測精度優于DES 模型。ARIMA(0,1,1)模型與DES 模型預測數據與既往數據的擬合情況如圖6所示。

圖6 兩種模型擬合對比
本文采用2006-2019年遼寧省政府衛生支出歷史數據,分別構建ARIMA(0,1,1)模型和DES 模型對遼寧省2020-2024 年政府衛生支出進行預測,通過對兩者評價指標的比較,得出ARIMA(0,1,1)模型更優。根據ARIMA(0,1,1)模型預測結果可知未來5 年遼寧省政府衛生支出總額穩步提升,對應年增長率卻呈現逐年下降的趨勢。到2024 年,遼寧省政府衛生支出總額將達到508.9351 億元,其年增長率可下降到5.2256%。本文所建立的ARIMA(0,1,1)模型,通過挖掘政府衛生支出歷史數據的內在變化規律,實現對未來政府衛生支出變化趨勢的預測。然而,影響政府衛生支出的相關變量是眾多的,例如:老齡化人口數、總人口數等。因此,在上述研究的基礎上,如何將相關變量對政府衛生支出產生的影響結合歷史數據的內在變化規律來進行預測,從而進一步改善模型預測效果,還需要從各個層面做更深入的研究。