中山大學孫逸仙紀念醫院(510120) 薛允蓮
廣州某院門診量的ARIMA模型預測*
中山大學孫逸仙紀念醫院(510120) 薛允蓮
目的對門診量序列進行預測,分析預測效果。方法采用時間序列ARIMA模型,對原始門診量序列和調整1~2月門診量后的序列進行預測,并在調整預測值基礎上計算2月份的校正預測值。結果調整后序列的相對預測誤差絕對值均值為3.84,明顯小于原始序列的相對預測誤差絕對值均值7.10。結論調整1~2月門診量序列的預測效果明顯優于原始門診量序列的預測效果。
門診量 ARIMA模型 移動假日效應 預測
隨著信息化的進展,統計預測越來越成為現代醫院管理工作不可或缺的工具[1]。門診量是衡量醫院門診業務量發展的重要指標之一。通過對既往門診量數據動態變化的分析,能夠科學、準確的進行預測,合理安排人財物等資源,提高經濟和社會效益。由于每年的春節在1月或2月出現,移動春節效應會影響門診量序列的預測效果。本研究用ARIMA模型比較原始門診量序列的預測效果和調整1-2月門診量,并校正2月門診量后預測效果的差異。
1.研究對象
本次研究利用2005年1月至2012年12月廣州市某三甲醫院每月門診量數據進行建模,利用2013年的每月門診量數據進行模型擬合效果的評價。
2.方法
(1)對原始門診量序列的ARIMA預測
本文稱原始門診量序列的預測值為原始預測值。ARIMA預測的步驟主要是模型識別、模型選擇和建模[2]。
(2)對調整門診量序列的ARIMA預測
用調整1~2月份的門診量序列預測后,校正2月份的門診量預測值,得出最終的校正預測值。將2月份的校正預測值替代2月份的調整預測值,與其他月份的調整預測值一起考察調整后序列的預測效果。
①對調整1~2月門診量序列后的預測
為了降低移動春節效應的影響,本研究對1~2月門診量序列進行調整:1月份調整門診量=mean(2~12月門診量),2月份調整門診量=mean(1月、3月~12月門診量)。對調整后的門診量序列進行預測,將所得預測值稱為調整預測值。
②移動假日效應(春節)影響月份的預測值校正
在調整預測值的基礎上,對春節影響月份的門診量預測值進行校正:根據工作經驗,春節對門診量影響的時間段主要是春節及節后至農歷正月十五。由于2013年春節日期為2月10日,故春節移動假日效應對門診量的影響主要在2月份,本次研究中對門診量的校正也是針對2月份的數據。
校正主要通過線性回歸完成,為兩步:(1)因變量:2月份門診量比例=2月份原始門診量/(1月+2月)原始門診量和;自變量:落入2月份的天數,以1.31日為0點,向前記為負數,向后記為正數。通過線性回歸得出2013年的2月份門診量比例。(2)因變量:差值和=(1月+2月)原始門診量-(1月+2月)調整門診量;自變量:年份。通過線性回歸得出2013年差值和。
根據2月份門診量比例和2013年差值和,得出2月份門診量校正值。2月份校正預測值=2月份調整預測值+2月份門診量校正值。
(3)預測效果評價指標
用相對預測誤差絕對值進行原始預測和調整預測的預測效果比較。相對預測誤差絕對值abs=abs((實際值-預測值)/實際值)×100%。
1.原始門診量序列的預測
2005年1月至2012年12月的門診量序列圖見圖1。可見,序列總體呈上升趨勢,每年春節后有明顯的下降,初步判斷存在年度周期。對序列進行年度差分,對差分后序列進行ARIMA建模。

圖1 2005年1月至2012年12月的門診量序列的時序圖
根據ARIMA建模方法,選擇疏系數模型:自回歸部分為1+0.36074 B(1);移動平均部分為1-0.85004 B(12)。預測效果見表1。
2.調整門診量序列的最終預測
對1~2月門診量調整后的序列進行預測。根據ARIMA建模方法,選擇疏系數模型:自回歸部分為1+0.22718 B(4),移動平均部分為1-0.50782 B(12)。調整序列的預測效果見表1。
以2月份觀測值比例(Y1)為因變量,以落入2月份的天數(X1)為自變量建立線性回歸方程,Y1=55.602+2.322X1;R2=0.723,P=0.007<0.05。根據2013年X1=10,可知2013年2月份觀測值比例為78.822。見表1。
以差值和(Y2)為因變量,以年份(X2)為自變量建立線性回歸方程(因2007年觀測值為異常值,故剔除),Y2=3332482.152-1688.862X2;R2=0.663,P=0.026<0.05。根據2013年X2=2013,可知2013年差值和為-67197.05。根據Y2和Y1可知,2013年2月份的校正預測值=2月份的調整預測值+Y2×Y1× 0.01=106040.0。見表2。

表1 原始序列和調整序列的ARIMA模型預測結果

表2 回歸分析用數據
ARIMA模型又稱求和自回歸移動平均模型,這一模型是建立在歷史數據基礎上的,因此對歷史數據的搜集時間有一定要求(一般要求多于50個點),通常,歷史數據越多,模型的準確性越高。
在用ARIMA模型進行預測時,需要注意移動假日效應的影響。移動假日效應是指假日在各年出現的公歷日期不同,具體表現為以下兩個特征[3]:①假日前后序列測量的活動規律有上升或下降趨勢,②假日對某相鄰兩個月(公歷)的影響程度依賴于每年出現的不同日期。節假日在公歷日期上的“移動”最直接表現為各年某些月份(如春節影響的1、2月份)觀測指標的不可比,甚至影響季節調整的效果[4]。Edward等[5]指出調整移動假日效應能提高序列的預測效果。
本文分別對原始門診量序列和調整1~2月門診量后的序列進行ARIMA建模和預測,并對2月份的調整預測值進行移動假日效應的校正,用2月份的校正預測值替代2月份的調整預測值。從預測效果看,調整預測的預測誤差絕對值均值明顯小于原始序列的預測誤差絕對值均值。可見,移動春節效應降低了序列的預測效果,這可能與移動春節效應對序列的時域和頻域均產生影響有關[6-7]。可見,在序列進行預測研究之前,有必要對移動假日效應進行調整。
致謝:非常感謝中山大學公共衛生學院張晉昕副教授對本論文的指導和幫助。
1.周忠彬,呂紅梅,鄒郢.ARIMA干預模型在醫院門診量預測中的應用.中國醫院統計,2008,15(2):110-112.
2.肖枝洪,郭明月.時間序列分析與SAS應用,2009:13-109,145-163.
3.X-12-ARIMA Reference Manual.Version 0.3.Time Series Staff Statistical Research Division Room.U.S.Census Bureau,Washington,2007.http://www.census.gov/srd/www/x12a/
4.Alper CE,Aruoba SB.Moving Holidays and Seasonal Adjustment:The Case of Turkey.Review of Middle East Economics and Finance,2004,2(3):203-209.
5.Edward E.Leamer.Workday,holiday and calendar adjustment with 21st century data:monthly aggregates from daily diesel fuel purchases.2011,C81:http://www.nber.org/papers/w16897
6.薛允蓮,張晉昕.時間序列分析中的移動假日效應.中國衛生統計,2009,26(5):502-504.
7.薛允蓮,張晉昕,劉貴浩,等.醫院住院人數序列的春節效應調整.中國衛生統計,2010,27(5):473-476.
(責任編輯:郭海強)
*廣東省醫學科研基金(No.B2014126)