唐 路,宋 萍,謝冰玨,佘 穎
(重慶醫科大學附屬兒童醫院病案統計科,重慶 400014)
門診醫療服務工作通常具有點多、線長、面廣的特點,是醫療活動的首要環節,關系到醫院的整體形象[1]。門診量在很大程度上直接反映出醫院規模、醫療技術水平、管理水平及患者對醫院的信任度[2]。我院是集醫教研為一體的國家三級甲等綜合性兒童醫院,在全國最佳醫院排行榜中連續多年位居全國兒童醫院第三位。2019 年醫院日均門診量0.92 萬人次,門診外埠患者比例近20%,加上兒童就診特殊性,極易形成短時間內人流量高峰,增加排隊時間,從而引發醫患矛盾。求和自回歸移動平均(auto regressive integrated moving average model,ARIMA)在門診量預測中已得到了廣泛應用,且預測效果較好[2-4]。本文通過對我院月門診量時間序列數據進行預測分析,了解其變化特點及規律,以期為醫院合理配置人力資源及醫療物資提供有力支撐,增強現代醫院的門診綜合服務能力及效率。
1.1 資料來源 數據來源于重慶醫科大學附屬兒童醫院病案統計科2009 年~2019 年醫院業務量月報表,其中2009 年~2018 年逐月數據用于建立時間序列預測模型,2019 年逐月數據用于模型效果檢驗及預測評價,數據真實可靠。
1.2 方法 ARIMA 模型全稱為求和自回歸移動平均模型,該模型是由1970 年美國統計學家G.E.P.Box和英國統計學家G.M.Jenkins 提出的一種經典時間序列預測模型[5,6]。ARIMA 模型可對具有季節效應的時間序列進行建模,根據季節效應的提取難易程度分為簡單季節模型ARIMA(P,D,Q)S 和乘積季節模型ARIMA(p,d,q)×(P,D,Q)S。因門診量時間序列既有季節效應又有長期趨勢效應且和隨機波動之間存在比較復雜的交互影響,所以本文采用混合效應的乘積季節模型ARIMA(p,d,q)×(P,D,Q)S,其中p、d 和q 分別表示非季節自回歸階數、差分階數和移動平均階數;P、D 和Q 分別表示季節自回歸階數、季節差分階數和季節移動平均階數,S 為季節差分周期[6-8]。
乘積季節模型建模步驟[9-10]:①時間序列平穩化:ARIMA 模型的使用前提條件是數據必須是平穩的時間序列數據。應用時序圖、自相關函數圖初步識別序列趨勢性、季節性等特征,采用單位根檢驗判斷序列的平穩性。對于非平穩時間序列則需進行自然對數轉換、非季節差分、季節差分等預處理,直到序列平穩為止。②模型參數定階:根據差分次數確定d、D 階數,p、q 和P、Q 階數依據平穩序列的自相關函數圖及偏相關函數圖拖尾、截尾特征來確定。R軟件中的auto.arima 函數可以進行最優模型自動篩選[11,12]。篩選依據:赤池信息準則(AIC)或貝葉斯信息準則(BIC)最小,對數似然函數值(Log likelihood)最大的模型為最優模型。③模型的檢驗:采用Ljung-Box test 判斷模型的適合性,若殘差滿足白噪聲,該統計量應沒有顯著性,否則模型需要進行改進。④模型預測:以2009 年~2018 年逐月門診量數據進行模型擬合,篩選出最優乘積季節模型。再用2019 年逐月門診量數據檢驗模型預測效果,根據預測值與實際值的平均絕對百分比誤差(MAPE)評價預測效果。,其中Xi為原始數據,為預測值,N 為數據個數。
1.3 統計學分析 采用Microsoft Excel 2016 建立數據庫,應用R-3.6.3 軟件中的tseries 程序包和forecast 程序包進行數據處理和統計建模,以P<0.05 表示差異有統計學意義。
2.1 2009 年~2018 年門診量時序圖 依據我院2009年~2018 年門診量數據繪制原始序列時序圖,見圖1。2009 年~2018 年我院門診量總體呈現上升趨勢,且有明顯的季節波動特征,每年的5~7 月份出現第一個高峰期,之后有所回落,在11~12 月份再次出現高峰。

圖1 原始序列時序圖
2.2 時間序列平穩化 由于原始序列時序圖存在上升和季節波動趨勢,且經單位根檢驗差異無統計學意義(Dickey-Fuller=-2.9882,P=0.1656),因此判斷原始序列不滿足ARIMA 模型建模要求。為了消除原始序列的時間趨勢,對其進行一階非季節差分和一階季節差分處理,處理后經單位根檢驗差異有統計學意義(Dickey-Fuller=-12.3890,P=0.01),時間序列數據已平穩,滿足建模前提。
2.3 模型參數定階 繪制平穩時間序列的時序圖、自相關圖(ACF 圖)和偏自相關圖(PACF 圖),見圖2。可以看出,平穩序列的ACF 和PACF 均拖尾,由此可以判斷模型適用于ARIMA(p,d,q)×(P,D,Q)S。因對原始序列進行了一階非季節差分和周期為12個月的一階季節差分,所以d=1,D=1,S=12,初步確定模型為ARIMA(p,1,q)×(P,1,Q)12。對于p、q 和P、Q 階數的判斷可以從平穩序列的自相關函數圖及偏相關函數圖拖尾、截尾的特征得到啟示,且根據歷史文獻參考超過兩階的情況較少[13,14]。本文利用R軟件中的auto.arima 函數自動篩選最優模型,得出參數分別為:p=1、q=2,P=2、Q=0,因此經篩選得出最優模型為ARIMA(1,1,2)×(2,1,0)12。

圖2 平穩序列相關圖
2.4 模型檢驗 最優模型ARIMA(1,1,2)×(2,1,0)12 的赤池信息準則AIC=2315.69,貝葉斯信息準則BIC=2334.46,模型中各參數檢驗均有統計學意義(P<0.05),見表1。采用Ljung-Box 方法對模型殘差進行檢驗,檢驗統計量Q=6.3022,P=0.3902,模型殘差為白噪聲序列。同時對殘差序列做自相關圖(圖3)和偏相關圖(圖4)。此模型殘差大部分都落入95%可信區間內,序列信息已經被充分提取,得到的模型是適合的擬合模型。

圖4 模型殘差偏相關圖

圖3 模型殘差自相關圖

表1 ARIMA(1,1,2)×(2,1,0)12 預測模型參數檢驗
2.5 模型預測 運用ARIMA(1,1,2)×(2,1,0)12 模型預測2019 年1 月~12 月門診量,預測值與實際值對比情況見表2,實際值均在月門診量預測值的95%可信區間以內,平均絕對百分誤差6.56%<10%,預測模型精確度較高。

表2 某兒童醫院2019 年1 月~12 月門診量預測值與實際值比較

表2(續)
隨著社會經濟發展,人們就醫意識不斷增強,及時就診成為人們的迫切需求[15]。兒童作為一個特殊群體,面對二孩政策放開,公立醫院應及時整合醫療資源來優化兒童門診,以便滿足日益增長的兒童衛生服務需求,提高兒童衛生服務效率,保證兒童健康水平。因此,科學準確的短期門診量預測在醫院日常管理和經營決策中具有重要意義,是現代醫院管理的重要內容。及時掌握門診量的變化趨勢可以為醫院合理開設門診科室、配置醫護人員等資源配置提供基礎數據,同時節約醫療業務成本,提高醫院的經濟效益,有利于公立醫院社會效益的實現[16]。
越來越多的預測模型在門診量短期預測中得到廣泛應用,如線性回歸預測、灰色GM(1,1)預測、指數平滑模型預測、ARIMA 模型預測等[17]。不同的模型各有其優缺點及適用范圍,其中,ARIMA 模型在醫學領域的應用較為廣泛,主要適用于有季節變動的數據,在短期預測上精確度較高。R 軟件作為一款開源軟件,在處理時間序列數據時具有強大的統計運算及繪圖功能,本研究利用R 語言,通過時間序列數據預處理、模型參數定階、模型檢驗等步驟,最終擬合得到門診量ARIMA(1,1,2)×(2,1,0)12 模型,進一步對該模型殘差分析發現,該模型較好地模擬了我院月門診量時間序列變化趨勢。利用該模型預測2019 年逐月門診量,預測值與實際值的平均絕對百分比誤差為6.56%,實際值均在預測值95%可信區間內,提示模型預測精準度較高。
綜上所述,本研究建立的ARIMA 乘積季節模型為相對最優模型,且適合門診量的短期預測,預測結果對醫院合理配置人力資源具有實際應用價值,醫院可以根據預測結果采取如下措施:①提前在門診高峰時間、季節盡可能多增加知名專家門診的坐診人數,周末適當增加專家或專科號,增強門診醫療技術力量。②實施彈性排班、分時段預約等措施,合理配置門診醫療資源,發揮人、財、物資源的最大效益。③對于慢性患者,健康宣教時盡量提醒他們在門診低峰時就診,既可緩解門診高峰時的就診壓力,也可節約患者的等待時間,從而緩解醫患矛盾。但門診量的變化是由多因素聯合作用引起的,某些因素的改變可能會使得擬合模型不適用,如政策因素、傳染病疫情流行與暴發。同時,ARIMA 模型由于其模擬的原理,對數據要求不高,只適合短期預測,因此下一步可以考慮通過組合模型進行預測,不斷提高模型預測精確度。