陸波 閔紅星 扈學琴 閔佳
ARIMA模型在流感發病預測中的應用
陸波 閔紅星 扈學琴 閔佳
目的 探討時間序列模型在流感病例發病預測方面的可行性。方法 通過國家疾病報告管理系統收集本市醫療機構2004~2012年的流感月發病數資料, 用Eviews軟件對流感月發病數據建模,用單位根檢驗法對模型的適應性進行檢驗, 并回代的方法驗證其有效。結果 流感月發病數時間序列的自相關分析圖顯示數據不平穩, 所以進行一階差分, 并建模, 最終模型為ARIMA(0, 2, 0)(0, 2, 0)7, 所建模型差異有統計學意義。結論 ARIMA(0, 2, 0)模型可用于流感發病的預測。
時間序列模型;ARIMA;流感;預測
時間序列目的是用變量過去的觀測值來預測同一變量的未來值。已經被廣泛應用于人口、經濟、環境衛生等研究領域[1-3]。本文通過對銀川市各個醫療機構2004~2012年的流感月發病數建立數學模型, 探討該方法的最佳適用范圍和適用條件, 為擴大其在傳染病發病預測方面的應用提供科學依據。
1. 1 一般資料 2004~2012年的流感月發病數通過國家疾病報告管理系統進行收集, 建立預測模型, 用2012年各月發病數進行組外回代和組內回代, 預測2013年流感的發病情況。
1. 2 研究方法 用Eviews6.0進行數據處理與分析。
2. 1 流感流行特征分析 流感月發病數呈現明顯波動, 均出現發病高峰月(每年12月或次年1月), 有相對固定的季節性或周期性波動。具體情況見圖1。
2. 2 建立預測模型
2. 2. 1 模型識別 該序列的自相關圖呈拖尾衰減, 偏相關圖呈兩步截尾, 說明序列為非平穩序列P<0.05, 進行一級差分處理結果, 通過單位根檢驗說明該數據滿足平穩條件。具體情況見圖2, 圖3。
2. 2. 2 參數估計和模型檢驗 建立預測模型后, 需要對ARIMA(0,2,0)(0, 2, 0)7, 的適應性進行檢驗。根據模型誤差序列的ACF圖, 自相關系數大部分都落入置信區間以內,可斷定模型包含原始時間序列的所有趨勢, 能用來預測, Eviews6.0統計結果顯示模型所有參數有統計學意義, 在大部分時滯上P值都>0.05;對殘差序列作自相關函數圖, 顯示殘差序列為白噪聲, 說明所選的ARIMA(0,2,0)(0, 2, 0)7, 模型是合適的, 可以用于預測。
2. 2. 3 預測應用 從圖中看出實際值與預測值欠吻合, 可用于流感監測信息的動態分析和短期預測, 見圖4。

圖1 2004~2012年流感月發病數時序圖

圖2 2004~2012年流感發病原始數據的自相關圖和偏自相關圖

圖3 2004~2012年流感發病一級差分后的自相關圖、偏相關圖及統計量

圖4 2004~2012年流感實際發病數與預測發病數
ARIMA模型是一種精度較高的短期預測模型[4]。本文應用ARIMA模型法預測傳染病, 是用預測疾病的過去值和現在值, 預測未來值, 可參照預測數據有目的地開展傳染病的防控工作。
按時間序列排列的每一個時期的觀測值都是由許多因素影響, 認為流感有季節性流行的特征, 發病存在較大的波動性。通過ARIMA模型對本市2004~2012年各月份的流感發病數的時序圖發現:流感月發病數呈明顯波動, 每年12月或次年1月為發病高峰月, 有相對固定的季節性或周期性波動。但2006年12月和2007年1月流感樣病例數出現2次高峰,是由于這一時期銀川市發生兩起學校流感暴發疫情引起。對模型進行一級差分處理和單位根檢驗, 使數據滿足平穩條件,將模型優化為ARIMA(0,2,0)模型建模, 并對ARIMA(0,2,0)(0, 2, 0)7, 的適應性進行檢驗, 發現模型誤差序列的自相關系數大部分都落入置信區間以內, 顯示殘差序列為白噪聲, 說明所選的ARIMA(0,2,0)(0, 2, 0)7, 模型是合適的, 可用來預測;用Eviews6.0擬合模型, 得到的九年預測效果的擬合優度R2為0.297, 相關系數為0.545。因此, 所選的ARIMA(0,2,0)(0, 2, 0)7, 所建模型有統計學意義, 可用于流感發病預測。今后,本院試圖采用其它方法進行預測, 如灰色模型、季節性結構分量模型等以探討在流感預測中的最佳模型。
[1] Yu Xinrui,Hua Lisha. Influenza.Medical Science in Overseas: Social Medical Science, 2000,17(3):128-131.
[2] 譚毅,康寧,閉福銀,等. 廣西2004-2007年流感性感冒監測分析.中國熱帶醫學, 2009,9(5):906-908.
[3] WHO.International Health Regulations (2005) http://www.who.int/ ihr/Case Definitions_zh.pdf )
[4] 邢慧嫻,楊維中,王漢章.傳染病預測.預防醫學情報雜志,2006, 6(4):639-642.
寧夏自然科學基金項目(項目編號:2012Z1239)
750004 寧夏醫科大學總醫院
閔紅星 E-mail:lbmhx6661@163.com