段清浩,李廷榮,楊連建
手足口病是一種兒童多發性傳染病。2009~2016年,重慶市沙坪壩區報告手足口病發病率連續8年均位居重慶市各區縣前5位,防控形勢十分嚴峻。若能對發病趨勢進行早期預測,則對防控策略的制定具有重要意義。目前用于手足口病發病趨勢預測較多是采用時間序列方法,如指數平滑法、移動平均法、自回歸模型、差分自回歸移動平均模型等,但預測精度均不太理想,波動較大[1-3]。諸多研究顯示,氣象因素與傳染疾病的發生具有相關性[1],而在模型中加入短期氣象因素等自變量是否能提高模型預測精度,相關研究卻很少。因此,本研究根據當地實際情況,考慮氣象因素,建立沙坪壩區手足口病的季節性ARIMA模型,并對模型預測效果進行評價。
1.1 數據來源 2009年1月1日~2016年12月31日每日手足口病病例數據來源于重慶市沙坪壩區疾病預防控制中心 “疾病監測信息報告管理系統”,剔除了疑似病例卡、已刪除病例卡和重復病例卡[2]。同期人口數據來源于2009~2016年《沙坪壩區統計年鑒》,同期氣象數據來源于重慶市沙坪壩區氣象局。
1.2 建模步驟 將該區2009~2015年每周手足口病病例數作為建模數據,構建乘積季節模型ARIMA(p,d,q)(P,D,Q)s,其中p、q分別為自回歸和移動平均階數,d為平穩化過程中差分的階數,P、Q為季節性的自回歸和移動平均階數,D為季節差分的階數,s為季節周期。建模步驟如下[3-5]:(1)序列的平穩性判定:根據該區2009~2015年每周報告手足口病病例數序列圖、自相關圖(ACF)和偏自相關圖(PACF)判定序列平穩性,采用季節差分或差分變換使序列趨于平穩。(2)模型識別:通過ACF圖和PACF圖確定相應ARIMA模型的階數及p、q、P和Q的取值。(3)參數估計和模型診斷:采用極大似然估計法計算參數,模型階數由AIC和BIC函數取最小值準則來定,同時對殘差序列進行白噪聲檢驗,最終確定擬合的最佳模型,(4)預測:用上述構建的模型預測2016年周發病數,與實際數據進行比較,驗證模型的預測效果。
1.3 統計學方法 應用Excel 2007軟件對該區2009~2016年每周手足口病病例數進行整理,繪制時間序列圖;應用IBMSPSS 22.0軟件的預測模塊中差分自回歸移動平均(ARIMA)模型分析法構建本研究模型,并對殘差序列進行白噪聲檢驗;sR2和BIC用于比較各模型間的優劣,sR2越大,BIC越小,模型越優;用均方根誤差RMSE衡量預測值與實際值的吻合度,RMSE越小,模型預測精度越高。
2.1 病例數分布 如圖1所示,2009年1月~2016年12月,沙坪壩區手足口病報告病例數呈明顯的周期性波動,且每隔12個月(52 w)為1個周期。每年度發病時間均呈雙峰現象,2009年主峰位于5~7月,占該年度發病總數的60.43%;次峰位于10~12月,占該病發病總數的21.52%;其余年份主峰均位于4~6月,次峰位于10~12月。由于手足口病有周期性發病特點,因此,建立乘積季節模型,s=52。經1階差分和1次季節差分處理后,序列基本平穩,模型取 d=1,D=1。
2.2 模型構建與評價 由上述分析結果,初步建立 ARIMA(p,1,q)(P,1,Q)52模型。 采用該區 2009~2015年每周手足口病病例數據擬合,最終選擇最優模型為 ARIMA(0,1,1)(1,l,1)52。 對模型殘差進行自相關檢驗,符合白噪聲序列,且殘差序列值基本都在置信區間內(圖2),可認為所選模型合適。再根據人群特點分男性、女性、幼托兒童和散居兒童分別建模(表1)。由于手足口病一般潛伏期為1 w以內[1-2],因此,上述模型中加入報告病例的前1 w平均氣溫作為自變量,再次建模。從表2可見,加入平均氣溫因素后,Model_2的各組sR2值均大于 Model_1,且各組BIC值均小于Model_1,模型有了很大改善。
2.3 模型預測驗證 進一步對該區2016年52周報告的手足口病病例數進行預測,結果提示,病例依然集中于4~7月和10~12月,與實際值吻合較好(圖2),均方根誤差RMSE為15.84。

圖1 重慶市沙坪壩2009年1月~2016年12月報告手足口病病例數分布

圖2 2016年重慶市沙坪壩區手足口病周發病數的實際值和預測值
手足口病傳播途徑多樣,傳染力強,速度快,特別是學齡前兒童,易在托幼機構中造成暴發或流行,因此,對該病的發病趨勢進行預測有利于及早采取措施,防止疫情的暴發和流行。氣溫是重要的氣象因素,對傳染病的流行傳播具有很大的影響,有研究發現,氣溫可影響病原攜帶者或宿主的移動[1-5]。但是在以往研究中,大多關注氣象因素與手足口病發生的相關性及效應,很少將氣溫等氣象因素納入構建預測手足口病發病趨勢模型[6]。本研究采用季節性ARIMA模型,同時考慮到手足口病一般潛伏期為1 w以內[1],因此,將報告發病的前1 w平均氣溫作為自變量納入建立手足口病周發病數預測模型。最終選擇最優模型 ARIMA(0,1,1)(1,1,1)52,對模型殘差進行自相關檢驗,序列滿足白噪聲序列標準[3],且殘差序列值基本都落入置信區間內,表明所選模型是合適的。

表1 根據手足口病周發病數且不考慮天氣因素構建的不同組sARIMA模型(ModeI-1)

表2 根據手足口病周發病數且考慮平均氣溫因素構建的不同組sARIMA模型(ModeI-2)
本研究還根據人群特點分男性、女性、幼托兒童和散居兒童分別建模,加入周平均氣溫因素后,總的模型sR2為0.80,高于以往其他地區僅僅采用時間序列方法而不考慮氣溫因素構建模型的預測精度[7]。再次說明氣溫與手足口病發生具有密切關系,建模時納入可顯著增加模型預測精度。本研究建模納入報告發病的前1 w平均氣溫后,各組模型的sR2值均高于普通ARIMA模型,且各組BIC值均小于普通ARIMA模型,使得模型有了很大改善。根據各組模型sR2、BIC值還可發現,除了幼托兒童組外,其余組模型表現均較好,這可能與樣本量大小有關,需要進一步收集數據深入分析。
采用本研究構建的模型對該區2016年52 w手足口病病例數進行預測,并與實際值比較,結果顯示,2016年前兩個季度(1~6月),手足口病預測值略高于實際值,第四季度(10~12月)預測值略低于實際值,總體吻合度較好,均方根誤差RMSE僅為15.84。
綜上所述,本研究將報告發病前1 w平均氣溫納入自變量,構建的沙坪壩區手足口病周病例數sARIMA模型具有較高的預測精度。該模型有助于沙坪壩區衛生部門進行手足口病的早期監測與預警,及早部署防控措施,有效遏制暴發或流行,同時該模型也值得在其他區借鑒采用。