池 也, 池水晶
(1.云南大學, 云南 昆明 650504 2.承德醫學院附屬醫院, 河北 承德 067000 3.河北省承德市疾病預防控制中心, 河北 承德 067000 4.河北省承德市中心醫院, 河北 承德 067000)
手足口病是由腸道病毒71型引起的常見兒童感染病之一,多以五歲以上兒童多發,主要表現為發熱,伴有手、足、口、臀等多部位斑丘疹、丘疹以及皰疹,少數病例會引起心、腦、肝、肺等多器官損傷,甚至危及生命。該病毒主要通過密切接觸、呼吸道、消化道等途徑傳播,致使其在幼兒園或中小學大范圍傳播[1]。通過應用差分整合移動平均自回歸模型進行傳染病季節性分析,對預測和防控手足口病的大范圍流行具有重要作用[2]。本研究采用ARIMA(0,1,2)疏系數模型分析2010年至2019年承德市手足口病發病資料,預測2020年至2022年手足口病流行趨勢,研究如下:
1.1一般資料:收集2010年至2020年河北省承德市疾病預防控制中心及承德市中心醫院手足口病患者診療記錄,收集所有患者發病年齡、發病時間、散居或集體幼托機構等流行病學資料。
1.2記錄所有患者流行病流行資料、發病情況、計算發病率、重癥數以及重癥率、死亡數、病死率以及重癥病死率等數據。
1.3分析承德市手足口病流行病特征:利用R軟件繪制承德市中心醫院發病時間分布圖,患者年齡分布圖,利用卡方檢驗判定年齡差異是否顯著,分析承德市手足口病流行特征及形成原因。
1.4ARIMA乘積季節模型的建立
1.4.1模型建構原理:差分整合移動平均自回歸模型屬時間序列分析方法,是統計不同時間點數據,將非平穩時間序列經過差分處理后轉化為平穩時間序列,并進行精度較高的預測分析方法[3]。ARIMA(p,d,q)模型是指d階查分后自相關最高階數為p,移動平均最高階數為q的模型,它通常包括p+q個獨立的未知系數,由三部分組成:①自回歸AR:根據自身滯后值或先前值進行回歸,p為自回歸階數。②移動平均MA:將一定時期內項數加以平均,q為滑動平均項數。③差分次數:平穩序列所做的差分次數,用d表示。如果ARIMA模型中有部分自相關系數或部分移動平滑系數為0,即原模型中部分系數省缺,則該模型稱為疏系數模型。
1.4.2模型建構步驟:①預處理與平穩性檢查:應用上述病例資料,通過R 4.0.3 軟件“tseries”軟件包中“ts”語句建立2010年至2019年以月為單位的承德市中心醫院手足口病發病例數時間序列圖,通過對數據進行一階差分獲得平穩時間序列,在確定平穩性特征的基礎上進行ARIMA模型建立,并利用“acf”語句和“pacf”語句繪制序列自相關系數函數圖和偏相關系數函數圖。②模型建立與參數估計:根據ACF圖與PACF圖的圖形特征判斷時間序列趨勢和周期性,初步確定p,d,q的階數,在p,d,q取值不大于2的條件下,建立擴展的自相關函數eacf圖,依據AIC信息準則選擇最優模型。③模型檢驗:利用“Box.test”語句和“confint”語句,采用參數檢驗及白噪聲檢驗方法對建立后模型進行檢驗,檢驗結果顯示其具有統計學意義(P<0.05),模型成立。④模型預測與評價:使用“predict”語句,利用ARIMA(0,1,2)疏系數模型進行承德市中心醫院手足口病患者2020年至2022年月度發病例數預測。
2.1收集2010年至2019年河北省承德市疾病預防控制中心及承德市中心醫院手足口病患者診療記錄。2010年至2019年承德市手足口病患者發病情況統計數據如表1所示,2010年至2019年間,病例總數及發病率呈逐年遞減趨勢,手足口病流行病傳染強度下降。病死率、重癥數、重癥死亡率呈現明顯下降趨勢,手足口病死亡危險性降低。見表1。

表1 2010年至2020年間河北省承德市手足口病發病分布(年)
2.2手足口病發病季節發病情況:手足口病在第三季度發病數量最多且與其他季度呈現明顯的差異,第一季度發病極少,第二季度為發病次高峰,見圖1。

圖1 2010年至2020年間承德市中心醫院手足口病患者發病時間季度統計圖
2.33294例手足口病患者人口學分布特征:基于疾病發生及發展與年齡有密切關系,對承德市手足口病特征進行年齡結構的差異分析。基于承德市中心醫院的共計3294例診療記錄數據,利用R軟件建立成的市中心醫院手足口病年齡分布百分比餅圖,見圖2。

圖2 2010年至2020年間承德市中心醫院手足口病患者年齡分布餅圖
2.4ARIMA模型建立
2.4.1時間序列模型:利用R軟件對承德市中心醫院2010年至2019年手足口病患者的發病數據建立時間序列圖模型,如圖3所示,其具有明顯的非季節波動,為非平穩的時間序列。

圖3 2010年至2019年間承德市中心醫院手足口病患者數據的時間序列
其中0~3歲患者群體占比超過60%;4歲患者群體占總患者群體的16.1%,5歲患者群體占比8.39%,6歲及6歲以上患者年齡占比較小。將年齡影響患者數量的問題轉換為各年齡段的患者數量是否存在顯著差異。所作的無效假設H0:各年齡段的患者數量不存在顯著差異,備擇假設H1:各年齡段患者數量存在顯著差異。利用R軟件進行卡方檢驗,得到結果顯示H1具有統計學意義,各年齡段患者數量存在著差異。
2.4.2差分轉化非平穩時間序列數據:時間序列呈非平穩,對其進行一階線性差分轉變為平穩時間序列,繪制自相關系數、偏相關系數函數圖。一階差分后數據呈現明顯的季節波動,沒有上升或者下降的趨勢,初步判斷其為平穩時間序列模型(見圖4)。樣本自相關函數圖(見圖5)檢驗,周期長度上并不存在著依存性,表明其不存在季節非平穩性。

圖4 2010年至2019年間承德市中心醫院手足口病患者數據一階差分后時間序列圖

圖5 2010年至2019年間承德市中心醫院手足口病患者數據一階差分后時間序列樣本自相關函數圖
2.4.3確定ARIMA模型的p值、d值、q值:通過一階差分后時間序列樣本自相關函數圖(圖5)及樣本偏相關函數圖(圖6)初步確定ARIMA模型自回歸階數及滑動平均項數,即p,q值。通過自相關函數圖確定q值為10,通過偏相關函數圖確定p值為8 。p值與q值過大,不符合p,q值小于2原則,進行擴展的自相關函數eacf圖(圖7)方法確定p值與q值

圖6 2010年至2019年間承德市中心醫院手足口病患者數據一階差分后時間序列樣本偏相關函數圖

圖7 2010年至2019年間承德市中心醫院手足口病患者數據一階差分后時間序列樣本擴展自相關函數圖
eacf圖并沒有呈現方便選擇取值的三角塊,按照x符號代表拒絕原假設,o符號代表接受原假設的原則選擇取值,經過篩選比較,選擇P值為0,q值為2的ARIMA模型。
2.4.4模型估計與檢驗 ARIMA(0,0,2,)擬合結果不顯著,采用參數檢驗及白噪聲檢驗方法對ARIMA(0,1,2)模型進行檢驗,白噪聲檢驗結果顯著,參數檢驗結果不顯著,建立ARIMA(0,1,2)疏系數模型,檢驗后確定為最優模型。
2.52020年至2022年承德市中心醫院手足口病流行趨勢預測:利用ARIMA(0,1,2)疏系數模型預測承德市中心醫院2020年至2022年各月份手足口病發病例數,預測發病例數值呈逐年遞減趨勢,第三季度高發季節性特征,預測結果如表2所示。

表2 預測承德市中心醫院手足口病2020年至2022年發病例數表
2010年1月至2019年12月承德市手足口病發病主要集中在6~11月份,具有明顯季節性特征,與我國北方手足口病發病時間基本一致,在此期間應加強手足口病的預防控制工作,疾病預防控制及衛生部門應在此期間加強監控與管理,合理配置醫療資源。手足口病的傳播速度與空氣中濕度與溫度相關,受季節氣候影響,適合建立ARIMA模型,為手足口病早期預警提供數理模型支撐[4]。
本研究基于2010年至2019年承德市中心醫院手足口病診療記錄資料建立以月為單位時間序列模型,一階差分使得序列平穩化,依據自相關系數ACF函數圖以及偏相關系數PACF函數圖初步確定自回歸階數及滑動平均項數,經過白噪聲檢驗和參數檢驗確定最優模型為ARIMA(0,1,2)疏系數模型,擬合的2020年及2021年發病例數與實際情況基本吻合,動態變化趨勢與手足口病流行趨勢基本一致,ARIMA模型能更好擬合承德市手足口病發病情況,更精準預測承德市手足口病流行趨勢。
根據預測結果,2020年至2022年承德市中心醫院接收手足口病患者的數量呈現明顯季節波動,自6月份承德市中心醫院預計出現接收病人高峰期,7月份迎來最多手足口病患者接收,其后8月份、9月份、10月份、11月份都將是醫院接受病人數量較大時期,2月份至次年的5月份出現接收病人數量低峰時期。
預測結果符合手足口病傳播自然因素及社會因素,夏季承德市中心醫院接收病人數量大與氣候因素有關[5]。河北省承德市作為旅游城市,夏季的旅游項目開展以及人口聚集也造成疾病發病數量的上升。9~11月份的手足口病患者高峰期與高發人群-低齡兒童,暑期結束開學形成人群聚集有重要關系[6]。12月份至次年的低峰值時期則從反方向驗證了手足口病傳播自然因素與社會因素的科學性。
選擇承德市中心醫院的手足口病的患者診療數據,不可避免產生一定選擇性偏倚,但由于承德市中心醫院作為承德市醫療水平較好,人流量大,市民選擇偏好度較高的醫院,造成的選擇性偏倚對研究承德市手足口病發病地區分布特征、人群分布特點、時間分布特點并不造成偏離分析結果的影響。
承德市中心醫院及承德市衛生部門可根據手足口病發病季節性特點,合理的分配醫療資源,實現資源節約及最大化利用。鑒于承德市手足口病流行情況,幼托所及學校等低齡兒童聚集場所應在手足口病傳播旺季采取衛生消毒防護措施及衛生知識普及,政府相關部門應制定針對易感人群的科學防控策略及措施。