滕沖 王玉蘭 劉柳 張芳 黃飛 李濤 趙冰 趙雁林 歐喜超
世界衛生組織(World Health Organization,WHO)2023年全球結核病報告顯示,2022年我國估算結核病患者數位居全球第三(占全球7.1%),報告發病數51.66萬例[1]。東城區位于北京市東部中心區域,人口密集,結核病防控難度較大,本地區的各項結核病防治工作亟需加強。時間序列分析是從自相關角度揭示數據隨時間發展規律的分析方法,因數據具有不可重復性,可通過構建合適的模型來反映數據變化規律。季節性自回歸滑動平均混合模型(seasonal autoregressive integrated moving average,SARIMA)是時間序列中常見的一種模型[2]。為了解北京市東城區肺結核報告發病情況和變化規律,提出有效降低本轄區肺結核發病防控策略,筆者分析了東城區2013—2022年肺結核報告發病數據,根據既往月份數據構建適合預測的SARIMA模型,并通過該模型對本轄區肺結核報告發病數進行短期預測。
通過“中國疾病預防控制信息系統”子系統“傳染病監測系統”獲取北京市東城區發病日期在2013年1月1日至2023年6月30日所有臨床診斷和實驗室診斷的肺結核及結核性胸膜炎報告發病相關數據;人口學數據來源于北京市統計年鑒。
根據《WS 196—2017結核病分類》,將2013—2018年的結核性胸膜炎患者歸入肺結核患者數據中。為確保數據前后一致性,2013—2018年的涂陽和僅培陽患者數據歸入病原學陽性患者數據,涂陰患者數據歸入病原學陰性患者數據,未痰檢和結核性胸膜炎患者數據歸入無病原學結果患者數據中進行分析。
1.平穩化處理:應用時序圖判斷數據是否平穩,如果是非平穩序列,則采用差分和(或)季節差分,應用單位根(augmented dickey-fuller,ADF)和隨機性檢驗判定平穩性和可用性。
2.模型構建與檢驗:選擇SARIMA(p,d,q)×(P,D,Q)s模型,p和q為自回歸和移動平均階數,d為差分次數,P和Q為季節性自回歸和移動平均階數,D為季節差分數,s為季節波動的周期,P和Q一般取值0~2[3]。自相關函數(autocorrelation function,ACF)圖和偏自相關函數(partial autocorrelation function,PACF)圖識別p和q參數。應用赤池信息量準則(Akaike information criterion,AIC)和貝葉斯信息量(Bayesian information criterion,BIC)評價擬合效果,最終確定最優模型階數。應用Ljung-BoxQ檢驗模型參數,模型殘差是隨機序列且QQ圖滿足正態分布,SARIMA模型可用于預測[4]。
3.模型評價:應用SARIMA模型均方根誤差(root mean square error,RMSE)和平均絕對百分比誤差(mean absolute percentage error,MAPE)評價模型預測準確性。RMSE值和MAPE值越接近0,表明模型越優,誤差越小。
根據傳染病監測系統的統一要求,東城區疾病預防控制中心每日有專人負責審核訂正轄區內結核病傳報卡,同時,定期對結核病診斷與報卡的人員進行技術培訓及醫療機構報告質量督導評價,以保證上報數據的及時性和準確性。



表1 2013—2022年北京市東城區肺結核報告發病情況
1.性別分布:2013—2022年北京市東城區報告的男性肺結核患者有1559例,女性肺結核患者有946例,男性與女性年均報告發病率分別為36.85/10萬和21.20/10萬,男女性年均報告發病率之比為1.73∶1,男性高于女性(χ2=184.738,P<0.001)。
2.年齡分布:2013—2022年北京市東城區報告肺結核患者中,構成比較高的年齡組為20~29歲組(19.88%)、50~59歲組(14.77%)及≥80歲組(14.38%)。見表2。

表2 2013—2022年北京市東城區報告肺結核患者不同特征分布情況
3.職業分布:2013—2022年北京市東城區報告的2505例肺結核患者中,構成比較高的職業有離退人員(37.72%)、家務及待業人員(24.71%),見表2。
4.時間分布:季節分析顯示,季節指數在0.83~1.09之間,呈周期性波動,2月和10月出現低谷,3月、5月和7月出現小高峰,流行期主要集中在3—8月和12月,見圖1。

圖1 2013—2022年北京市東城區肺結核月報告發病數據分布圖
5.地區分布:2013—2022年北京市東城區17個街道所有報告肺結核患者占比主要集中在永定門外街道[11.38%(285/2505)]、和平里街道[10.22%(256/2505)]、東直門街道[8.94%(224/2505)]、北新橋街道[6.83%(171/2505)]、東花市街道[6.43%(161/2505)]。
1.平穩化處理:2013—2022年時序圖呈不平穩且存在12個月周期波動性(圖1),通過一階差分和2次季節差分后,序列在0周圍波動,呈平穩化(t=-6.377,P=0.010)且為非隨機序列(χ2=11.556,P<0.001)。
2.模型構建及檢驗:參數d=1,D=2。ACF圖在2階呈截尾,PACF圖呈拖尾,判斷p取0,q取2,考慮SARIMA(0,1,2)×(P,2,Q)12,P和Q分別取0,1,2逐個嘗試,選擇SARIMA(0,1,2)(1,2,1)12模型(AIC=657.67,BIC=670.44)作為最優模型,模型殘差ACF和PACF系數均在95%CI范圍內(圖2),滿足正態分布且Ljung-BoxQ檢驗確定為純隨機序列(χ2=0.102,P=0.750)。

圖2 SARIMA(0,1,2)(1,2,1)12模型殘差自相關函數和偏自相關函數圖
3.模型評價與預測:SARIMA(0,1,2)(1,2,1)12模型的RMSE為5.188,MAPE為22.01%。總體相對誤差為-17.72%,實際值均在預測值95%CI內且變化基本一致,見表3。

表3 北京市東城區2023年1—6月肺結核報告發病數預測情況
2013—2022年北京市東城區肺結核報告發病率呈整體下降趨勢,且低于北京和全國肺結核同期報告發病水平[5],東城區結核病防治工作取得了一定的進展,并且年均遞降率為5.26%,暫時達到終結結核病策略的階段性目標[1]。2017年東城區結核病報告發病率下降較快,可能與東城區實行“三位一體”結核病綜合防治模式,以及《WS 196—2017結核病分類》標準實行有關;2018年報告發病率有所上升,提示東城區在實行新的結核病防治管理模式基礎上,相關的結核病防控政策與措施仍需要嚴格推行和落實。2020年報告發病率最低,可能是受其他呼吸道疾病流行的影響,人員流動減少、就診率下降所致[6]。2013—2022年,東城區病原學陽性肺結核占比呈逐年上升趨勢,與北京市其他區縣的研究結果一致[7-8]。這可能與醫療機構標本采集質量提升,實驗室開展痰涂片、培養及分子生物學聯合檢測使得檢測水平提升,市級和區級定點醫療機構的逐步納入等原因有關。
本研究中,男性報告肺結核發病率是女性的1.73倍,與全國[5]和北京其他區縣的研究結果相似[7,9]。男性肺結核發病率普遍高于女性的原因可能是由于家庭負擔重、不良生活習慣、吸煙飲酒比例高,以及激素水平影響等,導致在感染結核分枝桿菌的情況下,比女性更容易發展成為結核病[10]。同時,本研究發現肺結核高發人群主要集中在青壯年、老年人,推測與青壯年人群學習壓力大,生活不規律等原因有關;老年人群基礎疾病較多,免疫力隨年齡的升高而降低,結核病發病風險也隨年齡升高而升高,提示應加強鞏固轄區內老年人防控措施,增加主動篩查頻次,督促可疑癥狀者及時就診,同時,相關醫療機構引進新的檢測設備、技術和試劑,以便能做到早發現、早診斷、早治療。東城區肺結核患者職業以離退人員為主,與高發年齡相一致,家務及待業、干部職員、商業服務(含餐飲)、工人、教師及學生等群體也需要重點關注和排查,可通過宣傳結核分枝桿菌潛伏感染的預防干預,以及實施主動篩查措施等實現早發現和早治療的目的。此外,教師及學生群體仍是重點關注群體,為防止出現學校聚集性疫情,應繼續加強結核病早發現力度,做好新生入學篩查、日常晨午檢、出勤情況記錄、健康教育,以及疑似癥狀后續相關的預防性治療和隨訪等工作。從時間分布上看,報告發病在2月和10月呈現低谷,可能與春節、國慶長假期,就診機構放假、春節傳統習俗等有關,而3月出現高峰可能是因為節后效應所致,與薛曉等[11]研究結果相似。從地區分布上看,患者主要集中在永定門外街道、和平里街道、東直門街道、東花市街道等人口密集區域,提示人口密度越大,感染結核分枝桿菌的可能性越大。因此,應進一步加強這些地區不同人群的主動篩查工作和健康宣教,提高公眾對結核病的認知及就診檢查意識。
ARIMA模型在國內已廣泛應用于醫學研究和疾病預測[3],而且其研究結果均呈現較好準確性,但因各地區報告的傳染病流行特征不同,所構建的最優模型及預測效果也存在差異[12]。本研究基于北京市東城區10年報告發病數建立SARIMA模型,雖然每個月的預測值95%CI包含了實際值,但總體誤差結果大于北京市其他區[13]和其他省份的SARIMA模型預測結果[12],可能是由于每月發病數據較小的原因。另外,本研究也存在一定的局限性,研究所使用數據為報告發病數和報告發病率,與真實情況存在一定的差距,對模型的建立可能會有一些影響。因此,在今后的工作中將繼續定期收集數據,同時,在原有基礎上加強傳染病監測系統數據漏報漏登及數據準確性的核查工作,以便將來能定期更新和探索適合本區的更優疾病預測模型。
綜上所述,北京市東城區是全國低疫情區域,轄區內肺結核疫情雖然得到一定程度的控制,但因肺結核癥狀不明顯、發病周期和診斷時間較長、公眾就醫意識不高、患者依從性差、規律服藥率低等各種原因,疫情隨時有可能會上升。隨著轄區內結核病防治模式和結核病患者管理服務體系的成熟與完善,東城區下一步將進入攻克重點人群和重點地區的環節,結合轄區內街道社區實際情況,協同其他相關機構和部門進一步加強青壯年和老年人群的主動篩查和主動發現的力度,同時,借助其他各類公益宣傳活動,定期對不同人群開展多元化的健康宣教活動,提高公眾主動就醫意識。對于有結核病可疑癥狀者,建議在原有轉診的基礎上開展就醫綠色通道,降低患者就醫難度。
利益沖突所有作者均聲明不存在利益沖突
作者貢獻滕沖:實施研究、采集數據、分析/解釋數據、起草文章、統計分析;王玉蘭:實施研究、采集數據、指導、支持性貢獻;劉柳和張芳:實施研究、采集數據、支持性貢獻;黃飛和李濤:醞釀和設計實驗、統計分析、指導;趙冰:實施研究、分析/解釋數據、指導;趙雁林:對文章的知識性內容作批評性審閱、獲取研究經費、指導;歐喜超:醞釀和設計實驗、實施研究、分析/解釋數據、統計分析、指導