程勛杰陳 濤舒躍龍胡國清△
移動流行區間法在我國北方15省份流感流行閾值制定中的應用效果評價
程勛杰1陳 濤2舒躍龍2胡國清1△
目的介紹移動流行區間法的基本原理,評價其在我國北方15省份流感流行閾值制定中的應用效果。方法利用中國流感監測信息系統收集中國北方15省份2010-2014年的流感監測數據。為不提及具體省份名稱,用字母A~O分別代替15個北方省份。應用移動流行區間法制定各省份的流感流行開始和結束閾值,利用靈敏度、特異度、陽性預測值和陰性預測值四個指標評價該方法的應用效果。結果移動流行區間法得到的北方15省流感流行開始和終止閾值波動較大,開始閾值介于3.27%~18.03%,結束閾值介于5.04%~17.68%。其中8個省份的流行開始和結束閾值非常接近,但在3個省份相差很大。15省份平均靈敏度、特異度、陽性預測值和陰性預測值不高,平均值分別為54%、81%、65%和73%,但在5個省份的應用效果較好(靈敏度≥60%,特異度>80%)。結論移動流行區間法對我國北方5個省份流感流行閾值制定的應用效果較好,但對其他北方省份的效果相對較差,表明該方法還有改進的余地。
移動流行區間法 流感 流行 閾值
流感是由流行性感冒病毒引起的急性呼吸道傳染病,容易在人群中形成流行或大流行,是危害公眾健康的重大公共衛生問題。應對流感流行的一個重要舉措是提前對可能的流行進行預警,以便及早采取措施避免可能的大流行或降低流行的強度。早期有研究利用數學模型預測流感的流行[1-2],目前研究多集中于探討利用監測數據制定流感流行閾值的方法。常見的方法有百分位數法、往年同期均值加2倍標準差和實驗室檢測流感陽性率超過流行季節最大值的30%等[3-6],但這些方法均因缺乏外部金標準而無法對判斷結果的準確性進行評估[7]。特別是在這些方法應用到其他地區時,因缺乏外部評價指標,很難對他們在不同地區的應用效果進行比較。
移動流行區間法(moving epidemic method,MEM)是Vega等學者在2008年提出的一種新的制定流感流行閾值的方法[8-9]。與上述方法比較,這種方法能對所制定流行閾值的靈敏度、特異度、陽性預測值和陰性預測值進行評價,并在歐洲地區顯示了較好的效果。本文旨在介紹移動流行區間法的基本原理,并評價該方法在中國北方15省份的應用效果。
1.數據來源和指標選擇
中國疾病預防控制中心印發的全國流感監測技術指南(2011)將每年4月1日所在周至次年4月1日所在周前一周定義為一個流感監測年度[10],按流感監測年度的劃分準則,利用中國流感監測信息系統,本研究收集了中國北方15省份2010年第14周至2014年第13周每周的流感樣病例(influenza like illness,ILI)百分比(ILI%)、咽拭子檢測陽性率(positive rate,PR),一個省份由于監測數據不全而沒有納入分析。ILI%和PR是流感監測的兩個不同指標。兩者相比,基于實驗室檢測結果的PR更加準確地反映了流感流行的規律。因此,本文采用PR作為流感流行閾值的計算指標。鑒于O′Brien等人指出對監測數據使用五周移動平均值的方法平滑能更加清晰地反映其流行規律[11],作者對原始PR數據進行了平滑處理。
移動流行區間法需預先確定流感流行季節。已發表文獻顯示,中國北方15個省份的流感流行規律相對穩定,流感流行高峰期基本處于上年度12月份至下年度4月份之間,而中部和南方省份流感流行月份變異較大,難以準確劃分流行季節[12-15],因此本文選用中國北方15省份數據評價移動流行區間法的應用效果。為避免提及具體省份名稱,下文用字母A~O分別代替15個北方省份,利用隨機數字表將15個英文字母隨機分配給15個省份。
2.移動流行區間法的原理和計算步驟
移動流行區間法是Vega等學者在研究歐洲地區流感流行閾值時提出的一種新方法,該方法主要包括三個步驟[7]:(1)確定流感流行季節的開始和結束周,計算流感流行季節長度,將流感流行季節劃分為三個不同的時段:流行前(流感流行季節開始到流感流行開始前)、流行期(流行開始到結束)、流行后(流行結束到流感流行季節結束)(圖1);(2)利用流行前期和流行后期的監測數據計算流行開始閾值和結束閾值;(3)利用流行期監測數據計算一級、二級和三級流感流行閾值,實現分等級預警。
此處簡要介紹各步驟的核心思想和具體做法如下:
第一步:Vega等人認為在一個給定的流感流行季節內流行期是連續的,且流行期的累計監測指標值(ILI%或PR)大于流行前和流行后兩個時期的累計監測指標值。此時,可以通過尋找連續監測時間段內累計監測指標值占流感流行季節總累計指標值百分比的相對最大值來劃分流感流行季節。以每周流感監測PR為例,假設某流感流行季節的長度為S周,每周流感監測PR值用ti表示,r表示連續r周,tr表示連續r周監測PR累計和的最大值,pr表示連續r周監測PR累計所占百分比的最大值,公式表示為:

圖1 移動流行區間法對流感流行季節的階段劃分

其中k表示連續r周的起始周,k+r-1表示連續r周的結束周。
利用回歸平滑技術對(p1,p2,…,pS)進行平滑處理[16],對應的平滑后數值為預先規定一個最小增量δ,δ一般介于2%~4%。對于具體的監測PR數據可通過靈敏度和特異度的最優化來確定合適的δ,逐步增大r,計算的差值,第一次出現對應的r*為該流感流行季節流行期長度,然后通過公式(1)可推導出該流感流行季節流行期的開始周k*和結束周k*+r*-1,從而確定流行前期(1~k*-1),流行期(k*~k*+r*-1)和流行后期(k*+r*~S)。
第二步:選擇某地區各流感流行季節流行前期中PR最大的n個數(n=30/N,N為某地區納入分析的流感流行季節數)。原方法建議每個國家納入分析的流行季節最好不少于5個[9]。匯總該地區的30個數據,取其算術平均數的單側95%置信區間的上限作為該地區流感流行開始閾值。采用相同方法可依據流行后期數據得到該地區流行結束閾值。
第三步:取某地區各流行期內最大的n個數,然后分別取30個流行期監測數據幾何均數的單側50%、90%和95%置信區間的上限作為低、中、高3個等級的流感流行預警閾值。
3.數據分析
首先根據參考文獻分析中國北方15省份的流感PR監測數據,確定各省份季節性流感的流行周期及流行開始和結束時間,通過移動流行區間法確定三個不同的流行時期,計算各省份的流感流行開始和結束閾值。
按照移動流行區間法第一步中確定的各省份所有納入分析的流感流行季節3個時期的劃分,將處于流行期的所有監測周判定為流行周,處于其他兩個時期的監測周判定為非流行周。移動流行區間法將此判斷結果視為判斷依據,對按照各省份計算的流行開始閾值和結束閾值對各監測周的判斷結果(流行周、非流行周)進行評價。按照移動流行區間法的要求,流感流行季節最高點以前周監測數據超過流行開始閾值被判定為流行周,否則為非流行周;流感流行季節最高點以后的周監測數據超過流行結束閾值被判定為流行周,否則為非流行周。
以移動流行區間法確定的流行周與非流行周為判斷依據,對用流行開始和結束閾值確定的各省份四個流感流行季節內各監測周的結果進行評價。計算各省份基于所確定流感流行開始和結束閾值的靈敏度、特異度、陽性預測值和陰性預測值,具體計算公式如下[9]:
靈敏度=(流行期內監測指標值大于流行閾值的監測周數)/(流行期包括的總周數)
特異度=(流行前和流行后兩個時期內監測指標值小于流行閾值的總周數)/(流行前和流行后兩個時期總周數)
陽性預測值=(流行期內監測指標值大于流行閾值的周數)/(監測指標值大于流行閾值的總周數)
陰性預測值=(流行期外小于流行閾值的周數)/(監測指標值小于流行閾值的總周數)
所有分析和計算均采用R3.2.1實現。
1.北方15省份流感季節的確定
2010-2014年北方15省份流感監測數據有明顯季節性流行趨勢,通常每年有一個流行峰,部分省份個別年份出現多個流行峰(如C省、F省和N省)。各省份周平均監測PR存在較大差異,最小平均監測PR為4.76%,最大為13.27%。總體來看,將每年第27周到次年第26周作為一個流感季節可較好描述北方15省份的流行規律,也符合有關文獻的研究結果[12]。因此,本文最終設定流感季節的長度S=52周,將每年第27周到次年第26周作為流感季節的開始周和結束周。
2.各省的流感流行開始和結束閾值
圖2結果顯示,不同省份間流感流行開始閾值和結束閾值波動較大。流行開始閾值中最小的為G省(PR=3.27%),最大的為N省(PR=18.03%);15省流行結束閾值中最小的為O省(PR=5.04%),最大的為C省(PR=17.68%)。其中,K省和L省的流行開始和結束閾值比較接近(差值絕對值小于0.5%),而C省、D省和N省的流行開始和結束閾值相差較大(差值絕對值大于5%)。

圖2 移動流行區間法各省份流感流行開始和結束閾值
3.移動流行區間法在北方15省份的應用效果
按照移動流行區間法中建議的評估方法,15省基于此方法得到的流行開始和結束閾值對應的靈敏度、特異度、陽性預測值和陰性預測值的平均值分別為54%、81%、65%和73%(表1)。
靈敏度最小的是N省(32%),最大的是C省(71%),且60%以上的僅有3個省份。特異度最小的是D省(74%),最大是C省(90%)。陽性預測值最小的是N省(42%),最大的是C省(87%)。陰性預測值最小的是I省和N省(68%),最大的是G省、K省和O省(77%)(表1)。

表1 移動流行區間法各省份四個評價指標值(%)
移動流行區間法原理中提出用于計算的數據需包含5個或以上的流感流行季節,由于數據限制,本研究僅納入了4個流感流行季節,可能會帶來一定的結果不穩定性。與該方法在歐洲地區所得的流感流行閾值的應用效果相比[9],該方法在我國北方15省份的應用效果相差較大。盡管在5個省份的應用效果與在歐洲地區的效果相當,但在其他省份的應用效果要差很多,直接造成15省份的平均靈敏度、特異度、陽性預測值和陰性預測值分別比歐洲地區的研究結果下降了18%、15%、26%和16%,特別是15省份的平均靈敏度僅為54%。此外,采用移動流行區間法所得流行開始閾值和結束閾值在2個北方省份相差極大(6.24% vs.17.68%,18.03%vs.5.04%),而在歐洲地區利用ILI和急性呼吸道感染(acute respiratory infections,ARI)作為指標所得的流感流行開始和結束閾值相差均未超過2倍[9]。這些結果提示,移動流行區間法對我國不少北方省份的流感流行閾值制定的應用效果并不理想,需要對該方法做進一步的完善。
從移動流行區間法的原理來看,該方法有兩個明顯缺陷:
(1)未消除數據波動對流行閾值制定的影響。該方法利用流行前或流行后兩個時期部分取值較大的監測值(單側95%置信區間的上限)定義流行開始和結束的閾值。當流行前或流行后兩個時期的監測數據存在較大波動時,數據集的方差偏大,進而導致所制定的流行閾值偏大,如本文中C省的流行開始閾值和N省的流行結束閾值。在未來的研究中,一方面可考慮對方差進行調整,如刪除離群值后再做數據分析;另一方面可考慮改進中間的一些步驟,如對第二步中流行閾值的計算方法進行修改,取匯總數據的平均數或者某特定百分位數作為流感流行閾值等。原文作者建議的匯總30個數據可能是作者多次嘗試后的結果,可能因為選擇30個數據所得閾值的靈敏度和特異度相對較高。雖然原方法利用30個數據來計算歐洲地區流感流行閾值有較好的效果,但將此方法應用到我國時可根據靈敏度和特異度大小確定包括數據量的最佳取值。
(2)未利用流感流行季節內監測指標最大值的信息。此缺陷直接造成兩個方面的影響。一是該方法利用移動流行區間方式尋找連續時間段內累計監測指標值的最大值,然后比較不同連續時間段累計監測指標值占流感流行季節總監測指標值的百分比來劃分流感流行季節,忽略了流感流行季節內監測指標的最大值必然處于流感流行期這個事實。如果限定連續時間段包含最大值,可以避免計算很多不包含最大值的連續時間段,從而加快計算速度,同時使得計算結果更加合理。當監測數據變異較大而又未對其做出相應限制時可能會帶來較大偏差。本研究中D省、J省均出現了流感流行季節監測指標最大值未被包含在流感流行期的異常現象。二是當一個流感流行季節內連續出現兩個流行高峰時,該方法無法保證能夠同時將兩個流行高峰的最大值納入所判斷的流感流行期。此時,如能限制連續時間段包含兩個最大值可使結果更加合理。本研究中I省、J省和K省均出現了多個連續流行高峰的最大值僅有1個被納入流行期的不正常現象。
移動流行區間法在我國北方省份的應用效果相差較大,對部分省份的應用效果較好,但對其他省份的應用效果不理想。在未來的研究中,研究人員應考慮對此方法進行改進,如增加一些限制條件,或重新提出一種更合理的方法來確定流感流行閾值。
[1]王瑞平.兩種季節趨勢模型預測法的應用比較.中國衛生統計,2011,28(1):77-78.
[2]胡興,胡錫健.新疆H1N1甲型流感疫情預測模型的比較研究.中國衛生統計,2011,28(3):342-343.
[3]Hashimoto S,Murakami Y,Taniguchi K,et al.Detection of epidemics in their early stage through infectious disease surveillance.International Journal of Epidemiology,2000,29(5):905-910.
[4]王瑞平,春雅麗,畢安華,等.上海市松江區流行性感冒控制圖法預警界值優選研究.中國初級衛生保健,2010,24(7):77-78.
[5]楊維中,邢慧嫻,王漢章,等.七種傳染病控制圖法預警技術研究.中華流行病學雜志,2004,25(12):1039-1041.
[6]Cow ling BJ,Wong IO,Ho LM,et al.Methods formonitoring influenza surveillance data.International Journal of Epidemiology,2006,35(5):1314-1321.
[7]Unkel S,Farrington CP,Garthwaite PH,et al.Statisticalmethods for the prospective detection of infectious disease outbreaks:a review.Journal of the Royal Statistical Society:Series A(Statistics in Society),2012,175:49-82.
[8]Vega T,Lozano JE,Paget J,et al.Validation of themoving epidem ic method for detecting influenza epidem ics in Europe.In:Proceedings of the International Conference on Options for the Control of Influenza VI.London:International Medical Press Ltd,2008,657.
[9]Vega T,Lozano JE,Meerhoff T,et al.Influenza surveillance in Europe:comparing intensity levels calculated using themoving epidem ic method.Influenza and Other Respiratory Viruses,2015,9(5):234-246.
[10]中國疾病預防控制中心.全國流感監測技術指南,2011.
[11]O′Brien SJ,Christie P.Do CuSums have a role in routine communicable disease surveillance?Public Health,1997,111(4):255-258.
[12]Yu H,Alonso WJ,Feng L,et al.Characterization of Regional Influenza Seasonality Patterns in China and Implications for Vaccination Strategies:Spatio-Temporal Modeling of Surveillance Data.PLoS Medicine,2013,10(11):e1001552.
[13]李明,馮錄召,曹玉,等.中國2005-2013年流感暴發疫情的流行病學特征分析.中華流行病學雜志,2015(7):705-708.
[14]張靜,楊維中,郭元吉,等.中國2001-2003年流行性感冒流行特征分析.中華流行病學雜志,2004,25(6):461-465.
[15]高燕,方立群,張勇,等.中國大陸季節性流感活動的時空分布特征.中華流行病學雜志,2009,30(11):1097-1101.
[16]Hurvich CM,Simonoff JS,TsaiCL.Smoothing parameter selection in nonparametric regression using an improved Akaike information criterion.Journal of the Royal Statistical Society,2002,60(2):271-293.
(責任編輯:郭海強)
1.中南大學湘雅公共衛生學院流行病與衛生統計學系(410078)
2.中國疾病預防控制中心病毒病預防控制所病毒基因工程國家重點實驗室
△通信作者:胡國清,E-mail:huguoqing009@gmail.com