王海峰,尤愛國
腎綜合出血熱是由漢坦病毒引起,伴有腎損綜合征的一組出血熱的綜合名稱[1]。河南省于1963年首次報告腎綜合征出血熱病例,上世紀80年代經歷過2次發病高峰,2次高峰發病人數均接近萬例,此后疫情逐漸呈下降趨勢[2]。但近年來,河南省腎綜合征出血熱疫情又開始小幅度回升。因此,搞清腎綜合征出血熱病例時空分布特點,對探索疾病流行因素,進一步指導防治腎綜合征出血熱工作具有較高的應用價值。本文將河南省2010年度腎綜合征出血熱報告病例數按日期和縣區分布,分別進行Poisson分布和負二項分布的擬合,并進行檢驗,對病例的時間和空間聚集性進行分析。
1.1 疫情數據2010年河南省腎綜合征出血熱疫情資料來自“中國疾病預防控制系統V2.0”中的子系統“疾病監測信息報告管理系統”。
1.2 概率模型
1.2.1 Poisson分布[3]

(1)式中,e為自然對數的底,e=2.71828;λ為總體平均數,可用樣本平均數代替。X為報告病例數,X=0,1,2,3……n。計算出X對應的P之后,理論頻數T X=NP(X)。N為觀察單位總數。
1.2.2 負二項分布[3]負二項分布的參數μ一般用樣本均數作為其估計值,但參數k的估計就復雜一些。k值有4種估計方法[4],本文先用矩法估計一個粗略的k值,然后再用最大似然法估算精確的k值。所謂矩法就是用樣本的均數和方差S2分別作為負二項分布的均數μ和方差σ2的估計值,由下面式(2)求得。

f為樣本陽性數,X對應的頻數,N為觀察單位總數。
所謂最大似然法(maximum likelihood method)是指能夠滿足下面式(3)的Z=0的k值即為所求。

(3)式中m=Xmax,即樣本計數X所取得到的最大值;即樣本中所有計數大于X的頻數之和
求出精確k值后,令,則負二項分布的概率計算公式為

計算出X對應的P之后,理論頻數T X=NP(X)。N為觀察單位總數。
2.1 發病概況 2010年河南省共報告腎綜合征出血熱病例186例。按天計算發病數,則254 d沒有報告病例,其余每天發病數1~8例,每天平均發病數;按縣區計算發病數,則分布在88個縣區,每個縣區病例數1~9例。有79個縣區沒有報告病例。每縣區平均發病數
2.2 時間(日)分布與Poisson分布和負二項分布的擬合 按照X=0,1,2,3……8,將一年365 d對應的實際頻數進行歸類計數(見表1)。根據式(1)計算X對應的Poisson分布概率,求出各組的理論頻數T X;負二項分布則先由矩法求出粗略的k=0.557 3,再由最大似然法求出精確的k=0.561 3,根據(4)求出各組的理論頻數T X。擬合優度檢驗用卡方檢驗。
由表1可看出,河南省2010年腎綜合征出血熱發病時間分布不服從Poisson分布(χ2=51.251 9,v=2,ν=0.05,P<0.05),而服從負二項分布(χ2=0.414 3,v=2,ν=0.05,P>0.05)。由此,可以認為河南省2010年腎綜合征出血熱病例在時間分布上不是隨機均勻分布的,而是表現出一定程度的聚集性。用圓形分布法對2010年河南省腎綜合征出血熱進行季節性分析后,平均角(雷氏檢驗P<0.05),所對應的高峰日期為11月14日。

表1 河南省2010年腎綜合征出血熱時間(日)分布與Poisson分布和負二項分布的擬合Tab.1 The fitting on temporal distribution of HFRS cases in Henan Province in 2010 by Poisson distribution and negative binomial distribution
2.3 空間(縣區)分布與Poisson分布和負二項分布的擬合 按照X=0,1,2……9,將河南省167個縣區對應的實際頻數進行歸類計數(見表2)。根據式(1)計算X對應的Poisson分布概率,求出各組的理論頻數T X;負二項分布則先由矩法求出粗略的k=0.740 9,再由最大似然法求出精確的k=0.845 5,根據(4)求出各組的理論頻數T X。擬合優度檢驗用卡方檢驗。
由表2可看出,河南省2010年腎綜合征出血熱發病空間分布不服從Poisson分布(χ2=67.121 3,v=3,ν=0.05,P<0.05),而服從負二項分布(χ2=7.254 3,v=3,α=0.05,P>0.05)。由此,可以認為河南省2010年腎綜合征出血熱病例在空間分布上不是隨機均勻分布的,而是表現出一定程度的聚集性。結合流行病學標點地圖,可以看出病例主要聚集性駐馬店市的正陽縣、平輿縣和汝南縣等地。

表2 河南省2010年腎綜合征出血熱空間(縣區)分布與Poisson分布和負二項分布的擬合Tab.2 The fitting on spatial distribution of HFRS cases in Henan Province in 2010 by Poisson distribution and negative binomial distribution
Possion分布是一種稀有事件的隨機均勻分布,服從Possion分布的事件彼此間是相互獨立的,如某人是否患某種疾病與他人是否患該病無關等;換言之,若不服從Possion分布,則可認為某一疾病等事件具有空間聚集性、傳染性[5]。負二項分布是一種聚集性分布,在醫學中主要用于聚集性疾病及微生物、寄生蟲分布模型等的研究[3],具體地說,當個體間發病概率不相等即可以擬合負二項分布,如單位人數內某傳染病的發病人數等。腎綜合征出血熱是一種以鼠為宿主動物的自然疫源性疾病,其發病特點是自然散發。根據本研究結果,可認為2010年河南省腎綜合征出血熱病例在時間和空間分布上皆不服從Poisson分布,而皆服從負二項分布,這提示每個時間或空間單元內陽性個體的存在,受到了某些因素的影響,從而導致病例分布不再呈現隨機、均勻的特點,呈現一定程度的聚集性。
郭鳳蓮[6]等對山東省莒南縣1975-2004年的腎綜合征出血熱時空動態變化進行了研究,發現在腎綜合征出血熱流行初期,發病處于原始的自然散發狀態,病例呈現Poisson分布。但是,隨著自然疫源狀態被破壞,腎綜合征出血熱病例分布開始服從負二項分布。導致這種變化的原因,薛付忠[7]等認為是在秋末冬初滅鼠的時候,由于只滅家鼠,不滅野鼠,破壞了家、野鼠之間的生態平衡,使得帶病毒野鼠廣泛向室內遷移,人群感染機會增大,形成秋末冬初峰。春天家鼠密度回升,與野鼠爭奪領地,病毒在家野鼠之間傳播,形成春末夏初峰。因此,對于服從負二項分布的疫源地,在制定滅鼠措施的時候要采取綜合滅鼠措施,盡可能維持家鼠和野鼠之間的平衡,才有可能消除疫源地。
[1]宋干.腎綜合征出血熱[J].預防醫學論壇,2005,11(4):508-512.
[2]李林紅,吳振溢,張彥平,等.河南省腎綜合征出血熱不同類型疫區監測比較研究[J].中國媒介生物學及控制雜志,2002,13(2):127-130.
[3]孫振球.醫學統計學 [M].2版.北京:人民衛生出版社,2007:124-131.
[4]查明.負二項分布參數K的四種估算方法[J].熱帶病與寄生蟲學,2000,(29)2:107-109.
[5]金丕煥.醫用統計方法 [M].2版.上海:復旦大學出版社,2008:197.
[6]郭鳳蓮,許桂春,李學剛,等.山東省莒南縣腎綜合征出血熱的空間分布及其時空動態變化[J].中國預防醫學雜志,2007,8(5):559-562.
[7]薛付忠,王潔貞,馬希蘭.疾病空間分布狀態的負二項分布概率生成模型的討論[J].中國衛生統計,2000,17(6):366-368.