劉 潔,曲 波
狂犬病在全球廣泛流行,是迄今為止人類病死率最高的疾病[1]。衛生部公布的全國重點傳染病疫情顯示,2008年至2010年狂犬病的死亡人數均位居前列。其中,2010年全年狂犬病死亡人數2014例,僅低于艾滋病、肺結核死亡[2]。因此深入分析狂犬病流行病學特點,為了解該疾病的流行規律提供素材,為進一步有針對性的提出預防控制措施提供依據具有重要的現實意義。
聚類分析是研究事物分類的一種多元統計方法,是在沒有先驗知識的情況下,根據多個觀測指標,找出能夠度量樣本或變量之間相似程度的統計量,并以此為依據,采取某種聚類方法,將所有樣本或變量分別聚合到不同的類中。其中將多個指標歸類的方法又稱R型聚類,將多個樣品聚類的方法又稱 Q 型聚類[3-5]。本文利用我國2008-2010年的狂犬病發病率資料,分析其變化趨勢,采用樣品聚類分析法,對其進行綜合評判并進行分類,為有關部門制定相關衛生政策提供理論依據。
1.1 資料來源 收集整理2008-2010年《中華人民共和國衛生部公報》轉載的歷年我國狂犬病的發病相關資料。人口資料來自歷年《中國統計年鑒》。
1.2 分析方法 本文采用的層次聚類(hierarchical clustering analysis,又稱系統聚類)是實際工作中應用最多的一種將相似的樣品或變量歸類的聚類方法。層次的含義是:開始時將每個樣本(或變量)獨自視為一類,將距離最近的兩類合并;重新計算新類與其他類的距離,再將距離最近的兩類合并;重復以上步驟,直至所有的樣本(或變量)被并為一類。類與類之間的距離有各種不同的定義方法,常用的方法有類間平均法、類內平均法、最近距離法、最遠距離法、離差平方和法等。本研究將每個省視為一個樣品,其2008-2010年狂犬病發病率作為聚類指標,進行Q型聚類。類間距離采用常用的類間平均法。
1.3 統計分析軟件 采用SPSS 16.0軟件對數據進行統計分析。
2.1 一般情況 2008-2010年各年我國31個省具體發病情況見表1。2008年全國狂犬病發病率較高的省區有:海南、廣西、貴州、重慶、湖南、廣東。2009年全國狂犬病發病率較高的省區有:貴州、廣西、海南、重慶、廣東、湖南。2010年全國狂犬病發病率較高的省區有:海南、貴州、廣西、重慶、廣東、云南、湖南。
2.2 聚類分析結果 以狂犬病發病率值為聚類指標,對全國31個省、區、市進行層次聚類,結果見圖1-3。從圖1可以直觀地看出,2008年我國各省區狂犬病發病情況分為兩大類時,海南單獨作為一組,其余省區為一組,當各省區分為3類時,重慶、貴州和廣西也聚為一組。繼續細分組,廣東省和湖南省又被聚為一組。其余各省區報告發病率均不太突出,具體聚類結果見圖1。圖2結果顯示,2009年我國各省區狂犬病發病情況分為兩大類時,重慶、海南單獨作為一組,其余省區為一組,當各省區分為3類時,廣東省和湖南省也聚為一組。繼續細分組,貴州和廣西又被聚為一組。其余各省區報告發病率均不太突出,具體聚類結果見圖2。圖3結果顯示,2010年我國各省區狂犬病發病情況分為兩大類時,海南單獨作為一組,其余省區為一組,當各省區分為3類時,貴州和廣西也聚為一組。繼續細分組,湖南省、重慶、云南、廣東省又被聚為一組。其余各省區報告發病率均不太突出,具體聚類結果見圖3。聚類結果提示,全國狂犬病發病率高的省份,其發病與一般省區的相似程度較低,易被單獨分組,而發病率較低的省份,在分組數較少時,不易被單獨分列為一組。

圖1 2008年我國各地狂犬病發病率的聚類分析圖Fig.1 Hierarchical clustering analysis of actual incidences rabies reported in China in 2008

圖2 2009年我國各地狂犬病發病率的聚類分析圖Fig.2 Hierarchical clustering analysis of actual incidences rabies reported in China in 2009

圖3 2010年我國各地狂犬病發病率的聚類分析圖Fig.3 Hierarchical clustering analysis of actual incidences rabies reported in China in 2010

表1 2008-2010年全國各地狂犬病報告發病率(1/10萬)Tab.1 Incidence of rabies in China during 2008-2010(1/100 000)
亞洲是全球狂犬病流行最為嚴重的地區,近年來,80%以上的病例出現在亞洲,傳播宿主仍然以狗為主[6]。我國從1950-2004年人狂犬病死亡約102 280例,共出現5次高峰,前4次高峰約每10年出現1次,流行范圍幾乎遍及全國。從2008-2010數據顯示,狂犬病仍為公共衛生重大疫病。
本文利用全國不同地區狂犬病的發病率,應用層次聚類分析法,分析疾病的地區分布,為進一步做好狂犬病的防控工作提供參考依據。聚類結果提示的全國狂犬病高發省份為海南、廣西、貴州、重慶、湖南、廣東。這些省份有其共同的特點,均屬于南方城市,溫度較高,室外活動頻率較高,這些因素可能與狂犬病高發率有關。發病率較低的省份,發病率與一般省份的相似程度較高,在分組數較少時,個別狂犬病發病率較低的省份未被單獨分列為一組。本次研究中聚類分析結果和全國各地狂犬病的實際發病特點一致。鑒于狂犬病的高病死率,及對社會的嚴重危害,應進一步加強綜合防控措施,尤其是高發地區的防控措施,努力降低疾病的發生,減少其對社會的危害。
[1]Sun JW,Chen HM,Xu BL.Incubation period and survival-hazard tendency after exposure to human rabies by Cox regression analysis[J].Chin J Zoonoses,2011,27(8):734-737.(in Chinese)孫建偉,陳豪敏,許汴利.狂犬病潛伏期及病例暴露后生存與風險變化的Cox回歸分析[J].中國人獸共患病學報,2011,27(8):734-737.
[2]Ministry of Health of the People's Republic of China.China health statistical yearbook 2011[M].Beijing:Peking Union Medical College Press,2010:255-261.(in Chinese)中華人民共和國衛生部.2011中國衛生統計年鑒[M].北京:中國協和醫科大學出版社,2010:255-261.
[3]Chen JS,Chen WK.Exploration of cluster analysis and logistic analysis on quantitattive diagnosis of syndromes in Chinese medicine[J].Chin J Health Stat,2009,26(4):379-382.(in Chinese)陳建設,陳文塏.聚類分析結合logistic回歸分析在中醫證候診斷量化研究中的應用探討[J].中國衛生統計,2009,26(4):379-382.
[4]Li XS.Medical statistics[M].Beijing:Higher Education Press,2008:12.(in Chinese)李曉松.醫學統計學[M].北京:高等教育出版社,2008:12.
[5]Song MH,Sui H,Wang TT,et al.Hierarchical clustering analysis on the food intake patterns[J].Chin J Health Stat,2009,26(2):198-199.(in Chinese)宋忙華,隋虹,汪婷婷,等.聚類分析在膳食模式研究中的應用[J].中國衛生統計,2009,26(2):198-199.
[6]Qiu H,Deng ZJ,Hong J.Epidemiological characteristics of rabies in Kunming city during 1981-2010[J].Chin J Zoonoses,2011,27(9):854-856.(in Chinese)邱泓,鄧智杰,洪勁.1981-2010年昆明市狂犬病流行特點[J].中國人獸共患病學報,2011,27(9):854-856.