李婷 何金戈 楊長虹 李運葵 王丹霞 陳闖 吳建林
?
·論著·
基于空間聚集性與時空掃描的肺結核流行特征分析
李婷 何金戈 楊長虹 李運葵 王丹霞 陳闖 吳建林
目的 探討2011—2015年四川省肺結核發病的時空分布特征。方法 基于中國疾病預防控制信息系統傳染病報告信息管理系統中四川省184個縣、市、區2011—2015年肺結核疫情數據和人口數據,建立地理信息數據庫,導入OpenGeoda 1.2.0和SaTScan 9.4.1軟件,進行全局、局部空間自相關分析和時空掃描聚類分析,確定肺結核發病時空熱點區域,通過ArcGIS 10.2軟件進行可視化。結果 2011—2015各年度四川省肺結核報告發病率分別為77.62/10萬(63 040例)、76.45/10萬(62 325例)、74.51/10萬(60 781例)、68.65/10萬(56 485例)和67.13/10萬(54 645例),呈明顯的聚集性分布,各年度全局空間自相關系數(Moran指數I值)分別為0.46、0.50、0.52、0.56和0.63,均具有統計學意義(P值均=0.001)。局部空間自相關分析結果表明,2011—2015年分別有18、15、15、15、14個地區處于“高-高”(HH)區域,連續5年處于HH區域的有8個,全部位于甘孜州。時空掃描分析表明,2011—2015年四川省肺結核疫情存在八級聚集區域,共涉及81個地區,對數似然比(log-likelihood ratio,LLR)為24.65~3012.78,P值均<0.01。其中,一級聚類區域位于2013—2014年甘孜州的16個縣和阿壩州的7個縣,LLR值為3012.78,RR值為3.18,P<0.01。結論 四川省肺結核疫情存在明顯的時空聚集特征,在川西高原少數民族地區、涼山州彝族地區、秦巴山區尤為顯著,應實施針對性強的區域結核病防治策略和政策支持。
結核,肺; 時空聚類分析; 傳染病控制
目前,結核病仍是各國關注的嚴重公共衛生問題,是全球范圍內對人類最具威脅性和挑戰性的傳染性疾病之一。據估算2015年全球有1040萬新發結核病患者,中國有91.8萬例,結核病負擔僅次于印度和印度尼西亞[1]。四川省是結核病疫情最嚴重省份之一[2],筆者對四川省2011—2015年肺結核疫情展開分析,以縣域為空間分析尺度,采用空間自相關分析及時空掃描分析,旨在發現四川省肺結核發病的空間聚集性及時空熱點,為進一步探索影響發病的因素及有針對性地制定防控策略和合理配置衛生資源等提供科學的理論依據。
一、資料來源
從中國疾病預防控制信息系統傳染病報告信息管理系統中獲取四川省184個縣、市、區(包括綿陽市科學城)2011—2015年年統計表中肺結核報告發病例數和報告發病率(包括涂陽、涂陰、菌陰、僅培陽和未痰檢),按照發病日期進行統計。每年報告發病例數均為年末統一訂正的數據,確保數據的準確性。數據查詢日期為2016年5月25日。人口基數來源于中國疾病預防控制信息系統基本信息系統中的2011—2015年四川省常住人口數。
二、研究方法
1.構建地理信息數據庫:以縣、市、區為單位,建立包括地理編碼、經度和緯度等信息的地理信息數據庫。以數據屬性表中地理編碼關聯肺結核疫情數據及人口數據,建立四川省肺結核發病信息的地理信息數據庫。
2.空間自相關分析:空間自相關分析是以全局指數探測整個研究區域內的空間聚集模式,以局部指標評估每一空間單元與臨近單元同一屬性的相關程度,檢驗每個空間單元相對于整體其空間自相關是否足夠顯著,從而判斷研究單元在空間“高-高”(HH)、“高-低”(HL)、“低-高”(LH)和“低-低”(LL)的分布[3]。
全局型空間自相關系數(全局Moran指數I值)反映的是空間鄰接或空間鄰近區域單元屬性值的相似程度。全局Moran指數I值取值范圍介于-1~1,I值越接近于1,表示空間單元之間關系越密切,性質越相似,整體呈現聚集性分布(高值聚集或低值聚集);I越接近于-1,表示整體呈現離散型分布,樣本之間差異越大或分布越不集中;I值為0,表示整體隨機性分布[4]。本研究首先采用全局空間自相關Moran指數I值來探測整個研究區域內的空間聚集模式,并進行統計學檢驗,檢驗水準為α=0.05。
局部型自相關分析用于反映一個區域與鄰近區域的相關程度。Moran散點圖用來研究局部的空間不穩定性。Moran散點圖分4個象限,分別對應于區域單元或與其鄰近單元之間4種類型的局部空間聯系形式,能夠進一步區分區域單元和鄰近單元之間屬于HH、LL、HL、LH中的具體空間聯系形式,在Z檢驗的基礎上(P≤0.05)繪制局部空間關聯指標(local indication of spatial autocorrelation,LISA)積聚圖[4-5]。
3.時空掃描分析:SaTScan時空掃描軟件是以空間動態窗口掃描統計為基礎,對每一個掃描窗口,根據實際發病數和人口數計算出理論發病數,然后利用掃描窗口內和掃描窗口外的實際發病數和理論發病數構造檢驗統計量對數似然比(log-likelihood ratio,LLR)來評價窗口內的發病數是否異常,并通過蒙特卡羅法模擬進行統計學檢驗,計算概率值。LLR值越大且差異具有統計學意義,則表示該動態窗口下所含區域為聚集區域的概率越大[6]。其中,一級空間聚集區域的LLR值最大,二級空間聚集區域較一級空間聚集區域的LLR值小,說明其成為空間聚集區域的概率較一級聚集區域低,以此類推[4]。本研究將聚類范圍最大值限定為30%的總人口處于風險人群中、總研究期限的50%為時間尺度,根據資料特點(研究數據包含人口資料),選用SaTScan軟件中的Possion模型進行統計分析。以肺結核報告發病數為病例數據(分子),以常住人口數為人口數據(分母),以各縣、市、區質心坐標為空間分析數據進行分析。檢驗水準為α=0.05。
4.統計學分析:應用ArcGIS 10.2軟件構建地理信息數據庫并繪制年均報告發病率的空間分布;OpenGeoda 1.2.0軟件定義空間權重矩陣并對各年度肺結核疫情開展空間自相關分析;SaTScan 9.4.1軟件進行時空聚集性分析并在ArcGIS 10.2中完成可視化。
一、疫情概況
2011—2015年,四川省肺結核報告發病數分別為63 040、62 325、60 781、56 486和54 645例,報告發病率從77.62/10萬下降至67.13/10萬,見表1。肺結核年均報告發病率(5年總發病例數/總常住人口數)為72.86/10萬。年均報告發病率最高的為甘孜州雅江縣(901例,354.23/10萬),最低的為綿陽市科學城(9例,4.26/10萬),地區差異明顯,川西地區報告發病率較高,川中地區較低,見圖1。

表1 2011—2015年四川省肺結核報告發病率
二、空間自相關分析
1.全局空間自相關:2011—2015年四川省肺結核報告發病率分布的Moran散點圖見圖2~6(a),各年度Moran指數I值分別為0.46、0.50、0.52、0.56和0.63,且均具有統計學意義(P<0.05),表明各年度四川省肺結核報告發病率呈明顯的聚集性分布。
2.局部空間自相關:局部空間自相關分析結果顯示,2011—2015年分別有18、15、15、15、14個縣(區)處于HH區域,見圖2~6(b)、表2。連續5年處于HH區域的有8個,全部位于甘孜藏族自治州,分別是道孚縣、甘孜縣、德格縣、白玉縣、理塘縣、石渠縣、雅江縣和新龍縣。阿壩州的壤塘縣和紅原縣,分別在2011—2014年,2012和2014年處于HH區域,但在2015年轉變成了LH區域。涼山州木里縣在2012—2015年均處于LL區域。

圖1 2011—2015年四川省各地區肺結核年均報告發病率

表2 2011—2015年四川省各地區肺結核報告發病率聚集分布情況
注 各年度均未發現“高-低”區域

圖a為全局空間自相關分析;圖b為局部空間自相關分析,圖例括號內數值為該區域內縣區個數圖2 2011年四川省各地區肺結核報告發病率空間自相關分析示意圖

圖a為全局空間自相關分析;圖b為局部空間自相關分析,圖例括號內數值為該區域內縣區個數圖3 2012年四川省各地區肺結核報告發病率空間自相關分析示意圖

圖a為全局空間自相關分析;圖b為局部空間自相關分析,圖例括號內數值為該區域內縣區個數圖4 2013年四川省各地區肺結核報告發病率空間自相關分析示意圖

圖a為全局空間自相關分析;圖b為局部空間自相關分析,圖例括號內數值為該區域內縣區個數圖5 2014年四川省各地區肺結核報告發病率空間自相關分析示意圖

圖a為全局空間自相關分析;圖b為局部空間自相關分析,圖例括號內數值為該區域內縣區個數圖6 2015年四川省各地區肺結核報告發病率空間自相關分析示意圖
3.時空掃描分析:時空聚集性掃描分析結果顯示,2011—2015年四川省肺結核疫情存在八級聚集區域,共涉及81個縣、市、區。一級聚集區域(即最有可能聚集區域)位于2013—2014年的甘孜藏族自治州的石渠縣、德格縣、甘孜縣、色達縣、白玉縣、爐霍縣、新龍縣、巴塘縣、道孚縣、理塘縣、丹巴縣、雅江縣、鄉城縣、得榮縣、康定縣、稻城縣等16個縣和阿壩藏族羌族自治州的壤塘縣、阿壩縣、金川縣、馬爾康縣、紅原縣、若爾蓋縣、小金縣等7個縣。二級聚集區域位于2011—2012年的涼山彝族自治州的美姑縣、雷波縣、越西縣、昭覺縣、甘洛縣、喜德縣和金陽縣等7個縣和樂山市的峨邊彝族自治縣和馬邊彝族自治縣。三至八級聚集區域分別包括34、9、2、1、2、1個縣、市、區,見表3(因聚類分級信息較多,表中只列出了一、二、三級聚集區域信息)、圖7。

圖7 2011—2015年四川省各地區肺結核報告發病率時空聚集性分析圖

表3 2011—2015年四川省各地區肺結核報告發病率時空掃描分析結果
結核病是以空氣傳播為主要傳播途徑的慢性傳染病,患者之間在時間、空間上具有一定的相關性,即一定的時間或空間的聚集傾向或趨勢[7-8]。傳統的數量統計模型不能滿足傳染病時空分布變化的研究,而空間統計為在分析空間關系的基礎上進行數值的相關分析提供了新的思路,其核心就是認識與地理位置相關數據間的空間依賴關系[9]。肺結核作為一種傳染病,與當地地理環境、經濟狀況、人口特征等都存在一定的關聯,而這種空間相關特點成為空間統計學分析的前提[10]。對結核病在時間、空間或時空方面表現出來的聚集性進行研究,既可為疾病的病因學研究提供線索,還有助于進一步評價不同時期、不同區域結核病的防控效果,又可為制定有效的防控措施和衛生決策提供科學依據[11]。
既往研究中,趙飛等[7]通過空間掃描分析2008—2010年中國以省級為單位的結核病總登記率,發現四川省2008和2009年處于一級聚集區域,而2010年處于非聚集區域。說明四川省結核病總體負擔在下降。筆者在以縣域為單位的全局空間尺度的空間相關性分析結果顯示,2011—2015年的四川省報告發病率呈明顯的聚集性分布,提示四川省內結核病負擔存在較大的不均衡性。在局部自相關分析中,空間聚集區分布是逐年減少的,分別有18、15、15、15、14個縣處于HH區域(即發病率較高),周圍地區發病率也高的地區,但空間位置較為恒定,主要位于川西高原的甘孜、阿壩、涼山等少數民族聚集地區,其中連續5年處于HH區域的有8個縣,全部位于甘孜藏族自治州。由此,一方面提示結核病疾病負擔在川西高原區域較為集中和嚴重,是結核病高風險傳播聚集區,應采取措施加強結核病的控制工作,特別是做好肺結核的發現和治療管理工作;另一方面,也表明在“十二五”期間,全省結核病防治工作是卓有成效的,結核病發病高值聚集區逐步減少,肺結核報告發病數量總體呈現穩步逐年下降趨勢。在首先重點關注HH區域結核病防治的同時,也要重視和鞏固LH和LL區域的結核病防治工作。木里縣在2012—2015年均處于LH區域,提示應受到重點關注,防止向HH區域轉變,同時要考慮是否存在傳染病漏報。還值得注意的是,阿壩州的壤塘縣和紅原縣,分別在2011—2014年,2012和2014年處于HH區域,但在2015年轉變成了LH區域,可能與這兩個縣均在2014年底實施了結核病防治新型服務體系,將肺結核診療工作由疾控中心移交至了定點醫院,移交初期肺結核患者發現和疫情報告等工作滑坡有關。另外要注意處于LL區域的成都平原地區,與川西高原地區有著密切的人員文化及經濟交流,應高度防范。
通過對肺結核發病率的全局和局部空間自相關分析,基本摸清了其分布規律,但均忽略了時間在其中的作用,看不到肺結核發病隨時間變化的趨勢,而時空掃描統計考慮了時間維度,是單純空間掃描統計分析的有益補充[12]。本研究時空掃描分析的結果顯示,2011—2015年全省肺結核疫情存在八級聚集區域,共涉及81個縣。其中一、二級聚集區均為甘孜、阿壩、涼山州的34個少數民族縣,其地域遼闊、人口密度小、經濟社會發展相對滯后、防治機構力量薄弱等特點,為結核病患者發現工作帶來了一定的挑戰。三級聚集區為2011—2012年以巴中市通江縣為中心的川東北秦巴山區34個縣、市、區。可能與川東北地區社會經濟發展水平較低,結核病疫情本身較高,結核病防治技術力量及防治機構力量薄弱等有關[13]。結果也表明,四川省肺結核疫情呈現明顯的聚集性特征,高發區域具有一定的時空穩定性。出現空間聚集現象的原因有很多,除當地的肺結核疫情、結核病防治工作水平外,還可能與當地的氣候、人口學特征、地理、經濟、社會文化等諸多因素相關[14-17]。這也提示今后在防控策略和技術措施上,對聚集區和非聚集區要有所區分和側重,應該大力強化對川西高原少數民族地區、涼山州彝族地區、秦巴山區結核病防治的力度,結合高原山區的地理、人口、經濟、文化等因素,科學合理配置結核病等公共衛生資源,實施針對性強的區域結核病防治策略和政策支持,確保全省的結核病防治工作的均衡發展。
在傳統的流行病學“三間”分析中,地區分析無法考慮相鄰地區之間傳染病的相互影響及傳播。利用時空掃描分析方法探索傳染病聚集性,由于事先未對聚集性的大小、位置、規模作任何假定,避免了選擇偏倚,可以最大限度地進行數據信息的挖掘,發現聚集性的存在[14]。目前,國內對結核病空間分布的研究多以省為空間分析尺度,空間尺度較大,不夠精確;或是以鄉鎮為尺度對某市的疫情聚集性進行分析,區域較為局限。而本研究在相對較小尺度下(縣級水平)對四川省的情況進行分析,有較高的精確性。然而本研究也有一定的局限,研究數據均來源于“大疫情”系統的報告,由于部分患者未到結防機構進行確診,再加上各地結核病診斷和傳染病報告水平參差不齊,所以本數據并不能完全代表當地的結核病自然發病水平。另外,由于未收集各地區社會經濟、地理環境等信息,因此本研究只完成了肺結核病聚集性的統計學檢驗,未對產生聚集性的影響因素進行分析和描述,這也是今后需要進一步完善和探究的方向。
[1] World Health Organization.Global tuberculosis report 2016.Geneva:World Health Organization, 2016.
[2] 李婷,何金戈,張佩如,等.2012年四川省結核病流行病學調查結果分析. 預防醫學情報雜志,2013,29(11):937-941.
[3] Tsai PJ, Lin ML, Chu CM, et al. Spatial autocorrelation analy-sis of health care hotspots in Taiwan in 2006. BMC Public Health, 2009,9:464.
[4] 趙飛,王黎霞,成詩明,等.中國2008—2010年結核病空間分布特征分析.中華流行病學雜志,2013,34(2):168-172.
[5] 岳玉娟,任東升,劉起勇. 2005—2013年中國大陸登革熱疫情時空分布.疾病監測,2015,30(7):555-560.
[6] Song C, Kulldorff M. Power evaluation of disease clustering tests.Int J Health Geogr,2003,2(1):9.
[7] Nunes C.Tuberculosis incidence in Portugal: spatiotemporal clustering.Int J Health Geogr, 2007, 6:30
[8] Jia ZW, Jia XW, Liu YX, et al. Spatial analysis of tuberculosis cases in migrants and permanent residents, Beijing, 2000—2006. Emerg Infect Dis, 2008, 14(9): 1413-1419.
[9] 王永.肺結核發病的時空聚集性研究.杭州:浙江大學,2008.
[10] 唐益,龔德華,白麗瓊,等. 湖南省2003—2011年活動性肺結核患者登記的空間分析.中國防癆雜志,2012,34(12):764-767.
[11] 劉云霞,李士雪,王忠東,等.基于時空重排掃描統計量的結核病聚集性研究.山東大學學報(醫學版),2009,47(2):122-125.
[12] 山珂.肺結核發病空間聚集分布及影響因素研究.濟南:山東大學, 2014.
[13] 李婷,張佩如,夏勇,等. 2009—2013年四川省在校學生結核病患者登記情況及特征分析.中國防癆雜志,2015,37(1):24-29.
[14] 單志力,徐剛,周祖木,等.2008—2013年溫州市肺結核疫情時空流行病學分析.中國防癆雜志,2016,38(2):99-103.
[15] 孫果梅, 路麗蘋, 彭文祥, 等. 2006—2009年上海市松江區結核病空間分布特征及影響因素.中華預防醫學雜志,2012,46(10):903-907.
[16] Li XX, Wang LX, Zhang H, et al. Spatial variations of pulmonary tuberculosis prevalence co-impacted by socio-economic and geographic factors in People’s Republic of China, 2010. BMC Public Health, 2014, 14:257.
[17] 叢明瑤, 云妙英, 阿德娜依·阿力肯. 氣候因子對肺結核發病率影響的分析. 中華疾病控制雜志, 2014, 18(11): 1051-1054.
(本文編輯:李敬文)
A clustering study on pulmonary tuberculosis based on pure spatial clustering and spatiotemporal scanning
LITing*,HEJin-ge,YANGChang-hong,LIYun-kui,WANGDan-xia,CHENChuang,WUJian-lin.
*TuberculosisPreventionandControlDepartment,SichuanCenterforDiseaseControlandPrevention,Chengdu610041,China
Correspondingauthors:HEJin-ge,Email:hejinge@163.com;YANGChang-hong,Email:changhong_yang@hotmail.com
Objective To explore the spatial and temporal distribution of pulmonary tuberculosis (PTB) in Sichuan province. Methods Geographic information data were from the incidence data of PTB and demographic data reported in the China disease prevention of infectious disease reporting information management system in 184 counties of Sichuan province from 2011 to 2015. Global indication of spatial autocorrelation (GISA), local indication of spatial autocorrelation (LISA) and spatial-temporal clustering analysis were conducted with software OpenGeoda 1.2.0 and SaTScan 9.4.1 in order to determine high risk areas of PTB, and it could be visualized by software ArcGIS 10.2. Results From 2011 to 2015, the incidence rates of PTB in Sichuan were 77.62/100 000 (63 040 cases), 76.45/100 000 (62 325 cases), 74.51/100 000 (60 781 cases), 68.65/100 000 (56 485 cases) and 67.13/100 000 (54 645 cases), respectively. There was obvious clustering for the incidence rate in each year and the global spatial autocorrelation coefficient Moran’sIwas statistically significant (from 2011 to 2015, the values were 0.46, 0.50, 0.52, 0.56 and 0.63, respectively, allP=0.001). Local autocorrelation analysis showed that there were 18, 15, 15, 15 and 14 counties in the “high-high” (HH) region from 2011 to 2015, respectively. There were 8 counties all located in Ganzi in the HH region for 5 consecutive years. Spatial temporal clustering analysis showed that there were 8 clustering districts of the epidemic of PTB in Sichuan, covering a total of 81 counties, log-likelihood ratio (LLR) values ranged from 24.65 to 3012.78, allP<0.01. The most likely clustering was in 16 counties of Ganzi and 7 counties of Aba from 2013 to 2014 (LLR=3012.78,RR=3.18,P<0.01). Conclusion Obvious spatial temporal clustering of PTB distribution was found in Sichuan, especially in ethnic minority areas in the Western Sichuan Plateau, Liangshan Yi area and Qin Ba mountain area, where TB control strategies and policy support should be targeted.
Tuberculosis, pulmonary; Space-time clustering; Communicable disease control
10.3969/j.issn.1000-6621.2016.12.007
四川省科技廳應用基礎研究項目(2011JY0066)
610041 成都,四川省疾病預防控制中心結核病預防控制所(李婷、何金戈、李運葵、王丹霞、陳闖),公共衛生信息所(楊長虹),辦公室(吳建林)
何金戈,Email:hejinge@163.com;楊長虹,Email:changhong_yang@163.com
2016-09-18)