高磊 張慧 胡茂桂 徐成東 夏愔愔 李濤 陳偉 何翼君 曹雪芳 辛赫男 張浩然 趙雁林 王勁峰 成詩明 金奇 劉劍君
結核病目前仍是對人類健康威脅較大的重大傳染病之一。最新的模型估計全球有近1/4的人感染結核分枝桿菌并長期處于結核分枝桿菌潛伏感染(latent tuberculosis infection,LTBI)狀態[1]。在無預防性治療的情況下,LTBI人群中大約有5%~10%會在一生中發生活動性結核病[2],因此,LTBI人群是一個龐大的潛在“患者庫”。2015年世界衛生組織(World Health Organization, WHO)首次發布了LTBI管理指南,倡導在113個中高收入、結核病發病率低于100/10萬的國家(包括中國在內)推廣高危人群LTBI的檢測及預防性治療,以實現全球結核病發病率的快速下降[3]。2017年WHO召開全球部長級會議、2018年聯合國召開首次結核病高級別會議,均號召對包括LTBI預防性治療在內的全球戰略目標做出政府承諾,包括到2022年對至少600萬HIV感染者及400萬5歲以下的密接兒童開展預防性治療[4-5]。LTBI管理已經成為實現終止結核病流行(End TB)全球戰略目標的重要手段。
作為結核病高負擔國家,如何有效利用LTBI干預以實現結核病發病率的快速下降,值得探討。其中,準確掌握我國的LTBI負擔是評估策略可行性和科學性的前提。目前,LTBI的檢測是在排除活動性結核病的基礎上采用結核菌素皮膚試驗(tuberculin skin test, TST)或γ-干擾素釋放試驗(interferon-gamma release assay,IGRA)等免疫學方法界定目標人群的感染狀態。考慮到TST結果受卡介苗接種和環境非結核分枝桿菌感染等多種因素的影響,基于TST的流行病學調查結果可能會過高估計我國LTBI負擔。自2000年第四次全國結核病流行病學抽樣調查之后[6],我國未再就全國結核分枝桿菌潛伏感染率和感染人數開展過大規模調查。隨著我國結核病防控工作不斷進步,以IGRA為代表的特異性顯著改善的新型檢測技術得到普及,我國的LTBI負擔亟需重新評估。
在當前缺乏全國范圍的LTBI流行病學數據的背景下,本研究擬利用多中心的基于IGRA結果的流行病學調查數據[7]和糾偏空間統計推斷模型(Biased Sample Hospital-based Area Disease Estimation,B-SHADE),綜合全國多年肺結核報告發病率大數據,開展全國結核分枝桿菌潛伏感染率的估算。
樣本對總體的代表性是統計推斷的重要依據。如果總體存在分層而一些層內缺少樣本,則樣本有偏于總體,此時對總體估算需要糾偏。基于空間抽樣與統計推斷三位一體理論框架,在多源大數據支持下,先采用地理探測器q統計量對總體分層特性進行探索分析,然后使用具有糾偏能力的B-SHADE統計方法對總體進行估計[8-10]。B-SHADE綜合考慮樣點-樣點之間相關性、樣點-總體之間相關性,及樣本對總體代表性的總體估算方法,針對有偏樣本推斷總體的空間統計模型,具有最優線性無偏的性質[10-11]。該方法已在多個領域成功應用并在國際專業權威期刊發表[12-15]。樣點與樣點之間、樣點與總體之間的相關性通過協方差度量;樣本對總體代表性,通過比值關系度量,糾偏空間統計推斷方法原理見圖1[10-11,13]。

圖1 糾偏空間統計推斷(B-SHADE)模型原理
1.基于人群、多中心的LTBI流行病學調查數據:數據來源于“十二五”國家傳染病科技重大專項“結核分枝桿菌感染的流行病學調查和隊列研究”課題2013年基線橫斷面調查結果。調查對象是研究現場登記的5周歲及以上農村常住人口,研究現場的選擇綜合考慮了結核病疫情和當地社會經濟水平的代表性。采用方便抽樣的方法,確定了江蘇省丹陽市、河南省中牟縣、湖南省湘潭縣和甘肅省隴西縣等4個農村現場(每個現場納入2~3個村莊)各5500名,共計22 000名調查對象[7]。調查對象的結核分枝桿菌感染狀態是在排除活動性結核病的基礎上根據QuantiFERON-TB Gold In-Tube(QFT;一類IGRA上市產品)結果確定,各地結核分枝桿菌潛伏感染率與當地結核病疫情呈現明顯相關性。
2.多源大數據:2013—2019年全國各縣(區)肺結核報告發病數據作為模型估算結核分枝桿菌潛伏感染率的輔助變量。通過2013—2019年全國各縣(區)分年齡、性別肺結核報告發病數及分年齡、性別人口數,計算各縣(區)的肺結核報告發病率。肺結核報告發病率基于我國傳染病網絡報告系統(即網絡直報系統),數據來源于全國所有醫療衛生機構的實時在線上報,具有全國性、快速數據統計及實時質量監測等特點。
3.數據代表性分析:通過繪制樣本和總體的直方圖,分析研究對象在縣(區)水平分布的空間分異性及樣點在高、中、低區域的分布情況,從總體上判斷樣本的代表性。樣本對總體代表性無偏通常指樣本的直方圖與總體直方圖一致。
1.驗證數據來源:(1)在廣東省英德市選擇1個城鎮點和1個鄉村點,覆蓋5歲及以上本地戶籍人口或居住超過6個月的外來常住人口,開展基于IGRA的結核分枝桿菌潛伏感染率調查(抽樣人群年齡結構與當地總常住人口保持一致)。共計檢測1498名,IGRA陽性率為21.2%。(2)在“十三五”國家科技重大專項“肺結核患者社區人群潛伏感染干預研究”實施的重慶市南川區現場,選擇1個城鎮點和1個鄉村點,覆蓋5歲及以上本地戶籍人口或居住超過6個月的外來常住人口開展基于IGRA的結核分枝桿菌潛伏感染率調查(抽樣人群年齡結構與當地總常住人口保持一致)。共計調查1000名,IGRA陽性率為19.8%。
2.驗證方法:(1)利用2013年4個現場點分別估計2019年2個現場點(廣東省英德市、重慶市南川區);(2)從6個現場點中選擇任意4個現場點估算剩余2個現場點,并計算估計結果的平均絕對誤差。
以2013年全國各縣(區)肺結核報告發病率為參照總體,可以發現不同地區的報告發病率有明顯的空間分異性。已有現場調查點的報告發病率處于全國中間水平,對總體分布具有代表性(圖2)。

注 橫坐標表示縣(區)尺度2013年5歲及以上人群的肺結核報告發病率分布范圍,柱高表示報告發病率落入相應范圍內的縣(區)頻數;紅、藍色線分別代表4個現場點和2020年新補充現場點的γ-干擾素釋放試驗(IGRA)陽性率圖2 現場調查點對總體指標的代表性評估
1.按照性別、年齡校正后的多中心源數據:以2010年第六次全國人口普查數據作為參考數據,對4個調查點獲得的結核分枝桿菌潛伏感染率按照性別、年齡校正后,河南現場結核分枝桿菌潛伏感染率為15.50%(194 844 292/1 257 242 325)、江蘇現場結核分枝桿菌潛伏感染率為13.53%(170 064 913/1 257 242 325)、甘肅現場結核分枝桿菌潛伏感染率為17.32%(217 804 993/1 257 242 325)、湖南現場結核分枝桿菌潛伏感染率為20.93%(263 194 868/1 257 242 325)。
2.2013年全國肺結核報告發病率的空間分布:以全國縣(區)的肺結核報告發病率(2013年)為參照總體,可以發現不同地區的報告發病率有明顯的空間分異性(q=0.91),見圖3。

圖3 2013年全國5歲及以上人群肺結核報告發病率空間分布圖
根據B-SHADE模型估算結果顯示,2013年我國5歲及以上人群結核分枝桿菌潛伏感染率為18.08%(95%CI:13.73%~22.42%);15歲及以上人群結核分枝桿菌潛伏感染率為20.34%(95%CI:15.63%~25.06%),見表1。5~14歲人群的結核分枝桿菌潛伏感染率較低,15歲以后呈現隨著年齡增長而升高的趨勢,并且同年齡段男性的潛伏感染率高于女性。

表1 2013年全國5歲及以上人群結核分枝桿菌潛伏感染率估算[%(95%CI,%)]
B-SHADE模型對2個新增驗證點(廣東省英德市、重慶市南川區)估計結果的平均絕對誤差為0.95%,利用6個現場點中的任意4個現場點估計剩余2個點的結核分枝桿菌潛伏感染率時,平均絕對誤差為2.08%,見表2。

表2 應用糾偏空間統計推斷模型對2013年各研究現場5歲及以上人群結核分枝桿菌潛伏感染率估計誤差(%)
結核分枝桿菌潛伏感染率是疾病負擔的核心指標,直接反映結核病防控措施的實施效果。目前,我國通過傳染病網絡報告系統獲得了全國肺結核報告發病率及利用全國死因監測系統獲得了全國結核病死亡率。但是,自2000年第四次全國結核病流行病學抽樣調查以后,近20年沒有開展過全國范圍的結核分枝桿菌潛伏感染率調查。2013年,國家傳染病科技重大專項支持的多中心的流行病學調查樣本的選擇在一定程度上代表了我國不同結核病的流行區域,具備一定的結核病疫情空間分異性的代表性。因此,以2013—2019年全國各縣(區)肺結核報告發病數據為參考,利用研究項目多中心的調查數據和B-SHADE模型獲得全國分層結核分枝桿菌潛伏感染率無偏最優估算,填補了自2000年第四次全國結核病流行病學抽樣調查以來我國全國性結核分枝桿菌潛伏感染率的數據空缺。利用數學模型進行流行趨勢的評估和預測是傳染病流行病學的重要研究手段,利用小樣本空間統計模型進行LTBI負擔的估算是結核病流行病學研究技術和方法上的探索和進步。
我國是結核病高負擔國家,結核病防控策略的制定需要緊密結合我國國情包括公共衛生可供資源情況,可以借鑒但是不能照搬國外低流行區的經驗。準確的掌握LTBI負擔及其流行特征,有助于科學評價開展LTBI管理的可行性,制定適宜的潛伏感染干預技術指南,包括準確界定干預對象、開發本土化的預防性治療方案、建立高效的預防干預管理體系等。隨著直接監督服藥管理策略的實施和防治技術的進步,全球結核分枝桿菌潛伏感染率估算從1999年的1/3下降到2014年的不到1/4,兩次估算均是基于TST調查結果或根據Styblo法則獲得結核分枝桿菌年感染率之后通過數學模型獲得全球結核分枝桿菌潛伏感染率[1,16]。由于既往研究表明,相比較IGRA,TST結果受較多因素影響,包括卡介苗接種史、年齡、非結核分枝桿菌感染等[7,17]。而我國是卡介苗普遍接種的國家,因此,基于特異性較高的IGRA檢測結果進行我國結核分枝桿菌潛伏感染率本底數據的估算不僅對于完善結核病防控策略提供數據支撐,對于制定預防性干預目標、評價預防干預策略的效果也具有重要意義。本研究基于的多中心IGRA調查數據及全國各縣(區)肺結核報告發病數據是真實世界的數據,滿足了使用空間統計模型進行結核分枝桿菌潛伏感染率估算的條件。結果顯示,2013年我國5歲以上人群結核分枝桿菌潛伏感染率約為18.08%,明顯低于2000年對于結核分枝桿菌潛伏感染率的估算[6]。該數據一方面體現了我國LTBI負擔的明顯下降及我國結核病防控工作取得了一定的成效,同時也體現了技術進步對于闡明流行病學本底數據的貢獻。
另外,本研究結果顯示,15歲以下人群結核分枝桿菌潛伏感染率較低,15歲及以上人群結核分枝桿菌潛伏感染率隨年齡增長而升高,中老年人群是LTBI的重點人群。隨著社會老齡化發展,糖尿病等慢性疾病對中老年人群的健康影響也明顯增加了LTBI者的發病風險。因此,針對中老年LTBI重點人群開展適宜的預防性治療技術和方案研究是我國LTBI管理面臨的一個重要領域。但是,由于15歲以下的LTBI兒童多為新近感染,且機體免疫功能尚未發育成熟[18-19],因此,發病風險也會較高,尤其是在有密切接觸史的兒童中開展LTBI檢測和預防性治療受到廣泛重視。這也是我國高度重視學校結核病防控的價值所在[20-21]。因此,在獲得全國結核分枝桿菌潛伏感染率且了解了我國LTBI負擔的基礎上,還需要進一步加強重點人群的流行病學調查,開展適宜不同人群的預防性干預技術研究。
盡管本研究所使用的源數據僅針對研究現場的農村常住人口進行了LTBI調查,沒有覆蓋城鎮社區人群,且研究對象年齡覆蓋5歲及以上人群,無法獲得5歲以下兒童的基于IGRA結果的LTBI估算數據。但是,本研究融合全國性多年的結核病監測大數據,利用研究項目的調查數據和糾偏空間模型估算方法獲得了全國分層結核分枝桿菌潛伏感染率無偏最優估算,從方法學上一定程度彌補了多中心的流行病學調查數據在人群代表性上的不足。同時,本研究采用2019年底在兩個地區開展的LTBI的抽樣調查數據進行了模型精度的驗證,提示獲得的兩個驗證現場數據具備一定的可靠性。
綜上,本研究首次利用模型估算獲得我國基于IGRA檢測的LTBI負擔,為準確評估和預測我國結核病疫情豐富了基礎數據,對于LTBI預防干預策略的制定具有重要指導意義。我國幅員遼闊,不同地區的結核病疫情差別顯著,表現為東部沿海經濟發達地區疫情較低、西部經濟欠發達地區疫情較高的特點。因此,在科學評估LTBI負擔的基礎上,需要根據各地疫情、可供衛生資源、不同人群對干預需求的迫切性,分地區、分人群逐步推進規范化的LTBI控制工作。
利益沖突所有作者均聲明不存在利益沖突