沈朝建,劉麗蓉,康京麗,王幼明,李 印,劉愛玲,黃保續
(中國動物衛生與流行病學中心,山東 青島 266032)
以風險為基礎的調查或監測作為一種用于早期發現動物疫病或證明無疫的一種方法,由于可以節約成本,而一直深受大家關注。近年來,由于該方法內在偏倚引起的不能估算其置信水平,一直困擾著流行病學研究人員和動物疫病管理人員如何實施這個有效但不能定量分析其效果的調查或監測。過去10年里,流行病學專家們研究了許多與以風險為基礎監測有關的分析性問題,能夠定量分析其系統的敏感性和置信水平[1-4]。但如何正確的應用一些概念和以風險為基礎抽樣一直是我們所面臨的挑戰。本文目的是以一種簡單的、引導性的方式說明以風險為基礎的抽樣證明無疫的理念和方法。
1.1 以風險為基礎的調查或監測含義與作用 以風險為基礎的調查或監測是指有意識地抽取更可能感染或感染時更容易產生陽性檢測結果的抽樣單元(動物個體或群),是“故意”使調查或監測產生偏倚,主要用動物群體中的無疫證明或發現疫病。通過優先抽取高風險亞群,抽取更少的單元就可以獲得同代表性抽樣相同的無疫的把握。如國際上關于瘋牛病的監測即為以風險為基礎的監測,根據不同類型的牛檢測瘋牛病陽性的可能性不同,即不同類型的牛所在亞群群內流行率不同,將檢測對象分為四類,臨床疑似牛、緊急屠宰牛、死牛和常規屠宰牛,其中以臨床疑似牛檢出BSE陽性的可能性最大,同時將不同類的牛按年齡進行進一步細分,以4~6歲的牛檢出BSE陽性的可能性最大[5]。從中可以看出,以風險為基礎的調查或監測需要清楚的掌握疫病相關風險因素,以便提高發現疫病或感染的可能性;如果對疫病特征知之甚少或不掌握相應的風險因素,不可能開展以風險為基礎的抽樣;與代表性抽樣相比,以風險為基礎的調查或監測對于發現疫病而言更有效。但是,對于以風險為基礎的調查或監測,應該確保對每一個亞群的抽樣能夠代表本亞群,且代表性抽樣是以風險為基礎抽樣的基礎。
1.2 群敏感性及其意義 動物流行病學研究中的群敏感性(Herd Sensitivity,HSe)是指感染或發病群產生陽性的群檢測結果的概率[6]。從另一個角度理解,即當群未感染或疫病不存在時,證明無疫或發現疫病的把握。對于特定群,如果只要發現1只動物感染即認為該群感染,那么群敏感性表示為:

其中,Hse為群敏感性,p為群內流行率,n為檢測動物數。
上述是所用試驗為“完美”試驗條件下的計算公式。如果試驗存在偏差,那么以試驗檢測陽性為感染或發病的條件下,群敏感性表示為:

其中,AP為表觀流行率,即根據試驗結果直接計算獲得的流行率,是試驗陽性結果數和檢測動物總數的比例[7],表示為:

根據群敏感性和表觀流行率公式,可以看出影響群敏感性的因素包括所用試驗的敏感性(Se)和特異性(Sp)、群內流行率(p)、檢測時抽取的樣本量(n),以及判斷群是否感染的閾值。動物疫病實踐中,篩檢陽性的動物會用診斷試驗進行確診,這種策略為多重試驗的垂直策略,其特異性會大幅升高,所以假定試驗的特異性為1,那么群敏感性表示為:

對公式1和公式3進行反推,即可得到

公式4為群體較大且群內個體數對樣本量無影響時,證明無疫的樣本量計算公式,其中α為可接受誤差,即允許犯錯誤的可能性,p為預定流行率。公式5是考慮檢測方法敏感性Se條件下,抽樣數量的計算公式[8]。
1.3 證明無疫或發現疫病的代表性抽樣樣本量計算 當所調查目標群內個體數量較少時,證明無疫或發現疫病的樣本量計算公式為:

其中n為抽樣個數,CL為置信水平,D為群中的陽性動物數(等于群內個體數與預定流行率的乘積),N為群內個體數。
在動物疫病防控實踐中,證明無疫或發現疫病通常是通過實驗室檢測實現的,采用實驗室檢測就應該考試檢測方法的敏感性,即檢測到陽性動物。考慮檢測試驗敏感性的計算公式[9]為:

其中Se為檢測方法的敏感性,其余參數同公式6。
公式6和公式7不但適用于目標群內個體數量較小的情況,同樣適用于個體數量較大,可看做“無限”群證明無疫的樣本量計算。當前大多數獸醫流行病學抽樣軟件證明無疫或發現疫病的抽樣樣本量計算均采用這兩個公式。
2.1 以風險為基礎的調查或監測證明無疫的樣本量計算 以風險為基礎的抽樣,過程和代表性調查抽樣一樣,但考慮到需要優先抽取高風險單元,因此,抽樣過程中的預定流行率、樣本大小、系統敏感性均需要校正。為了達到此目的,需要獲得兩個額外的參數,即不同亞群間的相對風險及其在目標群中所占的比例。為便于理解,本部分以某地奶牛布病為例統一說明以風險為基礎證明無疫的調查或監測的樣本量計算。
(1)校正不同亞群的疫病風險:考慮到不同亞群感染風險不同,為了不會人為的改變預定流行率,用下述公式校正相對風險值:

其中ARi為各個亞群校正的風險值;
RRi為相對風險值;
PPri為各亞群在源群中所占比例。
∑(RRi×PPri)為每一個風險群相對風險與群所占比例乘機之和。這樣對于每一個風險群均可產生一個校正的風險估計值,用這個風險估計值乘以預定流行率,可以得到這個群校正后的感染概率。例如,根據研究結果或已有的資料分析,認為大規模場的感染風險(RR=3)是小群的3倍(RR=1),大規模場占整群的10%,那么大規模場校正的風險為3/(3×0.1+0.9)=2.5,小規模場校正的風險為1/(3×0.1+0.9)=0.833。
(2)計算各風險群預定流行率:風險群i預定流行率Pi*計算公式:

其中ARi為風險群i校正的風險值,P*為總預定流行率。
繼續前面例題,如果預定流行率為0.02,那么大規模場校正的感染概率(流行率)為0.05,小規模場校正的感染概率(流行率)為0.017。所有計算的關鍵是保持群的總預定流行率不變(0.05×0.1+0.017× 0.9=0.02),因此,為了達到此目的,需要在不同風險群中重新分配預定流行率。
(3)樣本量計算:對于以風險為基礎的抽樣,在確定樣本中不同風險群的比例后,需要用加權后的預定流行率P*a代替P*,表示如下:

其中
PrH為樣本中高風險單元所占比例
PrL為樣本中低風險單元所占比例
P*H為修正后的高風險單元感染的概率
P*L為修正后的低風險單元感染的概率
所以,以風險為基礎的抽樣公式為:

可以看出,計算以風險為基礎的抽樣樣本量,首先需要確定樣本中高風險單元和低風險單元各自所占的比例,以及高風險單元和低風險單元各自修正的流行率。繼續之前的例子,如果計劃樣本中高風險群的比例為60%,低風險群為40%,所用檢測試驗的敏感性為80%,為了保證調查或監測系統的敏感性為95%,需要檢測多少個群?根據公式8:

可以看出,需要抽取101個樣本,其中61個高風險群,40個低風險群。如果采用代表性抽樣,將數據帶入公式5計算得出需要抽取186個群,明顯高于以風險為基礎的抽樣。如果群內抽樣也采取以風險為基礎的策略,可以使用上述相同的過程來確定每個群中的抽樣數量。
上述為無限群證明無疫的抽樣,如果目標群為“有限”群,即數量較少,求出加權修正的預定流行率后,帶入代表性證明無疫樣本量計算公式6或公式7計算出抽樣數量,然后再在高風險群和低風險群之間分配。
2.2 以風險為基礎調查或監測證明無疫的敏感性計算 前述公式3也可以用來計算調查活動或監測系統的敏感性,即用群敏感性HSe代替試驗的敏感性Se、群預定流行率和抽樣群數代替動物個體水平的預定流行率和動物數。如果每個單元的敏感性和感染概率(預定流行率)不同,可以用下述公式計算群敏感性或系統敏感性:

注:這里與前述一樣,由于多數情況是為了證明無疫或發現疫病,篩檢陽性后會進行進一步的確診,這樣可以有效排除假陽性,因此,試驗過程的特異性很高,假定為1。
為將不同的感染風險引入到計算公式中來,所要做的是將每個單元相應修正過的感染概率列入到公式中來。繼續前述的例子,為證明某地區奶牛群不存在布病,采用對每個群的散裝奶進行檢測的方式,對該地區奶牛群進行調查。假定試驗的敏感性為80%,該地區大規模奶牛場(群)布病感染的相對風險為3,且10%的奶牛場(群)為大規模場。我們共抽取了55個大規模奶牛場(群)和45個小規模奶牛場(群)進行檢測。那么在預定流行率為2%,且所有檢測為陰性的條件下,系統敏感性是多少?根據公式9,系統敏感性(P*H為高風險群的流行率,P*L為低風險群的流行率)

對于代表性抽樣而言,在抽取相同樣本量的情況下,系統敏感性=1-(1-0.8×0.02)100=80.1%。也就是說,如果該地區存在奶牛布病的情況下,采用以風險為基礎的抽樣,有94.2%的把握發現它,而采用代表性抽樣,只有80.1%把握發現它。
本文對以風險為基礎的調查或監測證明無疫或發現疫病的基本原理以一種簡單、直觀的方式做了簡要介紹,推導出了以風險為基礎的抽樣樣本量計算和結果的敏感性分析,并舉例予以說明。從中可以看出,同代表性抽樣證明無疫的樣本量計算相比,在保證證明無疫的把握不變的條件下,以風險為基礎的抽樣樣本量計算具有一定的靈活性,即在保證對目標群所設定的預定流行率不變的情況下,可以通過調整樣本中不同風險群所占比例來調整樣本量,從而達到節省資源的目的。此是以風險為基礎抽樣廣受關注的關鍵,亦是其魅力所在。
[1]Hadorn D C,Hauser R,Katharina D C,et al.Risk-based design of repeated surveys for the documentation of freedom from nonhighly contagious diseases[J].Prev VetMed,2002.56(3):179-192.
[2]Martin P A,Camerom A R,Barfod K,et al.Demonstrating free?dom from disease using multiple complex data sources 2:case study-classical swine fever in Denmark[J].Prev Vet Med,2007,79(2-4):98-115.
[3]Martin PA,Cameron A R,Greiner M.Demonstrating freedom from disease usingmultiple complex data sources 1:a new methodology based on scenario trees[J].Prev VetMed,2007,79(2-4):71-97.
[4]Gustafson L,KLotins S,Cameron A,et al.Combining surveil?lance and expert evidence of viral hemorrhagic septicemia free?dom:a decision science approach[J].Prev Vet Med,2010,94(1-2):140-153.
[5]OIE.OIE Terrestrial Animal Health Code(volume I)[M].21th Edi?tion Paris:OIE,2012.
[6]Christensen,JIGardner A.Herd-level interpretation of test results for epidemiologic studies of animal diseases[J].Prev Vet Med,2000,45(1-2):83-106.
[7]Dohoo IM,Stryhn H.Veterinary Epidemiologic Research[M].21th Edition Charlottetown VER Inc,2010.
[8]Thomas F B.Some practical considerations in sampling livestock populations to estimate disease prevalence and other parameters[J].Prev VetMed,1984,2(1-2):450-462.
[9]Cannon R M.Sense and sensitivity--designing surveys based on an imperfect test[J].Prev VetMed,2001,49(3-4):141-146.