劉 鴻,周 潔,馮巧靈,顧海濤
·綜 述·
基于檢驗效能的診斷性試驗Meta分析及系統評價方法
劉 鴻,周 潔,馮巧靈,顧海濤
本研究提供一種基于檢驗效能的診斷性試驗Meta分析及系統評價的方法,其特征在于以檢驗效能為主線貫穿于以診斷性試驗Meta分析為主體的系統綜述評價中,實現檢驗效能與傳統Meta分析中納入研究的質量評估、總效應量合并、敏感性分析以及Meta分析后效評價的一體化整合。該方法實現了對納入研究質量評估從定性到定量的轉變,彌補了基于樣本量權衡合并效應量導致的不足,是檢驗效能在循證醫學領域的拓展和延伸,也有利于診斷性試驗Meta分析更加科學規范化、精確具體化和綜合全面化。
檢驗效能;Meta分析;循證醫學;診斷試驗
診斷性試驗是指應用實驗、儀器設備手段檢查就診者,從而診斷疾病的檢測方法,主要包括各種實驗室檢查(生物化學、免疫學、微生物學、寄生蟲學、病理學等)、影像學(超聲波、CT、X線及MRI等)、儀器檢查(心電圖、腦電圖、核素掃描及內鏡等)以及詢問病史、查體等,其主要目的是將患者與可疑有病但實際無病的人區別,以便對確診的患者予以相應的臨床干預[1]。但衛生健康資源有限,加之臨床上常因病種、患者依從性及倫理道德等限制,故諸多診斷手段不可能逐一地實施及研究對象的數量不可能無限的增加,鑒于此,診斷性試驗的Meta分析應運而生,以期借助于循證醫學的證據,基于臨床實踐,遴選出簡便易行、經濟廉價、安全無創的檢查方式,從而將有限的醫療資源合理地運用在那些已經在適當設計的評估中表現出有效的衛生健康服務的方式上[2]。
在當前診斷性試驗Meta分析及系統評價過程中,對納入研究質量的評估主要是基于研究者借助于國內外既定的慣例通過對納入研究進行定性評估,在評估過程中因研究者主觀臆斷往往造成額外的偏倚,并且在質量評估時因缺乏具體的量化指標因而研究者間的爭議也很難統一,極大地降低了Meta分析的統計學功效[3]?,F有的Meta分析在合并總效應量時,常以納入研究的樣本量或給予樣本量而衍生的標準差等為權重對象,雖然加權樣本量可在一定程度上使大樣本的研究獲得較大的權重,可較正確地估計整體效應的大小,但卻忽視權重質量較高的研究,從而造成了權重偏倚;尤其當納入的臨床診斷試驗的研究為陰性結果時,若僅僅依賴于樣本量的權重,很難判定研究的陰性結果是源于檢驗效能的不足還是臨床試驗本身的無差異,從而影響診斷性試驗Meta分析的科學性和可靠性[4]。近年來Meta分析的數量逐年遞增,但因尚未有專門針對Meta分析本身質量評估的量化標準,Meta質量卻參差不齊且有泛濫之勢,造成了循證醫學資源的極大浪費,很難確保Meta分析結果的真實性和可重復性,降低了Meta分析的論證強度和公信力,嚴重制約著循證醫學的發展[5]。為此作者提出并探討一種基于檢驗效能的診斷性試驗Meta分析及系統評價的方法。
1.1 檢驗效能 在實施診斷性試驗Meta分析及系統評價之前,應先確定適用于該診斷性試驗的檢驗效能公式。作者采用國際公認的診斷性試驗效能[6]。
P=(1-β),其中β=(1-NORMSDIST(Zβ))?2

式中,P為檢驗效能,β為Ⅱ型錯誤,Zβ為標準正態分布曲線下單側尾部面積,Zα/2為標準正態分布曲線下雙側尾部面積,a、b、c、d及n的臨床意義見表1。通常依據國際統計學及臨床實踐慣例的不同Ⅰ型錯誤(α)取值也不同[1]。

表1 診斷試驗的四格表及相關參數(例)
1.2 質量評估 在Meta分析對納入研究的質量評估過程中,基于傳統定性評估納入研究質量體系,增加以檢驗效能為參考標準對納入Meta分析的每個研究逐一個體化評價,憑借精確的量化得分以判斷納入研究質量的高低,若納入研究的檢驗效能P為1.0則說明該研究樣本量有足夠的效能達到甄別診斷試驗與金標準檢查兩者間差異,定義為完全效能(perfect);若檢驗效能P為0.8~1.0之間,則可認為該研究樣本量能高效地甄別兩者間差異,定義為高度效能(very high);若檢驗效能P為0.6~0.8之間,則可認為該研究樣本量能有效地甄別兩者間差異,定義為中度高效(medium high);若檢驗效能P為0.4~0.6之間,則可認為該研究樣本量在一定程度上尚可甄別兩者間差異,定義為中度效能(medium);若檢驗效能P為0.2~0.4之間,則可認為該研究樣本量很難甄別兩者間差異,定義為中度低效(medium low);若檢驗效能P為低于0.2,則可認為該研究樣本量尚未能達到甄別兩者間差異的效能,定義為非常低效(very low)。通過檢驗效能對每個研究的量化,可有效控制因研究者主觀因素所導致的評價偏倚[7]。
1.3 效應量合并 在Meta分析對所納入研究的總效應量合并過程中,以基于納入研究的檢驗效能替代單純基于樣本量大小作為合并總效應量的權重依據而分析量效關系。在診斷性試驗的Meta分析中,主要合并的統計學效應尺度為敏感性Sen=a/(a+c),特異性Spe=d/(b+d),診斷比值比(diagnostic odds ratio,DOR)=(a/c)/(b/d)。其效應量的合并步驟:設Meta分析中所納入研究的總個數為k(k≥2),第i項研究結果為敏感性Seni=ai/(ai+ci)、特異性Spei=di/(bi+di)、診斷比值比DORi=(ai/ci)/ (bi/di),將其自然對數化為ySeni=In(Seni)、ySpei=In(Spei)、yDORi=In(Spei);令μi和ei分別表示第i個研究ySeni、ySpei及yDORi總體效應和隨機效應,則隨機效應模型為ySeni=μSeni+eSeni、ySpei=μSpei+eSpei、yDORi=μDORi+eDORi;加權均數ySenw、ySpew、yDORw及其方差(SySen)2、(SySpe)2和(SyDOR)2的擬合公式為:


式中,wi為第i個研究的權重系數,由各個研究的檢驗效能計算,公式為:

式中,Pi為每個納入研究的檢驗效能;對于固定效應模型,k項研究合并估計的效應量及其95%可信區間(confidence interval,CI)分別為:Senf=exp (ySenw)及其95%CI為exp(ySenw±1.96SySen);Spef=exp(ySpew)及其 95%CI為 exp(ySpew± 1.96SySpe);DORf=exp(yDORw)及其95%CI為exp(yDORw±1.96 SyDOR)。
對于隨機效應模型,權重系數wi校正為wi′。

式中,(Sμ)2為μi(i=1,2,3,…,k)的估計方差。

加權均數yw′=∑wi′yi/∑wi′,(Sy′)2=(∑wi′)-1;同理,k項研究合并估計的效應量及其95%CI分別為:Senr=exp(ySenw′)及其95%CI為exp(ySenw′± 1.96SySen′);Sper=exp(ySpew′)及其95%CI為exp (ySpew′±1.96SySpe′);DORr=exp(yDORw′)及其95%CI為exp(yDORw′±1.96SyDOR′)。
基于檢驗效能的總效應量合并,有效規避了因臨床試驗結果的假陰性而被排除的風險,可提供更科學的效應量估計和增加統計效能[4]。
1.4 敏感性分析 在Meta分析的敏感性分析過程中,依次排除檢驗效能P低于1.0、0.9及0.75的研究后,重新估計合并效應量,并與未排除前的Meta分析結果相比較,觀察排除前后研究結果對合并效應量及異質性影響程度,從而判斷研究結果的穩健性和可靠性。若排除后結果未發生大的變化,說明敏感性低,結果較為穩健可信;相反,若排除后得到差別較大甚至截然相反結論,說明敏感性較高,結果的穩健性較低,在解釋結果和下結論的時候應非常慎重,提示存在與診斷效果相關的、重要的、潛在的偏倚因素,需進一步明確爭議的來源[7]。
1.5 后效評價 在完成Meta分析之后,將傳統僅應用于單一臨床診斷試驗的檢驗效能引入到系統綜述的評價中,作為后效評價Meta分析質量高低的重要參考標準。其檢驗效能公式為:

式中:

但式中a、b、c及d變為Meta分析中納入研究相對應條目的總和,其臨床意義同表1。其中,Ⅰ型錯誤(α)取值可以設定為0.01,據此可實現對Meta分析質量評估從定性評價到定量評價的轉變[8]。其實施的具體流程見圖1。
為了評估超聲心動圖用于胎兒先天性心臟病的產前診斷價值、探討人口統計學因素、超聲心動圖的檢查路徑以及先天性心臟病的臨床因素在診斷中的作用,作者檢索Cochrane圖書館、PubMed、OVID、Springer數據庫、中國知網期刊全文數據庫、萬方數據庫知識服務平臺和中國生物醫學文獻數據庫截止到2014年4月的文獻,按照診斷試驗的嚴格納入標準篩選文獻,提取納入文獻的特征信息[9]。采用STATA 10.0軟件進行Meta分析,檢驗異質性,并根據異質性結果選擇相應的效應模型。對所有文獻予以加權定量合并,計算敏感性、特異性及其95%CI。繪制匯總受試者工作特征曲線,并計算曲線下面積,最后進行敏感性分析。結果共納入文獻42篇包含58個對比研究,涵蓋胎兒329 965例。通過全文閱讀,每篇文獻的真陽性、假陽性、真陰性及假陰性被提取出來,利用上述方法計算每個對比研究的檢驗效能,然后依次排除檢驗效能P低于1.0、0.8、0.6、0.4及0.2的研究后,重新估計合并效應量,并與未排除前的Meta分析結果相比較,觀察排除前后研究結果對合并效應量及異質性影響程度(圖2)。從中可以看出,隨著納入研究檢驗效能的提高,總的合并效應量值中除特異性呈上升趨勢外,敏感性和DOR均呈下降趨勢,提示納入了大量的較低效能的檢驗效能的研究后,可能夸大了超聲心動圖在胎兒先天性心臟病的產前診斷的敏感性和診斷價值而掩蓋了其真實的特異性。

圖1 基于檢驗效能的診斷性試驗Meta分析及系統評價方法的流程
基于檢驗效能的Meta分析及系統評價的方法,其特征在于以檢驗效能為主線貫穿于以診斷性試驗Meta分析為主體的系統綜述評價中,實現了檢驗效能與傳統Meta分析中納入研究的質量評估、總效應量合并、敏感性分析以及Meta分析的后效檢驗的一體化整合。在Meta分析對納入研究的質量評估過程中,以檢驗效能作為評價研究質量的參考依據,基于檢驗效能對納入的每個研究量化評分,克服了因傳統基于樣本量大小作為判斷研究質量高低的缺陷[10]。在Meta分析對所納入研究的總效應量合并過程中,以檢驗效能作為合并效應量的權重依據,降低了因單純依賴樣本量大小作為權重依據合并總效應量而造成的系統誤差[11]。在Meta分析的敏感性分析中,以不同的檢驗效能作為重新合并效應量的參考標準,基于總效應量及異質性的變化程度判定其結果的穩健性,提高了與檢驗效能相關偏倚的檢出率[12]。在傳統Meta分析完成之后,以檢驗效能作為對Meta分析質量后效評價的衡量標準,增強了對診斷性試驗系統綜述評價的科學性和全面性。
基于檢驗效能的Meta分析及系統評價的方法,從納入研究質量的評價、總效應量的合并、敏感性分析到Meta分析的后效評價,實現了從傳統的定性到以定性與定量有機結合為特征的個體化評估的跨越,彌補了基于樣本量大小權衡合并效應量導致的不足,強化了敏感性分析引入檢驗效能的可行性,還開創了對Meta分析本身質量評估的先例。檢驗效能與Meta分析的一體化整合,是對檢驗效能在循證醫學領域的拓展和創新,也是對現有Meta分析的發展和完善,有利于使診斷性試驗Meta分析更加科學規范化、精確具體化和綜合全面化。
[1]李曉松.醫學統計學[M].2版.北京:高等教育出版社,2008:261-273.
[2]Onwuegbuzie AJ,Leech NL.Post hoc power:a concept whose time has come[J].Understanding Statistics,2004,3 (4):201-230.
[3]Hempel S,Miles JN,Booth MJ,et al.Risk of bias:a simulation study of power to detect study-level moderator effects in meta-analysis[J].Syst Rev,2013,2:107.
[4]Levine M,Ensom MH.Post hoc power analysis:an idea whose time has passed?[J].Pharmacotherapy,2001,21 (4):405-409.
[5]Cohen J.Statistical power analysis for the behavioral sciences[M].2nd ed.Hillsdale,NJ:Routledge,1988.
[6]Sahai H,Khurshid A.Formulas and tables for the determination of sample sizes and power in clinical trials for testing differences inproportions for the matched pair design: a review[J].Fundam Clin Pharmacol,1996,10(6):554-563.
[7]García García J,Ortega Campos E,De la Fuente Sánchez L.The use of the effect size in JCR Spanish journals of psychology:from theory to fact[J].Span J Psychol,2011,14(2):1050-1055.
[8]Hajian-Tilaki K.Sample size estimation in diagnostic test studies of biomedical informatics[J].J Biomed Inform,2014,48:193-204.
[9]Liu H,Zhou J,Feng QL,et al.Fetal echocardiography for congenital heart disease diagnosis:a meta-analysis,power analysis and missing data analysis[J].Eur J Prev Cardiol,2014[Epub ahead of print].
[10]Gibson E,Fenster A,Ward AD.The impact of registration accuracy on imaging validation study design:a novel statistical power calculation[J].Med Image Anal,2013,17 (7):805-815.
[11]Chakraborty DP.Prediction accuracy of a sample-size estimation method for ROC studies[J].Acad Radiol,2010,17 (5):628-638.
[12]Qiu SF,Tang NS,Tang ML,et al.Sample size for testing difference between two proportions for the bilateral-sample design[J].J Biopharm Stat,2009,19(5):857-871.
Method of power-based meta-analysis for diagnostic accuracy test
LIU Hong1,ZHOU Jie2,FENG Qiaoling3,GU Haitao1
(1.Department of Cardiothoracic Surgery,First Affiliated Hospital of Nanjing Medical University,Nanjing Jiangsu 210039,China;2.Department of Diagnostic Ultrasound,First Affiliated Hospital of Nanjing Medical University,Nanjing Jiangsu 210039,China;3.Key Laboratory of Diagnostic Medicine of Education Ministry,Institute of Laboratory Medicine,Chongqing Medical University,Chongqing 400016,China)
This study puts forward a method for power-based meta-analysis of diagnostic accuracy test and systematic review,which is characterized by the familiar integration of power and diagnostic accuracy test for meta-analysis.The advantage of of the method is that it contributes to integration of quality assessment of studies included,the pooling of effect size,sensitivity analysis and reevaluation in the process of meta-analysis.The method contributes to improve the quality assessment of studies included from qualitative analysis to quantitative analysis,makes up for the shortage from the sample size-based pooling of effect size,which results in not only the development and extension of power analysis in the field of evidence-based medicine,but also in scientization and standardization,preciseness and quantification,and comprehension.
Power analysis;Meta-analysis;Evidence-based medicine;Diagnostic accuracy test
R44;R195
A
2095-3097(2015)01-0051-05
10.3969/j.issn.2095-3097.2015.01.014
2014-08-05 本文編輯:徐海琴)
國家知識產權局發明專利項目(ZL201403116404);江蘇省普通高校研究生實踐創新計劃項目(SJZZ-2014-0118);南京市專利專項基金項目(NJ-14-KJZX6404)
210039江蘇南京,南京醫科大學第一附屬醫院胸心外科(劉 鴻,顧海濤),超聲診斷科(周 潔);400016重慶,重慶醫科大學檢驗醫學院教育部臨床檢驗診斷學重點實驗室(馮巧靈)