鄭文靜 么鴻雁 孫謹芳 亓曉 王琦琦
?
·流行病學與統計學方法·
Meta分析方法在結核病領域的應用及常見誤區解析
鄭文靜 么鴻雁 孫謹芳 亓曉 王琦琦
Meta分析是對原始研究的二次綜合分析與評價,實施過程中需要合理的研究選題、全面的文獻搜集、準確的入選標準、研究的質量評價、必要的異質性檢驗和敏感度分析、努力發現偏倚和重視整個過程的質量控制。作者通過總結結核病相關Meta分析文章中的常見錯誤,以期引起大家對Meta分析方法質量控制的重視,更好地促進Meta分析及其方法在結核病控制工作中的應用。
結核; Meta分析(主題); 統計學; 問題解決
Meta分析是近些年來應用較多的對文獻統計結果進行綜合、分析的研究方法,已被廣泛應用于公共衛生相關研究領域。筆者通過閱讀結核病領域已發表的Meta分析文章,總結Meta分析方法使用過程中的一些常見誤區,目的是讓大家更好地認識和更恰當地使用Meta分析方法,避免以后的工作中出現類似的錯誤,更好地促進Meta分析方法在結核病控制工作中的應用。
Meta分析的思想起源于20世紀30年代。60年代應用于教育、心理等社會科學領域,1976年由Glass命名為術語“Meta-analysis”,其意為“more comprehensive”,即更加全面或超常規的綜合,國內一般譯為元分析或者薈萃分析,但實際應用中多使用“Meta分析”一詞[1]。Meta分析是應用特定的設計和統計學方法,對已有的多個獨立研究資料進行合并分析,客觀、真實地反映業已存在的研究結果,以獲得對某一研究問題定量的綜合性結論[2]。
Meta分析的步驟如下:(1)找出與主題相關的所有研究;(2)制定研究納入標準,按照標準選擇合適的研究,其中可能出現納入標準偏倚、選擇偏倚及質量偏倚,應采取相應的措施予以降低;(3)復習每個研究并進行質量評價;(4)提取信息,填寫信息摘錄表,建立數據庫;(5)檢驗各研究效應的異質性;(6)選擇合適的統計模型,估計合并的總效應量的大小;(7)如存在異質性,應對其存在的原因進行合理解釋;(8)進行敏感度分析,驗證合并總效應量的大小是否會隨著納入研究的不同而產生較大的變化。
Meta分析在醫學科研中的作用主要體現在如下幾方面:(1)提高統計分析效能。由于把許多具有可比性的單個研究結果進行合并分析,提高了對初步結論的論證強度和效應的分析評估力度。(2)分析多個同類研究的分歧和原因。當多個臨床試驗結果不盡一致或存在分歧時,通過同質性或齊性檢驗和合并分析可以尋找有關原因,便于做出更科學的結論。(3)引出新見解。回答單個臨床試驗中尚未提及或是不能回答的問題,尋求新的假說。(4)節省研究費用。Meta分析比大規模臨床試驗代價低廉甚至更為可行。(5)Meta分析是循證的重要方法,高質量Meta分析得出的結論可以作為決策的依據[3]。
對于結核病預防與控制問題的研究,Meta分析可以彌補現場研究的不足,能夠在較短的時間內對現有信息進行全面綜合分析,為結核病的控制提供更全面和可靠的科學依據,為決策服務。目前,Meta 分析方法主要應用于結核病控制策略效果評價、結核病治療藥物療效和安全性的評價、結核病發生危險因素的探討、結核病新的診斷方法的評價、患者發現方法和方式,以及督導化療效果的評價等領域。
張永剛等[4]分析發現:結核領域Meta分析發表論文數量在2005年以前增長緩慢;從2006年開始每年發表的Meta分析論文數量逐年增加,說明結核病研究領域Meta分析越來越成為國際研究的熱點,仍處于上升趨勢。研究還發現我國結核病研究領域Meta分析研究雖起步晚,但發展迅速。近年來,隨著循證醫學及其方法學在中國的普及和公共衛生研究的不斷發展,中國結核病研究領域的Meta分析文獻數量也逐年增多,已居全球第一。
盡管國內已發表的結核病領域Meta分析文獻數量日益增多,但對其方法學質量和報告質量缺乏嚴格的評價。Meta分析作為高質量證據的來源,能為衛生服務提供者、利用者及決策者提供重要信息,然而低質量的Meta分析必會影響研究結果的價值,從而誤導決策。
筆者以“結核病”和“Meta”為關鍵詞,檢索萬方數據庫,共檢出311篇文獻,仔細閱讀其中的相關文獻,發現Meta分析方法使用過程中存在以下常見的誤區。
1.文獻檢索不全面:Meta分析文獻檢索的基本原則是查全,收集所有發表和未發表的研究,不漏檢。但是總結已發表的Meta分析文章,很大一部分文章只檢索了相關的電子期刊數據庫,有的甚至只檢索了中文數據庫,這樣勢必造成很大程度的漏檢。Meta分析是基于已有研究的二次分析,如果納入的資料不全面,有可能導致假陽性的結果,使其結論具有較大可能存在偏倚。
因此,在搜集結核病研究相關文獻時,正確的做法是,除了檢索電子資源數據庫,還應該手工檢索結核病相關的專業期刊,同時注意參考文獻的追溯,以及會議專題論文、未發表的學位論文、制藥工業的報告等未正式發表的文獻;另外還應通過結核病研究領域內的專家來獲取重要的文獻信息。
2.納入的研究設計類型不統一:檢索已發表的Meta分析文章,發現有的文章對納入的研究設計類型避而不談,有的文章將臨床隨機對照試驗(RCT)和病例-對照研究、隊列研究等觀察性研究納入一起合并分析。
Cochrane手冊[5]建議,不同研究設計,或者說RCT和觀察性研究的結果不建議合并進行Meta分析。但是也有研究證明,將RCT和觀察性研究合并進行Meta分析,比單獨合并隨機對照試驗得出的結論更可靠[6]。但這種合并是有一定條件的,比如低概率事件、目前研究證據稀缺,同時觀察性研究質量很高的情況下,可以合并,類似的Meta分析也不乏發表在頂尖專業雜志上的案例。
因此,筆者建議,如果有足夠數量的高質量的RCT,建議不納入觀察性研究。如果遇到將RCT和觀察性研究同時納入的情況,合理的處理方式是把現有的證據呈現出來,未必一定要合并,即使合并,也不應將關注點放在總的合并結果上,而應在完成主要的合并分析后,按照文獻類型做亞組分析,并對其中的異質性進行合理的討論。同時要注意,在文獻質量評價階段要分別使用RCT和觀察性研究相對應的質量評價工具。
3.濫用隨機效應模型:有的文章在進行Meta分析異質性處理時,只要異質性檢驗結果顯示為研究間存在異質性,就選用隨機效用模型進行合并。這種方式不可取。若要避免這種情況的出現,首先需要搞清楚兩個問題:隨機效應模型的理論原理是什么;何種情況下才可以選用隨機效應模型。
目前,隨機效應模型多采用D-L法(DerSimonian & Laird法),即通過增大小樣本資料的權重,減少大樣本資料的權重來處理資料間的異質性,但這種處理存在著較大風險。小樣本資料由于往往難以避免機遇的作用(偶然性),偏倚較大;而大樣本資料往往偶然性較小,代表性好,更接近真實。因此,經隨機效應模型處理的結果可能削弱了質量好的大樣本信息,增大了質量可能較差的小樣本信息,故對隨機效應模型的結論應該慎重解釋。
當異質性檢驗結果表明納入研究間存在異質性時,首先要從臨床異質性和方法學異質性的角度探討異質性的來源,從根本上解決同質性研究才能合并效應量的問題。比如根據不同的設計方案、研究質量、參加人群的特征如年齡、性別、病情嚴重程度、疾病分期、干預的時間和強度等進行亞組分析,或者考慮協變量的影響進行Meta回歸分析,以解釋異質性的來源。若存在輕度的異質性,但合并資料仍然具有實際意義,則可采用隨機效應模型,但要謹慎解釋研究結果。
4.錯誤選擇和解釋效應指標:Meta分析過程中常存在效應指標的選擇錯誤和解釋錯誤。這樣會得出錯誤的結論甚至完全相反的結果。已發表的文章中最常見的是RR值[兩組發病概率之比稱為危險度比(risk ratio)]和OR值的錯誤使用。
對于OR值和RR值的正確選擇和使用方面:(1)如果是隨機對照試驗(randomized controlled trial, RCT)或隊列研究的Meta分析,二分類變量首選RR值;只有當干預組和對照組事件發生率較低(一般認為≤20%)的時候,OR值與RR值的差異較小,此時也可以選用OR值。(2)當合并效應值<1時,OR值總是小于RR值;同樣,當合并效應值>1時,OR值總是大于RR值(如圖1,2中的合并結果)。所以,當事件發生率較高時,如果選用OR值,計算得出的效應值往往被夸大,大于真實情況,并且隨著事件發生率的逐漸增高,OR值和RR值的差異也逐漸增大,OR值的夸大效應也越來越明顯。(3)如果納入病例-對照研究,就只能選擇OR值作為效應指標。
5.未對Meta分析得出的結論進行質量評價:證據是循證的核心。Meta分析的目的之一是通過全面的檢索和嚴格的評價,最終得出可供決策者參考的證據。因此,證據質量的高低直接影響到決策者做出決策的正確與否。閱讀分析已經發表的Meta分析論文,作者主要對納入的單個文獻進行質量評價,并對同質研究進行合并。在對合并后的結果進行解讀時,由于沒有綜合考慮合并后的結果的質量,也就是說未對Meta分析得出的證據質量進行評價,因此可能產生誤導性的指導意見。
GRADE是由2000年建立的GRADE工作組創立的一套證據評級系統,于2004年正式推出,代表了當前對研究證據進行分類分級的國際最高水平,意義和影響重大。包括WHO 和Cochrane 協作網在內的28 個國際組織、協會已采納GRADE 標準。
GRADE 系統將證據質量分為“高、中、低和極低”4個等級。與其他的證據質量分級系統一樣,GRADE分級方法始于研究設計。在GRADE 分級方法中,無嚴重缺陷的RCT為高質量證據,無突出優勢或有嚴重缺陷的觀察性研究屬于低質量證據。但與其他分級系統不同的是,GRADE 系統詳細描述了影響證據質量的因素并給出了分級的定量標準,如果RCT中存在可能降低證據質量的因素,則降為中等質量;如觀察性研究中有增加證據質量的因素,則上升為中等質量,但觀察性研究中如有降低證據質量的因素,則降為極低質量[7]。

圖1 某藥治療耐多藥肺結核3個月后痰菌陰轉的Meta分析—OR值

圖2 某藥治療耐多藥肺結核3個月后痰菌陰轉的Meta分析—RR值
有研究摘錄了某雜志2012—2013年發表的部分未采用GRADE分級的系統評價,對其進行GRADE分級,并就結論進行解讀[8]。研究顯示,由于時間有限和無法獲取全文,臨床醫生會根據論文摘要中的結論指導臨床實踐。以上系統評價的摘要結論極易在臨床中造成誤導。進一步考察這些系統評價全文中的結論部分,發現均未能綜合考慮所有的降級因素,盡管結尾部分給出了“受納入研究數量和質量限制,還需要開展更多高質量的多中心隨機雙盲對照試驗進一步驗證”此類的說法,但對臨床醫生全面理解該系統評價提供的證據的可信程度仍非常有限。
結核病領域的研究結果被期望能為結核病預防控制提供決策依據,如果在Meta分析得出合并結果后,對得出的結論進行GRADE評級,清楚的注明是高質量、中等質量、低質量或者極低質量證據,則有助于使用者準確理解和正確應用該Meta分析提供的證據來做出正確的決策或指導。
Meta分析是對既往研究結果的回顧,實際上是一種觀察性研究,它不僅不能排除原始研究中存在的偏移,當研究質量不高時,合并的結果會遭受“垃圾進,垃圾出 ”的質疑。因此,要正確的認識Meta分析,在Meta分析實施過程中需要合理的研究選題、全面的文獻搜集、準確的入選標準、對納入研究的質量評價、必要的異質性檢驗和敏感性分析、努力發現偏倚和重視整個過程的質量控制,切忌為了Meta分析而進行Meta分析。
[1] 但漢雷, 白楊, 張亞歷, 等. Meta分析方法及其醫學科研價值與評價. 中華醫學科研管理雜志, 2003, 16(1): 12-15.
[2] 么鴻雁, 施侶元. Meta分析的某些爭議和質量保證措施. 藥物流行病學雜志, 2002, 11(3): 143-144.
[3] 么鴻雁, 劉劍君. Meta分析方法在結核病預防控制工作中的應用. 中國防癆雜志, 2005, 27(2): 120-122.
[4] 張永剛, 王妍亭, 彭媛玲, 等. 結核研究領域系統評價/Meta分析Web of Science收錄論文現狀調查. 中國循證醫學雜志, 2015, 15(2): 165-169.
[5] Higgins J, Green S. Cochran handbook for systematic reviews of interventions[EB/OL].(2011-03)[2017-05-05]. http://handbook.cochrane.org/.
[6] Shrier I, Boivin JF, Steel RJ, et al. Should meta-analyses of interventions include observational studies in addition to randomized controlled trials? A critical examination of underlying principles. Am J Epidemiol, 2007, 166(10): 1203-1209.
[7] 曾憲濤, 冷衛東, 李勝, 等. 如何正確理解及使用GRADE系統. 中國循證醫學雜志, 2011, 11(9): 985-990.
[8] 陳耀龍, 姚亮, Susan Norris, 等. GRADE在系統評價中應用的必要性及注意事項. 中國循證醫學雜志, 2013, 13(12): 1401-1404.
(本文編輯:李敬文)
Application and common mistakes of Meta-analysis in tuberculosis control
ZHENGWen-jing,YAOHong-yan,SUNJin-fang,QIXiao,WANGQi-qi.
OfficeofEpidemiology,ChineseCenterforDiseaseControlandPrevention,Beijing102206,China
YaoHong-yan,Email:yaohy@chinacdc.cn
Meta-analysis is the process of synthesizing data from a series of original studies, including selecting the reasonable topic, collecting the comprehensive literature, setting the accurate inclusion criteria of studies, evaluating the quality of included studies, performing necessary heterogeneity analysis and sensitivity analysis, and paying emphasis on the quality control of the whole process. This paper summarizes common mistakes in the tuberculosis-related Meta-analyses, in order to draw attention on quality control of methodology in this field and to refine its application in tuberculosis control.
Tuberculosis; Meta-analysis as topic; Statistics; Problem solving
10.3969/j.issn.1000-6621.2017.06.003
102206 北京,中國疾病預防控制中心流行病學辦公室
么鴻雁,Email:yaohy@chinacdc.cn
2017-04-17)
注:《中國防癆雜志》編輯委員會-中國疾病預防控制中心流行病學辦公室方法學協作組供稿