王吉耀
隨著現代醫學的發展,對疾病的診斷和治療已經不再由臨床醫生的個人經驗所決定,而是要有經過正確評價的科學證據的支持。臨床實踐指南或專家共識是為了幫助患者和醫護人員做出臨床診療重要決策,通過系統評價對相關證據進行評估和整合并且考慮到利/弊的平衡后,提出最恰當的推薦意見所形成具有權威性的醫療文件。一項好的臨床指南應具有真實性(validity)、可靠性(reliability)和可重復性(reproducibility),也就是說臨床指南中所提到的診斷治療建議要有充分的科學依據,真實、可靠、可以重復;所提的診斷治療建議在臨床上應用具有實用性,適應臨床實際情況。
不同的臨床問題,具有不同的特性,需要特定的標準來區分證據;循證醫學對于證據強度的認識有一個漸進的過程,因此在循證醫學文獻中,常出現不同的證據質量和推薦強度分級標準。盡管不同的證據分級系統之間有差異,但它們的目的相同:按質量從高到低對證據進行分級,幫助臨床醫生認識證據是否為高質量,干預措施是否利大于弊或利弊相當還是利弊關系不確定。
明確區分對待不同來源的證據是循證醫學的重要內容之一,特別當將證據用于制定臨床實踐指南時。循證證據的分級包括證據水平(level of evidence,LOE)和推薦級別(class of recommendation,COR)兩個方面。證據水平是對某項干預措施證據強度的精確估計。推薦級別除需要考慮是否獲益的證據強度外,還需要綜合考慮風險和可能造成的損害大小,以及分別從臨床醫生、患者、政策制定者角度謹慎權衡利弊,作明確實用的詮釋。高質量證據不一定意味著強推薦。
目前,被國際上廣泛接受和使用的證據等級劃分標準主要來自牛津大學循證醫學中心(Oxford Centre for Evidence-based Medicine)制定的證據等級標準以及“推薦分級的評估、制定與評價”工作組推出的將各個分級標準綜合而形成的GRADE標準(Grading of Recommendation Assessment, Development and Evaluation,GRADE)。
牛津循證醫學中心在2001年制定的證據水平分為5級,推薦建議分為A、B、C、D 4級(表1)。

表1 牛津循證醫學中心證據分級水平及推薦依據
是由2000年建立的GRADE工作組創立的一套證據和推薦的評級系統,于2004年正式推出。目前已被 WHO、美國內科醫師協會、美國胸科協會和Cochrane協作網等58個國際組織或協會采用。我國已經開始逐步應用GRADE標準。GRADE系統具有以下優勢:①由一個具有廣泛代表性的國際指南制定小組制定;②明確界定了證據質量和推薦強度;③清楚評價了不同治療方案的重要結局;④對不同級別證據的升級與降級有明確、綜合的標準;⑤從證據評級到推薦意見強度全過程透明;⑥明確承認患者價值觀和意愿;⑦就推薦意見的強弱,分別從臨床醫生、患者、政策制定者角度做了明確實用的詮釋;⑧適用于制作系統評價、衛生技術評估及指南。
GRADE系統將證據質量分為高、中、低、極低即A、B、C、D 共4 級(表2)。GRADE 系統中,就干預措施效果而言,最可靠的證據來自多個RCT的系統綜述,其次是單個RCT。雖然基于RCT得出的證據一開始被定為高質量,但RCT證據的可能會因為下面5個因素而降級:研究的局限性、研究結果不一致、間接證據、結果不精確以及報告有偏倚。觀察性研究(如隊列研究和病例對照研究)一開始被歸為低質量,但若某干預措施療效顯著;證據顯示存在劑量效應關系;存在各種可能導致療效顯著性降低的偏倚時,觀察性研究證據的等級將可能提高。
GRADE系統推薦級別只分為“強”、“弱”即1、2兩級。當明確顯示干預措施利大于弊或者弊大于利時,將其列為強推薦(推薦級別1)。當利弊不確定或無論質量高低的證據均顯示利弊相當時,則視為弱推薦(推薦級別2)。在推薦強度分級時,GRADE除考慮證據質量外,其他一些因素也會影響推薦意見的強弱,包括患者價值觀和意愿的不確定性或可變性,盡管該證據質量高,但不同價值觀和意愿的患者選擇會有不同,就不能確定為強推薦。另外,還考慮到資源的合理利用,推薦措施的獲益程度與風險以及成本比(圖1)。例如,預防短暫缺血性腦卒中患者中風復發,阿司匹林成本低,為強推薦;氯吡格雷聯合阿司匹林成本高,為弱推薦。在指南或者共識中,對于推薦意見標識的舉例如下:1A:基于A級證據,強烈推薦 ;2C:基于弱證據,弱推薦;2D:基于非常弱的證據,弱推薦;1B:基于中等強度證據,強烈推薦等。
和網站
1 http://www.gradeworkinggroup.org/society/index.htm
2 http://www.cebm.net/oxford-centre-evidence-based-medicine-levelsevidence-march-2009/
3 Guyatt GH,Oxman AD,Vist GE,et al.GRADE:an emerging consensus on rating quality of evidence and strength of recommendations.BMJ.2008,336(7650):924-926
4 Balshem,H,Helfand M,Holger J.Schunemann HJ,ndrew.Oxman A D,Kunz R,Brozek J,et al:GRADE guidelines:3.Rating the quality of evidence.Journal of Clinical Epidemiology 2011;64:401-406

表2 GRADE系統證據質量及其定義