劉海波 劉芳 桑紅
210002南京總醫院皮膚科
國內外的臨床實踐指南中,存在多種關于證據級別和推薦強度的評價系統,這些評價系統各異,標準不一[1]。為解決該問題,多個國家和組織包括WHO在2000年成立的“推薦分級評價、制定與評估(grades of recommendations assessment,development and evaluation,GRADE)”工作組于2004年推出了GRADE證據質量分級和推薦強度評價系統[2]。相比其他評價系統,GRADE系統具有合理性、規范性、透明性等優點[1,3],已被包括WHO在內的一百多個組織或協會采用,成為各國指南制定的標準。2009年[4]和2013年[5]頒布的“歐洲蕁麻疹診療指南”中均采用了GRADE系統對證據質量和推薦強度進行分級,2009版中,對二代抗組胺藥物反應欠佳的慢性自發性蕁麻疹患者劑量增加至4倍的方案證據質量為低,推薦強度為弱推薦;而2013版中,該方案已變為強推薦。這兩版指南中,證據質量是如何判定的?證據質量為低的意義是什么?強弱推薦對患者、醫生以及政策制定者分別意味著什么?又是由什么因素決定的呢?回答這些問題必須要理解GRADE系統。GRADE系統在國內指南的制定中已有應用[6?8],但尚處于起步階段,皮膚科領域頒布的指南中,尚未采用GRADE系統。本文擬介紹GRADE系統,以期未來皮膚科制定指南能應用該系統,提高指南的指導性。
近年來國內發表了多種常見疾病的診療指南[9?11]。應用指南研究與評價工具AGREE(appraisal of guidelines for research and evaluation)[12]對一些指南質量評估發現,中文指南的質量盡管逐年上升,但在AGREE包括的6個評價指標(范圍與目的、參與的人員、制定的嚴謹性、表達的清晰性、應用性、獨立性)方面均低于國際平均水平[13]。目前中文指南存在的問題主要有未注重在國際實踐指南注冊平臺注冊以及評審,未說明決策制定過程及使用的共識方法、未對證據質量和推薦強度進行分級(GRADE分級)、未說明利益沖突的處理方法等。另外,我國在患者指南制定方面仍是空白。
國際指南協作網(guideline international network,GIN)已經建立了全球最大的國際指南數據庫,截至2017年10月,已收錄了來自88個國家的6 423部指南。國外指南在制定的方法學上遠較我國規范、合理。2011年,美國醫學科學院發布了制定指南應該遵循的6大原則[14];2012年,國際指南聯盟在《國際指南聯盟:邁向臨床實踐指南制定的國際標準》一文中明確提出了高質量臨床實踐指南應遵循的11條標準[15]。NICE(national institute for health and care excellence)[16]和WHO[17]也對指南制定的方法和流程做過多次更新。GIN于2012年推出了第一部患者指南制定手冊,并在2015年進行了更新[18]。患者指南主要針對患者和非專業人群。以美國國家綜合癌癥網絡(national comprehensivecancernetwork,NCCN)為代表的多個機構已開始連續發布患者指南,它能夠在一定程度上促進醫患溝通和共同決策[18]。2014年,專門針對指南的注冊機構國際實踐指南注冊平臺正式啟動,極大地促進了指南制定過程的科學化和透明化[19]。
國外指南一個顯著的特點是對證據質量和推薦強度進行了分級和展示。目前多數分級系統將證據質量根據研究類型分為3級至6級不等,例如Ⅰ級到Ⅳ級證據,將隨機對照試驗(RCT)視為Ⅰ級證據,推薦強度也分為3級至5級不等。這些系統晦澀難解,且存在諸多問題,如不同RCT實施的標準相差甚大,有的RCT結果非常不可靠。GRADE系統是一個全新的證據質量評價體系,它根據相應標準對存在的相關研究進行證據質量再評價,將證據質量根據結局指標效應值的可靠程度進行分級,避免見到RCT就認為是高級別證據或見到觀察性研究就認為是低級別證據的錯誤。另外,GRADE系統也為指南中如何進行推薦強度分級提供了一種系統的方法。GRADE系統于2003年被引入《WHO指南制定手冊》[3],明確定義了證據質量和推薦強度及證據的升降級標準,注重患者的選擇意愿及就推薦強度的強弱進行詮釋等。利用GRADE系統制定指南[20],首先從明確問題開始。例如,對二代非鎮靜類抗組胺藥物療效不佳的慢性自發性蕁麻疹患者,增加劑量至4倍的方案與其他方案相比,在改善瘙癢、生活質量、病情嚴重程度方面有何優勢?對于這個問題,先將改善瘙癢、生活質量、病情嚴重程度等結局指標分為關鍵性與非關鍵性兩類[20]。其次,收集證據和形成效應估計,經檢索納入符合標準的研究,通過這些研究的數據綜合得出每個結局指標的效應估計值及該估計值的可信區間,然后對證據質量評級,納入的研究類型為決定證據質量的重要因素[20],RCT被定為高質量證據,5種因素可導致證據質量下降;觀察性研究被定為低質量證據,3種因素可提高證據質量[3,20]。根據研究的升降級因素可在GRADEpro軟件中對每個結局指標的證據質量進行分級。總的證據質量應基于關鍵結局指標的證據質量而不是非關鍵結局指標[20],即如果生活質量是關鍵結局指標,其證據質量為極低時,則總的證據質量為極低,而非參考非關鍵結局指標如瘙癢的證據質量。如有不止一個關鍵結局指標,則總的證據質量取決于關鍵結局指標中證據質量最低的評級。最后,綜合考慮利弊平衡、患者價值觀和選擇意愿、資源配置以及證據質量四個方面的因素來決定推薦的方向和強度[3]。
以前文所述增加抗組胺藥物劑量至4倍的方案治療慢性自發性蕁麻疹為例,對證據質量評級。假設經檢索發現5個符合標準的RCT,通過Meta分析,合并結果后差異有統計學意義,得出“來自高質量RCT的Meta分析結果顯示,增加劑量方案比其他方案在改善生活質量方面好”,開始被定為高質量證據。以下5種因素可導致證據質量下降:①研究局限性:研究在分配隱藏方面存在嚴重問題,可能會導致偏倚;②不精確:5個RCT樣本量未達到最佳信息量(optimal information size)[21],合并效應量的可信區間較寬,精確性較差;③結果不一致:5個RCT的效應大小和方向有不同程度差異,結果間存在異質性;④間接證據:關注的是生活質量指標,而5個RCT只報道了癥狀緩解情況,則對結論的信心因間接性而降低;⑤發表偏倚:5個RCT全部或部分由企業贊助,有陰性結果的研究未發表,存在發表偏倚可能。使用GRADE系統綜合這5個方面的因素[20]對證據質量重新評價后,可能會得出證據質量為低甚至極低的結論。對于觀察性研究的證據質量評級,則可能會因為①效應量大,②存在劑量-反應關系和③所有混雜或其他偏倚因素增加我們對效應估計值的信心這3個因素的影響,由低質量上升為高質量證據[22]。因此,由GRADE系統評價證據質量是十分必要的,對證據質量認識不足,可能導致指南推薦不當。GRADE系統將證據質量分為高、中、低、極低四類,高級質量(high):非常確信真實的效應值接近效應估計值;中級質量(moderate):對效應估計值有中等程度的信心,真實值有可能接近估計值,但仍存在二者大不相同的可能性;低級質量(low):對效應估計值的確信程度有限,真實值可能與估計值大不相同;極低質量(very low):對效應估計值幾乎沒有信心,真實值很可能與估計值大不相同[23]。
GRADE系統的推薦強度只有強推薦和弱推薦兩級,這兩級推薦強度對患者、臨床醫生和政策制定者的意義GRADE工作組也提供了明確的指導意見[24]。GRADE工作組建議指南制定者敘述時可使用“We recommend”和“We suggest”來分別表達“強”和“弱”推薦[25],前文提到的2009版[4]和2013版[5]歐洲蕁麻疹診療指南采用了這種表達方式。推薦強度分級要綜合考慮4個關鍵因素:利弊平衡、證據質量、價值觀和選擇意愿以及資源配置[24]。以使用奧司他韋治療H5N1禽流感患者為例,展示如何給出推薦強度:①利弊平衡:對使用奧司他韋的獲益并不是很確定,因為多個重要或關鍵結局指標沒有觀察;②證據質量:極低;③價值觀和選擇意愿:考慮到H5N1禽流感的高死亡率以及奧司他韋較低的不良反應,所有患者可能都愿意接受治療;④成本(資源配置):考慮到H5N1禽流感零星散發的特點,價格可以接受。綜合這4個方面因素,給出弱推薦的可能性較大。對臨床醫生而言,弱推薦的意義為“你應該認識到不同的治療選擇在不同患者身上都有其合理性,你應該幫助每個患者做出符合他或她本人價值觀和選擇意愿的處理決定”。但是,不同專家給出的推薦強度意見可能不一致,如有的專家可能考慮到價值觀和選擇意愿方面,由于H5N1禽流感的高死亡率及所有患者均可能愿意接受治療,則給出強推薦的建議。在這種情況下,則需指南委員會成員討論或者投票來決定推薦強度。
GRADE系統提供了一套規范的證據質量分級和推薦強度分級體系,它對證據質量升降級的因素做了詳細的解釋,也對如何從證據到質量做了明確的定義[20,24]。首先需理解GRADE系統,我們才能理解歐洲蕁麻疹診療指南中證據質量和推薦強度是如何判定的以及它們所代表的意義。在指南中給出證據質量對未來的研究還有一定的啟發性。如2009版歐洲蕁麻疹指南中,增加至4倍劑量的抗組胺藥物方案應用于反應不佳的慢性自發性蕁麻疹患者,為低質量證據。正是基于這一點,后續研究者針對該方案設計了一系列RCT研究[5],由于新的研究加入,其證據質量發生了變化,相應的推薦強度也發生了變化。因此,在2013版本中將該方案的推薦強度由原來的弱推薦提高至強推薦[4?5]。國內,北京大學第三醫院曾在GRADE中國中心的幫助下制定并發表了基于GRADE系統的指南[6,26],因其制定過程規范而被美國國家指南文庫收錄。皮膚科醫生也應該認識到在指南中應用GRADE系統的必要性和重要性,并積極與GRADE中國中心、AGREE工作組、GIN等國內外組織合作,制訂質量更高的指南。