王春青 胡雁
(復旦大學護理學院,上海200032)
證據具有等級性,證據的等級系統包括證據的質量等級(Quality level of evidence)和推薦級別(Grade of recommendation)。系統評價產生的證據,應標注其質量等級,而臨床實踐指南和證據總結等資源則應標注證據的推薦級別。因此,醫療衛生保健專業人員在將證據應用到臨床實踐中時,很重要的一步是對形成證據的研究進行方法學質量的嚴格評價,并進行分級,以明確該證據的推薦強度。多年來,全球各循證衛生保健組織構建了各自獨特的證據質量分級和推薦強度系統,并不斷更新。WHO于2004年推出證據的GRADE系統(Grades of Recommendations Assessment,Development and Evaluation,GRADE)[1],是目前最常用的證據分級系統,被較多國際循證衛生保健組織采納和應用,包括世界衛生組織、美國衛生保健政策研究所(AHRQ)、英國國家衛生與臨床優化研究所(NICE)、英國醫學雜志(BMJ)的臨床證據數據庫(Clinical Evidence)以及蘇格蘭院際指南網(SIGN)等。澳大利亞Joanna Briggs循證衛生保健中心(Joanna Briggs Institute,JBI)成立于1996年,是在全球擁有近50多個分中心的推廣循證護理即循證衛生保健的學術機構,該中心在2003年前采用的證據分級系統是澳大利亞健康與醫療研究協會(Australian National Health & Medical Research Council,ANHMRC)于1999年制訂的臨床實踐指南的制訂、應用與評估標準。2003年以后,JBI基于對證據多元性的認識,提出證據的FAME結構(證據的可行性、適宜性、臨床意義和有效性),制訂了“JBI證據等級系統”,并于2006年、2010年進行了更新。隨著GRADE系統的推廣與普及,2014年JBI根據GRADE系統及JBI循證衛生保健模式制訂了JBI證據預分級及證據推薦級別系統,該系統適用于護理學及其它衛生保健領域。本文主要介紹2014年版JBI證據預分級及證據推薦級別系統[2]。
在GRADE系統推出之前,各循證衛生保健組織的證據等級系統往往基于“唯設計論”,認為隨機對照試驗(Randomized Control Trial,RCT)設計的研究質量必然高于觀察性研究,對研究設計的多元性以及系統評價中納入研究的設計質量、各研究間的不一致性、不精確性、間接性、發表偏倚等帶來的問題未能進行綜合判定。因此,傳統的證據等級系統近年來受到研究方法論專家和臨床決策者的批評。GRADE證據系統的推出,突破了以往單純按照研究設計劃分證據質量等級的局限性,綜合考慮系統評價納入研究的偏倚風險、發表偏倚、不一致性、間接性、不精確性(隨機誤差)、效應量、劑量-反應關系、以及混雜因素等,將系統評價的效應指標作為“證據體”(Body of evidence)進行質量分級,原則上首先將來自隨機對照試驗的系統評價結果初定為高質量證據,來自觀察性研究的系統評價結果初定為低質量證據,然后按照GRADE的證據降級和升級原則(5個降低質量的因素及3個升高質量的因素[3],進行升級或降級后,最終將證據劃分為“高、中、低、極低”四個等級,如果RCT中存在可能降低證據質量的因素,則降為中等質量;如觀察性研究中有增加證據質量的因素,則上升為中等質量。然后再根據證據質量、利弊關系、患者價值觀和意愿、以及是否合理利用資源,由指南構建組通過討論和共識后,將推薦強度分為“強推薦和弱推薦”兩個級別。
GRADE系統適用于對RCT和觀察性研究的系統評價進行證據等級判斷,但其局限性是,并未涉及質性研究、經濟學評價、診斷性試驗、描述性研究等設計,對來自專業共識的系統評價也無法進行證據質量評級,也不主張對單項研究進行質量分級。JBI基于多元主義的哲學觀,認為醫療衛生保健領域證據的來源是多元化的,干預性研究、觀察性研究、質性研究、經濟學評價、診斷性試驗、預后研究、專業共識、專家意見均可提供有深刻價值和意義的證據,因此,在采納GRADE證據分級系統的同時,進一步考慮證據的多元性,提出在對證據體進行質量分級之前,可對證據進行預分級(Pre-ranking)。預分級出現在對單篇文獻質量進行嚴格評價(Critical Appraisal)之后,對納入的單項研究按照其設計類別,包括有效性研究(實驗性設計、類實驗性設計、觀察性研究)、質性研究、診斷性試驗、預后研究、經濟學評價五個設計類別進行預分級,分為Level 1~5五個等級(見表1~3)。目前,該證據預分級系統廣泛應用于JBI及其50多個國際分中心所構建的多項循證資源,包括證據總結(Evidence Summary)、最佳實踐信息冊(Best Practice Information Sheet)和推薦實踐(Recommended Practice)等,可通過預分級,實現對證據的快速分類。
該證據預分級系統與GRADE證據等級系統并不矛盾,是在應用GRADE進行證據體質量分級之前的預分級。對來自系統評價的證據,則應進一步按照GRADE證據降級和升級原則(5個降低質量的因素及3個升高質量的因素)進行證據體的升級和降級(見表4),在制作系統評價和臨床實踐指南時,應采用GRADE四級系統對證據劃分質量等級(見表5)。
需要注意的是,無論是GRADE系統還是JBI的證據預分級系統,均是基于可能獲得的最佳證據,因此不能用來作為最佳證據唯一的評定方法。盡管該證據分級系統為研究設計的分級提供了有用信息,但仍然不能替代對單項研究質量的嚴格評價(Critical appraisal)和臨床推理(Clinical reasoning)的過程。
第二步是確定證據的推薦級別,這時應在JBI FAME結構(見表6)指導下,根據證據的有效性、可行性、適宜性和臨床意義,結合證據的JBI推薦強度分級原則(見表7),由指南制定小組確定證據的推薦強度。
JBI證據預分級系統的主要優勢是:(1)有利于在GRADE分級之前對不同設計類型的單項研究進行預分級(pre-ranking),以體現證據的多元性。(2)有利于檢索證據時根據研究設計快速定位文獻(例如如果需要高等級證據,應找對RCT的SR)。(3)有利于對單項研究文獻進行快速篩選和分類,并進一步進行質量評價,構建JBI的證據匯總、最佳實踐信息冊、推薦實踐等實用性強的資源。(4)保留傳統的按單項研究設計分級的思路,有利于開展教育和培訓,使用者容易理解和應用。
綜上所述,JBI2014版證據預分級和推薦級別系統容易與 WHO GRADE證據系統結合,且因保留以往按設計分類的證據類型描述,易于使用者掌握,同時強調了證據的多元性特征和FAME屬性,因此適用范圍廣,可操作性強。

表1 JBI 2014版干預性研究證據預分級[2]

表2 JBI 2014版質性研究證據預分級[2]

表3 JBI 2014版診斷性試驗、預后研究、經濟學評價證據預分級[2]

表4 GRADE系統證據降級或升級的因素[3]

表5 GRADE證據的質量等級[1]

表6 JBI的證據 FAME結構(JBI FAME Scale)[2]

表7 JBI 2014版證據推薦級別[2]
[1]Guyatt GH,Oxman AD,Vist GE,et al.GRADE:an emerging consensus on rating quality of evidence and strength of recommendation[J].BMJ,2008,336(7650):924-926.
[2]The Joanna Briggs Institute Levels of Evidence and Grades of Recommendation Working Party.Supporting Document for the Joanna Briggs Institute levels of Evidence and Grades of Recommendation[J].The Joanna Briggs Institute.2014.http://joannabriggs.org/jbi-approach.html#tabbed-nav=Levels-of-Evidence
[3]Balshem H,Helf M,Schunemann,HJ,et al.GRADE guidelines:3.Rating the quality of evidence[J].J of Clinical Epidemiology,2011,64(4):401-406.