楊 悅,何 畔,鄒 韻,王 賀,武志昂(沈陽藥科大學工商管理學院,沈陽市 110016)
2010年,WHO在第18屆基本藥物遴選與使用專家委員會(以下簡稱委員會)中作出新規定,要求基本藥物申請者最好能以GRADE表格形式提交藥物相對有效性和安全性證據[1]。推薦分級的評估、制定與評價(GRADE)方法明確定義了證據質量和推薦強度,是WHO保證基本藥物遴選科學性的重要方法。基本藥物申請者將支持性證據以GRADE表格形式提交給委員會審查,委員會以此為基礎對所申請藥物的有效性、安全性及成本-效益等進行更進一步評價。本文主要研究了GRADE方法以及WHO在基本藥物遴選中的應用情況,說明GRADE方法在WHO基本藥物遴選中的重要性,從而為我國基本藥物遴選工作提供參考。
1GRADE方法簡介
判斷衛生保健中的治療證據質量并據此推薦治療方案是一項難度較高的工作。衛生保健效益的系統評價可以為制定合理的治療決策提供基本信息,但并不充分。評價人員和系統評價結果利用者都需要對該系統評價結論的證據質量作出“好”或“不好”的判斷,這些判斷將會指導之后的決策。20世紀70年代以來,已有越來越多的組織使用各種方法對證據質量和推薦強度進行分級,但不同組織使用不同分級系統對證據和推薦意見進行分級,導致相同證據和推薦意見在不同分級系統可能會被定為不同級別,如“Ⅱ-2,B”,“C+,1”,或“強證據,強推薦”,使人難以理解且妨礙有效交流[2]。
2000年,GRADE工作組創建了GRADE這一證據質量與推薦分級的系統評價方法。GRADE方法是一個對證據質量和推薦強度進行分級的通用、敏感的方法。用系統方法對治療方案推薦強度進行分級可降低偏倚,對是否推薦使用某種治療措施應綜合權衡收益、風險、負擔及潛在成本。如果收益大于風險和負擔,則意味著可向合適的患者推薦相應的治療措施。
GRADE全稱為推薦分級的評估、制定與評價(Grading of Recommendations Assessment,Development and Evaluation)。該法強調對證據質量及推薦強度進行分級,此方法明確定義了證據質量和推薦強度,證據質量指在多大程度上能夠確信療效評估的正確性;推薦強度指在綜合考慮研究設計、研究質量、研究結果一致性和證據直接性的情況下,在多大程度上能夠確信遵守推薦意見利大于弊[3]。
GRADE系統與其他分級系統相比,具有很多優勢,雖然其他分級系統也具備其中一些優勢但都沒有GRADE系統全面。如,由一個具有廣泛代表性的國際指南制定小組制定;明確界定了證據質量和推薦強度;清楚評價了不同治療方案的重要結果;對不同級別證據升級與降級有明確、綜合的判定標準;明確承認價值判斷和意愿(價值判斷是指個人對具體健康狀況表現出的愿望和喜好);就推薦意見強弱,分別從臨床醫師、患者、政策制定者角度作了明確實用的詮釋等[4],詳見表1。

表1 GRADE與其他分級系統的比較[5]Tab 1 Comparison of GRADE and other classification system
為達到透明和簡化的目標,GRADE系統將證據質量分為高、中、低、極低4級,詳見表2。

表2 GRADE證據等級表[6]Tab 2 Evidence levels of GRADE
對系統評價而言,證據質量反映了評估正確的可信程度。GRADE證據質量分級方法中,無嚴重缺陷的隨機對照試驗為高質量證據,無突出優勢或有嚴重缺陷的觀察性研究屬于低質量證據。可降低證據質量的因素包括:研究局限性、結果不一致、間接證據、精確度不夠、發表偏倚;可提高證據質量的因素包括:效果值(Effect)很大、降低已證明效果的合理混雜因素、劑量-效應關系梯度[6]。
GRADE系統將推薦意見分為“強”與“弱”2級,詳見表3。

表3 GRADE推薦意見等級表Tab 3 Recommend advice levels of GRADE
決定推薦強度的因素包括:在充分權衡不同治療方案收益風險基礎上的利弊權衡;證據質量;價值和偏好的不確定或多變性;成本[7]。
高質量證據不一定意味著強推薦,低質量證據反倒可以是強推薦。GRADE方法簡單明了地整合了證據質量和推薦強度的分級系統,方便了專家、患者、臨床醫師及政策制定者的使用。其對證據質量和推薦強度詳盡、明確的區分標準有助于指南和推薦的使用更加透明化。
GRADE方法是在總結其他證據分級系統的缺陷基礎上發展起來的,彌補了其他系統的一些關鍵缺陷,因此受到全球越來越多的組織關注。GRADE系統已被59個組織廣泛采納,包括:WHO、美國內分泌協會、美國胸內科醫師協會、Up To Date(一個在北美廣泛使用的電子醫書,www.uptodate.com)及Cochrane協作網等[8]。GRADE系統的普及說明其方法學嚴謹、使用方便已得到國際認可。
2003年,WHO將GRADE方法引入《WHO指南制定手冊》,該手冊是用來指導各種與衛生干預措施有關的指南的制定,在該手冊中詳細介紹了GRADE的基本方法[8]。
準備由系統評價信息形成的證據表;使用證據表中的信息作為判斷基礎;記錄對表中內容的任何分歧與評價。
每個研究結果的證據質量分級詳見表4(影響證據質量的因素參考本文“1.4”項)。

表4 各主要研究結果的證據質量Tab 4 Evidence qualities of main studies
總結每個研究結果以及結果對證據表中最重要問題制定決策的相對重要性,給相對重要性打分,以9分制表示。根據分數來判斷研究結果對最重要問題制定決策的相對重要性,詳見表5。

表5 研究結果對證據表中最重要問題制定決策的相對重要性Tab 5 Importance of study results to the decision of important problems
關鍵結果證據的總體質量應基于各研究結果中最低質量證據,而最低質量證據對制定決策也是至關重要的。
權衡關鍵結果和其他重要結果之間的利弊平衡點,形成推薦結論:強推薦或弱推薦。推薦結論應考慮以下因素:權衡利弊,包括成本、關鍵結果的證據質量、在具體情況下把證據轉變為可以使用不同治療方案的規則、使用不同治療方案基線風險的不確定性。最后,說明關于證據表的評論與建議。
2006年,由于迫切地需要一個指南來應對人類感染禽流感病例數的不斷上升,WHO根據《WHO指南制定手冊》GRADE方法成功制定了《人類感染禽流感藥物應對快速建議指南》[9](以下簡稱“指南”)。2009年,WHO召開第17屆基本藥物遴選與使用專家委員會,會議內容之一是審查將金剛烷胺與金剛乙胺調入WHO基本藥物示范目錄申請。該申請提供了金剛烷胺與金剛乙胺根據GRADE方法以及“指南”中研究更新的全面證據總結,臨床證據主要是基于Jefferson[1]于2006年發表的系統評價研究論文。
委員會審查了申請材料中的證據總結,同時參考了指南中GRADE方法對禽流感藥物的證據評價,并且綜合考慮了證據質量、證據重要性、臨床隨機試驗以及成本因素后,在WHO 958號技術報告中“6.4”項(抗病毒藥物),給出了關于金剛烷胺與金剛乙胺調入WHO基本藥物示范目錄申請的審查結論:目前基本藥物示范目錄不加入任何抗病毒藥物[1]。
那么,GRADE方法是如何對這2種藥物進行評價的呢?下面就對評價具體過程進行簡單介紹[10]。
文獻檢索策略是用來確定治療和預防任何流感的相關系統評價和衛生技術評估文獻的檢索方法。
由于是系統評價,在Cochrane圖書館(2006年第1期)中檢索標題為流感的信息,在PubMed中檢索標題包含流感與系統評價的信息。檢索PubMed數據庫中流感領域隨機對照試驗;檢索文獻的限制條件:出版日期為2005-2006年。利用PubMed檢索,確定對抗H5N1禽流感病毒(其中H和N分別代表病毒表面的2種蛋白質)化合物的有效性體外試驗和動物試驗文獻。每次檢索使用術語“扎那米韋或奧塞米韋或金剛烷胺或金剛乙胺或干擾素或利巴韋林”以及“H5N1或禽流感病毒”。每次檢索加入術語“體外”以確定每次檢索中的體外研究,加入“動物”研究以確定動物試驗研究。使用專業術語“H5N1”并限制在人類系列病例研究,可在PubMed檢索到已出版的人類感染H5N1系列病例研究文獻。在系列病例中選擇數據最完整的文章以及無重復患者研究。所有論文參考文獻進行細查以獲得更多有關研究。
用系統評價總結來自于流感隨機試驗證據。提取所有重要結果的每個問題的數據,首先提取近期高質量評價,其次以同樣問題其他高質量評價數據作為補充。使用GRADE方法以及GRADE軟件(v1.12)來創建證據表,使用此方法,對于每一個重要結果證據質量評估都要考慮到研究設計,研究局限性,研究中證據連貫性、證據直接性以及評價精密度。如果結果的大部分證據來自于無嚴重研究局限性的試驗,那么對于結果的總體評價也是無嚴重研究局限性的。
目前還沒有針對感染H5N1疾病患者的臨床試驗,因此所有針對H5N1的試驗證據都是間接的,也就是說這些證據是其他流感病毒的試驗證據,因此這些試驗證據應用于H5N1研究具有不確定因素,但這并不說明這些非H5N1流感試驗證據是低質量的,而是說明這些非H5N1流感試驗證據對于驗證H5N1流感問題是低質量的。對于治療發生的輕微不良反應也有一些證據直接性的不確定,因為不確定這些輕微不良反應是治療發生的不良反應還是流感癥狀。
評價每個動物試驗結果的證據質量依據以下3點:(1)該病毒致病性是否在模型中進行了測試;(2)統計方法是否充分;(3)是否可以說明重要效果。
在每個體外試驗中提取關于病毒株、化合物名稱、檢測法、對照試驗、抑制病毒復制效果、神經氨酸酶抑制作用效果以及研究結論信息。在每個動物試驗中提取關于試驗組與對照組的病毒株、動物模型、治療方法、療程、樣本量、存活率結果、病毒滴度結果,抗藥性測量方法以及研究結論信息。在人類感染H5N1系列病例中提取治療、劑量、療程、治療數與未治療數、治療結果、地點以及系列病例的年份、作者評價與結論。
搜集最佳證據來說明H5N1治療和預防的主要問題,例如金剛烷胺或金剛乙胺是否應該用于治療或預防。
證據質量分級方法按照本文“1.4”項的內容進行。證據分級將考慮以下主要因素:研究設計,進行研究的精確性以及如何很好的應用患者、干預措施、結果、對照組證據。其他重要因素還包括數據是否是稀疏或不精確,是否有潛在偏差報告。
感染H5N1患者治療評估的重要臨床試驗結果為死亡率、住院持續時間、降低下呼吸道并發癥、耐藥性和嚴重不良反應發生率。所有臨床試驗結果都總結在證據表中。
按照本文“2.3”項對重要結果的相對重要性進行鑒別。
將每個問題的H5N1病例報告、動物試驗和體外研究以及那些可用的間接H5N1證據都總結到證據表中。金剛烷胺是否應該用于治療成人流感的GRADE證據表詳見表6。其他問題證據表與表6相似,在證據質量評價方面都考慮了研究樣本數量、研究設計、研究局限、不一致、間接性、不精確以及其他因素,在結果總結方面也都包括患者數量、相對效果值與絕對效果值(相對效果值是指與陽性藥物比較時,估計治療發生有利事件可能性以及治療給患者造成傷害可能性的效果值;絕對效果值是指與安慰劑比較時,估計治療發生有利事件可能性以及治療給患者造成傷害可能性的效果值)。所有關于金剛烷胺與金剛乙胺治療與預防問題的證據質量與證據重要性詳見表7。

表6 金剛烷胺是否應該用于治療成人流感的證據表[11]Tab 6 Evidence of amantadine for adult influenza

表7 各個重要問題證據質量與證據重要性總結[11]Tab 7 Quality and importance of evidences of important problems
關于金剛烷胺與金剛乙胺的具體推薦分為兩部分:H5N1的治療推薦與H5N1的預防推薦。具體推薦應考慮證據質量、收益、風險、負擔、成本、價值判斷以及喜好等因素。金剛烷胺與金剛乙胺的治療與預防成本證據很少,因此主要考慮的成本因素是抗病毒藥物購買成本。推薦強度分級按照本文“2.5”項描述的進行。
GRADE對金剛烷胺與金剛乙胺進行證據質量與推薦強度分級之后,委員會綜合考慮了證據質量、證據重要性、臨床隨機試驗、成本這些因素后形成了最終結論:目前基本藥物示范目錄不加入任何抗病毒藥物,然而委員會通過了一項緊急會議機制提議:當流感大范圍流行時,應該使用一種或多種抗病毒藥物(包括兒童抗病毒藥物)[1]。金剛烷胺與金剛乙胺治療與預防禽流感H5N1的建議詳見表8。

表8 金剛烷胺與金剛乙胺治療與預防禽流感H5N1的建議[12]Tab 8 Suggestions on prevention and treatment of bird flu H5N1 with amantadine and rimantadine
由表8可知,當使用神經氨酸酶抑制劑有效時,不推薦金剛烷胺或金剛乙胺單一療法。雖然單一療法可能有臨床益處,但單一療法與迅速出現高發耐藥性有關,全球大多數H3N2甲型流感病毒以及一些H1N1甲型流感病毒已顯示了耐藥性。另外,許多H5N1甲型流感病毒顯示了天然耐藥性。
GRADE提供了明確、全面的分級和總結方法,對證據質量和推薦強度詳盡、明確的區分標準有助于指南和推薦的使用更加透明化。WHO將GRADE運用到基本藥物遴選與評價之中,僅僅只是基本藥物遴選的開始。但從本文可以看出GRADE方法滿足了其遴選原則中對安全性、有效性、經濟性方面的考慮。GRADE方法不但可作為有效的基本藥物遴選工具,而且其系統、透明的特點使基本藥物評價進行檢驗和討論成為可能。
目前,我國雖然強調了采用循證方法對基本藥物進行遴選,但某些藥物調入、調出證據不足,高質量證據是遴選基本藥物的技術核心和決策依據。筆者認為,參考WHO與國內、外相關技術和信息資源,學習并且借鑒GRADE方法,檢索相關藥物質量、安全性、有效性和比較成本效果的最佳可獲得證據,可作為基本藥物遴選的決策依據,從而推動我國基本藥物遴選工作順利地向前發展。
[1]WHO.The use of essential drugs:Report of the WHO Expert Committee,2009(WHO Technical Report Series 958)[M].Geneva:World Health Organization,2009:8-32.
[2]GRADE working group.Introduction.Grading the quality of evidence and the strength of recommendations[EB/OL].http://www.gradeworkinggroup.org/intro.htm.2006-01.2011-05-20.
[3]GRADE working group.FAQ[EB/OL].http://www.gradeworkinggroup.org/_CN/FAQ/index.htm.2007-02.2011-05-20.
[4]Guyatt GH,Oxman AD,Vist GE,et al.GRADE:an emerging consensus on rating quality of evidence and strength of recommendations[J].BMJ,2008,336(7651):924.
[5]GRADE working group.FAQ.How GRADE compares to othersystems[EB/OL].http://www.gradeworkinggroup.org/FAQ/gradecomp.htm.2008-03.2011-05-20.
[6]Guyatt GH,Oxman AD,Vist GE,et al.GRADE:what is“quality of evidence”and why is it important to clinicians?[J].BMJ,2008,336(7652):996.
[7]Guyatt GH,Oxman AD,Vist GE,et al.Going from evidence to recommendations[J].BMJ,2008,336(7652):1049.
[8]WHO.Guidelines for Development of WHO Guidelines[R].Geneva:World Health Organization,2003:18-19.
[9]GRADE working group.Organizations.Organizations that have endorsed or that are using GRADE*[EB/OL].http://www.gradeworkinggroup.org/society/index.htm.2009-07.2011-05-20.
[10]WHO.Rapid Advice Guidelines on pharmacological management of humans infected with avian influenza A(H5N1)virus[R].World Health Organization,2006:5,Ann3-7.
[11]WHO.Evidence-based Tables Provided to WHO Guidelines Panel in June 2009:WHO Rapid Advice Guidelines on Pharmacological Management of Influenza Virus[M].Geneva:World Health Organization,2009:56-75.
[12]WHO.Proposal for The Inclusion of Amantadine and Rimantadine in The World Health Organisation Model List of Essential Medicines:17th Expert Committee on the Selection and Use of Essential Medicines[M].Geneva:World Health Organization,2009:5-6.