周英鳳 朱政 胡雁 邢唯杰 顧鶯 張曉菊 陳瑜
(1.復旦大學護理學院 復旦大學JBI循證護理合作中心 上海市循證護理中心,上海 200032;2.復旦大學附屬兒科醫院,上海 201102;3.復旦大學附屬腫瘤醫院,上海 200032)
從1996年David Sackett[1]提出循證醫學的概念起,循證實踐意味著臨床人員將最好的研究證據與專業人員的臨床經驗及患者價值觀相結合,進行臨床決策,由此可見,證據是循證實踐的核心。而近50年來,醫學、護理及健康科學領域的飛速發展,形成了數量龐大的知識與信息,但正如著名未來學家John Naisbitt[2]在其著作《大趨勢》中所言:“與過去面對知識的饑荒相比,時至今日我們卻淹沒于信息的海洋。在信息社會,失去控制和沒有組織的信息不再是一種資源,而是一種嚴重的威脅”。因此,決策者面對浩瀚的信息海洋,如何獲取真實、可靠的證據指導其臨床決策,成為信息社會的最大挑戰。循證醫學誕生至今,盡管國內外學者對證據尚缺乏統一的定義,但從證據產生的角度,“內在真實性”是證據最本質的特征,即證據應真實可信;而從證據應用的角度,“外在真實性”是證據的重要特征,即證據應具有一定的適用性[3]。因此,對決策者、實踐者甚至患者來說,基于證據進行臨床決策時,不僅要關注證據的內在真實性,更應關注證據的外在真實性,以確保臨床決策的有效性,避免將不恰當、無效甚至錯誤的證據應用到實踐中。
本文旨在闡述證據的內涵及特征,介紹證據評價的原則與方法,在此基礎上,提出關于如何對證據進行科學評價以推動證據臨床轉化的思考和建議。
縱觀國內外不同的研究者或機構對證據的界定,有助于了解證據的內涵和外延,明確人們對證據這一概念認識的演進。2000年,循證醫學奠基人David Sackett等[4]將臨床證據定義為“以患者為研究對象的各種臨床研究(包括防治措施、診斷、病因、預后經濟學評價與研究等)所得到的結果和結論”,這一概念明確界定了證據是由臨床研究得出的結論。此后,Gordon Guyatt等[5]認為,“任何經驗性的觀察都可以構成潛在的證據,不論該證據是否被系統或不被系統收集”。根據這一定義,將研究得出的結論和經驗都界定為證據。2005年,加拿大衛生服務研究基金采用系統評價的方法將證據定義為“證據是最接近事實本身的一種信息,其形式取決于具體情況,高質量及方法恰當的研究結果是最佳證據”[5],這一定義明確了證據具有等級性這一特點。從循證護理的角度,澳大利亞JBI循證衛生保健中心基于證據多元主義的哲學觀,將證據定義為“證據是用于判斷某個觀點是否可信的數據或信息”[6],而胡雁、郝玉芳教授[7]主編的《循證護理學》第2版中,則將證據定義為“經過研究及臨床應用后,證明可信、有效、能夠有力地促進醫療或護理結局向積極方向改變的措施、方法”,與之前對證據定義最大的不同之處在于,這一概念是站在實踐者而非研究者的角度去界定證據的內涵,更強調證據內在真實性與外在真實性相統一。
證據作為循證實踐三要素的核心,具有4個特征[7]:(1)多元性:盡管隨機對照試驗被認為是評價療效的金標準,但衛生保健領域問題的多樣性決定了不同的研究問題需要由不同的研究方法來解決。因此,多元主義的證據觀已經被普遍接受,不但研究(包括量性研究和質性研究)可以作為證據的來源,習慣與傳統、經驗、專業判斷、推理等都可以作為證據的來源。(2)等級性:雖然證據的來源多元化,但不同的證據提供的論證強度并不同,這就意味著證據具有等級性。證據的等級性是循證醫學中證據最鮮明的特征,證據的等級系統包括證據的質量等級和推薦級別。最早對證據進行等級劃分的是加拿大衛生部成立的定期體檢工作組[8],在1979年首次基于試驗設計,將證據分為三級,設計良好的RCT級別最高,專家意見級別最低,由此開啟了對證據進行分級的時代。目前被廣泛接受和使用的證據分級系統主要有牛津大學循證醫學中心、GRADE工作組及澳大利亞JBI循證衛生保健中心提出的證據分級系統。(3)情景相關性:基于特定時間、特定人群、特定條件生產出來的證據,并不一定適用于所有的情景,這意味著證據具有情景相關性,這與該情景的資源分布、實踐條件、政策、文化、習俗、信仰等因素有關。既往的研究也指出,即使是基于相同的證據,也可能會導致不同情境下指南推薦意見的差異[9]。(4)動態變化性:衛生保健及健康科學領域的發展日新月異,推動著研究不斷發展和人們的認知不斷更新,因此證據不是一成不變的,而是具有動態變化性。既往的研究指出,臨床實踐指南在發布后,平均3.6年便過時[10]。
證據評價包括對其內在真實性和外在真實性兩方面的評價,內在真實性是指證據本身應真實可信,而外在真實性是指證據應具有一定的外推性及適用性。因此,證據的內在真實性是外在真實性的前提,若一項證據缺乏內在真實性,則沒有必要再去評價其外在真實性。不同的研究者從不同的角度對證據的內在和外在真實性進行評價,目前最常用的評價依據包括FAME策略和VIP策略。
3.1FAME策略 澳大利亞JBI循證衛生保健中心Alan Pearson等[11]從證據內在真實性和臨床適用性角度出發,提出了證據的四大屬性,即FAME策略,從4個方面對證據的內在真實性(即有效性)和外在真實性(即可行性、適宜性和臨床意義)進行了評價:(1)Feasibility(證據的可行性):主要指證據在多大程度上可應用于實踐,包括證據應用所需的資源是否具有可及性,是否有足夠的經驗和能力開展該實踐,開展該項實踐的成本效果如何等。(2)Appropriateness(證據的適宜性):主要指證據應用與特定情境是否適合或匹配的程度,包括該實踐方式在文化、政策、倫理、組織上是否可接受,該實踐方式可否在大多數人群中轉化或運用等。(3)Meaningfulness(證據的臨床意義):主要指證據應用給患者帶來的積極體驗的程度,包括證據應用是否給患者帶來積極或不良的體驗,是否符合患者的價值觀、意愿或信念。(4)Effectiveness(證據的有效性):關注證據的內在真實性,主要指證據應用在多大程度上能達到預期效果,包括該項實踐活動是否獲益,是否具有安全性,是否改善患者健康結局等。
3.2VIP策略 循證醫學則提出了證據評價的VIP策略[3],從3個方面評價證據的內在和外在真實性:(1)Validity(證據的真實性):主要指證據是否真實、可靠,評價研究實施過程中各種偏倚風險對證據內在真實性的影響程度,包括選擇偏倚、實施偏倚、失訪偏倚及測量偏倚等。(2)Importance(證據的重要性):主要指證據是否具有臨床應用價值,評價結局指標的統計效應量,然后結合專業判斷,評價結局指標是否具有臨床意義。(3)Practice(證據的適用性):主要指證據的外部真實性,證據是否適合具體的臨床情景,證據產生的情景與證據所要應用的情景是否一致,研究對象是否具有相似的特征,證據應用是否符合患者的意愿及價值觀,證據應用可能的獲益與風險,證據應用所需的技術與資源是否具備等。
證據內在真實性評價主要是針對研究的方法學質量進行評價,其評價方法在各大循證醫學及循證護理教科書中已經有非常系統、規范的描述,并且針對不同研究設計的原始研究和2次研究,均提供了清晰的評價清單(具體見本系列文章的第5篇)。
本文將重點介紹證據外在真實性的評價方法,將證據應用到研究人群以外的情景時,需要依據專業判斷評價證據的臨床適用性。
5.1定量評價法 定量評價方法是通過數學計算得出評價結論的方法,是指按照數量分析方法,通過數學運算及統計分析,從客觀量化角度對研究現象進行評價與篩選[12]。定量分析方法具有科學性、客觀性及嚴密性等特點,為人們提供了系統、客觀的數量分析方法,使結果更加直觀、具體。在對證據外在真實性進行評價時,可遴選相關領域的經驗豐富的專家,通過專家會議法、Delphi專家咨詢法或橫斷面調查,以證據的FAME屬性為判斷依據,從證據應用的可行性、適宜性、臨床意義及有效性4個方面,以打分的形式對證據的臨床適用性做出評價。然后通過統計分析,評價專家對證據的臨床適用性判斷意見的集中程度和離散程度,作為是否在實踐中應用此證據的依據。采用定量評價法進行證據評價,雖然評價結果比較量化、直觀,但無法對評價結果進行深層次剖析,無法了解某些證據臨床適用性差的具體原因,且該方法受專家個人的學術背景及專業判斷的影響較大,因此,該方法具有一定的局限性。
5.2定性評價法 定性評價方法是是運用分析和綜合、比較與分類、歸納和演繹等邏輯分析的方法,利用專家的知識、經驗和判斷對評價對象做出定性結論的價值判斷[12]。定性評價方法具有描述性、歸納性及靈活性等特點,為人們提供了關注內容實質與本質的分析方法,使結果更深入、更系統。在對證據臨床適用性進行評價時,也可遴選相關領域的經驗豐富的專家,通過專家會議法、焦點小組訪談法或利益相關者個人訪談,以證據的FAME屬性為訪談或討論提綱,從證據應用的可行性、適宜性、臨床意義及有效性四個方面,以訪談或討論的方式對證據的臨床適用性進行深入探討。系統收集專家的意見、觀點及建議,進行系統的歸納,深入分析某些證據臨床適用性差的障礙因素,并探討這些障礙因素如何解決。采用定性評價法進行證據評價,雖然評價結果比較深入,但評價結果不夠精確,有時甚至難以得出一致的結論,且該方法受專家個人價值觀和背景影響很大,因此,該方法也具有一定的局限性。
5.3定量與定性混合評價法 定量評價強調用數學工具來進行評價和分析,而定性評價傾向于用語言描述的方法進行解釋與說明,基于兩種評價方法各有優勢和缺陷,因此,采用兩種評價方法相結合的方式,定性評價方法使得定量評價所得到的數字獲得有意義的解釋,更具有目的性,而定量評價方法又使得對客體的認識更具有準確性,增加了說服力[12]。因此,在對證據外在真實性進行評價時,可以先通過定量評價的方法,請專家對證據的臨床實用性依據FAME屬性進行打分,在統計分析的基礎上,針對得分較低及得分變異較大的條目,再通過定性評價的方法,深入探討和分析該證據臨床適用性差的障礙因素。亦可以先通過定性評價方法,對證據的臨床適用性從FAME 4個方面進行分析和討論,根據討論結果對證據進行遴選,然后再通過定量評價方法,得出一致的結論。定量和定性相結合的評價方法,能確保評價結果更準確、更客觀、更科學。
6.1證據評價是將證據應用于實踐前的必要環節 證據是循證實踐應遵循的核心要素,但并非所有的研究結論都可成為證據。循證實踐強調科學的臨床決策應當依賴于當前可獲得的最佳外部證據,而最佳證據指來自設計嚴謹且具有臨床意義的研究的結論,只有真實可信的最佳證據才能作為決策的依據[7]。而研究結論的真實性取決于研究過程中對各種偏倚風險的控制程度,即研究的方法學質量,偏倚風險越小,研究質量就越高,研究結果的可信度就越高。但研究具有內在真實性,并不意味著具有很好的臨床適用性,因為證據的情景相關性的特點,在一定情境下真實可信的證據,應用到其他情景未必有效。因此,將證據應用于臨床實踐之前,采用嚴謹方法對證據的內在真實性和外在真實性進行科學的評價,是確保做出最佳臨床決策的重要保障。
6.2證據評價是依據臨床經驗和專業判斷的過程 除來自研究的最佳外部證據外,循證實踐決策的核心要素還包括來自專業人員經驗與判斷的內部證據。當對研究的真實性、重要性和臨床適用性進行評價時,都離不開專業判斷。首先,在對研究結論的真實性進行評價時,并不僅僅依據是否采取了控制偏倚風險的措施,更重要的是結合專業背景和臨床實際情況,判斷所采取的措施是否恰當,有無違背客觀規律及倫理原則。其次,在對研究結論的外部真實性進行評價時,更需要依據專業知識和經驗評價證據對特定人群的可行性、適宜性、臨床意義及有效性,將證據與實際問題相結合,做出合理的決策。因此,對證據進行評價時,僅依據統計學或臨床流行病學的方法學知識進行評價是不夠的,不管是對證據進行內在真實性進行評價,還是對外在真實性進行評價,都應當結合專業人員的臨床經驗和知識,做出科學的專業判斷。
6.3證據評價有助于證據的遴選及明確證據應用可能的障礙因素 由于受到多種因素的影響,包括證據本身的真實性及有效性,特定情景的資源、技術、政策、文化以及患者的價值觀和意愿等,來自研究的證據并非都能應用到臨床實踐中。因此,通過對證據的科學評價,明確證據的臨床適用性、復雜性、可行性及有效性,遴選出復雜性低、與現行臨床標準具有較好的一致性(例如不需要對現行實踐流程進行大規模調整)、患者接受度好、及應用后患者結局很可能被改善,且結局指標容易被測量的證據,優先進行轉化和推廣實施。此外,證據評價也有助于明確開展臨床轉化可能存在的障礙因素,比如系統層面資源的缺乏、實踐者層面技能的不足、患者層面支持性工具的缺乏等,為后續轉化策略的構建提供參考和依據。