劉 蕭,楊 楠,吳守媛,郭強強,劉 輝,孫雅佳,王健健,周 奇,王子君,史乾靈,趙思雅,李沁原,羅旭飛,呂 萌,宋旭萍,陳耀龍,,5,6,7,8
蘭州大學 1公共衛生學院 3第一臨床醫學院 5健康數據科學研究院,蘭州 730000 2蘭州大學基礎醫學院循證醫學中心 中國醫學科學院循證評價與指南研究創新單元,蘭州 730000 4重慶醫科大學附屬兒童醫院,重慶 400014 6世界衛生組織指南實施與知識轉化合作中心,蘭州 730000 7Cochrane中國協作網蘭州大學分中心,蘭州 730000 8GRADE中國中心,蘭州 730000
臨床實踐指南(下文簡稱“指南”)是基于現有最佳研究證據形成的推薦意見,是指導醫療實踐的重要工具和連接醫學研究與實踐的橋梁[1-2]。世界衛生組織等多個機構的指南制訂手冊強調:指南的推薦意見應基于系統檢索和評價后的證據體[3-5]。美國醫學科學院2011年更新指南定義時,強調系統評價必須作為指南推薦意見的基石[1]。然而調查顯示,我國期刊發表的指南,引用參考文獻的比例不足50%,引用系統評價的比例不足5%[6]。過去30年間,已有1000余部中國指南在學術期刊發表[7-8],但目前缺乏對指南推薦意見引用證據情況的分析研究。本文將對2019年期刊公開發表的中國指南推薦意見及其證據引用情況進行分析,為更好地形成循證推薦意見提供參考。
納入符合美國國家醫學院1990年或2011年定義的指南,第一作者單位為中國機構,公開發表于同行評審期刊,正式刊出時間為2019年1月1日—2019年12月31日,語種為中文或英文[9]。同時,本研究在參考文獻[9]的基礎上增加以下納入標準和排除標準。納入標準:(1)指南中有明確的推薦意見;(2)有推薦意見說明;(3)有證據質量分級和相應的解釋說明。排除標準:(1)推薦意見和推薦意見說明無法對應的指南;(2)無參考文獻的指南。
1.2.1 指南的檢索
2名研究者獨立在中國知網、萬方數據知識服務平臺和中國生物醫學文獻數據庫進行中文指南檢索,在PubMed數據庫進行英文指南檢索,并補充檢索其他網站[9]。具體檢索策略見參考文獻[9]。
1.2.2 指南的篩選
由經過培訓的2名研究者負責數據檢索和篩選,確認檢索結果一致后,將數據導入EndNote X9 軟件,通過獨立閱讀文獻標題、摘要和全文進行2輪篩選并核對,如遇分歧則通過討論或咨詢第三方解決。
1.2.3 信息的提取
2名研究者根據預先設定的信息提取表獨立提取納入指南的相關信息,并交叉核對,如遇分歧則通過討論解決,必要時咨詢第三方。通過預試驗對信息提取表格進行修正和完善,以保證所提取信息的全面性和科學性。提取的數據信息包括:(1)指南基本信息:標題、發表語種、制訂機構、發表期刊、疾病主題等;(2)證據信息:證據數量(若相同證據被引用多次,統計引用次數)、標題、發表語種、發表年份、第一作者國家、研究類型(包括系統評價、隨機對照試驗、隊列研究、診斷試驗、指南、綜述等)、證據分級情況等(本文所指證據為支持推薦意見的引文,而非證據體)。
采用EndNote X9和Microsoft Excel 2019軟件對數據資料進行整理分析;計數資料采用頻數(百分數)表示。
2019年期刊公開發表的中國指南共226篇,排除無明確推薦意見(177篇)、無證據分級說明(10篇)、證據和推薦意見不對應(7篇)、無引文(1篇)的指南,共納入符合標準的指南31篇,其中中文29篇,英文2篇。31篇指南共引用文獻3126(中位數:79;四分位間距:48)篇,平均每篇指南引用文獻101篇。其中2541(中位數:63;四分位間距:68)篇引文作為證據在指南推薦意見說明中呈現,其他引文在背景、方法學或討論部分被引用。僅13.7%(31/226)的指南按照報告規范同時給出了推薦意見和相關證據,共包含568條推薦意見,平均每篇指南包括18條推薦意見,平均每條推薦意見引用4篇證據。引用證據最多的指南為《中國腦血管病一級預防指南2019》[10],共引用245篇引文。證據在引文中所占比例最低為20%,最高100%。31篇指南的引文和證據基本情況見表1。

表1 31篇中國臨床實踐指南的引文和證據基本情況
發表語種方面,81.7%(2077/2541)的證據為英文文獻,17.8%(452/2541)的證據為中文文獻,0.5%(12/2541)的證據為其他語種。
發表年份方面,2019年(即指南發布當年)發表的證據占比4.5%(115/2541),近3年發表的證據占比22.0%(558/2541),近5年發表的證據占比39.2%(995/2541),近10年發表的證據占比67.5%(1716/2541)(圖1)。

圖1 2019年期刊公開發表的中國臨床實踐指南推薦意見的證據發表年份分布
證據來源方面,來自中國的證據占比28.8%(732/2541)、美國占比25.9%(658/2541)、英國占比7.0%(177/2541),為證據來源最多的三個國家(圖2)。中國發表的732篇研究中,系統評價占比14.3%(105/732),臨床研究占比58.1%(425/732),中國發表的臨床研究占全部臨床研究的25.9%(425/1644)。

圖2 2019年期刊公開發表的中國臨床實踐指南推薦意見的證據來源國家分布
研究類型方面,隨機對照試驗研究最多,占比26.9%(683/2541),其次是隊列研究(15.3%,389/2541)和病例報告/病例系列(12.5%,318/2541),系統評價僅占比12.0%(306/2541)(表2)。

表2 2019年期刊公開發表的中國臨床實踐指南推薦意見的證據類型(n=2541)
本研究結果顯示,2019年期刊公開發表的中國指南,絕大多數未按照報告規范清晰列出推薦意見和引用的研究證據。在明確列出推薦意見的指南中,引用最新證據支持推薦意見的比例較低,引用系統評價的比例更低。
納入分析的31篇指南中,平均每篇指南引用101篇引文,雖然仍低于國際水平(平均167篇)[11-12],但與2013年(平均36篇)相比,已顯著增加[6]。分析可能原因:一方面是近年來大量臨床研究的開展和相關研究成果的發表,為引用證據提供了前提;另一方面,隨著循證醫學和指南方法學的不斷發展,指南制訂者意識到采用更加嚴謹的方法,特別是基于當前可得證據制訂指南的重要性。此外,指南的報告標準RIGHT(Reporting Items for Practice Guidelines in Healthcare)和方法學質量評價工具AGREE Ⅱ(Appraisal of Guidelines for Research and Evaluation Ⅱ)對指南中證據的呈現和使用均有明確要求[13-14],促使了證據在指南中的引用。
本次調查發現,中國指南的證據來源于國外研究占比超過70%。如果支持指南推薦意見的證據大部分來自其他國家和人群,推薦意見在中國人群和醫療環境中可能不適用或存在潛在的醫療風險。中國本土證據在中國指南中引用占比較小,主要原因可能為中國臨床研究質量較低[15],以及指南制訂者未對中文發表的研究進行系統檢索,或對中文文獻引入指南設置了更為嚴格的標準(如限定僅引用發表在核心期刊的研究)[16-17]。2019年期刊發表的中國指南引用證據中,1/4來自中國學者主導發表的臨床研究,因引文數量較大,未進一步分析這些研究納入的人群是否均來源于中國。
本研究顯示,超過1/2的指南引用了5年以上的證據支持推薦意見。而醫學領域文獻的半衰期為5年[18],如果在指南制訂過程中,引用過時的系統評價或證據可能會導致指南作出錯誤的推薦[4]。此外,中國指南引用系統評價的比例,雖然從2013年的5%上升至12%,但與國際平均水平(50%)相比,尚存在較大差距[19]。嚴格意義上講,未基于系統評價證據的指南,不符合美國醫學科學院對指南的最新定義。盡管循證醫學和系統評價在中國引入和發展已超過20年,中國也成為全世界發表系統評價最多的國家之一,但指南制訂者對系統評價的了解和重視程度遠遠不夠。相較于基礎研究和臨床研究,系統評價對醫學的影響力仍然很低。
2019年期刊公開發表的中國指南,存在未明確列出推薦意見及對支撐推薦意見的證據引用不全面、不及時等問題。針對中國指南證據引用存在的問題和不足,提出以下建議:(1)遵循指南報告規范,清晰列出推薦意見及支撐推薦意見的證據;(2)在指南制訂過程中,加強對研究證據的系統檢索、評價和引用,尤其是高質量的系統評價證據;(3)加大對中國本土研究證據的挖掘和利用,設計、實施更高質量的中國臨床研究。
指南制訂者應進一步提高檢索和評價證據的能力,強化有效利用系統評價證據的意識,合理利用當前可得的研究證據,進一步提高我國指南的制訂質量。
作者貢獻:劉蕭、楊楠負責數據提取、統計并撰寫文章初稿;吳守媛、郭強強、劉輝、孫雅佳、王健健、王子君、史乾靈、趙思雅、李沁原負責數據提取;周奇、羅旭飛、呂萌負責初稿修改;陳耀龍、宋旭萍負責文章選題、結構設計、團隊組建、數據核查及文章修訂。
利益沖突:無