馬華萍 韓振蘊 胡文悅 林景峰 劉甘露 王振亦
1.北京中醫藥大學,北京 100029;2.北京中醫藥大學深圳醫院(龍崗)神經內科,廣東深圳 518100
抑郁癥是由各種原因引起的以顯著而持久的心情低落為主要癥狀的精神類疾病,主要表現為興趣喪失、注意困難、自罪感、食欲下降,甚者自殺觀念,并有其他認知、行為和社會功能異常[1]。據世界衛生組織報道,2015 年全球抑郁癥患者超過3 億,且患病率隨年齡而變化,成年后達到高峰[2]。隨著全球抑郁癥患者不斷增加,西方國家曾預測到2030 年的疾病負擔中,抑郁癥將位列首位[3]。面對急劇增加的醫療費用、復雜的醫療服務環境等問題,大力研發臨床實踐指南是提高臨床診療水平的有效途徑,因此各個國家相繼出臺成人抑郁癥相關指南。但由于不同國家制訂的方法學存在差異,指南質量參差不齊[4-5]。而高質量的指南對臨床醫師的決策具有重要意義[6]。因此本研究通過采用應用臨床指南研究與評估系統(AGREE Ⅱ)[7]評價近5 年的成人抑郁癥臨床實踐指南,以期鑒別出高質量的指南,為今后成人抑郁癥指南的制訂或更新提供參考。
計算機檢索中國知網(CNKI)、中國生物醫學文獻數據庫(CBM)、萬方數據庫、維普數據庫(VIP)、PubMed、國際指南聯盟(G-I-N)、美國國家指南交換中心(NGC)、英國臨床實踐指南(NICE)、美國AAP(AAP)、蘇格蘭校際間網絡(SIGN)、醫脈通臨床指南APP 等,納入成人抑郁癥臨床實踐指南。中文檢索詞:“抑郁癥”“成人”“孕期”“圍產期”“產后”“圍絕經期”“老年”“指南”。英文檢索詞:“depression”“depressive disorder” “adult” “pregnancy” “postpartum” “perinatal”“perimenopausal” “elderly” “guideline” “guide” “guidance”。具體檢索策略,以PubMed 為例:(depression)OR(depressive disorder)AND(adult)OR(pregnancy)OR(postpartum)OR(perinatal)OR(perimenopausal)OR(elderly)AND(guideline)OR(guidance)OR(guide)。
納入標準:①公開發表、可獲取全文的成人抑郁癥臨床實踐指南;②研究人群:18 歲以上的成人,包括特殊人群孕產婦、圍絕經期女性及老人;③時限:2015 年1 月1 日—2020 年1 月31 日;④語種:中、英文。排除標準:①解讀、摘要、或翻譯版等非原始指南;②已有更新或修訂的舊指南;③合并其他疾病的指南;④干預措施僅為某一藥物的指南;⑤無具體方法學的指南。
由2 名研究者按照檢索策略進行檢索,根據納排標準,剔除不符合要求的文獻,提取納入指南的信息(指南發布機構/著者、年份、指南名稱、目標人群、參考文獻等),交叉核對結果,當意見不一致時通過討論協商或向第三方咨詢解決。
由3 名研究員使用AGREE Ⅱ評價納入指南質量,主要包括6 個領域(23 個條目),和指南總體質量評價(2 個條目)。每個條目的分值為1~7 分:7 分表示很同意,1 分表示很不同意。評分員可根據滿足標準的程度分配分值。計算各領域標準化得分,公式如下:(實際總分-最低可能分數)/(最高可能分數-最低可能分數)×100%。根據6 個領域的標準化總分判斷指南的推薦級別:若6 個領域標準化總分均≥60%,則為A 級(推薦);若標準化總分≥30%的領域數≥3 個,但有領域得分<60%,則為B 級(修改完善后推薦);若標準化總分<30%的領域數≥3 個,則為C 級(不推薦)[8-9]。
運用SPSS 20.0 統計學軟件計算組內相關系數(ICC) 以檢驗3 名研究者評分間的一致性,ICC 值介于0~1 之間,并采用95%置信區間(CI),以P <0.05為差異有統計學意義。若ICC≥0.75,表示一致性較好;若ICC 在0.4~<0.75 之間,表示一致性一般;若ICC<0.4,表示一致性較差[10]。
初檢453 篇文獻,其中數據庫398 篇、指南數據庫55 篇。排除非指南性文獻、重復指南、非原始指南、合并其他疾病指南、單一藥物指南、無具體方法學指南等,最終納入4 部英文指南[11-14]。文獻篩選流程及結果見圖1。

圖1 文獻篩選流程
4 部指南分別來自美國醫師學院臨床指南委員會(ACP)[11],加拿大情緒和焦慮治療網絡(CANMAT)[12],安大略省注冊護士協會(RNAO)[13],馬來西亞衛生技術評估組(MaHTAS)[14],4 部指南均為循證指南。見表1。
運用SPSS 20.0 檢驗3 名研究者之間的一致性,結果示ICC 值均>0.75,提示3 名研究者評分一致性好。見表2。
ACP[11]指南、CANMAT[12]指南在“參與人員”“嚴謹性”“應用性”3 個領域得分<60%,其余領域得分均>60%,推薦級別為B 級;RNAO[13]指 南、MaHTA[14]指南6 個領域的得分均>60%,推薦級別為A 級。見表3。
AGREE Ⅱ是目前國際較為公認的指南質量評價“金標準”,通過AGREE Ⅱ可以鑒別高質量指南,為臨床醫生的使用提供較好的推薦和參考[15-16]。本研究的評價結果顯示,4 部指南總體質量較高,但在“參與人員”“嚴謹性”“應用性”領域得分較低。

表1 納入指南信息提取表

表2 ICC 一致性檢驗結果
“參與人員”領域,目標人群的偏好是指南的要素之 一[17],如RNAO[13]指南通過文獻研究或讓目標人群作為利益相關者參與指南審查以獲得其的偏好。還可通過訪談、問卷調查形式獲得目標人群偏好[18]。“嚴謹性”領域與循證醫學方法的應用息息相關,循證過程需做到全面、客觀、可重復[19-20]。在證據向推薦意見轉化過程中,指南中應描述推薦意見形成的方法(如Delphi 法、共識會議法等)[21]和結果。納入的4 部指南均未報告此部分的內容。“應用性”領域,涉及指南實施過程中的有利條件和潛在不利因素及其改進策略。促進指南應用需要考慮多方面的問題,如醫療保健體系及配套設施、地區經濟衛生水平、政策制訂者重視度等[22]。而指南制訂者、使用者、目標人群、傳播者等持續關注指南實施問題,并進行定期有效的討論及反饋,將有助于降低指南實施的障礙因素[23]。另外指南中還應考慮推薦建議在應用過程中潛在的資源成本(如采集藥物費用),此環節涉及經濟學評估,因此指南開發小組應有衛生經濟學家參與,最好將調查和評估的費用信息反映在指南中[7]。

表3 納入指南各領域標準化得分及推薦等級
本研究的局限性:AGREE Ⅱ工具注重對指南方法學和報告質量的評價,但未涉及對指南具體內容的評價,而且對指南的推薦等級僅依據達到標準的領域的個數,沒有衡量不同領域和條目所占的權 重[15,24]。
通過AGREE Ⅱ評價,納入的成人抑郁癥實踐指南質量較高,但“參與人員”“嚴謹性”“應用性”領域得分較低,相關低分條目內容仍需修改完善。RNAO[13]指南、MaHTA[14]指南為A 級推薦,值得借 鑒,ACP[11]指南、CANMAT[12]指南為B 級推薦。