袁 歡,彭小玉,肖菊花,景奕瑄,張慧霞
1.湖南中醫藥大學護理學院,湖南 410208;2.湖南省中醫藥研究院附屬醫院
意識障礙(disorders of consciousness,DOC)由中樞神經系統受損導致個體感知能力出現障礙的一種神經系統疾病[1]。臨床上根據評估病人的意識障礙程度來確定可行性治療,醫務人員通過量表評估病人并調整治療措施,從而促進病人意識恢復。據調查,美國每年意識障礙病人的總數約42萬例,我國每年新增意識障礙病人約10萬例[2]。研究表明長期處于意識障礙的病人容易并發肺部感染、肺積水、陣發性交感神經興奮等并發癥,導致治療周期延長,醫療資源消耗增加,因此盡早評估意識障礙有利于病人預后,減輕醫療負擔[3]。目前在臨床上應用的意識障礙評估量表有格拉斯哥昏迷評分(Glasgow Coma Scale,GCS)、格拉斯哥匹茲堡昏迷評分(Glasgow-Pittsburgh Come Scale,GCS-P)、全面無反應性量表(Full Outline of UnResponsiveness Score,FOUR)、反應水平量表(Reaction Level Scale,RLS)等。最常使用的評估量表是GCS量表,但是隨著疾病發展多元化,而GCS無法評估語言反應,因此建立人工氣道的病人在語言功能上存在明顯的盲區,為了彌補GCS的缺點,FOUR量表被發明出來后逐漸在臨床上應用。陶鵬飛[4]的研究表明FOUR量表擁有略高于經典權威GCS評分的可信度和有效性,唐秋月等[5]也得到相似的結論,對于腦卒中合并意識障礙病人的預后恢復情況,FOUR量表預測的準確性以及辨別力可能更好。目前,已有多項前瞻性研究評估了FOUR量表在意識障礙中的預測價值,但由于納入研究對象、樣本量、量表臨界值等不同,研究結果也不盡相同。此外數據庫中沒有關于FOUR量表的診斷Meta分析,與劉振興等[6]在2018年發表的Meta分析相比,本研究檢索時間跨度更長,病人數量更大、納入的前瞻隊列研究更多,其結果更具有說服性。本研究通過使用MetaDisc 1.4軟件對大量數據進行Meta分析,以評估FOUR量表對意識障礙病人院內死亡預測的有效性,以期為臨床工作者選擇有效的意識障礙評估工具提供依據。
計算機檢索中國知網(CNKI)、萬方數據庫(WanFang Database)、中國生物醫學文獻服務系統(SinoMed)、中國生物醫學文獻數據庫(CBM)、PubMed、MedLine Complete、the Cochrane Library數據庫,檢索時間為建庫至2022年2月1日,無語言限制,也包括未出版的灰色文獻,其檢索網站為http://www.opengrey.eu/。中文檢索詞為:全面無反應性量表、意識障礙、昏迷、危險評估、診斷、預測。英文檢索詞為:Full Outline of UnResponsiveness score、consciousness、coma、risk assessment、diagnosis、predictive,并通過手工檢索和文獻溯源以避免文獻漏檢。
1.2.1 納入標準
①研究對象:出現意識障礙的病人,無病種、年齡限制;②干預措施:使用FOUR量表進行評估;③結局指標:院內死亡率;④研究類型:前瞻性隊列研究,意識障礙中有明確的分級和界定標準,總分為0~16分;⑤觀察指標:敏感度、特異度、陽性似然比、陰性似然比、診斷比值比和總受試者工作特征(summary receiver operating characteristic,SROC)曲線下面積(area under curve,AUC)。
1.2.2 排除標準
橫斷面研究、動物實驗研究、文獻綜述、重復的研究、方法學不全的研究、數據資料不全的研究以及無法提取四格表數據的研究。
由2名研究者根據納入和排除標準獨立地對文獻進行篩選、提取然后匯總。如遇不同意見交由第3名研究者評判,遵從少數服從多數原則。資料提取包括作者、研究國家(地區)、研究時間、納入研究對象的年齡、性別、院內死亡例數、樣本量、FOUR量表的臨界值以及FOUR量表預測的結局指標敏感度、特異度、真陰性數(true negative,TN)、真陽性數(true positive,TP)、假陰性數(false negative,FN)、假陽性數(false positive,FP),必要時通過郵箱聯系作者獲得數據。
由2名評價者根據診斷性研究質量評價工具的評價標準對納入的文獻進行質量評價。本研究采用的評價工具是Quality Assessment of Diagnostic Accuracy Studies-2(QUADAS-2),其包括病例選擇、待評價的診斷試驗、金標準、病例流程和診斷實驗與金標準間隔的時間。每個條目對應的評價為“是”“不清楚”“否”。在偏倚風險層次為“高”“低”“不清楚”。由2名評價者對納入的文獻逐條進行評價,如遇不同意見則由第3方介入,遵從少數服從多數原則。本研究所納入的文獻質量均較高,無剔除的文獻。
對納入文獻進行數據提取,構建2×2四格表,并采用 MetaDisc 1.4軟件進行Meta分析。通過I2檢驗評估異質性,以P<0.05為差異有統計學意義。當I2<25%表示研究間存在低度異質性;I2在25%~70%則研究間存在中等程度異質性;I2>70%則研究間存在高度異質性[7]。根據異質性檢驗結果選擇隨機效應模型或固定效應模型(I2<50%采用固定效應模型,I2≥50%采用隨機效應模型),根據異質性結果來確定是否存在閾值效應,計算靈敏度對數與(1-特異度)對數的Spearman相關系數評估閾值效應,如不存在閾值效應,則提取類別進行亞組分析并探討異質性的來源。最后合并效應值,包括敏感性、特異性、合并陽性似然比、合并陰性似然比、診斷比值比及各自的95%置信區間(CI)。繪制SROC曲線并計算AUC的面積(0.5 初步檢索到1 615篇相關文獻,經過逐項閱讀文獻題目、摘要或全文,排除重復發表、綜述、不符合納入標準、無法提取四格表的研究,最終納入23篇文獻[9-31],均為前瞻性研究。其中20篇英文文獻,3篇中文文獻,共納入病例2 531例。文獻篩選流程圖及結果見圖1。 圖1 文獻篩選流程及結果 表1 納入文獻的基本特征 使用QUADAS-2工具對文獻質量進行評價,通過RevMan 5.3軟件進行偏倚分析,見圖2。 圖2 文獻質量風險評價比例圖 結果顯示,應用FOUR量表預測院內死亡率敏感度的23篇研究間存在中度異質性(I2=68.2%,P<0.000 1),故采用隨機效應模型。結果顯示:合并敏感度為0.80[95%CI(0.76,0.83)],見圖3。應用FOUR量表預測院內死亡率合并特異度為0.84[95%CI(0.83,0.86)],見圖4。應用FOUR量表預測院內死亡率合并陽性似然比為4.97[95%CI(4.04,6.12)],見圖5。應用FOUR量表預測院內死亡率合并陰性似然比為0.24[95%CI(0.19,0.31)],見圖6。應用FOUR量表預測院內死亡率合并診斷比值比為23.82[95%CI(17.06,33.26)],見圖7。SROC曲線下面積AUC為0.90(SE為0.01),見圖8。 圖3 FOUR量表預測院內死亡率的合并敏感度森林圖 圖4 FOUR量表預測院內死亡率的合并特異度森林圖 圖5 FOUR量表預測院內死亡率的合并陽性似然比森林圖 圖6 FOUR量表預測院內死亡率的合并陰性似然比森林圖 圖7 FOUR量表預測院內死亡率的合并診斷比值比森林圖 圖8 FOUR量表預測院內死亡率的SROC曲線 根據合并敏感度、特異度、陽性似然比、陰性似然比的分析結果將敏感性差異較大的研究[15,22,26,28]剔除后再進行Meta分析,敏感性不變,說明納入文獻的穩定性較好,但是異質性明顯降低,說明文獻的異質性很大程度來源于這4篇研究間的差異。見圖9。 圖9 去除4項差異較大研究后合并敏感度森林圖 根據數據分析顯示23項研究間存在中度異質性。此外,研究表明閾值效應不是引起該研究異質性的主要原因(r=0.262<0.6即不存在閾值效應),這可能與未達到最佳樣本量有關。結果表明,異質性可能來源于研究對象間差異,由于疾病的特殊性,出現意識障礙多見于重癥病人,除了無法獲取數據的病人,只要符合納入標準幾乎全部納入,同時也不存在不適當的排除標準。所有病人都使用FOUR量表,沒有干預方式的差異,因此來源于臨床異質性的原因較低。另外,所有研究均采用前瞻性隊列研究,因果證明關系較可靠,根據結局指標顯示不需要隨訪,因此異質性來源于方法學可能性也不高。但是,各研究間還是存在發表偏倚風險,因為病人無意識,無法接受一個相同的金標準,此外,由于樣本量偏少,也可能存在結果的偶然性。 意識是一種動態過程,喚醒和意識的相對組成部分可能在短時間內波動,而意識障礙病人無法說出自身疾病的變化,因此,醫務人員及時評估病人的病情變化極為重要[32]。現如今有很多醫療器械可以評估病人意識變化,如神經電生理技術、誘發電位、腦成像技術,但是,昏迷量表作為快捷和最簡便的基礎評價工具,在各項診療基礎上是不可替代的。在昏迷量表評估中使用最多的是GCS,以熟悉性占有統治優勢,但是實際上,GCS暴露的缺點越來越無法忽視,FOUR量表作為一種新的評估量表,彌補了GCS的缺點。但是關于這2種評分系統中哪一個具有最佳預測價值仍然存在沖突。其中在遠程醫療評估中GCS的表現優于FOUR量表[33],這與之前的面對面評估相反,這可能與機器人遠程醫療采用了高清攝像頭、變焦和平移-俯仰技術,并調整了環境照明條件有關,然而事實證明,遠程判斷腦干,尤其是瞳孔反應是具有一定挑戰性的。但是總的來說遠程醫療評估可用于改善危重病人的早期評估的缺陷,消除不確定性并幫助建立遠程醫療昏迷評估。但是也有研究表明FOUR量表在評估腦死亡前期更為準確,研究指出使用FOUR量表和GCS評估腦死亡前期都是可行的,但是FOUR量表可能更為有效,因為FOUR量表結合了瞳孔、角膜和咳嗽反射,因此更容易評估病人的自主呼吸[26]。根據大量文獻顯示FOUR量表已經應用于腦卒中、自發性蛛網膜下腔出血、肝性腦病等疾病領域中,且對兒童的意識障礙評估同樣有效。此外,對于預測院內死亡的臨界值也存在眾多爭議,但是本研究通過數據分析得出臨界值不是引起閾值效應的直接因素。陳璇等[14]認為FOUR量表評估院內死亡的最佳臨界值為7分,并且大多數研究也將7分作為評估院內死亡的臨界值,但是在Marcati等[13]研究中將10分作為院內死亡的臨界值,并且其敏感性和特異性分別為91%和86%,對比將7分作為臨界值的其他研究的敏感性和特異性都比較高,這可能與Marcati等[13]的研究樣本量較少,且未考慮評估者間一致性有關,因為該研究只有醫生進行評估,在意大利只有醫生擁有評估法律價值,而其他研究考慮了評估者間一致性,因此具有差異性。綜上所述,本研究對23篇文獻中2 531例病人進行了Meta分析,以確定FOUR量表對意識障礙病人院內死亡危險預測的有效性。結果顯示FOUR量表對意識障礙的預測合并敏感度為0.80,合并特異度為0.84,AUC為0.90,提示FOUR評估量表預測院內死亡的有效性較強,具有較強的診斷意義。 剔除4篇較大差異的文獻后敏感性無明顯降低,但是異質性由原來的68.2%下降至27.1%。分析后得出,首先與Chen等[15]研究對象的疾病嚴重程度有關,該研究共納入101例病人,其中80例病人都存在嚴重的創傷性腦損傷,表明FOUR量表在預測微弱神經狀態效果更佳,因此預測嚴重意識障礙病人效能更強。其次,該研究將4分作為預測院內死亡的臨界值,與其他研究中的臨界值相差較大,說明預測院內死亡率可能還與臨界值有關。Saika等[22]的研究對象也是較少的輕微創傷性腦損傷病人,并且納入對象只為ICU病人,存在較大的發表偏倚,此外,該研究并沒有考慮評估者間的一致性,表明這些均是影響FOUR量表評估意識障礙病人的因素。Zappa等[26]的研究對象也是腦損傷病人,并且都在ICU住院超過24 h,研究對象意識障礙程度也較重,此外,該研究對象樣本偏少,只有40例,也存在較大的發表偏倚。Hosseini等[25]的研究中考慮了評估者間的一致性,結果顯示預測院內死亡的敏感性為100%,但是FOUR量表預測院內死亡的特異性僅為62%,但是FOUR量表預測不良結局的特異性為92%,表明FOUR量表在區分病人存活的能力較低,區分不良結局的能力較強。 根據RevMan 5.3軟件進行偏倚分析顯示本研究納入的文獻質量均較高,這可能與納入的研究均為前瞻性研究,其次與評估者都是具有一定年限的醫務人員有關,同時FOUR量表可以明顯區分病人的意識狀態,可靠性較強。但由于納入的文獻樣本量不夠多,這與疾病種類和無法獲取研究對象的資料有關,由于研究對象的特殊性,有的研究未嚴格按照非隨機對照試驗設計,因此對結果會產生一定的偏倚。 因本研究納入的各研究間存在不同程度的異質性,在一定程度上說明FOUR量表作為單獨指標對意識障礙病人的預測有效性還存在一定的局限性。盡管研究發現FOUR量表在預測院內死亡顯示出較強的敏感性和特異性,并且可以通過應用于不同的研究對象來提高其預測的有效性。但也不能一味地尊崇新出現的評估量表,在不同病人、不同情況上應該合理地選擇有效的評估量表,同時臨床護理人員要積極嘗試評價意識障礙病人的評估工具,以期為病人提供更有效的優質護理服務,改善現有意識障礙風險評估工具的不足。2 結果
2.1 文獻檢索結果

2.2 納入文獻的基本特征(見表1)

2.3 納入文獻的質量風險評價

2.4 Meta分析






2.5 敏感性分析

2.6 異質性分析
3 討論
3.1 FOUR量表應用的意義
3.2 敏感性分析
3.3 文獻質量分析
4 小結