徐園 朱麗筠 王鈺 孫建華 王曉杰 鄧海波 王磊 安然遜 馬玉芬
隨著醫學的進步,越來越多的研究證實臨床事件的發生多受一系列因素的影響,且因素間存在著較為復雜的交互關系[1]。既往可通過經驗或量表評估臨床事件風險,但其評估結果面臨嚴峻挑戰[2]。在醫療資源緊張、患者需求多樣、醫療護理服務質量要求高的當下,精準醫療受到熱切關注,其中能夠精確預測風險、低成本、高效率的預測模型更成為研究趨勢和熱點[3]。國務院辦公廳于2021年發布的《深化醫藥衛生體制改革2021年重點工作任務》中提出“要提升早期監測預警、風險評估研判的能力”,更是為預測模型的研發和應用提供了政策保障。近年來,我國護理學者也開展了大量預測模型的研究,以期精準預測潛在風險,保證患者安全。為了系統描述并剖析我國護理學者公開發表的預測模型相關文獻,進而推動其高質量發展,本研究在澳大利亞Joanna Briggs Institute(JBI)循證衛生保健中心范圍綜述方法學框架[4]的指導下,描述了該領域的研究現狀、研究方法和研究內容,并借鑒個體預后或診斷的多變量預測模型透明報告(Transparent Reporting of a Multivariable Prediction Model for Individual Prognosis or Diagnosis,TRIPOD)[5-6]對模型進行評價?,F將結果報告如下。
納入標準:①我國護理學者發表的中、英文文獻,特指從事臨床護理(護士)、護理教育工作者(護理教師)及護理專業學生(如護理學研究生)撰寫的文獻;②針對特定的臨床護理問題,通過嚴謹的方法學構建預測模型的文獻。排除標準:①綜述或個案類文獻;②會議類文獻;③重復發表的文獻;④無法獲取全文的文獻;⑤非中、英文的文獻。
計算機檢索中文數據庫包括中國生物醫學文獻服務系統(SinoMed)、中國知網(CNKI)、萬方數據庫(Wanfang Data)及中文科技期刊數據庫(VIP);英文數據庫包括Embase、PubMed、CINAHL、Web of Science。采用主題詞與關鍵詞相結合的方式,根據數據庫的具體要求及醫學信息學專家意見制定檢索策略,全面收集我國護理學者發表的預測模型建立的相關文獻。在預檢索的基礎上,確定最終的中文檢索式(以萬方數據庫為例):(預測模型)AND(建立OR研發OR構建OR開發OR形成)AND(護理);英文檢索式(以PubMed為例):((((Models, Statistical [MeSH Terms]) OR (((prediction model*[Title/Abstract]) OR (risk assessment[Title/Abstract])) OR(risk prediction[Title/Abstract])))AND ((China[MeSH Terms])OR ((China[Title/Abstract])OR (Chinese[Title/Abstract]))))AND ((nurses[MeSH Terms])OR ((nurse*[Title/Abstract]) OR(nursing[Title/Abstract])))) AND((((build*[Title/Abstract]) OR(establish[Title/Abstract])) OR(structure[Title/Abstract])) OR(construct*[Title/Abstract]))。檢索時限均為建庫至2021年8月31日。
首先將檢索出的文獻導入EndNote軟件進行整理和去重。由2名受過JBI循證方法培訓的研究者嚴格按照納入及排除標準,先閱讀文獻題目和摘要進行初篩,然后進一步查閱全文進行復篩。對篩選結果有爭議時,邀請第3名專家進行判定。根據TRIPOD標準形成了信息提取表,內容包括如下2個部分。①基本信息:研究者姓名、單位和地區,文獻標題、發表年份、期刊名稱和基金,學位論文年份和類型等;②研究內容及方法:所采取的理論框架、研究主題、研究設計、研究對象、研究場所、樣本量、模型建立的方法、呈現方式等。
將信息提取表的內容導入SPSS 22.0軟件進行統計分析。采用頻數、構成比、率等對數據進行描述性分析。
按照檢索策略從數據庫共檢索出文獻1 005篇,最終納入文獻141篇(中文136篇,英文5篇)。文獻篩選流程見圖1。

本研究共納入文獻141篇,其中學位論文29篇(20.6%),期刊論文112篇(79.4%)。學位論文以碩士論文為主,占到89.7%(26篇),自2014年開始,呈逐年遞增的趨勢。期刊論文中,核心期刊文獻或SCI文獻占77.7%(87篇),雖然自2003年開始已有相關文獻發表,但發文量主要集中在2019年及以后(圖2),占83.9%(94篇)。在刊載期刊方面,共發表于43種期刊,76.8%(86篇)的文獻發表在護理類期刊,其中發表量排在前5位的期刊分別為《中華護理雜志》(15篇,占13.4%)、《護理學雜志》(13篇,占11.6%)、《護理研究》(12篇,占10.7%)、《中華現代護理雜志》(11篇,占9.8%)及《護理學報》(8篇,占7.1%)。在基金資助方面,56.3%(63篇)的文獻有基金支持,其中,以省部級及以上的基金支持為主(36篇,占57.1%),其次為市級基金(14篇,占22.2%)。在第一作者來源方面,有26.8%(30篇)的作者來自學校,有73.2%(82篇)來自醫院。從研究者所在地區看,文獻分布區域以北京、上海、廣州等一、二線城市為主。

在納入的141篇文獻中,從建立預測模型聚焦的問題看,圍繞并發癥主題的預測模型最多,占61.7%,其次為疾病轉歸(9.9%)、心理健康(6.4%)等。具體內容見表1。

?
2.4.1 數據來源
在納入的141篇文獻中,橫斷面調查研究58篇(41.1%),回顧性研究55篇(39.0%),前瞻性研究28篇(19.9%)。研究皆可清晰描述數據收集的起始、結束時間和隨訪結束時間節點。
2.4.2 研究對象與場所
研究對象主要以患者為主(116篇,占82.3%),其次為孕產婦(9篇,占6.4%),同時還關注到了兒童、失能老年人等特殊群體。患者多圍繞慢性病(冠心病、高血壓、血透/腹透、糖尿病、慢性阻塞性肺疾病等)、重癥(ICU、急性缺血性/出血性卒中、急性冠脈綜合征)、癌癥(肺癌、乳腺癌、腫瘤晚期)、手術(神經外科、心臟、骨科、血管)、傳染?。ㄒ腋危┤巳海瑫r也關注到了血友病等罕見病患者人群的研究。
研究場所以單中心為主(116篇,占82.3%),僅有25篇(17.7%)選擇了多中心研究,涉及醫院、社區或護理院等不同場所。
2.4.3 預測因素
預測因素的篩選方面,有35篇文獻單純采用了文獻回顧的方法納入預測因素,3篇文獻采用文獻回顧結合統計分析的方法,33篇文獻采用文獻回顧結合專家意見的方法,1篇文獻單純使用文獻統計分析的方法,1篇文獻單純采用專家意見法,還有2篇文獻同時采用了以上3種方法(文獻回顧、統計分析、專家意見)。另外,有66篇文獻(46.8%)未介紹預測因素篩選的來源。
2.4.4 樣本量及缺失數據
48篇(34.0%)文獻詳細闡述了研究的樣本量計算方法,納入樣本量從60~188 715例不等。其中樣本量在500例以下的文獻共94篇(66.7%),500~1 000例的有20篇(14.2%),1 000例以上的共23篇(16.3%)。有4篇文獻使用Meta分析或德爾菲方法篩選危險因素,因此未提及樣本量及其計算方法。
另外,在缺失數據處理方面,僅有26篇文獻(18.4%)簡單闡述了研究數據收集過程中缺失數據的處理方法。
2.5.1 預測模型的擬合(統計模型類型)
模型的建立過程中,大多數文獻(119篇,占84.4%)選擇了二分類變量結局的常用方法Logistic回歸擬合模型。其余研究的統計模型類型使用的是機器學習(8篇)、COX回歸擬合(6篇)、結構方程模型(5篇)、德爾菲專家函詢(1篇)、相關與回歸分析(1篇)、整合移動平均自回歸模型(1篇)。
2.5.2 預測模型的評價
預測模型的性能評價包括區分度和校準度兩部分。納入的141篇文獻中,有45篇文獻(31.9%)完成了模型的區分度和校準度的評價,并以ROC曲線或校準曲度等圖形進行呈現,來反映模型的性能。有73篇文獻(51.8%)僅完成了區分度的評價,有23篇文獻(16.3%)未完成模型的性能評價。
2.5.3 預測模型的驗證
模型的驗證包括內部驗證和外部驗證。52篇文獻(36.9%)完成了預測模型建立的內部驗證,選用的方法有隨機拆分驗證(26次)、交叉驗證(4次)和Bootstrap方法(25次)。進行外部驗證的文獻僅有34篇(24.1%)。
2.5.4 預測模型的呈現
31.9%(45篇)的文獻將模型進行了可視化呈現,其中以列線圖為主,占84.4%(38篇),還有6篇文獻(13.3%)建立了評分標準/評分表,1篇文獻(2.2%)構建了生存曲線圖。
在討論或結論中對研究存在局限性進行說明的有113篇,占80.1%。其中以研究場所多為單中心或范圍較?。?3次)及研究樣本量有限(60次)為主,同時也有學者關注到模型的建立使用了回顧性研究(16次),且納入的預測因素較為局限(25次)。
預測模型的建立,標志著循證醫學高質量研究證據的誕生,也為精準醫學提供了有利的應用工具[7]。它實現了根據預測人群未來發病風險的高低將風險人群正確地區分出來[6]。然而,臨床預測模型的質量欠佳將直接影響模型的應用與推廣[8]。因此,依據TRIPOD聲明對現有護理學者發表的預測模型進行評價不僅可以提高模型報告的規范性,也將有利于預測模型研究質量的提高。
本研究檢索了4大中文數據庫和4大英文數據庫自建庫至2021年8月31日我國護理學者公開發表的預測模型建立的相關研究,從研究數量上看,盡管我國護理學者開展預測模型研究起步較晚且呈散發狀態,但2019年及以后文獻發表數量急劇增加。這與近年來我國護理人員對預測模型這一量化工具的認可有關,預測模型的出現為臨床護理決策提供了便捷。而本研究也發現,超過一半的研究都具備基金項目支持,且有73.2%的作者都來自臨床一線。這說明護理預測模型的建立不僅符合目前國家政策發展需要,得到項目評審的認可,也切實圍繞護理工作的中心——患者,解決了他們的需求。從研究主題可再次印證,與患者密切相關的問題是護理預測模型關注的熱點,排在前3位的研究問題分別是并發癥、疾病轉歸和心理健康,均與患者緊密相關。這些預測模型的臨床應用將幫助發現患者早期的潛在問題、識別高危個體,更可促進臨床研究的高效轉化。我國護理學者開展預測模型研究的增加,有助于推動護理人員臨床決策工具質量的提高,提升異常風險識別的科學性和準確性。同時使用高質量的預測模型,引導護理人員洞察臨床護理實踐中患者存在的問題,是為患者提供精準護理的有力保障。
將預測模型的開發和驗證過程進行完整的報告將有利于模型外部驗證、臨床應用及推廣。然而本研究納入的護理學者開展的預測模型研究在使用TRIPOD聲明評價后,發現報告的質量欠佳、信息不完整,還有較大的改進空間,這與李秋萍等[9-10]的研究結果一致。具體表現在如下幾個方面。
3.2.1 數據來源應嚴謹
本研究納入的141篇文獻,僅有19.9%的預測模型采用了前瞻性研究,而回顧性研究占到39.0%。這樣的研究設計將形成選擇偏移和回憶偏移等,導致模型的質量降低。有學者指出,利用已有數據進行預測模型的構建,不一定能較好地滿足模型研究需要,高質量的預測模型原則上應使用專門針對該預測模型設計和構建的前瞻性研究[11]。因此,未來我國護理學者在進行預測模型的研究時應克服研究設計上的局限性,通過嚴謹的研究設計實現高質量預測模型的構建。
3.2.2 預測因素納入應全面
本研究結果顯示,將近一半的文獻未報告預測因素納入的方法,這將直接影響模型所涉及的因素來源及研究的質量??梢钥闯觯A測模型建立前都進行了預測因子的匯集及梳理,但僅有53.2%的研究進行了來源報告。事實上,在建立預測模型前,研究者應該系統檢索文獻,收集、整理已報道的預測因子作為備選預測因子。而后,利用統計方法并結合醫學認識和專家經驗,從備選因素中選出最終納入模型的預測因子開展研究[8]。另外盡管部分研究報告了預測因素的納入方法,但在確定預測模型的預測因素時,部分研究單純將多種量表或問卷作為預測因素,增加了指標測量及應用的難度,導致模型在最終應用過程中資料收集的難度增加。因此護理學者應嚴格選用預測因素的獲取及報告方法,同時納入便于臨床實踐直接應用的因素以提高預測模型研究的科學性和應用性。
3.2.3 樣本及場所的選擇應謹慎
預測模型研究中除了要詳細報告研究樣本的選擇及樣本量的確定方法外,結合預測模型很難直接在不同類型的場所互通使用的特點,應對研究場所進行詳細的報告,以便于判斷模型的應用范圍[9]。本研究中25篇文獻選擇了多中心研究,進一步分析發現有2項研究在多中心場所選擇上出現差異,選擇了不同等級、不同地域城市的場所進行研究,這無形中增加了模型使用的復雜性?,F實中不同區域患者特點存在的差異限制了預測模型應用的目標人群特征,會影響預測模型的通用性和準確性[8,12]。因此,在進行場所的選擇時,應謹慎地選擇研究場所的性質、數量和位置,然后進行嚴格的樣本量測算,以提高模型的質量。
同時數據缺失在研究中難以避免,從本研究的結果可以看出,僅有18.4%的文獻描述了缺失數據的處理方法,占比較低。未來的研究中可以通過清晰透明地描述缺失數據的處理方法,提高研究結果報告質量及研究的可重復性[9]。
3.2.4 模型的評價與驗證應完善
在最終形成臨床可直接使用的預測模型前,模型需要經歷擬合、評價、驗證、呈現等步驟[8]。應進行嚴格的驗證,以考察模型的可重復性以及外推性。但從本文結果可以看出,目前我國護理預測模型的報告中,模型的評價和驗證并不完善且質量欠佳。在模型的評價過程中,存在僅完成了區分度的檢測、未進行模型校準度評價等類似問題,使得模型建立過程不完整。這與王俊峰等[13]的研究結果相一致,他提出相比于模型開發的蓬勃發展,模型驗證卻存在一定程度的滯后。這將造成未被有效驗證的同一疾病或終點事件的新預測模型不斷涌現,導致僅有少數模型可應用于臨床實踐[14-15]。
3.2.5 研究局限性應報告
TRIPOD聲明里明確提到要對研究的局限性進行闡述和分析[6],然而本研究納入的141篇文獻中仍有19.9%的文獻未提及模型建立過程的局限性及不足。作為科學論文討論中最有價值的部分之一,有必要在研究中充分認識并承認研究的局限性。大部分學者在局限性中建議未來應開展多中心、大樣本、前瞻性研究,以提高模型的準確性及可行性。
3.3.1 采用可視化方法促進模型結果的呈現
臨床預測模型本質上是預測因素間復雜的公式組合,并不能在臨床上直接應用。為了更好地應用模型,研究者還需要考慮模型的呈現方式,這樣才能將復雜的模型公式轉化成方便臨床使用的工具。從本綜述納入的模型中可以看出,列線圖已在預測模型呈現方面形成了應用規模[16-18],其便捷、可視化的方法,在一定程度上代替了復雜、煩瑣的計算公式[19]。因此,在模型生成時,可通過直觀的工具,如列線圖、評分表、線上預測軟件/工具等,方便醫護人員及患者使用。
3.3.2 借助人工智能等方法提高模型的科學性
機器學習作為疾病預測模型構建的常見方法之一,通過其強大的數據信息提取功能,實現了智能地采集、分析、存儲和預測數據,對臨床疾病的管理與決策有著積極的作用[20]。本研究中僅有1篇文獻采用了機器學習中隨機森林、人工神經網絡模型等方法構建預測模型,研究的樣本量為11 788例[21],且該研究嚴格按照TRIPOD聲明的要求開展模型的構建及報告。然而現有的護理模型建立研究中多以單中心、小樣本的研究為主,這與臨床易開展簡潔、快速、低成本的護理研究有關。但隨著醫學的發展,借助人工智能等高質量的研究方法將是未來研究的趨勢,它可規避傳統方法的局限,從而實現高質量模型成為疾病預測發生的關鍵要素[1]。
3.3.3 結合臨床實際建立預測模型以提高模型的應用性
對于尚處于起步階段的護理預測模型研究,除了需要嚴謹的研究方法,還需要緊密結合臨床實際情況,去解決存在潛在風險的問題,才能更好地指導臨床實際工作。同時,臨床預測模型還需要不斷地更新,以避免出現模型因疾病危險因素、治療措施及治療背景等隨時間變化而發生的性能下降[7]??梢姡R床預測模型要在臨床實際情況中不斷調整、動態更新,從而提高模型的可推廣性。
本研究對我國護理學者開展的預測模型建立研究從發文數量、研究設計及模型建立方法等方面進行了系統的回顧與分析??傮w來看,我國護理學者開展預測模型研究的報告質量不高,存在研究方法缺陷及報告不完整等問題,建議護理學者遵循TRIPOD聲明中要求的研究方法和報告流程,以提高模型的報告質量。本研究也存在一定的局限性,未對模型外部驗證方面進行系統的檢索與分析,可在后續研究中進一步開展。