王晶 李玲利 趙春林 楊雪 賀婷婷 袁鄰雁 陳瀟
(四川大學華西護理學院/四川大學華西醫院,四川 成都 610041)
國務院辦公廳發布《關于促進和規范健康醫療大數據應用發展的指導意見》[1],其中提出醫療發展應該順應新興技術發展趨勢,推進科研大數據的應用,建立疾病、藥物副作用預測機制,充分利用優勢資源,推動智慧醫療發展。隨著大數據、人工智能等領域的飛速發展,精準醫學與臨床決策支持系統也是醫療服務進入智能化時代的要點。通過收集個人數據,應用算法,對個體易感性、敏感性進行預測分析,是服務模式向個性化、智能化地有效轉變[2]。機器學習作為新型算法,可以對大量復雜數據進行深度學習并充分挖掘數據,獲取新邏輯關系[3]。目前,風險預測模型構建是機器學習的常見用途之一[4],且已經在護理領域進行了系列模型探究與驗證,實現了部分疾病癥狀的預測性防護與護理。因此,本文將通過對機器學習在護理風險預測模型的應用現狀進行總結展望,為后續護理學者探索未來研究方向提供參考。
1.1機器學習 信息技術等領域的快速發展,使得計算機數據分析的能力迅速提高,多個行業因此受益良多,其中尤其為醫療健康行業,可以將分析方法應用于大型數據庫為醫療保健決策提供證據[5]。其中,機器學習指科學家探索如何開發合適的算法促進數據學習的研究領域,也指使用計算機等機器將統計算法應用于數據集中的人工智能方法之一[6]。在模型構建中,機器學習主要可以對結構化數據(診斷代碼、人口統計學等)及非結構化數據(主訴、病例中的自由文本數據等)進行觀察描述并挖掘他們之間可能的關系,以此開發出可以輔助臨床決策或患者結果的預測模型。目前,常用的算法有Boost算法、支持向量機、決策樹、隨機化森林、貝葉斯及人工神經網絡等[7]。
1.2風險預測模型 隨著計算機技術和醫療領域的相互促進,依托“互聯網+”,智慧醫療已經在健康發展取得一定的成果。智慧醫療不僅僅包含健康管理創新化、互化,還包括健康結局可視化、預測化;健康醫療大數據背景下,人工智能將利用海量的健康數據,進行計算機建模,從而實現精準的疾病未來結局、癥狀發生可能性等事件的概率,從而協助醫護人員制定個性化地預防性治護方案[8]。風險預測模型指將患者的某些特征或癥狀作為預測因子,并對其進行權重分配,從而獲得風險概率的工具[9]。近幾年,越來越多的護理研究者將風險預測模型引入慢病管理、不良事件等領域。
2.1預測慢性病進展 反應國家經濟社會發展、衛生保健水平和人口健康素質的指標之一是慢性病狀況[10]。目前,慢性病已經成為全球死亡的第一大原因,我國已有2.6億人確診慢病,占據我國疾病負擔的70%左右[11]。針對慢病患病率上升且逐步年輕化的現狀,重視預防與管理成為重要舉措。而大數據與新技術對健康管理的重要性應該得到關注與利用[12]。
2.1.1糖尿病 糖尿病是一種以高血糖為特征,伴隨多種并發癥的慢性疾病,其對人體的健康及生活質量造成嚴重影響[13]。近年來糖尿病發生率逐步增高,其防治措施亟需關注。Savita等[14]從機器學習儲存庫中收集糖尿病患者相關信息,通過使用分類算法(支持向量機、貝葉斯、決策樹、隨機森林及神經網絡等)在數據集上進行測試和計算,并與Pima印度糖尿病數據集進行比較,以期能夠精準的預測患者糖尿病風險。最終結果顯示,改進的隨機森林和k近鄰算法具有最佳精度。同時,Dinh等[15]利用受監督的多個機器學習模型(物流回歸、支持向量機、隨機森林和梯度提升)對美國國家健康數據集進行搜索,并將模型進行組合,開發出加權集合模型,最終得出腰圍、年齡、體質量及鈉攝入量等為糖尿病患者的預測性因素。Quan等[16]和Kwon等[17]研究者皆使用數據集對糖尿病預測模型進行開發探究。
2.1.2心血管疾病 心血管疾病被視為最嚴重、最致命的疾病,占全球死亡總數的1/3,即頭號死因[18]。但其早期診斷困難,后期診治又需要充足完善的資源,對部分國家或地區具有挑戰。因此,準確的預測是有效解決問題的方法之一。Pronab等[18]通過慢性心臟病的數據集構建智能機器學習系統,納入多個特征包括年齡、性別和血壓等,選擇多個模型進行模型構建與評估,最終得到的隨機森林混合模型具有最佳性能(精度約92.65%)。Nayan等[19]同樣通過人工神經網絡得到具有90%特異度、靈敏度及準確性的模型,其可以從心電圖、血壓、總膽固醇等方面進行心血管預測。
2.1.3慢性呼吸系統疾病 慢性呼吸系統疾病是全世界死亡和發病的主要原因之一,慢性阻塞性肺病(chronic obstructive pulmonary disease,COPD)和哮喘最為常見[20]。Dimitris等[21]考察了醫療保健領域的臨床決策支持系統,對代表性樣本靜息研究,結果得出準確率為97.7%的COPD隨機森林模型,其關鍵預測因素為吸煙、年齡、第1秒用力呼氣量和強迫肺活量;以及精度為80.3%的哮喘隨機森林模型,其顯著因素為呼出25%與75%肺活量時的最大呼氣流量。
結合機器學習的風險預測模型構建已經在慢性病及其并發癥管理中得到一定的研究與應用,但是由于研究者的數據來源不同以及不同模型在數據集中的性能優劣,目前沒有統一適用的模型,后期研究有待改進。但是,對于較為確定的、可避免的關鍵危險因素可通過加強宣傳與前期預防干預進行規避,從而有效減少慢病發病率以及不良結局的發生率,降低醫療成本,節約資源。
2.2預測不良事件 隨著醫療衛生行業的快速發展以及健康中國建設的推進,患者安全這一醫療管理的核心成為了推進醫藥衛生改革的基礎,黨的十九大指出要將患者安全作為醫療管理的重要內容,不斷提高管理水平,減少醫療服務中可避免的不良事件[22]。目前,國內外對不良事件的定義尚未統一,但是大多研究中所指為壓力性損傷及跌倒等類別[23]。據研究[24]數據顯示,住院患者中50%的不良事件是可以預防的,因此探究準確有效的預測方案對實現優質護理有重要意義。
2.2.1壓力性損傷 壓力性損傷通常指壓力或壓力與剪切力的組合導致皮膚或組織損傷,其發生率是評價護理質量的重要指標之一。Ling等[25]研究者針對外科手術患者術中壓力性損傷相關指標進行logistic回歸建模,決策樹算法分析自變量的重要性,最終得出BMI、手術時長及術中失血等是獨立因素,整個模型靈敏度為0.81,特異度為0.88,曲線下面積為0.69,具有良好的診斷價值。Hu等[26]整合以往的文獻、量表等內容,選擇54個變量在11 838例病例中使用線性回歸(LGR)、決策樹、隨機森林等方法進行分析,最終得出隨機森林為最佳模型(召回=0.802),其中皮膚完整性、收縮壓變化、表達能力等為關鍵變量,而飲酒、食用堅果等習慣需要考慮不同地區或國家的文化。探索壓力性損傷的關鍵危險因素,可以有效幫助臨床護士全面了解患者所處現狀,減輕工作量的同時提高住院質量。Alderden等[27]和Mireia等[28]研究者同樣發開了面對不同患者群體的壓力性損傷預測模型。
2.2.2跌倒 跌倒是醫院內常見不良事件之一,其可能導致患者受傷、住院時間延長等問題,因此積極有效預防跌倒極為重要。目前,臨床常用跌倒評估量表(如Morse量表),但是此類評估工具可能會受到評估時機、實際環境和患者類型等的影響而不準確,且增加了護士的工作量。Yokota等[29]研究者對電子病歷中的患者數據進行統計,采用支持向量機算法建立FINDS模型,可以根據護理記錄以及患者每日相關信息預測患者是否會在某日跌倒,克服傳統評估模式的部分問題,客觀準確預估,減輕護士負擔。Olivier等[30]將848例老年住院患者納入人工神經網絡進行分析,通過床旁臨床評估以及電子病歷采集相關數據,最終得出高特異性的模型;結果表明,面對老年患者時,應該多用診斷測試而不是篩查測試。
基于數據挖掘的不良事件預測模型相較于傳統的量表評估,可以動態地、連續性地評估患者危險等級,且與醫院系統銜接后,自動提取相應數據進行分析,免除護士主動評估的程序,在減少工作量的同時,提高預測準確率,盡早對高危患者、高危因素實施干預,減少不必要的不良事件發生,把控患者安全。
2.3管理模式及成效預測 相關政策倡導應該強化信息化醫療人才的培育,推動醫療、政府等機構的醫療數據型人才隊伍建設。同時,利用信息技術手段與大數據資源,完善醫療評價體系,推動醫院制度改革,優化醫療衛生資源的管理布局[1]。
護士短缺已經成為了全球醫療問題,不斷增長的醫療需求加劇了短缺程度,為了緩解該局面,降低離職率是方法之一,因此可探究護士離職相關因素從而進行相應干預。Chang等[31]對護士進行調查,利用結構方程進行模型構建,發現提高專業能力的意識和行動與離職意向呈負相關。因此,護理管理者可以通過合理分配資源,提高護士專業能力來降低其辭職意圖。同時,由于護理人員工作挑戰較大以及需長期處于醫患群體的關系中,很容易發生職業倦怠,該因素與護士離職率上升有關,給衛生保健組織及患者安全帶來較大影響。Yao等[32]研究者通過馬斯拉赫職業倦怠量表等問卷對860名護士展開調查,并通過通用線性模型進行機器學習,結果顯示壓力、自我效能與個性類型是3大風險因素。Kelly等[33]研究者進行重癥監護室護士的倦怠進行限行逐步回歸分析及聚類,得出工作壓力、工作滿意度和工作樂趣等可預測護士的職業倦怠。因此,醫院及科室管理者可以通過減輕壓力、增強自我效能等策略幫助護士減輕倦怠。護士是醫療系統的核心人力資源,護理質量直接對患者健康有影響。如果護士人員的配置不能滿足患者需求,護理質量可能會受到影響。Daniel等[34]對圍產期護理數據庫進行二次數據收集,通過套索算法篩選可能影響護士人員配置的預測變量,后使用混合效應線性回歸模型以及10倍交叉驗證構建護理人員配置預測模型,可以解釋1/3的護理人員變動,且結果表明人員的增加可能會減少不良事件。根據此類研究,未來衛生服務可通過合理調整人員配比提高護理服務質量。
除人員管理外,在評價護理單元方面,目前大多數醫院多基于規范的評價標準進行考核??荚u方式多為管理委員會成員進行檢查、評價,給出評分進行評選優秀護理單元。雖然會結合科室特性,但是缺少更加客觀、科學、準確的評價標準。通過數據挖掘技術與客觀數據結合,如將各護理單元的工作量、人員配置及資源績效等進行全面評估記錄,分析其對護理質量的影響及相應得分,從而得到個性化、精準化的各護理單元護理質量評價結果。同時,利用平臺自動分析,可以減少管理委員會工作量,實時動態計算,更加科學化的監督護理服務質量。
2.4教育方式及模式成果預測 鼓勵探索開發新型教學模式,推進學習成效評估等應用,從而方便護理學生的學習,提升護理水平[1]。美國勞工統計局預計,截止到2028年,全美國將需要340萬護士進入醫療行業中,這比目前所擁有護士數量增加了12%[35]。為滿足日益增長的醫療保健需求,教育行業應該積極招收護理學生并提高畢業率。為此,研究者們探究出影響學業成功的預測因素,以便于積極干預。Hannaford等[35]總結某私立大學的學生信息,選擇8種機器學習算法進行模型構建與比較,最終選擇最佳模型為隨機森林,其曲線下面積為0.60。且研究結果顯示,護理相關課程成績、學分以及大學平均成績可以預測識別出高危學生。該類模型可指導高校改進教學模式與方法,為學生制定個性化培養方案以及早期高危干預措施,提高教育質量。除在護理人員數量缺失外,全球卓越的高等教育需求也日益增加。但目前對于教育質量的指標尚未有一個“基準”,Langan等[36]納入來自英國9所大學護理課程的數據,使用機器學習方法(分類決策樹等)客觀地選擇價值變量來預測我們衡量成功、學生進步的指標后,用選擇的變量構建基準模型,最終得出年齡、性別、青年參與高等教育的比例等因素平均重要性最高。該基準方法可以為探索其他地區基準提供依據,以提高高等教學的質量。
3.1前期數據缺失或記錄不規范 構建風險預測模型時,最重要的基礎是數據集的全面性與準確性;目前,大多數研究為回顧性探究,但是現有數據存在一些問題,導致模型構建不理想。雖然早在2008年住院護士工作站系統應用率已經高達67.22%[37],但是由于護理記錄沒有規范化格式,因此不能直接作為原始數據進行挖掘,需要大量前期處理,耗費人力、時間。而且一些數據未被記錄入系統中,例如傷口、壓瘡等圖片資料,導致大量數據資源流失。目前,大多數醫院擁有自己的數據中心,可以進行數據分析與利用。但是醫院間、地區間信息處于孤立狀態,無法進行數據共享,導致信息孤島的產生。因此,大多研究成果雖然在實驗所在地效果良好,但因為數據集特征不同,因此結果無法共用且研究結果代表性不足,可推廣性不強。部分研究在考慮臨床相關因素時,忽略了大環境因素對人體的影響,例如在探究慢性呼吸系統疾病高危因素時,是否應該納入患者長期生活環境的空氣質量等影響因素,保證預測的全面性與有效性。鑒此,為了能夠更加有效利用數據中蘊藏的豐富信息,應該從日常工作記錄規范化這一基礎措施做起,有利于數據利用的同時有助于推動后續數據庫共享化、信息共通化以及系統評價制度的完善化。
3.2護理人員數據挖掘知識儲備不足 醫工結合已經成為當今醫療行業發展趨勢,護理人員與多學科學者進行交叉合作,以期快速有效提升護理服務質量。但是我國護理人員自身缺少信息技術相關知識儲備,不僅僅會降低與專業人士合作的效率,同時可能會忽視一些可以用信息技術解決的臨床問題。目前,我國護理學者在構建風險預測模型時,還是以logistic等傳統分析方法為主,相較于國外研究,我國大數據在護理領域的探究還處于起步階段。部分研究者雖走在前列,利用機器學習進行數據挖掘,但通常會通過閱讀文獻或經驗來選擇某一種算法,而同一研究問題在不同數據庫中構建模型,適用的算法可能都會發生變化[38-40],故后續研究可以對同一問題訓練多個模型,再進行模型性能評估,以選出最優模型。面對目前研究過程中護理人才的短板,更提示培養具有醫工素養的復合型人才應該早期著手,可在本科、碩士教育階段中,增加信息化教育相關課程,拓展視野,豐富知識存儲,充分發揮信息技術在護理領域的應用。
3.3研究停留于表面,缺少臨床驗證與應用 大多數研究立足于回顧歷史數據,使用信息技術進行內部驗證,缺少外部驗證來明確模型的準確性及敏感度。而且臨床依然多應用傳統量表進行風險評估,可見預測模型目前的臨床應用范圍不廣。因此,提高模型的準確性,使用的便利性,才能加快研究成果臨床化的進程,推進護理信息化發展。
綜上所述,目前護理領域中應用機器學習算法構建風險預測模型已經取得了一定的研究進展,但是護理的信息化發展仍然面臨巨大的挑戰。規范且完整數據庫的缺乏,數據挖掘技術使用的不成熟,研究領域和理論還未被全面拓展等問題依舊嚴峻。隨著醫工交叉的快速推進,護理研究者需要把握學科自身特點,尋求高效的多學科合作,利用信息化技術開展護理風險預測模型研究,不斷創新研究方法,進一步拓展研究的廣度與深度,提高護理質量與效率,促進護理學科發展。