999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

3種機器學習算法對維持性血液透析病人衰弱風險預測性能比較

2024-01-22 11:12:08汪丹丹姚侃斐祝雪花
護理研究 2024年1期
關鍵詞:模型研究

汪丹丹,姚侃斐,祝雪花

浙江中醫藥大學護理學院,浙江 310053

維持性血液透析(maintenance hemodialysis,MHD) 是終末期腎病病人主要的治療方式[1]。但MHD 不能替代正常腎臟所有復雜的代謝和內分泌功能,長期血液透析的病人易出現一系列并發癥,衰弱是最常見的并發癥之一,其發病率為46%~50%[2-3]。有研究顯示,衰弱會增加MHD 病人跌倒、骨折、功能障礙、死亡等的風險,與多種不良健康結局密切相關[4-5]。因此,對MHD 病人進行衰弱風險的早期預測從而降低病人衰弱的發生率、提高其生活質量至關重要。Logistic 回歸、決策樹CART 和隨機森林是機器學習算法中的重要分類器,被廣泛應用于風險預測研究中。3 種機器學習算法均能有效預測疾病的風險因素,但由于運算方法不同,3 種算法的預測性能有所區別。本研究利用Logistic 回歸、決策樹CART 和隨機森林3 種算法分別構建MHD 病人衰弱風險的預測模型,并對比分析3種模型的預測效果,確定適用于MHD 合并衰弱的風險預測模型,以期為預防和早期干預MHD 病人并發衰弱提供參考依據。

1 對象與方法

1.1 研究對象

選取2021 年10 月—2022 年3 月于杭州市2 所綜合性醫院血液凈化中心接受MHD 治療的485 例病人作為研究對象。納入標準:符合慢性腎臟?。–KD)/終末期腎病(ESRD)診斷標準;年齡≥18歲;規律血液透析治療≥3個月 (≥3次/周),每次透析治療時間≥3 h;具有一定的認知能力和溝通能力,能配合閱讀、書寫或回答問題;知情并自愿參與本研究。排除標準:意識障礙或有精神疾病病人;調查前2 個月內發生重大外傷 (腦外傷、骨折等)和嚴重后遺癥,或合并有嚴重危及生命的原發性疾病者;病歷數據不全者。本研究已獲醫院倫理委員會批準(批準號:20211014-3)。

本研究樣本量按7∶3 劃分為訓練集和測試集。經理論研究整合發現可能的危險因素有16 個、MHD 病人衰弱的發生率為46%~50%,Logistic 回歸模型要求陽性事件數是自變量的10 倍以上,決策樹CART 及隨機森林模型要求樣本量大于解釋變量的2 倍,故本研究采用Logistic 回歸模型的樣本量估算方法,納入訓練集病人341 例、測試集病人144 例。

1.2 研究工具

1.2.1 臨床觀察指標收集表

結合文獻回顧和臨床專家意見自行設計,主要調查病人的一般資料,如年齡、性別等,生活方式如吸煙史、飲酒史等,疾病用藥情況如血液透析情況等,實驗室指標如血管通路類型、血清清蛋白等。

1.2.2 Fried 衰弱表型

本研究以Fried 衰弱表型作為衰弱判定的標準,該量表為Fried 等[6]于2001 年基于臨床大數據開發形成,是臨床認可度高的衰弱測評工具,被廣泛應用于血液透析及腎病病人群體中。量表共包含5 個條目,分別為不明原因的體重下降、自我報告的疲乏、軀體活動量降低、握力下降和步行速度減慢,符合5 個條目中任意3 個及以上即為衰弱,符合3~5 個判定為衰弱。

1.2.3 日常生活活動能力量表(Activity of Daily Living Scale, ADL)

該量表由Lawton 等[7]于1969 年編制,是國內外常用的用于測評病人日常生活能力的測評工具。該量表由軀體性生活自理能力量表和工具性日常生活能力量表兩部分組成,共包含行走、吃飯、穿衣等共14 個條目。每個條目分別計1~4 分,總分為14~56 分,得分越高表示功能缺陷越明顯,14 分為完全正常,>14~21分為ADL 輕度受損,>21 分為ADL 重度受損。

1.2.4 醫院焦慮抑郁量表(Hospital Anxiety and Depression Scale, HADS)

該量表由Zigmond 等[8]于1983 年編制,主要應用于篩查綜合醫院病人的焦慮和抑郁情緒。相較其他焦慮和抑郁量表而言,該量表在醫院中應用較多,更為貼合病人的實際情況,且題型精簡,可同時測評病人的焦慮和抑郁水平,能較大程度地提高病人填寫問卷的質量。該量表分為焦慮分量表和抑郁分量表兩部分,分量表各7個條目,每個條目分別賦值0~3分,若分量表≥8 分即懷疑有抑郁或焦慮可能。

1.2.5 社會支持評定量表(Social Support Rating Scale, SSRS)

該量表由肖水源[9]基于國外較權威的評定量表制定,可較好地反映個體的社會支持狀況,是國內評定社會支持水平的主要測評工具,較多研究證實該量表具有較好的信效度。量表包含客觀支持(3 個條目)、主觀支持(4 個條目)和對社會支持的利用度(3 個條目)3個維度共10 個條目,每個條目依據所選項分別計分,得分越高則社會支持度越高,≤31 分為社會支持不足。

1.2.6 查爾森合并疾病指數(Charlson Comorbidity Index,CCI)

該量表由Charlson 等[10]于1987 年為研究合并癥與死亡風險之間的關系建立,研究證實共病是MHD 病人預后的強預測因子[11-12],該量表在血液透析病人并發衰弱的危險因素研究中具有重要作用。量表共19個條目,總分0~38 分,得分越高,合并疾病程度越重。

1.2.7 營養風險篩查評分(Nutrition Risk Screening,NRS-2002)

NRS-2002 由歐洲腸外腸內營養學會專家基于臨床隨機對照試驗結果推薦,用于評定住院病人的營養風險[13]。該量表既包含各營養指標,同時基于證據對疾病的嚴重程度進行評分以反映因疾病而增加的代謝和營養需求,可全面評定病人的營養風險,已廣泛應用于腎病及血液透析病人中。量表共3個條目,“是”計1分,“否”計0分,總分0~3分,評分≥3分為存在營養風險。

1.3 資料收集方法

采用面對面問卷調查。調查前,2 名護理研究生接受相關知識的培訓和考核,以熟練掌握各量表的評判標準。調查中,在征得研究對象的知情同意后,采用統一的指導語進行面對面資料收集,所有條目均現場填寫,錯填或漏填選項及時反饋、更正,問卷有效回收率為100%。體檢相關指標從臨床電子信息平臺提取。調查過程中每周開展雙人交叉審核。

1.4 統計學方法

采用SPSS 25.0 進行統計描述,符合正態分布的定量資料采用均數±標準差(±s)描述,不符合正態分布的定量資料采用中位數、四分位數[M(P25,P75)]描述,定性資料用頻數和百分比(%)描述。采用R 4.1.2進行模型構建,以訓練集數據進行建模,應用單因素Logistic 回歸初步篩選影響因素,將P<0.05 的變量納入后續研究。采用Logistic 回歸、決策樹CART 和隨機森林算法分別建立風險預測模型,利用訓練集和測試集數據分別對3 種模型的預測性能進行比較分析。

2 結果

2.1 MHD 病人衰弱的發生情況

共納入MHD 病人485 例,其中并發衰弱者205例(42.27%)。485例病人中,男318例(65.6%),年齡25~91[62(52,71)]歲;原發疾?。郝阅I小球腎炎185 例(38.14%),糖尿病腎病144 例(29.69%),高血壓腎病28例(5.77%),其他128 例(26.39%)。訓練集納入病人341 例(70.31%),測 試 集 納 入 病 人144 例(29.69%)。訓練集和測試集各基線資料比較差異均無統計學意義(P>0.05),兩組的衰弱發生率比較差異無統計學意義(χ2=0.958,P=0.328),提示訓練集和測試集的各項指標較為均衡。

2.2 MHD 病人衰弱危險因素的單因素分析

根據病人是否并發衰弱,將訓練集劃分為衰弱組(n=149)和非衰弱組(n=192),對兩組病人的一般狀況開展單因素分析,結果顯示,兩組病人年齡、性別、體質指數(BMI)、文化程度、職業、婚姻、吸煙史、每日睡眠時間、日常鍛煉情況、原發疾病、多重用藥情況比較差異均有統計學意義(P<0.05);對兩組病人的實驗室指標進行比較,結果發現,兩組血肌酐(Scr)、血管通路類型、總蛋白(TP)、清蛋白(ALB)、前白蛋白(PAB)、C反應蛋白(CRP)比較差異均有統計學意義(P<0.05);兩組病人SSRS 得分、CCI 得分、ADL、焦慮、抑郁、NRS-2002比較差異均有統計學意義 (P<0.05)。詳見表1~表3。

表1 MHD 并發衰弱一般狀況相關危險因素單因素分析(n=341)

表2 MHD 并發衰弱其他危險因素的單因素分析(n=341)

2.3 MHD 病人衰弱風險的3 種預測模型

2.3.1 Logistic 回歸模型

將單因素分析篩選出的具有統計學意義的22 個變量作為自變量,進行向后逐步回歸分析構建模型。連續性變量以原值輸入,分類及等級變量賦值見表4。根據赤池信息準則(AIC)原則,以最小AIC=164.3 為最優值,此時多因素Logistic 回歸結果顯示,年齡、性別、日常鍛煉情況、ALB、SSRS 得分、CCI 得分、ADL、NRS-2002 是MHD 病人發生衰弱的獨立危險因素,詳見表5。

表4 多因素Logistic 回歸賦值情況

表5 MHD 并發衰弱危險因素的Logistic 回歸分析結果

2.3.2 決策樹CART 模型

將單因素分析所篩選出的22 個變量作為預測因子納入決策樹CART 模型,以基尼系數為基礎進行樹的生長,選擇最小代價復雜度剪枝法對決策樹CART進行后剪枝,生成的決策樹CART 模型見圖1。該樹形圖包含5 層,5 個終末節點,其中CCI 得分、抑郁分級、NRS-2002 分級、年齡、SSRS 得分、性別是決策樹CART 模型的6 個重要解釋變量。

圖1 MHD 病人衰弱危險因素的決策樹CART 模型

2.3.3 隨機森林模型

采用R 語言實現隨機森林算法的擬合,經過模型驗證,總樣本量誤差最小時樹的數量為442,此時OOB誤差為12.32%,模型的精確度較高。采用平均準確度降低量衡量模型變量的重要性,并采用重復5 次的十折交叉驗證對變量進行取舍,結果顯示當變量數為7時OOB(out of bag)最小,故選取前7 個重要的變量對初始隨機森林模型進行優化,重要性評分居前7 位的變量分別為CCI 得分、年齡、NRS-2002 得分、性別、抑郁分級、日常鍛煉情況、吸煙史。變量的重要性排序見圖2。

圖2 隨機森林模型

2.4 3 種風險模型的預測性能比較

2.4.1 訓練集風險模型預測性能比較

在訓練集中,3 種模型的準確率均在90%以上,其中隨機森林模型的準確率(97.95%)、靈敏度(99.32%)、特異度(96.91%)、陽性預測值(PPV,96.05%)、陰性預測值(NPV,99.47%)和Kappa 值(0.958)均高于其他模型。AUC 值由大到小依次排序為:隨機森林模型(0.998)、Logistic 回 歸 模 型(0.971)、決 策 樹CART 模 型(0.954),3 種模型AUC 值的兩兩比較結果顯示,Logistic回歸模型與決策樹CART 模型比較差異無統計學意義(P=0.219),而隨機森林模型與Logistic 回歸模型、決策樹CART 模型比較差異均有統計學意義(P<0.001)。具體見表6、圖3。

圖3 訓練集ROC 曲線

表6 訓練集中3 種模型的預測性能

2.4.2 測試集風險模型預測性能比較

在測試集中,3 種模型的準確率均在80%以上,其中隨機森林模型的準確率(88.19%)、靈敏度(87.50%)、NPV(93.41%)和Kappa值(0.741)均高于其他模型,Logistic回歸模型的PPV(81.03%)高于其他模型。AUC 值由大到小依次排序為: Logistic 回歸模型(0.957)、隨機森林 模 型(0.934)、決 策 樹CART 模 型(0.870),3 種 模 型AUC 值的兩兩比較結果顯示,Logistic 回歸模型與隨機森林模型之間差異無統計學意義(P=0.367),而決策樹CART 模 型 與Logistic 回 歸 模 型(P=0.014)、隨 機 森 林模型(P=0.002)比較差異有統計學意義。見表7、圖4。

圖4 驗證集ROC 曲線

表7 測試集中3 種模型的預測性能

3 討論

3.1 MHD 病人衰弱現狀

總體而言,各國家或地區的MHD 病人衰弱的發生率仍處于較高水平。本研究發現MHD 病人衰弱的發生率為42.27%,與Lee 等[2]的一項系統評價結果相近(43%),但低于MHD 病人衰弱的發生率(46%~50%)。究其原因可能與研究對象相關,本研究中男性比例高于女性,女性僅為34.3%,且本調查中受試者的年齡跨度較大,年齡范圍為25~91 歲,而既往研究表明,性別與衰弱存在一定的關聯,女性MHD 病人衰弱的發生率高于男性[14],此外,既往研究也證實年齡是衰弱的重要影響因子,年齡越高則衰弱程度越高。另外,由于各研究的地域環境、樣本選擇均存在差異,在一定程度上也會使衰弱的發生率有所不同。因此,早期識別衰弱發生的MHD 高危人群,可有效加強醫護人員對MHD 并發衰弱的早期預防和及早干預,從而提高病人的生活質量,改善疾病預后。

3.2 Logistic 回歸、決策樹CART 和隨機森林模型的共同預測因子

3 種模型均將年齡、性別、CCI 得分和NRS-2002分級列為共同預測因子,且4 個預測因子在隨機森林模型的預測準確性排序中位居前列,可見這4 種因素對于MHD 病人衰弱預防的意義重大,值得臨床醫護人員重視。

3.2.1 年齡

本研究結果顯示,年齡是3 種風險預測模型的重要組成要素,在Logistic 回歸模型中OR=1.171,P<0.001;在決策樹CART 模型中位于第3 層;是隨機森林模型的第2 重要因子。高齡是MHD 病人并發衰弱的獨立危險因素。隨著年齡的增長,個體的許多生理機能都會衰退,身體成分也會發生變化,導致其生理儲備、抗應激能力、認知功能、免疫功能等下降,脂肪量和肌肉質量也隨之減少,從而加速衰弱進展[15]。此外,終末期腎病會加重MHD 病人體內的尿毒癥毒素累積,增加蛋白質能量消耗和氧化應激,進而加速病人的衰老過程[16]。

3.2.2 性別

本研究結果顯示,性別是3 種風險預測模型的共同預測因子,在Logistic 回歸模型中OR=15.581,P<0.001;在決策樹CART 模型中位于第4 層;是隨機森林模型的第4 重要因子。在所有的年齡組中,女性發生衰弱的可能性更大,衰弱程度也更高。分析原因可能是:1)肌肉質量是衰弱表型的重要組成部分,與衰弱密切相關,而與男性相比,女性的體重普遍較輕,骨骼肌質量較少,肌肉力量較弱,而且女性的活動水平較低,更容易發生肌肉減少癥,增加了衰弱發生的可能性[17]。2)男女之間存在社會和行為領域的差異,女性對疾病的感知更為敏感,也傾向于規避風險,更愿意報告自身的健康問題,使得其衰弱檢出率高[18]。3) 由于基因不同,男女之間的內分泌有所差異,女性更容易發生癡呆、抑郁、骨折等慢性疾病,在慢性疾病的影響下衰弱的患病率也更高[19]。

3.2.3 CCI 得分

本研究結果顯示,CCI 得分與衰弱呈正相關,在Logistic 回歸模型中OR=1.936,P<0.001;為決策樹CART 模型的根節點;是隨機森林模型的首要重要因子。MHD 病人的CCI 得分越高則衰弱的發生率越高,這與范炯同[18]的研究結論相同。CCI 評分常用于評估病人的生存與多種疾病狀態,是一種可有效預測臨床病人長期死亡率的評估工具[20]。因為終末期腎病行MHD 病人常合并其他的基礎疾病或誘發疾病,這些疾病多無法治愈,大大加重了MHD 病人的共病負擔和經濟壓力,使得病人長期處于慢性消耗狀態,生理儲備持續下降,不同程度地限制病人的活動能力,增加病人的負性情緒,加速衰弱發展。

3.2.4 NRS-2002 分級

NRS-2002 分級是3 種模型的共同預測因子,在Logistic 回歸模型中OR=35.086,P<0.001;在決策樹CART 模型中位于第2 層;是隨機森林模型的第3 重要因子。營養不良與衰弱密切相關。營養不良可表現出身形消瘦、精神萎靡不振、四肢無力等癥狀,這些表現與衰弱表型中的體重減輕、疲乏和步速減慢3 個指標相重疊。此外,既往研究表明,機體的低營養狀態可能導致蛋白質合成降解,使得肌肉質量下降并引起個體活動量減少,最終導致機體呈現衰弱狀態,而由于終末期腎病的慢性消耗,MHD 病人需要滿足更高的營養需求,才能防止或延緩蛋白質能量消耗的惡性進展[21-22]。

3.3 隨機森林模型的預測性能最高

比較3 種模型在訓練集和測試集的綜合表現,可確定隨機森林模型的預測效果最佳,這一結果與已有研究[23-24]應用機器學習算法預測臨床結局的結果一致。從機器學習算法的特性分析,Logistic 回歸分析因其可解釋性較強,OR 值能直接反映指標的風險性大小而被廣泛應用于危險因素研究,但在模型構建時由于該算法對樣本量和數據類型要求較高,易出現模型性能不高、易受缺失數據影響等問題[25]。決策樹CART 是一種可解釋性很強的算法,對缺失變量及數據分布類型不敏感,能夠通過樹形圖直觀了解到分類或預測的過程,但模型結構往往較為復雜,易出現過擬合和泛化能力弱的問題。隨機森林算法是一種集成學習算法,該算法的本質是將若干個決策樹進行組合分析,使得單一樹因各自差異性導致的不同分類邊界變得更為合理,從而減少整體的錯誤率,實現更好的預測效果。并且隨機森林算法對數據類型要求不高,能自動分析預測因子的交互作用和非線性效應,通過有目的的放回方式對數據進行充分利用,能夠有效提高算法的預測精度,獲得更為準確、穩定和強健的結果[24]。綜上所述,隨機森林模型是預測MHD 病人衰弱風險的最優選擇。

4 本研究的不足

本研究的不足之處在于采用便利抽樣法選取病人,僅對模型進行內部驗證,因而存在地域性的局限性,也無法證明模型的泛化能力,今后應擴大樣本量,開展多中心研究,并在實際應用中檢驗模型的臨床應用性并完善模型,使本研究結果能為MHD 病人衰弱的預防提供可靠依據。

猜你喜歡
模型研究
一半模型
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
新版C-NCAP側面碰撞假人損傷研究
3D打印中的模型分割與打包
主站蜘蛛池模板: 国产在线观看精品| 成人久久18免费网站| 欧美日韩一区二区三区在线视频| 99热在线只有精品| av午夜福利一片免费看| 97视频在线观看免费视频| 国产精品毛片在线直播完整版| 国产欧美日韩视频怡春院| 69av在线| 色视频国产| 亚洲精品福利网站| 亚洲人成网线在线播放va| 亚洲αv毛片| 国产主播一区二区三区| 中文字幕在线观看日本| 欧美精品aⅴ在线视频| 日韩 欧美 国产 精品 综合| 亚洲一区二区三区国产精品 | 手机精品福利在线观看| 欧美日韩在线亚洲国产人| 色窝窝免费一区二区三区 | 激情综合网址| 干中文字幕| 亚卅精品无码久久毛片乌克兰| 久久国产热| 亚洲欧美日韩视频一区| 国产无套粉嫩白浆| 亚洲欧洲日韩久久狠狠爱| 国产黄视频网站| 中文字幕伦视频| 四虎在线高清无码| 国产精品大白天新婚身材| 日韩精品资源| 亚洲综合经典在线一区二区| 久久久受www免费人成| www.youjizz.com久久| 九九这里只有精品视频| 丰满人妻中出白浆| 尤物成AV人片在线观看| 国产新AV天堂| 91无码人妻精品一区二区蜜桃| 亚洲永久免费网站| 狠狠色成人综合首页| 国产精品任我爽爆在线播放6080| 欧美一级视频免费| 老司国产精品视频| 亚洲无码高清免费视频亚洲| 欧美激情视频一区| 青青草91视频| 久久婷婷六月| 色综合综合网| 欧美色图久久| 国产波多野结衣中文在线播放 | 日本欧美一二三区色视频| 亚洲美女视频一区| 欧美一区二区自偷自拍视频| 国产一级片网址| 国产精品成人不卡在线观看 | 国产精品成人久久| 国产成人精彩在线视频50| 久久国产精品国产自线拍| 偷拍久久网| 国产亚洲欧美在线专区| 国产精品第5页| 国产va免费精品观看| 中文字幕66页| 制服丝袜在线视频香蕉| 伊人激情综合网| 88国产经典欧美一区二区三区| 国产尤物在线播放| 欧美午夜在线观看| 亚洲精品天堂自在久久77| 国产av一码二码三码无码| 91欧美亚洲国产五月天| 久久久久久久久久国产精品| 亚洲天堂视频在线免费观看| 国产乱子伦视频在线播放| 国产一二视频| 国产精品第一区| 精品国产免费观看| 久久国产精品嫖妓| 国产欧美精品专区一区二区|