999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于可解釋性機(jī)器學(xué)習(xí)算法的開(kāi)顱手術(shù)患者重癥監(jiān)護(hù)室住院時(shí)間預(yù)測(cè)模型

2022-05-28 10:46:06王紹博王琪琪焦增濤劉有軍于榮國(guó)
中國(guó)醫(yī)療設(shè)備 2022年5期
關(guān)鍵詞:特征手術(shù)模型

王紹博,王琪琪,焦增濤,劉有軍,于榮國(guó)

1.北京工業(yè)大學(xué) 環(huán)境與生命學(xué)部,北京 100124;2.醫(yī)渡云(北京)科技有限公司,北京 100191;3.福建省立醫(yī)院 外科重癥醫(yī)學(xué)科,福建 福州 350001

引言

開(kāi)顱手術(shù)是一種神經(jīng)外科疾病治療方法,包括腦腫瘤摘除術(shù)、血腫清除術(shù)、腦挫裂傷去骨瓣減壓術(shù)等,由于這種手術(shù)的難度大、醫(yī)療費(fèi)用高且術(shù)后并發(fā)癥較多,建議開(kāi)顱手術(shù)患者進(jìn)入重癥加強(qiáng)護(hù)理病房(Intensive Care Unit,ICU)進(jìn)行監(jiān)護(hù),盡可能降低患者各種風(fēng)險(xiǎn)[1]。ICU內(nèi)住院時(shí)間(Length of ICU Stay,LoICUS)是一種常見(jiàn)的作為護(hù)理質(zhì)量與資源使用的衡量指標(biāo)[2]。對(duì)于大部分患者而言,ICU內(nèi)的醫(yī)療費(fèi)用是高額支出,而隨著患者LoICUS的增長(zhǎng),患者在承受痛苦的同時(shí),還需承擔(dān)高額醫(yī)療費(fèi)用,會(huì)造成較大醫(yī)療負(fù)擔(dān)。從人員成本和資源管理的角度來(lái)看,預(yù)測(cè)LoICUS是否過(guò)長(zhǎng)并提供相應(yīng)的干預(yù)和決策建議具有重要價(jià)值[3]。部分研究探討了護(hù)理路徑對(duì)重癥顱腦損傷患者LoICUS的影響,并發(fā)現(xiàn)通過(guò)實(shí)施干預(yù)或改善臨床護(hù)理路徑,可縮短患者LoICUS,改善患者病情[4-5]。

預(yù)測(cè)模型(Predictive Model,PM)作為一種重要的風(fēng)險(xiǎn)評(píng)估與知識(shí)發(fā)現(xiàn)工具,已有相當(dāng)數(shù)量的學(xué)者對(duì)LoICUS進(jìn)行了研究。2017年,有學(xué)者基于神經(jīng)網(wǎng)絡(luò)算法建立了LoICUS是否大于5 d的模型,準(zhǔn)確率為80%[6]。2019年,基于線性回歸與長(zhǎng)短期記憶網(wǎng)絡(luò)算法,建立的LoICUS是否大于7 d的模型準(zhǔn)確率為84%[7]。2021年,通過(guò)對(duì)比線性回歸、隨機(jī)森林(Random Forest,RF)模型、支持向量機(jī)等6種算法建立的LoICUS二分類模型,通過(guò)患者LoICUS的中位數(shù)(2.64 d)將其分為兩類,認(rèn)為RF模型效果較好(準(zhǔn)確率為65%)[8]。

本文的研究對(duì)象為需要進(jìn)行開(kāi)顱手術(shù)并進(jìn)入ICU住院的患者,有研究發(fā)現(xiàn)因腦腫瘤而開(kāi)顱的患者LoICUS不超過(guò)1 d[9],還有研究表明LoICUS的中位數(shù)在2~6.9 d[10],基于此本研究將開(kāi)顱手術(shù)患者LoICUS較長(zhǎng)定義為患者LoICUS≥8 d。

本研究基于開(kāi)顱手術(shù)患者電子病歷,通過(guò)自身可解釋性較強(qiáng)的邏輯回歸(Logistic Regress,LR)模型、RF模型以及梯度下降決策樹(shù)(Gradient Boosting Decision Tree,GBDT)模型三種機(jī)器學(xué)習(xí)算法建立PM,對(duì)此類患者的LoICUS進(jìn)行分類預(yù)測(cè),并通過(guò)對(duì)其進(jìn)行評(píng)估挑選效果較好的模型并從中挖掘影響開(kāi)顱手術(shù)患者LoICUS較長(zhǎng)的風(fēng)險(xiǎn)因素,為ICU內(nèi)臨床醫(yī)生提供輔助性決策或干預(yù)建議的相關(guān)參考,盡可能減少患者高額醫(yī)療費(fèi)用支出、減輕醫(yī)療負(fù)擔(dān)。

1 材料與方法

1.1 數(shù)據(jù)來(lái)源

本研究選取在福建省立醫(yī)院外科ICU專病庫(kù)2005年3月至2018年9月接受過(guò)開(kāi)顱手術(shù)的患者836例,其中男性493名,女性343名,平均入院年齡為55歲,ICU內(nèi)住院天數(shù)的平均數(shù)為41.79 d、中位數(shù)為12.61 d、眾數(shù)為0.94 d,69名患者的結(jié)局為死亡。上述數(shù)據(jù)通過(guò)醫(yī)渡云(北京)科技有限公司的智能大數(shù)據(jù)平臺(tái)導(dǎo)出,不包含任何患者的個(gè)案數(shù)據(jù),且通過(guò)醫(yī)院倫理委員會(huì)認(rèn)可。

本研究將此類患者的各項(xiàng)臨床檢驗(yàn)指標(biāo)作為數(shù)據(jù)源?;颊叩募{入規(guī)則為年齡≥18歲,經(jīng)歷過(guò)開(kāi)顱手術(shù)(包括腦挫裂傷去骨瓣減壓術(shù)、血腫清除術(shù)、腦膜瘤摘除術(shù)、垂體瘤摘除術(shù)、動(dòng)脈瘤出血介入術(shù))需進(jìn)入ICU監(jiān)護(hù)治療,且至少有一次完整的ICU內(nèi)相關(guān)檢查記錄的患者?;颊叩呐懦?guī)則為L(zhǎng)oICUS不足24 h或LoICUS為空值或患者的院內(nèi)結(jié)局為死亡。對(duì)于患者院內(nèi)死亡的規(guī)定為患者入院24 h后,“死亡記錄”登記為“死亡”的,或“出院情況”為“自動(dòng)出院”的。經(jīng)過(guò)上述患者納排規(guī)則后,最終納入患者病例為677例。

1.2 方法

本研究首先對(duì)患者數(shù)據(jù)進(jìn)行預(yù)處理,然后對(duì)患者特征進(jìn)行統(tǒng)計(jì)學(xué)分析,建立兩種患者特征集。通過(guò)三種機(jī)器學(xué)習(xí)算法對(duì)兩種特征集建立PM,根據(jù)模型評(píng)估方法挑選最優(yōu)模型,并對(duì)最優(yōu)模型進(jìn)行解釋分析。

1.2.1 數(shù)據(jù)預(yù)處理

經(jīng)過(guò)患者納排規(guī)則以及具有豐富臨床經(jīng)驗(yàn)與知識(shí)的福建省立醫(yī)院外科ICU主任確認(rèn),最終本研究篩選得到67個(gè)字段作為構(gòu)建PM的候選變量,這些變量包括患者的人口學(xué)信息(如年齡、性別等)4個(gè)、既往病史(如高血壓、糖尿病等)7個(gè)、腦損傷誘因(如腦積水、癲癇等)5個(gè)、感染源(如肺部、泌尿系等)4個(gè)、生命體征(如舒張壓、收縮壓等)6個(gè)、格拉斯哥昏迷指數(shù)(Glasgow Coma Scale,GCS)評(píng)分、血腫性質(zhì)(如蛛網(wǎng)膜下、硬膜下等)4個(gè)、實(shí)驗(yàn)室檢查(如血紅蛋白、血小板計(jì)數(shù)等)31個(gè)以及治療指標(biāo)(如手術(shù)時(shí)間、麻醉類型等)5個(gè),并去除缺失率高于30%的臨床變量。

本研究將包含67個(gè)字段的候選特征集按照獲取時(shí)間分為開(kāi)顱手術(shù)前特征集與開(kāi)顱手術(shù)后特征集,并將特征集中的字段分為靜態(tài)指標(biāo)與動(dòng)態(tài)指標(biāo)。靜態(tài)指標(biāo)為只有唯一取值的變量,如患者入院年齡、性別等;動(dòng)態(tài)指標(biāo)為隨時(shí)間變化的臨床變量,如患者的血壓、脈搏等,本研究提取患者在ICU住院期間此類變量的首次值、最大值與最小值。

對(duì)于候選特征集中的離散型變量,缺失部分使用該變量中類別頻率最高的一類進(jìn)行填充(即使用眾數(shù)進(jìn)行填充);對(duì)于連續(xù)型變量,缺失部分則使用該項(xiàng)的均值進(jìn)行填充并進(jìn)行歸一化處理。對(duì)于納入的所有連續(xù)型特征F={F1,F2,F3,…,Fi,……,Fn},i[1,n],其中每個(gè)特征Fi所對(duì)應(yīng)的特征集記為XFi={XFi1,XFi2,XFi3,…,XFij,……,XFim},j[1,m],將XFi中的每個(gè)值XFij減去XFi中的最小值(minXFi),并除以最大值(maxXFi)與最小值的差,得到X'Fij,如式(1)所示,X'Fij為歸一化結(jié)果,其范圍為0~1。

首先將上述經(jīng)填充與歸一化處理后的候選特征集結(jié)合具有統(tǒng)計(jì)學(xué)意義的(P<0.05)篩選結(jié)果形成醫(yī)生挑選特征集(醫(yī)學(xué))和醫(yī)生與統(tǒng)計(jì)學(xué)共同挑選特征集(醫(yī)學(xué)+統(tǒng)計(jì)學(xué)),然后將上述兩種特征集均劃分為訓(xùn)練集與測(cè)試集,其比例均為7:3(訓(xùn)練集473,測(cè)試集204)。訓(xùn)練集用于進(jìn)行PM的訓(xùn)練與參數(shù)調(diào)整,測(cè)試集用于進(jìn)行模型效果的評(píng)估。驗(yàn)證模型參數(shù)的方法為10折交叉驗(yàn)證,即訓(xùn)練集數(shù)據(jù)樣本被隨機(jī)分為10份子樣本集,其中1份為驗(yàn)證集,9份為訓(xùn)練集。

1.2.2 機(jī)器學(xué)習(xí)方法

本研究基于機(jī)器學(xué)習(xí)技術(shù)進(jìn)行PM的構(gòu)建,分別使用LR、RF以及GBDT進(jìn)行建模。機(jī)器學(xué)習(xí)中存在一些黑盒的模型,如支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)等,它們具有極高的特征抽象和非線性擬合能力,但是人類對(duì)此類模型的擬合過(guò)程無(wú)法理解,特別是在醫(yī)學(xué)研究領(lǐng)域,即使神經(jīng)網(wǎng)絡(luò)的效果優(yōu)于傳統(tǒng)方法,由于其不可解釋性依舊使醫(yī)學(xué)工作者無(wú)法完全信任模型的價(jià)值。本研究所選模型的優(yōu)勢(shì)在于可解釋性較強(qiáng),并且大部分模型可以建立特征之間的關(guān)系,即自身可解釋。

(1)邏輯回歸。LR是線性回歸模型的擴(kuò)展,可用于預(yù)測(cè)二分類問(wèn)題中每一類別的概率。由于LR具有應(yīng)用廣泛、可解釋性強(qiáng)的優(yōu)點(diǎn),因此LR在醫(yī)學(xué)PM中得到廣泛的應(yīng)用[11]。但是LR模型作為一種線性模型,其缺點(diǎn)也顯而易見(jiàn),即LR僅可對(duì)數(shù)據(jù)進(jìn)行線性擬合,并且無(wú)法體現(xiàn)特征之間的關(guān)聯(lián)。

本研究通過(guò)LR的95%置信區(qū)間比值比(Odds Ratio,OR)對(duì)其進(jìn)行解釋。比值(odds)表示某件事發(fā)生與不發(fā)生之比,計(jì)算公式如式(2)所示;OR表示某個(gè)特征xj增加一個(gè)單位前后odds的比值,如式(3)所示,其中βj為特征xj對(duì)應(yīng)的系數(shù),特征xj對(duì)應(yīng)的OR值為exp(βj)。

一般OR值為1的特征,表示該特征對(duì)結(jié)局無(wú)明顯影響;OR值>1的特征表示該特征對(duì)結(jié)局影響較大(正相關(guān));OR值<1的特征表示該特征是一個(gè)保護(hù)因素,即與結(jié)果呈負(fù)相關(guān)。另外,置信區(qū)間的上下限最好均>1或者均<1,例如:若95%置信區(qū)間為0.9~1.1,則不符合要求,即這種跨越1的區(qū)間可能會(huì)出現(xiàn)該特征同時(shí)與結(jié)局呈正相關(guān)與負(fù)相關(guān)的可能性。本研究引入假設(shè)檢驗(yàn)的方法,對(duì)OR值進(jìn)行假設(shè)檢驗(yàn),計(jì)算其P值,若P<0.05,則本研究認(rèn)為該特征的OR值具有統(tǒng)計(jì)學(xué)意義。本研究基于python語(yǔ)言(3.7.3版本)中的statsmodels模塊進(jìn)行建模。

(2)隨機(jī)森林。RF是集成學(xué)習(xí)中bagging框架的擴(kuò)展變體[12],通過(guò)生成多個(gè)決策樹(shù)并引入隨機(jī)特征選擇,從而完成分類任務(wù)。這種方法具有較強(qiáng)的解釋性,并且建立了特征之間的關(guān)聯(lián)。本研究通過(guò)RF模型的特征重要性以及風(fēng)險(xiǎn)樹(shù)的方法對(duì)其進(jìn)行解釋。每個(gè)特征的重要性通過(guò)該特征及子節(jié)點(diǎn)的基尼系數(shù)(Gini)得到,Gini值計(jì)算公式如式(4)所示,其中t為類別,pi為類別i的樣本占總樣本的比例。特征重要性計(jì)算公式如式(5)所示,N為樣本總數(shù),Nt為當(dāng)前節(jié)點(diǎn)的樣本數(shù),NtR(L)是右(左)子節(jié)點(diǎn)的樣本數(shù),Cini_R(L)為右(左)子節(jié)點(diǎn)的Cini值。本研究基于python語(yǔ)言(3.7.3版本)中的scikit-learn模塊進(jìn)行建模。

(3)梯度下降樹(shù)。在機(jī)器學(xué)習(xí)領(lǐng)域,GBDT是一種對(duì)真實(shí)分布擬合效果較好的方法[13],通過(guò)boosting的理念,用多棵分類回歸樹(shù)模型的訓(xùn)練結(jié)果乘以其所對(duì)應(yīng)的權(quán)重值集成樣本預(yù)測(cè)結(jié)果,這些樹(shù)不是獨(dú)立的,而是后面的樹(shù)在前面的基礎(chǔ)上學(xué)習(xí)誤差,即GBDT將弱分類器組合為強(qiáng)分類器,所有樹(shù)的結(jié)果加起來(lái)是預(yù)測(cè)得到的結(jié)果,通過(guò)梯度下降的方法優(yōu)化目標(biāo)函數(shù)。該算法可建立特征間的關(guān)聯(lián),并具備自身可解釋性。

本研究通過(guò)特征重要性以及風(fēng)險(xiǎn)樹(shù)的方法對(duì)此模型進(jìn)行解釋。特征j的全局重要性通過(guò)特征j在GBDT多棵樹(shù)中的重要性的均值衡量,見(jiàn)式(6),其中M為樹(shù)的數(shù)量。特征j在單棵樹(shù)中的重要性計(jì)算公式如式(7)所示,其中L為樹(shù)m的葉子節(jié)點(diǎn)數(shù)量,νt為與節(jié)點(diǎn)t相關(guān)的特征,為節(jié)點(diǎn)t分裂后平方損失值,計(jì)算公式如式(8)所示,其中friedman_mse為節(jié)點(diǎn)的分割準(zhǔn)則,其計(jì)算公式如式(9)所示,wL(R)表示左(右)子節(jié)點(diǎn)中樣本權(quán)重加和,其中表示左(右)子節(jié)點(diǎn)中樣本目標(biāo)y的加權(quán)均值。基于python 語(yǔ)言(3.7.3版本)中的scikit-learn模塊進(jìn)行建模。

1.2.3 模型評(píng)估方法

對(duì)于模型的評(píng)估方法,首先通過(guò)混淆矩陣計(jì)算出真陽(yáng)性例數(shù)(True Positive,TP)、真陰性例數(shù)(True Negative,TN)、假陽(yáng)性例數(shù)(False Positive,F(xiàn)P)與假陰性例數(shù)(False Negative,F(xiàn)N)。其次,根據(jù)上述4個(gè)指標(biāo)計(jì)算出PM的準(zhǔn)確率、精確率、召回率(Recall)、F1值(F1)以及受試者工作特征(Receiver Operating Characteristic,ROC)曲線下的面積(Area Under the Curve,AUC),并對(duì)模型的預(yù)測(cè)性能進(jìn)行評(píng)估[14]。

ROC曲線由真陽(yáng)率(True Positive Rate,TPR)和假陽(yáng)率(False Positive Rate,F(xiàn)PR)繪制而成,ROC曲線的AUC值越高表明模型分類性能越好。對(duì)于模型的校準(zhǔn)方法,本研究通過(guò)繪制校準(zhǔn)曲線,并且計(jì)算模型的Brier值來(lái)表示模型的校準(zhǔn)程度。Brier值是對(duì)風(fēng)險(xiǎn)和實(shí)際結(jié)果之間的均方差的度量,其取值范圍為0~1,Brier值越小則模型校準(zhǔn)程度越高[15-16]。

1.3 統(tǒng)計(jì)學(xué)分析

對(duì)于離散型特征,本研究使用類別n(%)表示,并通過(guò)χ2檢驗(yàn)比較組間差異性。對(duì)于連續(xù)型特征,首先判斷該組數(shù)據(jù)是否符合正態(tài)分布,若符合正態(tài)分布,則使用±s表示,若不符合正態(tài)分布,則使用上分位數(shù)、中位數(shù)和下分位數(shù)[median (Q1,Q3)]表示;對(duì)于兩組樣本均符合正態(tài)分布的特征使用t檢驗(yàn),否則使用Wilcoxon檢驗(yàn)判斷組間差異性。若上述假設(shè)檢驗(yàn)P<0.05則為有顯著性統(tǒng)計(jì)學(xué)差異。本研究統(tǒng)計(jì)學(xué)分析使用Python語(yǔ)言(3.7.3版本)中Scipy模塊實(shí)現(xiàn)。

2 結(jié)果

2.1 統(tǒng)計(jì)結(jié)果

本研究對(duì)677名患者進(jìn)行統(tǒng)計(jì)分析的結(jié)果為:LoICUS≥8 d的患者數(shù)量為392人(57.90%),患者隊(duì)列的平均年齡為56歲,男女比例為407:270,術(shù)前特征包括年齡、性別、是否高血壓等21個(gè)特征,術(shù)后特征包括手術(shù)中麻醉類型、GCS值、舒張壓、收縮壓等123個(gè)特征(其中包括部分動(dòng)態(tài)指標(biāo)的首次值、最大值或最小值)等。

根據(jù)統(tǒng)計(jì)結(jié)果,在開(kāi)顱手術(shù)前獲取的字段中,患者LoICUS較長(zhǎng)(≥8 d)具有統(tǒng)計(jì)學(xué)意義的特征為:入院年齡(P=0.037)、是否高血壓(P=0.022)、腦損傷誘因?yàn)檠茴惣膊。≒<0.001)等;開(kāi)顱手術(shù)后獲取的字段具有統(tǒng)計(jì)學(xué)意義的特征為:是否氣管切開(kāi)(P<0.001)、體溫最大值(P<0.001)、高密度脂蛋白膽固醇最小值(P<0.001)、是否鼻飼(P<0.001)等。

2.2 分類器性能評(píng)估

2.2.1 測(cè)試集結(jié)果

將兩種特征集(醫(yī)學(xué)、醫(yī)學(xué)+統(tǒng)計(jì)學(xué))分別作為三種PM的輸入,并在訓(xùn)練集上進(jìn)行訓(xùn)練,生成6種開(kāi)顱手術(shù)患者LoICUS是否過(guò)長(zhǎng)的PM。隨后在測(cè)試集上進(jìn)行模型驗(yàn)證,并通過(guò)準(zhǔn)確率、精準(zhǔn)率、Recall、F1、AUC以及Brier六種評(píng)價(jià)指標(biāo)分別對(duì)六種模型在測(cè)試集中的效果進(jìn)行評(píng)估,結(jié)果如表1所示。

表1 六種模型在測(cè)試集上的評(píng)估結(jié)果

根據(jù)三種機(jī)器學(xué)習(xí)方法建立的六種PM在測(cè)試集的表現(xiàn)為:基于醫(yī)學(xué)+統(tǒng)計(jì)學(xué)特征集的PM效果普遍優(yōu)于基于醫(yī)學(xué)特征集的PM。首先在模型準(zhǔn)確率方面,GBDT(醫(yī)學(xué)+統(tǒng)計(jì)學(xué))效果最好(準(zhǔn)確率為0.85);其次在精確率、召回率以及F1值方面,GBDT(醫(yī)學(xué)+統(tǒng)計(jì)學(xué))模型的精確率(0.90)、召回率(0.85)和F1值(0.87)均高于其他模型;RF(醫(yī)學(xué)+統(tǒng)計(jì)學(xué))、GBDT(醫(yī)學(xué))模型的AUC值均為0.90,與GBDT(醫(yī)學(xué)+統(tǒng)計(jì)學(xué))相同;從模型擬合評(píng)判指標(biāo)Brier值的角度評(píng)判,GBDT(醫(yī)學(xué)+統(tǒng)計(jì)學(xué))模型的效果最優(yōu)(0.12)。

2.2.2 測(cè)試集評(píng)估曲線

本研究測(cè)試集評(píng)估曲線包括ROC曲線、校準(zhǔn)曲線以及P-R曲線。

(1)ROC曲線。根據(jù)各模型結(jié)果在不同閾值下的TPR與FPR繪制ROC曲線,其中橫軸為FPR、縱軸為T(mén)PR,ROC曲線下的面積為AUC,作為模型評(píng)估指標(biāo)中的一種(圖1)?;冢ㄡt(yī)學(xué))特征集的三種模型ROC曲線如圖1a所示;基于(醫(yī)學(xué)+統(tǒng)計(jì)學(xué))特征集的三種模型ROC曲線如圖1b所示。

圖1 不同閾值下TPR與FPR繪制的ROC曲線

通過(guò)ROC曲線可知:LR(醫(yī)學(xué))模型AUC為0.87,RF(醫(yī)學(xué))模型AUC為0.89,GBDT(醫(yī)學(xué))模型AUC為0.90;LR(醫(yī)學(xué)+統(tǒng)計(jì)學(xué))模型AUC為0.88,RF(醫(yī)學(xué)+統(tǒng)計(jì)學(xué))模型AUC為0.90,GBDT(醫(yī)學(xué)+統(tǒng)計(jì)學(xué))模型AUC為0.90。

(2)校準(zhǔn)曲線。使用分桶法觀察分類模型的預(yù)測(cè)概率是否接近真實(shí)情況,從而繪制出不同特征篩選條件與不同場(chǎng)景下的模型校準(zhǔn)曲線,理想情況下校準(zhǔn)曲線是一條對(duì)角線。各模型的不同情況下校準(zhǔn)曲線如圖2所示。

圖2 各模型的不同情況下校準(zhǔn)曲線

通過(guò)校準(zhǔn)曲線可知:LR(醫(yī)學(xué)+統(tǒng)計(jì)學(xué))(Brier值為0.14)與GBDT(醫(yī)學(xué)+統(tǒng)計(jì)學(xué))(Brier值為0.12)模型校準(zhǔn)效果較好,其中GBDT(醫(yī)學(xué)+統(tǒng)計(jì)學(xué))模型的Brier值優(yōu)于其他模型。

(3)P-R曲線。根據(jù)各模型結(jié)果不同閾值下的精確率(Precision)與召回率(Recall)繪制P-R曲線,橫軸為Recall值、縱軸為精準(zhǔn)率值,P-R曲線下的面積也可作為評(píng)判標(biāo)準(zhǔn)。相比于ROC曲線,P-R曲線更加側(cè)重于關(guān)注樣本中的正例,在類別不平衡問(wèn)題中,ROC曲線會(huì)兼顧正負(fù)樣本,因此通常會(huì)給出較為樂(lè)觀的效果,但對(duì)于正樣本的預(yù)測(cè)情況P-R曲線更為適宜。各模型不同情景下P-R曲線如圖3所示。

圖3 各模型不同情景下的P-R曲線

通過(guò)比較P-R曲線及曲線下面積可知:RF(醫(yī)學(xué))模型以及GBDT(醫(yī)學(xué)+統(tǒng)計(jì)學(xué))模型P-R曲線下面積較大(均為 0.94)。

通過(guò)上述分析,在特征選擇層面,通過(guò)對(duì)比PM的結(jié)果,本研究認(rèn)為經(jīng)過(guò)醫(yī)生和統(tǒng)計(jì)學(xué)共同篩選特征的方法普遍優(yōu)于僅經(jīng)過(guò)醫(yī)生篩選特征的方法。對(duì)于PM評(píng)估指標(biāo),本研究首先考慮模型在測(cè)試集中的準(zhǔn)確率、AUC以及F1值(其中F1值是由精確率與召回率共同決定),對(duì)于模型的校準(zhǔn)程度,除了Brier值外,本研究還需通過(guò)校準(zhǔn)曲線來(lái)評(píng)估模型的校準(zhǔn)程度。經(jīng)過(guò)綜合考慮,在預(yù)測(cè)開(kāi)顱手術(shù)患者LoICUS是否過(guò)長(zhǎng)(≥8 d)的場(chǎng)景中,本研究認(rèn)為GBDT(醫(yī)學(xué)+統(tǒng)計(jì)學(xué))模型表現(xiàn)最好,優(yōu)于其他模型,故本研究選擇該模型進(jìn)行分析。

2.3 模型可解釋性分析

本研究選擇GBDT(醫(yī)學(xué)+統(tǒng)計(jì)學(xué))模型構(gòu)建開(kāi)顱手術(shù)患者LoICUS是否過(guò)長(zhǎng)的PM。由于GBDT的自身可解釋性,因此通過(guò)特征重要性以及風(fēng)險(xiǎn)樹(shù)對(duì)模型進(jìn)行解釋。

2.3.1 特征重要性

本研究選取了重要性最高的前20個(gè)特征(圖4)??梢园l(fā)現(xiàn)在此場(chǎng)景中,患者術(shù)后特征對(duì)結(jié)局的影響普遍高于術(shù)前特征。在這20個(gè)重要特征中,排在前三名的特征分別為是否氣管切開(kāi)(is_tracheotomy)、高密度脂蛋白膽固醇最小值(min_HDL_C)以及是否鼻飼(is_nasal_feeding),其次依次為直接膽紅素最小值(min_DBIL)、體溫最大值(max_temperature)、降鈣素原最小值(min_PCT)、滲透壓首次值(first_OSM)、天門(mén)冬氨酸氨基轉(zhuǎn)移酶最大值(max_AST)等。術(shù)前特征只有是否診斷為血管類疾?。╠iagnosis_blood_vessel),并且其特征重要性遠(yuǎn)低于上述術(shù)后特征。

圖4 GBDT(醫(yī)學(xué)+統(tǒng)計(jì)學(xué))模型特征重要性

2.3.2 風(fēng)險(xiǎn)樹(shù)

本研究通過(guò)風(fēng)險(xiǎn)樹(shù)的形式對(duì)開(kāi)顱手術(shù)患者LoICUS是否過(guò)長(zhǎng)的GBDT PM決策過(guò)程進(jìn)行解釋。如圖5所示,對(duì)于訓(xùn)練集數(shù)據(jù)中的473名開(kāi)顱手術(shù)患者:模型首先通過(guò)特征“是否鼻飼”將患者進(jìn)行劃分;其次,對(duì)鼻飼的患者(217人)的決策規(guī)則為高密度脂蛋白膽固醇最小值是否≤0.875 mmol/L,對(duì)于無(wú)須鼻飼的患者(256人)的決策規(guī)則為是否氣管切開(kāi);其次,對(duì)于高密度脂蛋白膽固醇最小值≤0.875 mmol/L的患者(193人)的決策規(guī)則為天門(mén)冬氨酸氨基轉(zhuǎn)移酶最大值是否≤43.8 U/L,對(duì)于無(wú)須氣管切開(kāi)的患者(218人)的決策規(guī)則為滲透壓首次值是否≤281.213 mOSM/L。根據(jù)上述決策規(guī)則,如圖中圓形部分所示,可得到6組患者人群(組1~6),并根據(jù)風(fēng)險(xiǎn)比例將其分為開(kāi)顱手術(shù)患者LoICUS較長(zhǎng)的高風(fēng)險(xiǎn)組(組2與組4)、中風(fēng)險(xiǎn)組(組1與組6)與低風(fēng)險(xiǎn)組(組3與組5)。組2(需要鼻飼且min_HDL_C≤0.875 mmol/L且max_AST>43.8 U/L)中患者的風(fēng)險(xiǎn)為94.35%(167/177),組4(無(wú)須鼻飼但需要?dú)夤芮虚_(kāi))患者的風(fēng)險(xiǎn)為76.32%(29/38),組1(需要鼻飼且min_HDL_C≤0.875 mmol/L且max_AST≤43.8 U/L)患者的風(fēng)險(xiǎn)為56.25%(9/16),組6(無(wú)須鼻飼且無(wú)須氣管切開(kāi)且first_OSM>281.213 mOSM/L)患者的風(fēng)險(xiǎn)為51.11%(23/45),組3(需要鼻飼且min_HDL_C>0.875 mmol/L)患者的風(fēng)險(xiǎn)為33.33%(8/24),組5(無(wú)須鼻飼且無(wú)須氣管切開(kāi)且first_OSM≤281.213 mOSM/L)患者的風(fēng)險(xiǎn)為18.50%(32/173)。

圖5 開(kāi)顱手術(shù)患者LoICUS超過(guò)8 d風(fēng)險(xiǎn)樹(shù)

3 討論

本研究認(rèn)為基于機(jī)器學(xué)習(xí)算法的PM可用于預(yù)測(cè)開(kāi)顱手術(shù)患者LoICUS是否過(guò)長(zhǎng)(>8 d),并且模型在測(cè)試集具有較好的表現(xiàn)(準(zhǔn)確率為0.85,AUC為0.90),可為福建省立醫(yī)院院外科ICU醫(yī)生提供一定的輔助決策建議。同領(lǐng)域研究還包括:Gentimis等[6]基于神經(jīng)網(wǎng)絡(luò)對(duì)LoICUS是否大于5 d的預(yù)測(cè)研究中,模型準(zhǔn)確率約為0.80;Harutyunyan等[7]基于深度學(xué)習(xí)的方法建立了LoICUS是否>7 d的PM,并認(rèn)為這種方法優(yōu)于線性回歸模型,AUC值為0.84;2021年,Alghatani等[8]建立了 LoICUS是否超過(guò)2.64 d的PM,他們使用了與本研究類似的模型,并認(rèn)為RF效果較好(準(zhǔn)確率為0.65)。本研究的PM在其他數(shù)據(jù)集中的表現(xiàn)尚未討論,因此該模型在不同場(chǎng)景的有效性還需后續(xù)研究進(jìn)一步驗(yàn)證。

通過(guò)對(duì)PM的解釋,本研究從特征層面進(jìn)行分析并構(gòu)建風(fēng)險(xiǎn)樹(shù):對(duì)于術(shù)前特征,研究認(rèn)為患者在術(shù)前診斷為血管類疾病會(huì)導(dǎo)致LoICUS較長(zhǎng);對(duì)于術(shù)后特征,研究發(fā)現(xiàn)影響開(kāi)顱手術(shù)患者LoICUS較長(zhǎng)的主要風(fēng)險(xiǎn)因素為氣管切開(kāi)、鼻飼以及ICU內(nèi)檢測(cè)到的高密度脂蛋白膽固醇最小值,其次為體溫最大值、降鈣素原最小值、天門(mén)冬氨酸氨基轉(zhuǎn)移酶最大值以及直接膽紅素最小值等。Scales等[17]發(fā)現(xiàn),在ICU中氣管切開(kāi)往往用于延長(zhǎng)機(jī)械通氣時(shí)間,而機(jī)械通氣患者一般在9~12 d接受氣管切開(kāi),因此氣管切開(kāi)勢(shì)必會(huì)延長(zhǎng)LoICUS。有學(xué)者使用隨機(jī)對(duì)照試驗(yàn)研究間接性鼻飼對(duì)ICU內(nèi)患者的影響,并發(fā)現(xiàn)此類患者LoICUS超過(guò)21 d[18],因此需要進(jìn)行鼻飼的患者LoICUS較長(zhǎng)。有研究發(fā)現(xiàn)對(duì)于嚴(yán)重?cái)⊙Y患者,在ICU內(nèi)高密度脂蛋白膽固醇過(guò)低與死亡率和不良的臨床結(jié)果顯著相關(guān)[19],但是低水平的高密度脂蛋白膽固醇對(duì)于開(kāi)顱手術(shù)患者ICU內(nèi)的術(shù)后情況尚不清楚。Diringer等[20]發(fā)現(xiàn),在神經(jīng)科ICU中體溫最大值是導(dǎo)致患者住院時(shí)間延長(zhǎng)的風(fēng)險(xiǎn)因素。通常情況下,開(kāi)顱手術(shù)后患者降鈣素原會(huì)升高[21],而低水平的降鈣素原是排除合并感染的預(yù)測(cè)指標(biāo)[22],而對(duì)于開(kāi)顱患者的降鈣素原最小值對(duì)LoICUS的影響沒(méi)有明確的研究,有研究發(fā)現(xiàn)有40%的患者在開(kāi)顱手術(shù)后伴有至少一種感染[23],因此降鈣素原最小值的出現(xiàn)可解釋為患者感染消除,感染的消除時(shí)間較長(zhǎng)可能導(dǎo)致LoICUS延長(zhǎng)。有探究根據(jù)統(tǒng)計(jì)學(xué)分析認(rèn)為天門(mén)冬氨酸氨基轉(zhuǎn)移酶是影響LoICUS的因素[24],本研究認(rèn)為ICU內(nèi)監(jiān)測(cè)到的天門(mén)冬氨酸氨基轉(zhuǎn)移酶最大值對(duì)開(kāi)顱手術(shù)患者LoICUS超過(guò)8 d具有一定影響。有研究將直接膽紅素用于ICU內(nèi)死亡率的預(yù)測(cè)中,但是效果并不理想(AUC為0.62)[25],目前對(duì)于ICU內(nèi)監(jiān)測(cè)到的直接膽紅素最小值對(duì)于開(kāi)顱手術(shù)患者住院時(shí)間較長(zhǎng)的影響的研究較少,因此還需后續(xù)研究進(jìn)一步驗(yàn)證。

4 結(jié)論

本研究基于可解釋性機(jī)器學(xué)習(xí)算法建立了開(kāi)顱手術(shù)患者LoICUS是否超過(guò)8 d的PM,并取得了較好的預(yù)測(cè)效果(模型準(zhǔn)確率達(dá)到0.85,AUC達(dá)到0.90)。通過(guò)對(duì)PM的分析與解釋,挖掘并發(fā)現(xiàn)了影響LoICUS的風(fēng)險(xiǎn)因素并構(gòu)建風(fēng)險(xiǎn)樹(shù),可為臨床醫(yī)生提供輔助性決策或干預(yù)建議,有利于縮短患者LoICUS,減少患者醫(yī)療費(fèi)用支出,減輕醫(yī)療負(fù)擔(dān)。

猜你喜歡
特征手術(shù)模型
一半模型
重要模型『一線三等角』
手術(shù)之后
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
如何表達(dá)“特征”
不忠誠(chéng)的四個(gè)特征
抓住特征巧觀察
3D打印中的模型分割與打包
顱腦損傷手術(shù)治療圍手術(shù)處理
中西醫(yī)干預(yù)治療腹膜透析置管手術(shù)圍手術(shù)期106例
主站蜘蛛池模板: 少妇极品熟妇人妻专区视频| 手机成人午夜在线视频| 欧美色99| 久久亚洲综合伊人| 自拍偷拍欧美| 日韩无码视频播放| 中文字幕伦视频| 国产一级毛片网站| 国产成人精品综合| 亚洲一级色| 丁香婷婷综合激情| 伊人久久久久久久| 免费看av在线网站网址| 天堂成人在线| 国内熟女少妇一线天| 黑人巨大精品欧美一区二区区| 日本一本在线视频| 久久久精品久久久久三级| 欧美成人免费一区在线播放| 久久大香伊蕉在人线观看热2| av大片在线无码免费| 中文字幕永久视频| av一区二区三区高清久久| 国产高清精品在线91| 欧美成人一级| 女人天堂av免费| 国产精品深爱在线| 精品福利网| 熟女视频91| 国内精品久久九九国产精品| 一级不卡毛片| 国产一线在线| 国产精品久久自在自线观看| 2019国产在线| 热这里只有精品国产热门精品| 色综合热无码热国产| 欧美成人h精品网站| 亚洲欧美日韩成人在线| 国产亚洲欧美在线专区| 亚洲性影院| 日韩少妇激情一区二区| 精品国产免费人成在线观看| 青草精品视频| 色综合婷婷| 国产黑人在线| 97se亚洲| 日日噜噜夜夜狠狠视频| 国产在线观看第二页| 亚洲国产欧洲精品路线久久| аⅴ资源中文在线天堂| 中文毛片无遮挡播放免费| 91 九色视频丝袜| 国产一级α片| 国产在线自在拍91精品黑人| 老司机精品久久| 日本91视频| 国内a级毛片| 国产95在线 | 2022国产91精品久久久久久| 日韩国产高清无码| 久久综合干| 国产日韩欧美中文| 亚洲无码在线午夜电影| 在线视频亚洲欧美| 国产精品一区二区不卡的视频| 成人一级免费视频| 成人午夜亚洲影视在线观看| 亚洲精品第1页| 美美女高清毛片视频免费观看| 成人午夜网址| 成人在线观看一区| 91热爆在线| 在线国产你懂的| 国产91色| 永久天堂网Av| 欧美在线综合视频| 欧美日韩国产一级| 久久久久免费精品国产| 97免费在线观看视频| 国产综合在线观看视频| 拍国产真实乱人偷精品| 乱人伦99久久|