999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

ICU住院患者重度急性呼吸窘迫綜合征早期預測模型的構建

2023-01-02 05:00:28武俊偉杜甲珺
解放軍醫學院學報 2022年11期
關鍵詞:模型研究

武俊偉,劉 超,王 雪,杜甲珺,李 姣,謝 菲

1 中國醫學科學院/北京協和醫學院 醫學信息研究所,北京 100020;2 解放軍總醫院研究生院圖書館,北京 100853;3 醫渡云(北京)技術有限公司,北京 100083;4 首都醫科大學宣武醫院 圖書館,北京 100053;5 解放軍總醫院第八醫學中心 呼吸與危重癥醫學部,北京 100853

急性呼吸窘迫綜合征(acute respiratory distress syndrome,ARDS)是一種以急性雙肺異常為特征的具有獨特類型的低氧血癥性呼吸衰竭。ARDS的ICU死亡率和住院死亡率分別為35.3%和40%,且死亡率會隨病情嚴重程度而增加。有研究表明,輕、中、重度ARDS死亡率分別達到34.9%、40.3%、46.1%[1]。因此提前預測重度ARDS的發生變得尤為重要。現有研究報道呼吸頻率(respiratory rate,RR)和外周血氧飽和度(SpO2)是預測和識別ARDS的兩個重要參數,并通過以下指標進行進一步評估:RR≥30次/min;SpO2≤92%;氧合指數(實際采用動脈血氧分壓與吸入氧濃度分數的比值PaO2/FiO2,下文均用P/F表示)P/F≤300 mmHg (1 mmHg=0.133 kPa)[2]。但SpO2和氧合指數都需要相應的醫療儀器及有創的檢查來實現,這對于資源緊缺的醫療機構來說是一項難以解決的問題。以往研究報道了不同ARDS預測模型,如Le等[3]選取22種特征,提前12 h、24 h、48 h預測ARDS的發生,其中提前12 h預測ARDS發生的AUC最高(AUC=0.827)。Singhal等[4]選擇148個統計特征對COVID-19患者提前6 ~ 36 h進行ARDS發生的預測,最佳預測時間為ARDS發生前12 h,其AUC為0.89。上述不同的預測模型存在樣本量小、模型復雜、特征選取較多等問題。因此,有必要選取無創、快速的體征指標對重度ARDS的發生進行提前預測。我們重點關注的是重度ARDS預測模型的方法學,以期找到一種簡單、高效、便捷、準確的預測方法。本次研究采用eICU協作研究數據庫(eICU Collaborative Research Database)通過RR、心率(heart rate,HR)、體溫三項生命體征及其相關統計指標,提前6 h預測患者是否會進展為重度ARDS。

資料與方法

1 數據來源 eICU協作研究數據庫是一個由MIT計算生理學實驗室與飛利浦eICU研究所合作創建的大型多中心公開數據庫,該數據庫包含2014 - 2015年美國各地重癥監護病房超過20萬例患者的ICU數據,且數據內容是經過去隱私化處理,包括生命體征監測、護理計劃文檔、疾病嚴重程度監測、診治信息等[5]。選取eICU數據庫中診斷結果為ARDS的1 714例患者的臨床資料。研究的納入標準:1)年齡≥18歲;2)入院期間有至少一次PaO2檢測記錄用于氧合指數P/F的計算(圖1);3)被診斷為“pulmonary| respiratory failure|ARDS”的患者,ICD編碼為518.81, J80。排除標準:1)住院記錄中沒有測量PaO2;2)氧合指數觀測時間段內體溫、HR、RR存在缺失值。

圖1 一個觀測時間段(時間窗口)的詳細信息eICU中ARDS患者的體溫信息缺失較多,因此一個時間段內如果沒有同時包含HR、RR、體溫三種體征信息,則不會納入該時間窗口。體征信息較為完整的患者會有多個符合上述條件的觀測點及時間窗口Fig.1 Details of an observation period (a time window)There is a mass of missing temperature data for ARDS patients in the eICU, so if a time period that does not contain HR, RR, and Temp, it will not be included in the time window. Patients with complete vital sign will have multiple observation points and time windows that meet the above criteria

獨立驗證集來源 另外選取2014年解放軍總醫院醫院呼吸重癥監護室收治的15例因吸入性肺損傷所致的ARDS患者,均為男性,平均年齡20.7(18 ~ 24)歲,平均住院時間16.6 d。經上述相同的納入排除標準,最終納入重度ARDS觀測點21個,輕中度ARDS觀測點62個。

2 ARDS嚴重程度界定 根據ARDS的柏林定義[6],輕度ARDS:呼吸機設置為呼氣末正壓(positive end expiratory pressure,PEEP)或持續氣道正壓(continuous positive airway pressure,CPAP)≥5 cmH2O (1 cmH2O=0.098 kPa)時,200 mmHg<P/F≤300 mmHg;中度ARDS:呼吸機設置為PEEP≥5 cmH2O時,100 mmHg<P/F≤200 mmHg;重度ARDS:呼吸機設置為PEEP≥5 cmH2O時,P/F≤100 mmHg。

3 預測變量選擇及處理 心率、呼吸和體溫是機體在應急狀態下最早出現變化的生命體征,國際上已有臨床評分指標采用了體征及臨床檢驗數據對急診患者的病情進行評估預測,如改良早期預警評分(MEWS)[7]及全身炎癥反應綜合征評分等[8]。本次研究將探討僅采用HR、RR、體溫三種體征信息來預測重度ARDS發生的可行性。

eICU的lab表中包含患者在ICU期間全部的實驗室檢查的結果,其中PaO2和FiO2在同一時刻分別記錄了二者實際的數值,可以計算出不同時刻的氧合指數P/F的值,判斷ARDS嚴重程度。模型以ARDS觀測點為原點,分析倒推6 ~96 h時間段內的HR、RR、體溫體征信息及其在該時間段內的波動值(極值、極差和平均值)患者是否會進展為重度ARDS(P/F≤100 mmHg)。本研究亦對6 ~ 48 h及6 ~ 24 h兩個不同觀測時間段的數據進行分析處理,用于比較不同時間窗口對模型預測能力的影響。

4 算法選擇 研究選擇三種不同的算法建立預測模型。1)邏輯回歸(logistic regression,LR)是從線性回歸模型推廣的一種廣義的分析模型,具有模型簡單、訓練快速等特點。2)隨機森林(random forest,RF)是利用bootsrap重抽樣方法從原始樣本中有放回的選擇多個樣本,對于每個Bootsrap都構建一個決策樹模型,多棵決策樹通過投票的方式最終給出預測結果,大量的研究證實RF具有很高的預測準確性且不容易出現過擬合[9],且決策樹的繪制與臨床路徑的制定原理相似,具有一定的模型可解釋性。3)LightGBM是Mircosoft開發的基于決策樹的一種梯度提升框架,具有快速、分布式及高性能等特點。可用于排序、分類、回歸及相關機器學習領域。它采用新的一直分裂葉子節點的策略(按最大增益的節點或葉子明智,Leaf-wise)進行展開[10]。

5 數據處理 使用PostgreSQL數據庫篩選并提取符合納入標準的數據信息,應用Python 3.7進行進一步的數據清洗,去除患者體溫<30℃、HR、RR為0的測量值,然后對數據進行統計分析并采用Python建立預測模型。

6 模型評價指標 應用Python的sklearn庫對三種不同算法的預測模型及三個不同時間窗口的受試者工作特征曲線下面積(area under the receiver operation characteristic curve,AUC)進行評價,AUC用于衡量機器學習的泛化能力(性能),值越大表示模型的性能越好,預測能力越強。采用oob error(袋外錯誤率,out-of-bag error)來評價隨機森林的預測性能誤差,oob score(1-oob error)越高則模型預測性能越好。應用sklearn.calibration庫中的校準曲線(calibration curve)比較分類器概率預測的校準效果,最理想情況下,校準曲線是一條對角線(以虛線表示),模型越貼近校準曲線,說明預測概率越接近于真實概率。

結 果

1 納入人群的人口學特征 eICU隊列 eICU中共有200 859例住院患者,最終納入232例患者的3 140個氧合指數觀測點,全部氧合指數觀測點包括1 042次P/F≤100 mmHg(重度ARDS),2 098次P/F>100 mmHg(輕中度ARDS)。232例ARDS患者,男性115例,女性117例。年齡19 ~ 88(56.1 ± 16.1)歲。身高(168.0 ± 14.2) cm;體質量(90.0 ± 31.4) kg。死亡101例(43.5%)。人種分布:非裔美籍25例,亞裔8例,白種人165例,西班牙裔15例,印第安人3例,其他或未知16例。平均住院時間13.4 d。見表1。此隊列數據按照3:1的比例分為測試集和驗證集。

表1 eICU中232例ARDS患者人口學特征Tab. 1 Demographic characteristics of 232 patients with ARDS in the eICU

2 不同模型預測性能比較 模型以ARDS患者6 ~ 96 h、6 ~ 48 h、6 ~ 24 h三個時間段內的HR、RR、體溫體征信息及其在該時間段內的波動值(極值、極差和平均值)為變量,預測6 h后患者是否會進展為重度ARDS (P/F≤100 mmHg)。隨機森林模型6 ~ 96 h時間窗口的預測準確率為0.833,AUC為0.885,oob評分0.809(oob error為0.191)。LightGBM 6 ~ 96 h時間窗口的準確率為0.805,AUC為0.868。邏輯回歸6 ~ 96 h時間窗口準確率為0.702,AUC為0.634。6 ~ 48 h、6 ~ 24 h時間窗口的詳細指標見表2、圖2。校準曲線顯示,96 h時間窗口中,隨機森林和LightGBM的預測能力要遠優于邏輯回歸的預測能力(圖3)。

圖3 不同算法的校準曲線Fig.3 Calibration curves for different algorithms

3 模型預測性能的外部驗證 為了進一步比較模型在獨立數據集中的表現,我們提取了來自解放軍總醫院醫院(圖2中以PLAGH表示)15例吸入性肺損傷所致的ARDS患者,其中重度ARDS觀測點21個,輕中度ARDS觀測點62個,隨機森林解放軍總醫院醫院96 h時間窗口的準確率為0.834,AUC為0.843(各模型的ROC曲線及AUC值見表2、圖2)。predicted incorrectly, so true positive/TP=0, thenSand Sp=0.

圖2 不同模型及時間窗口的ROC曲線Fig.2 ROC curves for different models and time windows

表2 不同模型各個時間窗口的預測性能指標Tab. 2 Prediction performance metrics of different models for each time window

討 論

隨著ARDS嚴重程度的增加,相應的臨床干預措施也隨之增強。以往的研究多為ARDS的風險預測[11]、預后評估[12]、死亡率預測[13]等,應用機器學習對ARDS的發生進行早期預警的模型報道較少,采用體征指標建立早期預警模型尤甚。Taoum等[14]通過MIMIC-Ⅱ中40例ARDS患者持續的HR、RR、SpO2、平均動脈血壓(ABPMean)四種動態生理信號監測來建立模型,預測1 ~180 h后ARDS的發生,測試集中的敏感度和特異性分別為62.89%和72.67%。劉京銘等[15]通過MIMIC-Ⅲ中四種連續的基本生理特征SpO2、RR、HR、MAP的時序數據,采用11個包括SpO2的平均值、標準差、傾斜度和樣本熵,RR的平均值和標準差,HR的平均值和標準差,MAP的平均值、傾斜度和峰度在內的特征,提前預測ARDS的發生,最佳AUC為0.94。上述兩種模型存在著僅使用單中心數據進行預測及驗證、模型性能差異較大,預測變量處理十分復雜、對幾種生理指標的時序性信息關注度較高等問題。本研究采用多中心的eICU數據集,使用更為簡單的心率、呼吸頻率及體溫三種體征信息,應用解釋性強、快速高效的隨機森林算法建立預測模型,旨在對模型預測的方法學進行簡化和改進,對重度ARDS的發生予以簡單高效、快速無創的早期預測。

本次研究選取三種基礎的體征信息來自232例患者的88萬余次臨床監測數值,大量的數據保證了建模后模型的可靠性,同時在進行模型預測時,通過同步計算三種體征數據的最大值、最小值、極差值和平均值,可反映出患者在該時間段內體征數據波動情況。此種方式的優勢是不需要對連續大量的體征信息進行存儲,對于上述的預測變量進行實時更新替換即可,極大地減少了ARDS患者基數大、采集體征數據信息密集造成存儲壓力、訪問獲取壓力和分析處理的計算壓力等問題。本研究的模型應用到臨床后,可以更早對潛在的重癥ARDS患者進行干預。納入本次研究的患者年齡分布廣泛,為19 ~ 88(56.1 ± 16.1)歲,身高、體質量等均沒有特異性,在構建模型時,排除了入住ICU類型等患者相關的全部靜態信息,增加了模型應用的普適性。為進一步驗證模型在獨立驗證集中的表現,研究還選取15例來自真實世界的ARDS患者進行獨立驗證。獨立驗證集的患者體征數據采集間隔遠高于eICU(1 h/次vs5 min/次),造成獨立驗證集的準確性降低,但AUC的值沒有過多下降(AUC=0.834),說明模型在體征數據測量間隔1 h以上依舊表現良好。

研究的不足之處在于沒有應用真實世界中COVID-19所致的ARDS患者的體征數據進行驗證,在接下來的研究中,我們將對美國國家衛生研究所組建的國家COVID協作研究組織(N3C)提供的超過300萬COVID-19陽性患者的臨床數據進行驗證[16]。本研究雖然是側重于預測模型的方法學的可行性研究,但并未對模型的參數進行優化以提高模型的性能。因此我們還將在算法參數優化、模型的可解釋性上做進一步的研究,并嘗試探討體征數據的不同測量間隔對預測準確性的影響。

猜你喜歡
模型研究
一半模型
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
新版C-NCAP側面碰撞假人損傷研究
3D打印中的模型分割與打包
主站蜘蛛池模板: 亚洲一区精品视频在线| 色综合国产| 国产一二三区视频| 极品国产在线| 制服丝袜亚洲| 韩日免费小视频| 久久综合亚洲色一区二区三区| 亚洲最大情网站在线观看| 日韩精品一区二区三区视频免费看| 久久这里只精品国产99热8| 亚亚洲乱码一二三四区| 97视频精品全国在线观看| 久久无码高潮喷水| 国产免费怡红院视频| 国产高潮流白浆视频| 久久综合九色综合97网| 天天干天天色综合网| 精品91视频| 亚洲天堂精品视频| 欧美成人午夜视频免看| 免费高清毛片| 亚洲二三区| 日韩乱码免费一区二区三区| 乱人伦中文视频在线观看免费| 国产精品99在线观看| 亚洲国产清纯| 国产凹凸视频在线观看| 99尹人香蕉国产免费天天拍| 免费观看亚洲人成网站| 日本手机在线视频| 亚洲—日韩aV在线| www.亚洲一区| 五月婷婷综合网| 狠狠色丁香婷婷| 久久青草免费91线频观看不卡| 夜色爽爽影院18禁妓女影院| 在线免费无码视频| 国产无码制服丝袜| 亚洲国语自产一区第二页| 亚洲成人精品久久| 亚洲码在线中文在线观看| 青青草欧美| 精品国产污污免费网站| 欧美在线网| 伊人久久大线影院首页| 久久久久久久久18禁秘| 亚洲无码熟妇人妻AV在线| 在线色国产| 国产麻豆福利av在线播放| 精品亚洲国产成人AV| 58av国产精品| 国产日本欧美亚洲精品视| 91福利在线观看视频| 国产乱视频网站| 91美女视频在线| 91精品网站| 91免费国产高清观看| 无码AV日韩一二三区| 国产成人无码久久久久毛片| 狠狠干欧美| 国产黄视频网站| 97色伦色在线综合视频| 日韩成人午夜| 日本不卡在线视频| 日本少妇又色又爽又高潮| 青青操视频在线| 亚洲精品日产精品乱码不卡| 岛国精品一区免费视频在线观看| 精品人妻系列无码专区久久| 亚欧成人无码AV在线播放| 2020国产免费久久精品99| 黑人巨大精品欧美一区二区区| 日韩在线中文| 国产精品流白浆在线观看| 亚洲福利网址| 国产欧美精品专区一区二区| 美女毛片在线| 亚洲一道AV无码午夜福利| 日韩性网站| 一级毛片免费不卡在线视频| 1级黄色毛片| 日韩性网站|