999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于MW-REF算法的心肺復蘇影響因素分析

2023-08-23 07:17:32張友坤陳偉靳小靜孫潔李瑞月張瑛琪
科學技術與工程 2023年22期
關鍵詞:重要性特征模型

張友坤, 陳偉, 靳小靜, 孫潔, 李瑞月, 張瑛琪*

(1. 華北理工大學電氣工程學院, 唐山 063210; 2. 中國移動通信集團河北有限公司系統集成中心, 石家莊 050000; 3. 河北醫科大學第一醫院急診科/河北省急診急救技術創新中心, 石家莊 050031)

隨著大數據、人工智能、區塊鏈、物聯網技術的飛速發展,醫療數據的獲取、儲存、查詢、分析方法已經實現了網絡化,智能化。這推動了人工智能技術在醫療領域迅速落地。急診醫學領域目前面臨著醫務人員診療水平差別、患者診治時間、醫療資源相對短缺等問題[1]。機器學習技術作為人工智能的核心技術在急診醫療中已運用于診療決策輔助、醫療資源快速分揀、疾病預測、病例記錄檢測、藥物檢測等方面,在急診醫學領域具有廣闊的運用前景[2-3]。近年來機器學習模型可解釋性得到了越來越多的關注,使機器學習的特征與機器學習預測結果之間的關系變得更為清晰,使醫生可以參考各個特征對模型預測結果的影響,這為機器學習在醫療中的應用,對臨床輔助診斷提供了依據。

在心肺復蘇領域對機器學習的運用近年來開始有所涉及, Harford等[4]運用機器學習在心肺復蘇數據集上依據27個特征預測了心肺復蘇后神經系統的預后情況并通過敏感性分析探討了旁觀者心肺復蘇(cardio pulmonary resuscitation, CPR)、靶向溫度管理和冠狀動脈造影對患者的預后(神經預后良好與否)的影響。Nooraldeen等[5]使用隨機森林模型在收集的心肺復蘇相關數據直接訓練。對患者院前的生存率進行預測并根據隨機森林的特征重要性評分分析影響患者院前生存率影響因素的相對重要性。證實了初始節律是最重要的預后因素,其次是年齡、心肺復蘇開始時間、院外高級心肺復蘇情況(emergency medical services, EMS)反應時間和位置。一些傳統上被視為重要的因素,例如性別,并不重要。韓劍等[6]運用統計學的方法及Logistic模型對院前心臟驟停患者心肺復蘇成功率的影響因素進行了分析。現階段中外的研究主要集中于利用傳統的機器學習模型分析心肺復蘇后與存活率相關的特征及其重要性,并未使用有效的特征提取方法進行特征過濾,且并未探討預測結果下各個特征的具體表現對臨床診療輔助的意義。

針對上述問題,現基于河北省急診急救技術創新中心的急診數智化平臺收集的1 201份心肺復蘇數據,建立于多模型加權遞歸消除法(MW-REF)的心肺復蘇結果預測模型,通過與傳統的遞歸消除算法對比對模型預測結果進行評價,并依據SHAP評分,分析預測結果對心肺復蘇輔助診療的意義。

1 心肺復蘇數據處理

1.1 數據收集與整理

心肺復蘇相關數據來源于河北醫科大學第一醫院急診科、河北省急診急救技術創新中心的急診數智化平臺的院內心臟驟停和心肺復蘇注冊登記網。數據的收集參考了Utstein Resuscitation Registry Template[7]的心肺復蘇結果報告模板,創建了基于Utstein模式的院內心臟驟停和心肺復蘇注冊研究登記表。該登記表由中國研究型醫院學會心肺復蘇學專業委員會和河北省急救醫學會心肺復蘇專業委員會專家論證聯合制定。在2018年9月至2022年4月收集了來自河北省7家醫院急診科心臟驟停和心肺復蘇數據。數據主要包含醫院等級和年急診量、患者一般情況、發生心臟驟停和心肺復蘇時情況、院內自主循環恢復(return of spontaneous circulation,ROSC)、ROSC到住院、住院到出院、出院后隨訪等部分內容。在此基礎上在相關領域專家的指導下對數據進行了整理,最終整理后的數據包含心臟驟停原因推斷、心搏驟停至CPR開始總時間、腎上腺素總劑、意識、CPR開始至停止總時間等30個特征以及死亡與復蘇成功兩個標簽。

1.2 數據預處理

整理完畢的數據含有1 201個樣本與29個特征。

對特征的統計指標進行探索。由于患者個體的特殊性,頭部磁共振成像(magnetic resonance imaging, MRI)、頭部CT、碳酸氫鹽總量、碳酸氫鹽首次使用時間在數據集中屬于小樣本特征,故其缺失值大于50%,所以對這5個特征刪除。

對于時間類型數據CPR開始時間(CPR start time,TCPR)與腎上腺素開始使用時間(first use time of adrenaline,TFa)求差值,使用新特征腎上腺素首次使用時間(time to use adrenaline,Ta)進行代替,并對其缺失值進行刪除。

Ta=TCPR-TFa

(1)

分別對年齡、腎上腺素總劑量的缺失值使用中位數、眾數填補。對其他缺失值較少(<0.02)的樣本進行刪除。

檢驗可以檢驗出一組數據中與均值偏差超過3倍標準差的數據,剔除異常值。對數據集進行檢驗后的結果表明數據中無異常值。

對于標簽使用LabelEncoder將死亡與復蘇成功分別轉換為1與0。對于分類型特征使用OrdinalEncoder將其轉換為對應其特征類別數目的數值形式

2 模型搭建與評估

2.1 MW-REF算法

隨機森林分類器、梯度提升決策樹(gradient boosting decision tree,GBDT)、極端梯度提升樹(eXtreme gradient boosting, Xgboost)是機器學習時下非常流行的集成算法,通過在數據上構建多個模型,再綜合各個模型的預測結果,獲得比單個模型更優異的性能[8-10]。樹模型的可解釋性較強可以通過對各個特征在模型預測結果的重要性評估得出特征重要性得分進行特征分析。本次研究使用包含200棵樹的隨機森林分類器、GBDT分類器與Xgboost分類器。

常用的特征提取方法包括統計學的過濾方法如卡方過濾、互信息法過濾等[11-12]。這些方法都側重于對各個特征對模型的線性或者非線性相關性進行描述,排除相關性低的特征。在實際運用中存在某些變量在統計學分析中相關性不高但是模型認為重要的情況。

各種降維算法也被采用作為特征提取的一種方式但降維后的特征已經經過特征變換,提取出的特征不能直接觀察出與原始數據的關系,在醫療數據中不具有可解釋性。

遞歸特征消除法(recursive eliminat feature, REF)是特征重要性過濾法衍生而來的。通過該模型下特征重要性得分的排序情況每次消除一個或多個特征并重新訓練模型,多次迭代來選取評價指標下的最優特征集[13]。但單一模型的預測結果往往側重于某幾個特征進行預測,各個學習器之間對特征側重點不同,隨著學習器的改變,選取出的最優特征也會隨之發生改變。

本文中設計的MW-REF算法在傳統的REF算法上對3種基模型的特征重要性得分進行加權,并采用融合模型的交叉驗證準確率篩選最優特征。其目的在于融合多個模型的重要性得分從而消除各個特征獨立進行特征遞歸消除時對某幾個特征的‘偏向性’其算法具體實現步驟為:①使用3種模型在數據集下進行訓練;②使用Voting融合3種模型并計算其5折交叉驗證下的平均準確率;③對3種模型訓練結果的特征重要性得分進行加和;④濾除得分最低的特征;⑤判斷是否達到閾值;⑥更新數據集回到步驟①直到達到閾值,特征數目等于5時停止訓練;⑦選取交叉驗證準確率最高特征下的模型。

其具體實現流程如圖1所示。

圖1 算法流程圖Fig.1 Algorithm flow chart

2.2 模型評估

模型結果評估指標根據混淆矩陣(混淆矩陣可以反映出模型結果中真實值與預測值的分布情況)計算出模型的評價指標。

準確率(Accuracy)是樣本中,所有標簽預測結果中分類正確的樣本所占比例,用于衡量模型對心肺復蘇結果預測的準確率。

(2)

精確度(Precision)是模型預測的結果中有多少是預測正確的。在少數樣本上的精確率可以衡量將死亡預測為復蘇成功的代價。在實際中將死亡預測為復蘇可能會致使醫生判斷失誤影響診療效果。

(3)

在一些情況下,希望不計一切代價找出少數類,即希望更多樣本被預測為復蘇成功就可以追求較高的召回率。

(4)

F1-score是精確率和召回率的調和平均數用于綜合評估模型的性能。

(5)

AUC面積是ROC曲線(受試者工作特征曲線)下的面積之和,其越接近1,表明預測方法的正確性越高,本文研究采用5折交叉驗證下的平均AUC面積作為模型的評價指標。

SHAP是基于Python的一個機器學習模型可解釋包,對于每個預測樣本,每個特征都會被分配一個SHAP值用于衡量各個特征對預測結果的影響力,并能夠表現其正負性[14]。

3 實驗結果

3.1 預測結果對比

MW-REF算法特征提取結果通過與RC-REF、XGBOOST-REF、GBDT-REF特征提取的結果對比來驗證其在心肺復蘇數據集下性能的優勢。MW-REF設置每次過濾得分最低的特征。各算法閾值都設置為5個特征。各算法在評價指標下的得分如表1所示。

表1 算法對比Table 1 Algorithm contrast

可以看出MW-REF算法在準確率、精確率、召回率與F1-score上都有提升。其能夠在心肺復蘇數據集上發揮更好的性能,提升心肺復蘇預測的準確率。

3.2 特征提取結果對比

進一步對比MW-REF算法提取出的特征重要性得分與RC-REF、XGBOOST-REF、GBDT-REF提取出的特征重要性得分如圖2所示。

圖2 特征重要性對比Fig.2 Feature importance comparison

可以看出,MW-REF算法提取出的重要特征有8個包括:年齡、疾病細分、心臟驟停發生地點、心臟驟停至CPR開始總時間、CPR總時間、除顫、腎上腺素總劑量、腎上腺素首次使用時間。

在RC-REF算法下沒有特征被過濾掉,且心臟驟停至CPR開始總時間、心臟驟停發生地點、除顫重要程度不高。RC-REF高度依賴年齡、CPR總時間、腎上腺素總劑量、腎上腺素首次使用時間4個特征對結果進行預測。

在GBDT-REF算法下只留下了年齡、疾病細分、CPR總時間、腎上腺素總劑量、腎上腺素首次使用時間這5個特征。

在XGBOOST-REF算法篩選出16個特征,模型認為院外高級心肺復蘇情況、意識比較重要而這兩個特征在其余算法上的重要性得分均不高。

綜上采用MW-REF算法可以彌補單一特征的缺陷。

3.3 SHAP模型可解釋性分析

SHAP特征密度散點圖可以根據特征重要性對心肺復蘇預測結果的貢獻度進行分析,并提供特征在其分布下對結果的貢獻程度如圖3所示。

圖3 SHAP特征密度散點圖Fig.3 SHAP characteristic density scatter plot

圖3中從上到下依次為SHAP框架下的特征重要性排序,模型認為CPR總時間、腎上腺素使用量、疾病史、年齡、腎上腺素首次使用時間、心搏驟停至CPR開始總時間為對預測結果產生重要影響的特征。對重要特征進一步探尋其分布情況與心肺復蘇結果的影響繪制其獨立分布散點圖,如圖4所示。

圖4 SHAP獨立分布散點圖Fig.4 SHAP independent distribution Scatter plot

模型認為對于CPR總時間,時間越長,患者越容易死亡,在臨床中隨著CPR總時長的增加,重要臟器血流灌注越差,會加重損傷,從而導致ROSC率進一步下降[15]。在發生心臟驟停30 min以內進行心肺復蘇對患者的復蘇結果有積極影響。對于腎上腺素使用量,預測結果表明在腎上腺素使用量為5 mg左右時患者生存的可能性很高,使用量超過50 mg時模型預測結果全部為死亡。對于患者年齡,模型認為患者年齡處于25~35歲時復蘇成功率最高,隨著年齡的增加,死亡風險也會增加。對于心搏驟停至CPR開始總時間,模型認為該時間越長,患者越容易死亡,在臨床上認為快速進入高質量的CPR對患者的復蘇成功率提升有很大的幫助[16]。對于疾病史模型認為,對于有高血壓病史的患者更容易產生不良的預后情況。對于腎上腺素首次使用時間,預測結果表明初次使用腎上腺素時間越短,ROSC率越高。且復蘇組相比于死亡組在使用腎上腺素初始時間上的分布較廣,其分布與患者是否需要除顫、心臟驟停發生的地點、救治間隔時間的長短等因素相關[17-18]。需要綜合多種變量進行多因素分析研究。

4 結論

在心肺復蘇數據集上,基于多模型加權遞歸消除算法建立了心肺復蘇結果預測模型,相比于傳統的機遞歸特征消除算法達到了更為理想的預測效果。通過對模型預測結果的分析與解釋,發現并挖掘了影響心肺復蘇結果的影響因素,提出了為臨床診療提供輔助的方法。

機器學習需要大量的數據支撐,本文研究的數據量對于機器學習模型來說較少,死亡與復蘇成功的樣本存在樣本不均衡問題,當數據量增加時模型的擬合能力可以得到進一步的提升。只進行了單變量分析未對多個特征之間的相關性進行分析,僅依據單個特征對臨床診斷的輔助有限。預測結果沒有在臨床上的實際運用中得到驗證,模型的外推性不足。

綜上所述本文研究建立的機器學習模型在心肺復蘇結果預測上能夠達到較好的準確率,能夠探尋出影響心肺復蘇結果的重要因素并給出臨床上的解釋達到輔助診療的目的。但還需進一步擴大數據集,綜合分析各個變量的相關性,并增強模型的外推性。

猜你喜歡
重要性特征模型
一半模型
“0”的重要性
論七分飽之重要性
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
幼兒教育中閱讀的重要性
甘肅教育(2020年21期)2020-04-13 08:09:24
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
3D打印中的模型分割與打包
主站蜘蛛池模板: 亚亚洲乱码一二三四区| 精品五夜婷香蕉国产线看观看| 国产真实二区一区在线亚洲| 精品偷拍一区二区| 97视频在线精品国自产拍| AV色爱天堂网| 欧美日本在线观看| 福利在线免费视频| 老司国产精品视频| 四虎影视永久在线精品| AV不卡国产在线观看| 日本免费福利视频| 国产91成人| 亚洲三级色| 青青草国产在线视频| 在线中文字幕网| 色香蕉影院| 毛片免费视频| 国产精品一区二区国产主播| 亚洲激情区| 国产精品精品视频| 日韩国产精品无码一区二区三区| 久久综合亚洲鲁鲁九月天| 强乱中文字幕在线播放不卡| 欧美午夜视频| 精品综合久久久久久97超人| 四虎精品国产永久在线观看| 欧美综合中文字幕久久| 国产成人久久综合一区| 久草美女视频| 欧美日韩国产高清一区二区三区| 自拍偷拍一区| 免费无码AV片在线观看中文| 亚洲最黄视频| 国产成年女人特黄特色大片免费| 97se亚洲综合不卡 | 国产亚洲视频中文字幕视频| аⅴ资源中文在线天堂| 性欧美在线| 欧美精品成人一区二区视频一| 欧美日韩资源| 欧美69视频在线| 亚洲天堂视频在线观看免费| 亚洲成AV人手机在线观看网站| 欧美自慰一级看片免费| 素人激情视频福利| 老司机久久99久久精品播放 | 亚洲成a人片| 国产H片无码不卡在线视频| 天天综合网站| 青青操视频免费观看| 伊人久久青草青青综合| 久久久久国色AV免费观看性色| 国产精品自在自线免费观看| av在线人妻熟妇| 国产日本欧美在线观看| 国产精品无码作爱| h视频在线播放| 污网站在线观看视频| 日本国产一区在线观看| 九九视频在线免费观看| 91探花在线观看国产最新| 最新国产在线| 天堂网国产| 国产jizzjizz视频| 精品国产99久久| 日本日韩欧美| 99久久成人国产精品免费| 欧美综合区自拍亚洲综合绿色| 黄色网址手机国内免费在线观看| 亚洲色无码专线精品观看| 久久久久久久久18禁秘| 无码高潮喷水专区久久| 亚洲天堂日韩在线| 亚洲电影天堂在线国语对白| 国产精彩视频在线观看| 97se亚洲综合在线天天| 久久午夜夜伦鲁鲁片不卡| 四虎成人在线视频| 2022精品国偷自产免费观看| 欧美爱爱网| 欧美一区二区三区香蕉视|