999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

決策樹算法在腦卒中危險分級預測中的應用

2019-03-05 05:16:18汪仁邊迪王樹奇李雪萌趙東升
中國療養醫學 2019年3期
關鍵詞:模型

汪仁 邊迪 王樹奇 李雪萌 趙東升

1 引言

近年來,腦卒中作為一種死亡率高、復發率高、致殘率高的急性腦血管疾病逐漸成為世界第二大致死病。我國腦卒中患者數量居世界第二位,每年因腦卒中致死人數達上百萬,并且絕大多數腦卒中患者存在不同程度的后遺癥,給患者家庭和國家都帶來了沉重的負擔[1]。2009年,原國家衛生部啟動了“國家腦卒中防治工程”,并建立了“中國卒中數據中心”。截至目前,已收集存儲了從2011年以來對全國40歲以上人群進行抽樣篩查的近700萬篩查對象和高危人群的信息資料[2]。腦卒中篩查過程中,定義危險因素包括:高血壓、血脂異常、糖尿病、房顫或瓣膜性心臟病、吸煙史、明顯超重或肥胖、缺乏運動、腦卒中家族史、TIA既往史、腦卒中既往史等。根據危險因素的篩查結果,將被篩查者腦卒中風險分為3級(低危、中危、高危)。具有0~2個危險因素且無慢性病危險因素(高血壓、血脂異常、糖尿病)的檔案分類為低危;具有0~2個危險因素且有慢性病危險因素的檔案分類為中危;具有3個及以上危險因素或有TIA既往史、腦卒中既往史檔案分類為高危。

在腦卒中篩查數據統計分析中,危險級別檢出率、相對危險度等統計指標在對篩查工作質量評定、臨床決策支持、相關醫療政策制定具有指導意義,這些統計指標的計算需要使用到危險分級字段[3]。在實際篩查數據中,由于采集時間限制、個人主觀性、檢查數據獲取成本高等原因造成原始數據中危險因素字段存在不同程度的數據缺失,因而導致無法對這些被篩查者進行腦卒中危險評級。通常對這些缺失數據進行刪除處理,但這樣會給統計分析的結果帶來誤差。對危險分級的缺失數據進行預測插補,可以矯正數據分析結果、統計指標準確度。其中危險因素與危險分級數據缺失模式(圖1)。圖1中顯示了原始腦卒中篩查數據中危險評級與危險因素數據的缺失情況,灰色顯示為正常數據,黑色顯示為缺失數據。其中左圖為危險評級數據與危險因素數據的缺失率柱圖,右圖顯示了危險評級數據與危險因素數據的缺失分布。可以看出房顫或瓣膜性心臟病數據與血脂異常數據的缺失率在7%左右,其余危險因素數據與危險分級數據缺失率在2%左右。

近年來,相關數據挖掘預測算法發展迅速,在數據插補以及各個場景之下得到了廣泛的應用[4-6]。常用的數據插補算法有均值插補法、k最近鄰插補法[7]、決策樹插補法[8]、多重插補[9]。腦卒中篩查數據中缺失的危險分級數據進行預測并插補,對相關腦卒中統計分析指標的準確性、新篩數據危險分級預測起到重要的促進作用,能夠提高腦卒中衛生防治效率。

圖1 腦卒中篩查數據危險因素與危險分級缺失模式

2 方法

2.1 材料 以2011—2017年腦卒中院外篩查數據作為研究對象。篩查數據覆蓋全國31個省市自治區及新疆生產建設兵團總計454個篩查點,數據采集時采用隨機選定城鄉社區的40歲及以上常駐人群進行社區整群抽樣方法獲得。截至目前,累計收集并存儲了近700萬人的院外篩查檔案。本文實驗將對原始篩查數據隨機抽樣10 000條檔案作為實驗數據集,并在實驗數據集中隨機抽取70%為訓練集、30%為測試集。數據包含相關腦卒中危險因素(高血壓、糖尿病、房顫、血脂異常、吸煙、超重、缺乏運動、腦卒中家族史等)的初篩數據,以及對高危人群的常見實驗室檢查、既往病史及用藥信息、介入治療及手術信息等復篩數據。

2.2 數據預處理 腦卒中篩查數據采集與整理過程中,由于時間限制、篩查對象主觀性、信息獲取成本高等原因造成數據不規范、空值、字段不統一等問題,所以在建立決策樹模型之前需要對原始篩查數據集進行數據預處理操作。針對原始篩查數據進行預處理的主要目標包含:數據合并與字段類型的統一,由于篩查項目時間跨度長、數據版本繁多,需要對數據進行格式類型統一并合并;邏輯范圍外連續數據清洗,例如年齡低于40歲或大于110歲等。數據預處理流程圖(圖2)。

2.3 決策樹模型 根據相關腦卒中危險因素調查研究報告以及實際腦卒中篩查數據的字段情況[10],選取部分基本信息、既往病史、相關醫學檢查作為決策樹建模的影響變量。具體影響變量選取(表1)。

具體分析流程(圖3):①對數據集進行相關預處理,并劃分訓練集與測試集。②從數據集中的個人信息、既往病史、醫學檢查信息中選取建立決策樹模型中的影響變量。③使用訓練集進行決策樹模型的建立。④使用測試集進行決策樹模型的測試,并得出測試結果。

圖2 數據預處理流程

表1 訓練數據集影響變量屬性說明表

圖3 分析流程

采用C4.5決策樹算法進行決策樹模型的訓練與建立[11-12]。這種決策樹算法會根據統計檢驗來確定自變量與分割點,假設自變量與分割點相對獨立,在對其進行卡方獨立檢驗之后,將檢驗P值小于設定的閾值的自變量加入決策樹模型,并使用“增益率”(gainratio)來選擇自變量的分割點,這也是C4.5 決策樹算法相比J.RossQuinilan 提出的IDE3算法的重要改進[13]。其中增益率的定義為:,其中

C4.5算法在處理連續性描述屬性的時候采取的二分法,這樣C4.5算法既能夠處理離散的描述屬性,也能夠處理連續的描述屬性[14]。決策樹建模工具使用R3.5.1 的PARTY軟件包。PARTY包是Hothorn等[15]于2006年開發的決策樹算法包,其中的CTree函數提供一種遞歸的分割、組合工具,用來構建基于樹形的回歸和分類模型。

3 結果

構建出包含共計35個節點的決策樹模型,具體決策樹模型(圖4)。

通過使用測試集對危險分類決策樹模型進行驗證,對測試集危險分級預測的總體準確率為85.03%,其中低危、中危、高危級別預測準確率分別為87.19%、75.56%、77.07%;其中低危、中危、高危級別的F1度量值分別為0.93、0.64、0.57。

圖4 危險分級決策樹模型圖(部分)

4 討論

腦卒中發病同時伴隨著多種并發癥,其中部分會對腦卒中患者帶來永久性損傷。因此,及時對篩查人群的檔案進行腦卒中危險級別精準劃分,及時進行相關干預手段,對降低腦卒中患病率、發病率具有十分重要的促進作用。對建立的危險分級決策樹模型觀察得出,腦卒中危險分級中影響因素最為密切的為高血壓疾病(node1)。其中高危的最為密切的影響因素為心腦血管疾病,所有的心腦血管病患者均預測為高危級別(node3、node24);分級為中危的關鍵影響因素為糖尿病、血脂異常等常見慢性病(node20、node26、node33);其中分級為低危的主要影響因素為年齡(node7、node8、node17)。可以看出腦卒中的危險級別主要通過慢性疾病患病情況、心腦血管疾病患病情況以及年齡等因素進行劃分。

通過與現行篩查項目腦卒中危險分級的評價依據做對比,其中各個危險級別的預測劃分情況與實際腦卒中危險分級依據相符,但從決策樹分級模型中可以看出,腦血管病對中危、高危分級有著較為明顯的作用,而實際的危險分級劃分依據中并沒有將腦血管疾病作為危險因素進行考量。

通過使用測試集對決策樹模型進行評估結果看出,模型整體預測準確度較高,各個危險級別都能夠實現較為精準的預測。通過F1度量值可以明顯看出,在對于低危級別的預測最為穩定,而在中危與高危級別預測結果穩定性一般。雖然腦卒中篩查數據樣本大,但其中危險分級為中危、高危級別的檔案數量較少,造成決策樹模型對中危、高危預測性能穩定性上不如低危準確。隨著腦卒中篩查項目的進行,可以進一步擴大實驗數據集,同時可以考慮采用不同的數據抽取方法獲取數據集、引入不同的影響變量等方法,提高對中、高危人群分析預測的準確度。

5 總結

本文基于全國腦卒中篩查數據,構建了腦卒中危險分級決策樹模型,可以較為精確的預測被篩查者的危險級別,實現對原始腦卒中篩查數據中缺失的危險級別數據進行較為準確的插補,提高相關統計指標的精確度,提高腦卒中數據統計分析與腦卒中防治的效率。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 第一区免费在线观看| 成人在线不卡视频| 国产精品久久久久无码网站| 91久久精品日日躁夜夜躁欧美| 免费人成黄页在线观看国产| 亚洲三级视频在线观看| 国产精品视频观看裸模| 1024你懂的国产精品| 人人妻人人澡人人爽欧美一区| 91久久夜色精品| 精品无码视频在线观看| 欧美亚洲国产精品久久蜜芽| 久久婷婷六月| 亚洲精品动漫在线观看| 国产欧美又粗又猛又爽老| 亚洲第一色网站| 国产成熟女人性满足视频| 尤物精品国产福利网站| 亚洲成人动漫在线观看| 欧美成人一级| 伊人丁香五月天久久综合 | 91精品国产一区自在线拍| 国产粉嫩粉嫩的18在线播放91| 婷婷亚洲视频| 国产sm重味一区二区三区 | 亚洲第一成人在线| 欧美综合成人| 日本人妻丰满熟妇区| 精品伊人久久大香线蕉网站| 精品偷拍一区二区| 亚洲开心婷婷中文字幕| 国产免费一级精品视频| 精品国产美女福到在线直播| 国产午夜不卡| 亚洲无码不卡网| 亚洲无码在线午夜电影| 天天综合网色| 亚洲国模精品一区| 国产精品自在拍首页视频8| 婷婷综合在线观看丁香| 久久综合色视频| 在线免费无码视频| 国产91九色在线播放| 欧美成a人片在线观看| 亚洲aaa视频| 国产粉嫩粉嫩的18在线播放91 | 91精品专区国产盗摄| 最新国产高清在线| 免费 国产 无码久久久| 亚洲AV一二三区无码AV蜜桃| 黄色网站在线观看无码| 亚洲视频一区在线| 成人综合在线观看| 欧美黄网站免费观看| 欧美福利在线观看| 国产高清在线丝袜精品一区| 欧美亚洲网| 久操线在视频在线观看| 日本在线视频免费| 国产毛片不卡| 伊人久久久大香线蕉综合直播| 老司机精品一区在线视频| AV不卡无码免费一区二区三区| 一级爆乳无码av| 一级一级一片免费| 国产不卡网| 成人一级黄色毛片| 国产成人免费观看在线视频| 成人免费黄色小视频| 国产主播在线一区| 成人在线欧美| 国产成在线观看免费视频| 国产一区二区三区在线观看视频| 亚洲第一香蕉视频| 91精品最新国内在线播放| 亚洲综合亚洲国产尤物| 亚洲天堂伊人| 日韩欧美91| 精品91在线| 国产视频一区二区在线观看| 欧美激情视频二区三区| 日韩在线2020专区|