999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于多因素回歸分析和機器學習算法的冠心病預測模型構建及比較

2022-05-14 04:29:00陸浩軒徐瑾妍程可愛謝燕青計禮麗何文明
寧波大學學報(理工版) 2022年3期
關鍵詞:冠心病模型

陸浩軒, 徐瑾妍, 程可愛, 謝燕青, 王 麗, 計禮麗, 周 忠, 楊 卓, 景 勝, 何文明*

基于多因素回歸分析和機器學習算法的冠心病預測模型構建及比較

陸浩軒1, 徐瑾妍2, 程可愛1, 謝燕青1, 王 麗1, 計禮麗1, 周 忠1, 楊 卓1, 景 勝1, 何文明1*

(1.寧波大學醫(yī)學院附屬醫(yī)院 心血管內科, 浙江 寧波 315020; 2.寧波大學醫(yī)學院附屬醫(yī)院 神經(jīng)內科, 浙江 寧波 315020)

本文旨在構建基于臨床電子病歷數(shù)據(jù)的冠心病預測模型. 回顧性收集了2015年至2020年在寧波大學醫(yī)學院附屬醫(yī)院住院期間, 接受選擇性冠狀動脈造影的患者的臨床數(shù)據(jù), 分別應用決策樹、樸素貝葉斯和邏輯回歸算法構建冠心病預測模型, 比較3種模型的預測性能. 共收集354例患者數(shù)據(jù), 其中冠心病患者140例, 非冠心病患者214例, 根據(jù)邏輯回歸、樸素貝葉斯、決策樹算法構建的3種預測模型的準確性分別為70.6%、89.5%、90.7%; 曲線下面積分別為0.676、0.869、0.921. 所構建的3種預測模型均具備較好的冠心病預測能力, 具有用于冠心病篩查的潛在價值.

冠心病; 機器學習; 決策樹; 樸素貝葉斯

冠狀動脈粥樣硬化性心臟病(Coronary Atherosclerotic Heart Disease, CAD)是一種常見的心血管疾病, 簡稱冠心病. 一直以來, 選擇性冠狀動脈造影是診斷冠心病的“金標準”, 但其是一種有創(chuàng)操作, 且價格相對昂貴, 難以作為冠心病的篩查手段. 現(xiàn)存的一些冠心病風險評估模型, 包括弗拉明翰風險評分模型[1-2]等已被證明對診斷冠心病的準確率有限[3], 也不適用于冠心病早期篩查.

鑒于現(xiàn)有方法的局限性, 本研究嘗試構建無創(chuàng)冠心病預測模型, 基于相關的臨床數(shù)據(jù), 對冠心病進行預測分類. 人工智能技術在醫(yī)學研究領域中被廣泛應用于構建疾病預測模型, 其對數(shù)據(jù)處理具有傳統(tǒng)統(tǒng)計學方法不具備的獨特優(yōu)勢[4-7]. 目前國內外也報道了基于機器學習算法構建冠心病預測模型的研究, Babaoglu等[8]基于支持向量機算法挖掘了23個臨床數(shù)據(jù)特征, 構建了一種冠心病預測模型, 該模型的診斷準確率達到了79.71%.

本文以包含354例患者的臨床電子病歷數(shù)據(jù)為數(shù)據(jù)源, 使用邏輯回歸分析和兩種常見的機器學習算法構建預測模型, 以準確性、曲線下面積(Area Under the Curve, AUC)、敏感性和特異性作為評價指標, 評估基于冠心病預測模型進行冠心病篩查的可行性.

1 資料收集

本研究回顧性收集了2015—2020年在寧波大學醫(yī)學院附屬醫(yī)院住院期間行選擇性冠狀動脈造影的患者資料, 收集的臨床數(shù)據(jù)包括年齡、性別、身高、體重、收縮壓、舒張壓、高血壓病史、高脂血癥史、糖尿病史、血管疾病史、腎病病史、吸煙史、飲酒史、實驗室檢查結果、心超左室射血分數(shù). 收集的患者資料符合如下要求: ①既往無冠心病及相關疾病; ②數(shù)據(jù)資料較完整; ③年齡≥20歲. 所有患者均簽署冠狀動脈造影知情同意書.

2 數(shù)據(jù)方法

使用單因素分析篩選與冠心病存在相關性的特征因素, 然后使用多因素邏輯回歸分析構建冠心病預測模型. 同時, 使用兩種常用的機器學習算法(決策樹和樸素貝葉斯)構建冠心病預測模型. 比較3種算法構建的模型的預測性能. 模型的評價標準為準確性、AUC值、敏感性和特異性.

2.1 特征篩選與多因素邏輯回歸分析

特征選擇通過單因素分析進行, 即將所有納入的變量進行分析, 檢驗變量對冠心病分類結果有無顯著性影響. 單因素分析結果見表1.

表1 單因素分析結果

以<0.1作為特征篩選條件, 篩選出13個變量: 年齡、性別、吸煙史、高血壓病史、高脂血癥史、糖尿病史、血管疾病史、血鈉、血鈣、血糖、血肌酐、尿素氮、左室射血分數(shù). 通過前向迭代法進行多因素邏輯回歸分析并構建預測分類模型.

2.2 決策樹算法

決策樹算法可基于數(shù)據(jù)樣本的分布概率, 通過類似樹枝結構形態(tài)的方式, 實現(xiàn)多層判斷, 從而判定目標所屬類別. 決策樹有3種常用的求解方法: ID3、C4.5、CART. 本文選用ID3法求解, 其核心原理在于信息熵原理, 即通過信息熵增益選擇數(shù)據(jù)集內對于信息增益最大的特征作為分類屬性, 逐步確定樹的分支, 最終實現(xiàn)決策樹的構建.

信息熵用于反映隨機特征的不確定性, 信息熵越大, 樣本的不確定性越大.

計算以進行數(shù)據(jù)劃分時的信息增益:

2.3 樸素貝葉斯算法

樸素貝葉斯算法是貝葉斯分類算法中最常用的算法之一.

樸素貝葉斯公式:

2.4 統(tǒng)計學處理

3 結果

3.1 描述性統(tǒng)計

表2列出了符合條件的354名患者的人口統(tǒng)計學特征. 根據(jù)選擇性冠狀動脈造影結果顯示冠心病140例(39.5%), 非冠心病214例(60.5%).

表2 人口統(tǒng)計學特征

續(xù)表

表3 多因素邏輯回歸分析結果

3.2 多因素邏輯回歸分析

多因素邏輯回歸分析允許同時分析線性變量和分類變量, 將篩選出的13個變量納入算法. 本文使用前向迭代法, 算法迭代7次后趨于平穩(wěn), 最終納入了7個變量(年齡、性別、高血壓病史、糖尿病史、血鈉、血糖、血肌酐), 多因素邏輯回歸分析結果見表3. 表4顯示了模型的迭代情況及最終的準確性. 結果顯示, 迭代7次之后最終模型的準確性為70.6%.

表4 回歸模型迭代情況

3.3 模型預測結果

圖1為3種模型的受試者工作特征(receiver operating characteristic, ROC)曲線.

由圖1可知決策樹算法構建的預測模型的AUC值最高, 為0.921, 其次是樸素貝葉斯算法, AUC為0.869, 邏輯回歸的AUC值最低, 為0.676. 不同算法的預測分類結果見表5. 可以看出, 2種機器學習算法的準確率均在85%以上, 預測效果良好. 準確性更高的為決策樹, 其準確性達到了90.7%, 樸素貝葉斯次之, 準確性為89.5%, 邏輯回歸分析的準確性最低, 僅為70.6%. 3種模型的混淆矩陣即冠心病的實際預測結果見表6.

表5 3種模型的評價

表6 3種模型的混淆矩陣

4 結語

冠心病因其高發(fā)病率、高住院率、高死亡率, 已然成為了倍受重視的國民健康問題[9]. 準確診斷冠心病依賴冠狀動脈造影, 然而, 由于選擇性冠狀動脈造影操作的有創(chuàng)性和復雜性, 其并不適合作為臨床篩查冠心病的工具. 以弗拉明翰風險評分為代表的心血管風險評分工具篩查冠心病的準確性十分有限, 也難以滿足臨床篩查冠心病的需求.

以人工智能算法為代表的大數(shù)據(jù)挖掘技術的興起為解決上述問題提供了新的思路. 近年來, 基于醫(yī)療大數(shù)據(jù)訓練機器學習算法并構建疾病預測模型的研究不斷涌現(xiàn). Gould等[10]基于常規(guī)臨床和實驗室檢查數(shù)據(jù), 利用機器學習算法建立了肺癌預測篩查模型, 且證明了該模型相比于現(xiàn)有的篩查標準更準確(AUC為0.86). Dinh等[11]基于機器學習構建了糖尿病和心血管疾病預測模型, 所構建的兩種預測模型的AUC分別為0.831和0.862, 表現(xiàn)出了不俗的預測性能. Krishnamurthy等[12]從臺灣健康保險研究數(shù)據(jù)庫獲得的共病和藥物數(shù)據(jù)進行慢性腎臟病的發(fā)病預測, 使用卷積神經(jīng)網(wǎng)絡算法構建的預測模型在6個月和12個月預測的測試集AUC分別為0.957和0.954.

以上研究為本研究構建冠心病預測模型提供了思路, 本研究分別應用機器學習算法和邏輯回歸算法構建了冠心病預測分類模型, 其中決策樹算法顯示了最高的準確性和AUC, 決策樹及樸素貝葉斯算法相比于傳統(tǒng)邏輯回歸方法均表現(xiàn)出明顯的優(yōu)越性. 因此, 機器學習算法適用于冠心病分類預測, 對于冠心病的篩查可能具有一定的應用前景.

本研究也存在一些局限性. 首先, 樣本量相對較少, 未來仍需進一步擴大樣本量以進行外部驗證該預測模型的準確性. 其次, 選取的變量中, 關于心血管影像學的變量只納入了心超顯示的左室射血分數(shù), 未來將嘗試進一步納入更多的影像學變量并構建模型. 最后, 本研究使用的冠心病數(shù)據(jù)集存在一定程度的樣本缺失, 雖使用了均值填補法對缺失值進行了填補, 但仍可能對模型的準確性產生了一定程度的影響.

綜上, 基于機器學習的冠心病預測分類模型是一種很有應用前景的工具, 有利于早期篩查冠心病. 本研究初步證明了機器學習算法對預測冠心病具有較好的準確性. 未來可在此基礎上進一步改良機器學習算法, 同時發(fā)掘更多與冠心病具有相關性的臨床數(shù)據(jù), 隨著大規(guī)模心臟中心的建立和冠心病數(shù)據(jù)庫的完善, 這項研究的臨床應用可推廣性將被進一步評估.

[1] D’Agostino R B Sr, Vasan R S, Pencina M J, et al. General cardiovascular risk profile for use in primary care: The Framingham heart study[J]. Circulation, 2008, 117(6): 743-753.

[2] Pencina M J, D’Agostino R B Sr, Larson M G, et al. Predicting the 30-year risk of cardiovascular disease: The Framingham heart study[J]. Circulation, 2009, 119(24): 3078-3084.

[3] Reriani M K, Flammer A J, Jama A, et al. Novel functional risk factors for the prediction of cardiovascular events in vulnerable patients following acute coronary syndrome[J]. Circulation Journal: Official Journal of the Japanese Circulation Society, 2012, 76(4):778-783.

[4] Johnson K W, Torres Soto J, Glicksberg B S, et al. Artificial intelligence in cardiology[J]. Journal of the American College of Cardiology, 2018, 71(23):2668- 2679.

[5] Kann B H, Hosny A, Aerts H J W L. Artificial intelligence for clinical oncology[J]. Cancer Cell, 2021, 39(7):916-927.

[6] He J X, Baxter S L, Xu J, et al. The practical implementation of artificial intelligence technologies in medicine[J]. Nature Medicine, 2019, 25(1):30-36.

[7] Topol E J. High-performance medicine: The convergence of human and artificial intelligence[J]. Nature Medicine, 2019, 25(1):44-56.

[8] Babao?lu I, F?nd?k O, Bayrak M. Effects of principle component analysis on assessment of coronary artery diseases using support vector machine[J]. Expert Systems with Applications, 2010, 37(3):2182-2185.

[9] 《中國心血管健康與疾病報告2020》編寫組. 《中國心血管健康與疾病報告2020》要點解讀[J]. 中國心血管雜志, 2021, 26(3):209-218.

[10] Gould M K, Huang B Z, Tammemagi M C, et al. Machine learning for early lung cancer identification using routine clinical and laboratory data[J]. American Journal of Respiratory and Critical Care Medicine, 2021, 204(4): 445-453.

[11] Dinh A, Miertschin S, Young A, et al. A data-driven approach to predicting diabetes and cardiovascular disease with machine learning[J]. BMC Medical Informatics and Decision Making, 2019, 19(1):211.

[12] Krishnamurthy S, Ks K, Dovgan E, et al. Machine learning prediction models for chronic kidney disease using health insurance claim data in Taiwan[J]. Healthcare (Basel, Switzerland), 2021, 9(5):546.

Construction and comparison of coronary heart disease prediction models based on multivariate regression analysis and machine learning algorithm

LU Haoxuan1, XU Jinyan2, CHENG Ke’ai1, XIE Yanqing1, WANG Li1, JI Lili1, ZHOU Zhong1, YANG Zhuo1, JING Sheng1, HE Wenming1*

( 1.Department of Cardiology, Affiliated Hospital of Medical School, Ningbo University, Ningbo 315020, China; 2.Department of Neurology, Affiliated Hospital of Medical School, Ningbo University, Ningbo 315020, China )

The current study was designed to construct coronary heart disease (CHD) prediction models based on clinical electronic medical record data. The clinical data was collected from the patients who underwent elective coronary angiography during hospitalization at the Affiliated Hospital of Medical School, Ningbo University from 2015 till 2020. Decision tree, naive Bayes, and logistic regression algorithms were applied to construct prediction models for coronary heart disease. The predictive performance of these three models was compared. A total of 354 patients, including 140 CHD patients and 214 non-CHD patients, were recruited. Using logistic regression, naive Bayes, and decision tree algorithms, the accuracies of the three prediction models were 70.6%, 89.5% and 90.7% respectively. The AUCs were 0.676, 0.869, 0.921, respectively. All the three prediction models had good predictive ability for CHD and may have screening potential for CHD.

coronary heart disease; machine learning; decision tree; naive Bayes

通信作者:何文明(1981-), 男, 浙江紹興人, 副主任醫(yī)師, 主要研究方向: 心血管醫(yī)學. E-mail: fyhewenming@nbu.edu.cn

R541.4

A

1001-5132(2022)03-0057-06

2021?11?02.

寧波市自然科學基金(2021J240, 202003N4231); 寧波大學人體生物力學研究院開放基金(CJ-HBIO202104).

陸浩軒(1995-), 男, 浙江杭州人, 醫(yī)師, 主要研究方向: 心血管醫(yī)學. E-mail: 271621481@qq.com

寧波大學學報(理工版)網(wǎng)址: http://journallg.nbu.edu.cn/

(責任編輯 韓 超)

猜你喜歡
冠心病模型
一半模型
ADAMTs-1、 CF6、 CARP在冠心病合并慢性心力衰竭中的意義
茶、汁、飲治療冠心病
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
警惕冠心病
智慧健康(2019年36期)2020-01-14 15:22:58
3D打印中的模型分割與打包
冠心病室性早搏的中醫(yī)治療探析
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
中西醫(yī)結合治療冠心病心絞痛56例
主站蜘蛛池模板: 国产91久久久久久| 精品国产aⅴ一区二区三区| 国产成人免费高清AⅤ| jizz在线免费播放| 性欧美久久| 伦伦影院精品一区| 亚洲视频一区| 在线观看网站国产| 国产精品手机在线观看你懂的 | 日本一区二区不卡视频| 精品伊人久久大香线蕉网站| 性欧美在线| 亚洲无码高清一区| 黑人巨大精品欧美一区二区区| 国产91线观看| 久久国产拍爱| 亚洲欧美自拍中文| 免费高清毛片| 亚洲伊人天堂| 免费啪啪网址| 香蕉视频在线观看www| 国产精品香蕉在线| 欧美在线一级片| 亚国产欧美在线人成| 在线观看欧美国产| 99ri国产在线| 国产精品视频a| 国产99在线| 国产激爽大片高清在线观看| a级毛片网| 久久99蜜桃精品久久久久小说| h视频在线观看网站| 久青草国产高清在线视频| 国产a网站| 污网站在线观看视频| 一级毛片在线播放| 在线va视频| 国产99视频免费精品是看6| 午夜国产在线观看| 亚洲国产成人无码AV在线影院L| 亚洲成aⅴ人片在线影院八| 99久久国产自偷自偷免费一区| 国产a v无码专区亚洲av| 欧美日韩免费在线视频| 亚洲国产无码有码| 国产精品偷伦在线观看| 国产女同自拍视频| 9999在线视频| 久久久91人妻无码精品蜜桃HD| 青青操视频在线| 国产精品白浆无码流出在线看| 97超碰精品成人国产| 71pao成人国产永久免费视频 | 素人激情视频福利| 青草午夜精品视频在线观看| 91无码人妻精品一区二区蜜桃| 亚洲第一天堂无码专区| 国产精品福利在线观看无码卡| 精品福利网| 免费毛片在线| 在线精品视频成人网| 一级毛片高清| 亚洲精品无码抽插日韩| 熟妇丰满人妻| 精品夜恋影院亚洲欧洲| 67194亚洲无码| 福利视频一区| 尤物精品国产福利网站| 不卡无码h在线观看| 国产又黄又硬又粗| 久久久久国产一区二区| 欧美性色综合网| 久久a毛片| 日韩在线成年视频人网站观看| 亚洲中文在线视频| 欧美精品在线免费| av色爱 天堂网| 日韩美女福利视频| 999在线免费视频| 尤物在线观看乱码| 精品国产香蕉在线播出| 国产视频只有无码精品|