999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

典型機器學習算法在脂肪肝分類預測研究中的實現與比較△

2019-01-14 07:45:52余秋燕孫繼佳邵建華
數理醫藥學雜志 2019年1期
關鍵詞:分類模型

余秋燕 趙 瑩 孫繼佳 邵建華

(上海中醫藥大學中藥學院數理教研室 上海 201203)

脂肪肝(Fatty Livers)是由多種疾病和病因所導致的肝臟脂肪代謝功能障礙,進而使肝內脂質蓄積過多的一種病理變化,也是一種臨床常見病癥。現代醫學認為,脂肪肝不是一個獨立的疾病,常見的一些導致脂肪肝疾病因素有肥胖、酒精中毒、高脂血癥等[1],而甘油三酯、體重、舒張壓等危險因素指標是形成脂肪肝的主要危險因素[2]。雖然目前針對脂肪肝發生的危險因素研究有很多,但是脂肪肝的發病機制仍然不夠完全明確,通過應用數據科學的方法,尋找對脂肪肝影響的因素是科學且有效的。

機器學習可以通過自動學習大量輸入的數據樣本內在結構和規則,進而對新樣本進行智能的辨識,甚至實現對未來的預測[3]。隨著機器學習與大數據的結合,如今,越來越多的科研人員運用機器學習方法對醫藥領域進行探索,推動著疾病診療規范化的發展[4]。

本文根據所收集到的實際臨床體檢數據資料,應用5種典型的機器學習建模方法,對脂肪肝分類辯證進行分類預測和比較分析,旨在為脂肪肝分類辯證提供客觀、標準和規范的算法模型。

1 資料與方法

1.1 資料來源

原始臨床數據來源于2017年上海市浦東新區某地段醫院60歲以上2337例老年人體檢的實際臨床資料。

1.2 臨床數據預處理

首先,對2337例原始數據進行初步篩選,剔除部分有缺失和不完全等模糊的臨床記錄,通過篩選剩余1956例。研究中選取一些重點關注的臨床指標,運用R語言,通過主成分分析(PCA)進行降維并提取主成分,得到:臀圍(HIP)、總膽固醇(TC)、谷草轉氨酶(AST)、肌酐(CR)、收縮壓(SBP)、甘油三酯(TG)、白蛋白(ALB),總共7個主成分。將所有主成分臨床指標作為參數自變量,脂肪肝分類判別(FL)作為結果變量建立模型。同時,將脂肪肝分類當中的輕度脂肪、中度脂肪、脂肪歸為“有脂肪肝”,將無歸為“無脂肪肝”,分別編號1和0。資料顯示,有脂肪肝的病例為1044例,無脂肪肝的病例為912例。

數據預處理后,再對數據進行標準化,本文采用“0-1標準化”,即公式(1)所示:

(1)

1.3 5種模型在R語言的應用程序包

本文將通過R語言機器學習相關工具包實現模型構建和預測,分別使用到:C5.0(決策樹)、nnet(神經網絡)、e1071(支持向量機)、bnlearn(貝葉斯網絡)和randomForest(隨機森林)等5種R語言包。

2 結果

2.1 5種機器學習模型分類預測結果

本研究通過應用R語言來實現機器學習模型的建立,安裝加載“gmodels”添加包以輸出混淆矩陣,通過R包中的CrossTable()函數查看結果,例如,決策樹(Decision Tree, DT)模型預測結果如表1所示。

表1 決策樹DT的預測結果

Actual FLPredicted FL01Row Total0125(25.56%)105(21.47%)230141 (8.38%)218(44.58%)259Column Total166323489

2.2 模型的評估與比較

在1956例臨床體檢數據中,模型的訓練集取75%,即1467例樣本用于訓練;測試集取25%,即489例樣本用于預測,五類機器學習模型的效度評價如表2所示。

觀察數據,發現決策樹模型的預測準確率最高,達到了70%以上,支持向量機和神經網絡模型次之,處于68%左右的水平,而貝葉斯網絡模型的預測性能最低,僅有62.17%。由此可見,決策樹模型的分類預測效果最優,應用在小樣本數據上有優勢;同時,觀察貝葉斯網絡結構圖(圖1)和重要性評分,發現臀圍(HIP)和甘油三酯(TG)對脂肪肝分類的重要性評分最高,關聯密切,且對脂肪肝分類預測有直接和間接的影響因素。

表2 5類機器學習模型的效度評價

模型FL預測準確率(%)決策樹(Decision Tree, DT)70.14神經網絡(Neural Network, NN)68.30支持向量機(Support Vector Machine, SVM)68.71貝葉斯網絡(Bayesian Network, BN)62.17隨機森林(Random Forest, RF)66.05

圖1 貝葉斯網絡結構圖

3 討論

在脂肪肝分類預測研究中,機器學習方法的應用是研究的一個重要方向,而且也被廣泛應用在臨床研究當中。例如,呂航等[5]運用決策樹模型來探討糖尿病伴發非酒精性脂肪肝病的預測作用,構建風險模型;權蔚蔚等[6]將BP神經網絡引入到脂肪肝的圖形識別中;韓秀芝等[7]使用LBP特征提取肝臟超聲圖像特征后,采用了支持向量機對脂肪肝等肝病進行了分類;張永媛[8]采用了貝葉斯網絡即概率圖模型,對非酒精性脂肪肝與代謝綜合癥之間的潛在雙向因果關系進行了推斷;白江梁等[9]探討了隨機森林在體檢人群糖尿病、脂肪肝的風險預測中的應用等。

本文所運用的5種典型機器學習算法在數據挖掘領域中是比較成熟且穩定的,我們將其模型運用到體檢數據研究當中,提取了重要的指標作為參數并進行了比較分析,基于預測結果的準確率,驗證了各個模型的有效性和可行性,為脂肪肝疾病預測提供了基于數據科學的研究方法。

猜你喜歡
分類模型
一半模型
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 欧美乱妇高清无乱码免费| 国产一区二区三区在线观看视频| 国产午夜一级淫片| 无码免费的亚洲视频| 久久综合九色综合97网| 免费全部高H视频无码无遮掩| 国产精品尹人在线观看| 91在线丝袜| 青草精品视频| 亚洲无码视频图片| 国产又色又刺激高潮免费看| 国产精品久线在线观看| 91精品国产自产在线观看| 国产精品密蕾丝视频| 日韩成人免费网站| 黄色片中文字幕| 欧美一级爱操视频| 免费在线色| 国产色伊人| 久久久国产精品免费视频| 成人国产精品2021| 欧美日本中文| 国产视频你懂得| 女人18毛片久久| 天堂网亚洲系列亚洲系列| 亚洲无码高清视频在线观看 | 在线国产综合一区二区三区| 亚洲欧美精品一中文字幕| 国产精选自拍| 中文字幕在线日韩91| 国产在线观看精品| 欧美日本一区二区三区免费| 日本91在线| 国产chinese男男gay视频网| 91精品专区国产盗摄| 亚洲经典在线中文字幕| 亚洲色图欧美在线| 国产在线八区| 美女被躁出白浆视频播放| 国产h视频免费观看| 亚洲欧美自拍中文| 国产精品永久在线| 久久中文电影| 欧美一级高清片久久99| 亚洲欧美色中文字幕| 在线观看亚洲精品福利片| 亚洲综合精品第一页| 最新亚洲人成无码网站欣赏网| 欧美成人一级| 不卡午夜视频| 久久综合丝袜日本网| 麻豆精品久久久久久久99蜜桃| 久久香蕉欧美精品| 亚洲天堂网在线视频| 亚洲 日韩 激情 无码 中出| 青青青国产在线播放| 亚洲国产精品一区二区第一页免| 日韩毛片基地| 99国产精品免费观看视频| 女同久久精品国产99国| 欧美亚洲国产精品第一页| 无码'专区第一页| 国产成人你懂的在线观看| 小13箩利洗澡无码视频免费网站| 国禁国产you女视频网站| 99热国产在线精品99| 日韩欧美国产综合| 亚洲人成网站在线播放2019| 色有码无码视频| 国产激情无码一区二区三区免费| 黄色免费在线网址| 91精品国产丝袜| 色婷婷视频在线| 最新精品久久精品| 在线观看视频99| 亚洲欧州色色免费AV| 精品国产免费观看一区| 九九这里只有精品视频| 亚洲 欧美 日韩综合一区| 啪啪免费视频一区二区| 国产亚洲高清在线精品99| 色视频国产|