999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于XGBoost算法的潛在高血脂癥預測研究

2021-04-20 02:23:54李榮楊嘉燁宋蘇燕郭志高丁有偉
電子技術與軟件工程 2021年2期
關鍵詞:高血脂癥高血壓模型

李榮 楊嘉燁 宋蘇燕 郭志高 丁有偉

(南京中醫藥大學人工智能與信息技術學院 江蘇省南京市 210033)

1 引言

隨著人民生活水平和膳食結構的改變,我國血脂異常的發生率呈持續上升趨勢,血脂異常與動脈粥樣硬化密切相關,是冠心病、腦卒中、心肌梗死、猝死的危險因素[1]。我國成人血脂異常患者的知曉率和治療率仍處于較低水平,血脂異常的防治工作有待加強[2],因此高血脂的評估和預測對阻止病情的發生,延緩病情具有重要意義。

近年來,機器學習技術發展迅速,并被廣泛用于慢性病預測。M Chen 等人[3]在數據不完整的情況下使用潛在因素模型重建丟失數據,并對某一地區的慢性病腦梗死患者的結構化和非結構化數據進行試驗,提出了一種新的基于CNN 的多模態疾病風險預測算法(CNN-MDRP),該算法準確率高,收斂速度快。A Wang 等人[4]借助logistic 回歸對風險因素初篩,進而采構建BP 算法的多層感知神經網絡模型預測高血壓。將Logistic 回歸和ANN 進行有效結合,對于高血壓篩查具有重要意義。Chang W 等人[5]使用遞歸特征消除與交叉驗證從體檢數據中提取最佳特征子集后,采用SVM、決策樹、隨機森林、XGBoost 預測高血壓,發現XGBoost 預測性能最好,此試驗對深入研究高血壓并發癥具有較強的現實意義。

在國內外的相關研究中,將機器學習應用于疾病預測的研究可以分為用于預測慢性疾病的模型設計和通過不同模型比較預測結果,大部分研究主要針對高血壓等一些慢性疾病,由于高血脂癥和其他慢性疾病同樣重要,因此本研究選擇高血脂癥作為主要分析的疾病,提出基于XGBoost 算法的潛在高血脂疾病預測方法。針對采集到的數據進行數據的清洗、轉化等處理,利用XGBoost、隨機森林和Logistics 三種算法對潛在高血壓進行預測,并比對不同算法的預測結果,從而找到最理想的算法,為早期高血壓的檢測和防治提供保障。

2 相關技術

2.1 高血脂癥的預測原理

高血脂癥是指血清中的膽固醇(TC)和(或)甘油三酯(TG)水平升高,通常患有高血脂癥的患者會在某些方面的身體數據指標有異于正常人的表現。潛在高血脂癥的預測原理是通過機器學習相關理論及在海量個體生理數據中搜索異常的,可能引發高血脂癥的相關數據。

2.2 隨機森林

隨機森林(Random Forest)是由Breiman[6]提出的,是基于多棵決策樹的集成分類方法。隨機森林由多棵決策樹構成,用隨機的方法組成森林,決策樹之間互不關聯。當有樣本需要判斷時,將抽取的樣本數據放到決策樹的根節點,抽取樣本采用有放回的抽樣方法,保證每棵樹之間相互獨立。決策樹根據選擇的屬性進行判斷,并得到一個結果,最后匯總這些結果,通過少數服從多數的方法,出現最多的分類結果就是最后的答案。

2.3 XGBoost

XGBoost(eXtreme Gradient Boosting)是由陳天奇[7]等人2015年提出,是一種基于決策樹的集成機器學習算法。是在GBDT 基礎上,加入目標函數的二次泰勒展開項和模型復雜度的正則項,使得目標函數與實際數據相差更小,達到減少數據誤差,提高預測準確度的一種算法。

2.4 Logistic回歸

Logistic 回歸算法是從統計學中借鑒而來的,通過使用固有的Logistic 函數估計概率,來衡量因變量與一個或者多個自變量之間的關系。邏輯回歸假設數據服從伯努利分布,通過極大化化似然函數方法,運用梯度下降來求解參數達到將數據二分的目的。

3 數據預處理

實際在生活中取得的數據存在許多問題,特別是醫療領域的數據,有其獨特的特點,決定了數據處理過程中面臨諸多問題,比如冗余性,不完整性,不一致性,多類別數據特征等,因此,數據預處理在數據建模過程中占據重要作用,本研究主要使用下述方法對體檢數據進行預處理。

(1)數據清洗。對待預測人員體檢數據采集的過程中,不可避免會有大量與潛在高血脂癥預測無關的冗余信息以及不完整信息,因此,需要對采集到的數據集進行清洗。

(2)數據轉換。將隸屬于非布爾屬性的體檢數據轉換成布爾數據屬性。可以通過文本關鍵詞的提取,長文本轉換成數值向量等方式進行處理。

通過上述方式處理得到待預測人員的體檢數據,能更方便的進行高血脂癥的數據預測分析,為潛在高血脂癥的預測提供數據支撐。

4 實驗結果及其分析

4.1 實驗環境和條件

實驗使用的是Windows 10、i5 處理器、8GB 內存的計算機,編程語言采用的是Python 3.8。

4.2 實驗數據集

本實驗選擇美年體檢數據,其中包括57298 份體檢報告,2795項體檢項目。該體檢報告中包括數值型數據和文本型數據,體檢項目名稱已被脫敏處理,個人id 也進行加密處理。

4.3 分類性能評判標準

使用準確率(precision,P)、召回率(recall,R)和F1 值(F1-measure,F1)3 個指標作為分類器評判標準。在分類問題中,可將樣本根據真實類和分類模型給出的預測類的組合,劃分為真正例(True Positive,TP)、假正例(False Positive,FP)、真反例(True Negative,TN)、假反例(False Negative,FN)四種情況。則有如下定義:

4.4 不同分類模型的比較

本研究主要從體檢數據中提取個體特征,對疾病進行風險預測,預測其膽固醇和血清甘油三酯是否處于異常,從而判斷是否屬于高血脂。

為驗證XGBoost 算法分類的準確性,本研究還選擇了隨機森林和Logistics 兩種算法,在100%數據量下,進行比較。由表1可知,XGBoost 算法的結果要明顯優于其他兩種算法。

4.5 不同數據量的影響

隨機選取20%、40%、60%、80%的數據作為訓練集。從圖1中可以看出,隨著數據量的增加,模型的結果逐步增強,但是有一定的波動。由于數據集樣本分布并不均衡,且一些字段存在一定的缺失率,這導致了模型結果出現波動,但從F1 值來來看,隨著數據量的增加,模型的結果逐步增強,且未出現明顯下降的趨勢。如表2所示。

圖1:XGBoost 在不同的數據量下測試結果的變化

表1:XGBoost 與其他算法的對比

表2:訓練樣本數據量對xgboost 算法的影響

5 結束語

針對高血脂預測問題提出了基于XGBoost 算法的預測方法。通過與其他算法的比較可以發現XGBoost 算法結果好于其他算法,通過不同數據量的測試可以看出:隨著訓練樣本的增加,準確率有一定程度的提高。通過本研究可以為高血脂癥的預測提供強而有力的理論基礎。

猜你喜歡
高血脂癥高血壓模型
一半模型
復方樺褐孔菌咀嚼片的制備及對高血脂癥小鼠降血脂作用
特產研究(2024年1期)2024-03-12 05:40:24
全國高血壓日
西部醫學(2021年10期)2021-10-28 08:25:50
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
如何把高血壓“吃”回去?
基層中醫藥(2018年4期)2018-08-29 01:25:58
高血壓,并非一降了之
基層中醫藥(2018年6期)2018-08-29 01:20:14
3D打印中的模型分割與打包
高血脂癥的診治
阿托伐他汀合氨氯地平治療老年高血脂癥52例臨床療效觀察
主站蜘蛛池模板: 欧美日韩亚洲综合在线观看| 久久无码高潮喷水| 好紧好深好大乳无码中文字幕| 伊人久久福利中文字幕| 人与鲁专区| 亚洲αv毛片| 国产亚洲精品97AA片在线播放| 999精品色在线观看| 91在线视频福利| 波多野结衣在线一区二区| 免费无码一区二区| 99re这里只有国产中文精品国产精品| 三区在线视频| 久久永久免费人妻精品| 欧美一级黄色影院| 国产美女无遮挡免费视频| 国产日韩欧美视频| 国产在线91在线电影| 久久精品人人做人人爽97| 无码精品国产dvd在线观看9久 | 香蕉视频在线精品| 毛片基地美国正在播放亚洲| 四虎永久免费在线| 香蕉精品在线| 成人免费视频一区| 粉嫩国产白浆在线观看| 五月天在线网站| 91久久夜色精品国产网站| 色屁屁一区二区三区视频国产| 免费一级全黄少妇性色生活片| 成年免费在线观看| 国产乱人免费视频| 久久精品欧美一区二区| 免费国产高清视频| 久久亚洲国产一区二区| 国产亚洲男人的天堂在线观看 | 国产午夜看片| 国产男人天堂| 五月婷婷精品| 无码AV高清毛片中国一级毛片| 国产精品女熟高潮视频| 国产午夜福利片在线观看| 国产微拍精品| 在线观看国产精品一区| 99这里精品| 国产在线观看精品| 欧美全免费aaaaaa特黄在线| 亚洲香蕉久久| 亚洲va视频| 精品国产网| 一本色道久久88综合日韩精品| 国产精品第5页| 综合色区亚洲熟妇在线| 成年网址网站在线观看| 大香网伊人久久综合网2020| 蜜桃视频一区二区三区| 色婷婷综合激情视频免费看| 国产精品久久久久鬼色| 国产成人高清精品免费软件| 亚洲一区黄色| 红杏AV在线无码| 日韩小视频在线观看| 日本不卡在线播放| 日本免费精品| 最新加勒比隔壁人妻| 亚洲第一区在线| 二级毛片免费观看全程| 91口爆吞精国产对白第三集| 国产在线观看一区精品| 亚洲中文久久精品无玛| 91麻豆精品视频| 亚洲成网站| 最新国语自产精品视频在| 国产乱子精品一区二区在线观看| 国产一区二区丝袜高跟鞋| 日韩毛片在线播放| 无码综合天天久久综合网| 亚洲床戏一区| 欧美日韩国产在线观看一区二区三区| 亚洲国产一区在线观看| 国产真实乱子伦视频播放| 国产一二三区视频|