999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數據挖掘的2型糖尿病風險預測模型的建立和應用

2019-05-09 11:48:08陳淑良常紅王冬平張策
糖尿病新世界 2019年4期
關鍵詞:糖尿病模型

陳淑良 常紅 王冬平 張策

[摘要] 目的 采用數據挖掘方法,考察2型糖尿病的危險因素,確定最優風險預測模型,為建立手機APP軟件提供算法,為糖尿病I級預防提供風險預測支持。 方法 收集某醫院2016年1月—2017年7月的糖尿病患者全數據集,共5 571例,通過與同期體檢健康對照組5 571例進行對比研究,分別建立Logistic 回歸模型和多層感知器神經網絡模型,比較優劣,確定最終預測模型。 結果 結果顯示 Logistic 回歸和多層感知器神經網絡模型對訓練樣本的預測準確率分別為89.7%、80.4%,對測試樣本的預測準確率分別為89.8%、79.8%。 結論 Logistic回歸模型對2型糖尿病風險預測效能較高,預測結果也更容易結合臨床實際,用于風險控制手機APP軟件后臺編程。

[關鍵詞] 2 型糖尿病;風險預測分析;Logistic回歸模型;多層感知器神經網絡模型;決策樹分析模型

[中圖分類號] R587.1????????? [文獻標識碼] A????????? [文章編號] 1672-4062(2019)02(b)-0001-03

Establishment and Application of Risk Prediction Model for Type 2 Diabetes Based on Data Mining

CHEN Shu-liang1, CHANG Hong1, WANG Dong-ping2, ZHANG Ce1

1.The Second Affiliated Hospital of Dalian Medical University, Dalian, Liaoning Province, 116027 China; 2. Zhongshan College, Dalian Medical University, Dalian, Liaoning Province, 116023 China

[Abstract] Objective To investigate the risk factors of type 2 diabetes by using data mining methods, to determine the optimal risk prediction model, to provide algorithms for establishing mobile APP software, and to provide risk prediction support for diabetes level I prevention. Methods A total of 5 571 patients with diabetes mellitus from January 2016 to July 2017 in the hospital were enrolled. A logistic regression model and a multi-layer perceptron neural network model were established by comparing with 5 571 healthy people in the same period, comparing the pros and cons, determine the final prediction model. Results The results showed that the prediction accuracy of the logistic regression and multi-layer perceptron neural network model for training samples were 89.7% and 80.4%, respectively, and the prediction accuracy for the test samples was 89.8% and 79.8%, respectively. Conclusion Logistic regression model has higher predictive effect on risk of type 2 diabetes, and the prediction results are more easily combined with clinical practice. It is used for background programming of risk control mobile APP software.

[Key words] Type 2 diabetes; Risk prediction analysis; Logistic regression model; Multilayer perceptron neural network model; Decision tree analysis model

隨著經濟發展,生活水平的提高,人口不斷向老齡化、城鎮化方向發展,糖尿病已經成為嚴重危害人類健康的重大公共衛生問題,其中全世界約有3.5億人患有2型糖尿病(T2DM)[1]。流行病學資料顯示我國每年新發的2型糖尿病人數達到 680 萬~740萬[2],由于2型糖尿病臨床確診前有較長的潛隱期,因此,對高危人群的篩查和防治是控制2型糖尿病發病的有效途徑[3]。近年來,數據挖掘方法廣泛應用于醫學領域,在疾病診斷、預后、風險評估等方面表現出良好的應用價值[4-6],也為臨床慢性病的控制提供了有效的工具和手段[7]。在前期的文獻檢索過程中,發現對糖尿病及其并發癥的研究較多,但各研究的樣本量不多,從數百例到數千例不等,達不到數據挖掘的準確度要求[8-9]。該研究收集2016年1月—2017年7月11 142例數據,預測未知人群的2型糖尿病風險,做好慢性病的I級預防,并期望將這種數據模型軟件化,制成手機APP軟件,為2型糖尿病以及其他慢性疾病的I級預防提供理論依據及必要的預測工具,現報道如下。

1? 資料與方法

1.1? 一般資料

對醫院的內分泌科住院的糖尿病患者全數據集5 571例進行分析。同時,在同期42 716名體檢中心健康人數據集中隨機抽取5 571名數據作為對照組,隨機種子數為1 794,數據處理過程中對數據進行脫敏操作,保護患者隱私,通過醫院倫理委員會審查。

納入的糖尿病患者,診斷均符合2010版《中國2型糖尿病防治指南》[10]診斷標準:①糖尿病癥狀加上隨機血糖檢測,靜脈血漿葡萄糖≥11.1 mmol/L或②空腹血糖(FPG)靜脈血漿葡萄糖≥7.0 mmol/L或③葡萄糖負荷后2 h血糖≥11.1 mmol/L,癥狀不典型者,臨床診斷必須經過另一天的重復試驗所證實。

1.2? 變量及定義

①文化程度分為“高學歷”“低學歷”;②吸煙分為 “是” “否”;③飲酒分為“是”“否”;④地區分為市區、市區外;⑤婚姻分為“已婚”‘未婚;⑥職業分為腦力為主、體力為主;⑦體質指數 (body mass index,BMI)= 體重(kg)/身高(m)2;⑧高血壓:確診為高血壓者;⑨甘油三酯(TG):正常值0.4~1.81 mmol/L;⑩糖化血紅蛋白:正常值≤6.5%;{11}高血脂疾病史:均符合《血脂異常防治建議》中關于高血脂的診斷標準,已被確診為高血脂癥;{12}冠心病疾病史[11]:以往被確診為冠心病;{13}甲狀腺疾病史[12]:以往被確診為甲狀腺性疾病;{14}糖尿病家族史:根據既往病例判斷,直系親屬患有糖尿病。

1.3? 統計方法

采用SPSS 17.0統計學軟件進行數據統計分析。采用軟件的隨機數功能從全數據集中選取70%,作為訓練樣本。余下的30%作為測試樣本。訓練樣本用于計算參數和建立Logistic回歸模型和神經網絡模型,測試樣本用于評估預測效果。

2? 結果

2.1? 一般情況

該研究共納入11 142例數據,糖尿病組男性3 124例,女性2 447例,平均年齡(62.49±0.17)歲,健康對照組男性 3 002例,女性2 569 例,平均年齡(44.75±0.19)歲[13-14]。

2.2? logistic 回歸分析

模型變量篩選過程采用多因素建模篩選,按照“一般情況”(性別、年齡、文化程度、職業、民族、家庭住址、婚姻狀況、吸煙情況、飲酒)“既往病史”(家族史、高血壓、冠心病、甲狀腺、高血脂)“檢驗結果”(收縮壓、舒張壓、總膽固醇、低密度脂蛋白、高密度脂蛋白、甘油三酯、谷草轉氨酶、谷丙轉氨酶、糖化血紅蛋白、BMI),將因素分為不同的模型,分別回歸,將有意義的因素篩選出來進入最終的模型,得出糖尿病的最終影響因素。

Logistc回歸結果,如表1,建立多因素預測方程為:

P=1/(1+e(16.089-0.09×年齡+2.687×高血壓病史-1.471×冠心病病史-4.549×甲狀腺病史-0.021×收縮壓+0.005×谷草轉氨酶+2.941×糖尿病家族史+0.129×糖化血紅蛋白)。

根據所建方程對訓練樣本進行預測,其預測準確率為89.7%。其對測試樣本的預測準確率是89.8%。

2.3? 多層感知器神經網絡分析

該多層感知器神經網絡模型共分為2層。見圖1。以2.2中篩選出的變量為自變量,以是否發生糖尿病為因變量建立多層感知器神經網絡模型,其對訓練樣本的預測準確率為80.4%,對測試樣本的預測準確率為79.8%。

3? 討論

該文研究結果表明,二個模型預測準確率均較高,Logistic回歸模型得出的因素比較全面,對2型糖尿病的風險預測結果相對準確,可以較好地應用于慢病風險預測。我們結合臨床實踐,并考慮決策樹在多類別選擇時,錯誤可能會增長的比較快,故該次研究未采用,多層感知器神經網絡模型雖然有諸多優勢,但其是一個黑箱系統,至今沒有明確的公式,結果不容易解釋,同時其對數據預測準確率也不優于Logistic模型。數據顯示,兩個模型在影響因素的選擇方面取得了良好的一致性,印證了對真實世界數據集預測的相符性[15-18]。

該文最終采用Logistic回歸模型用于手機預測APP的編程,是目前流行病學和醫學中最常用的分析方法之一。首先從該文的結果可以看出,相同條件下Logisitc模型結果準確率較高,其次其可以將建模結果公式化,相比于神經網絡模型,更適用于軟件編程等實際應用過程,另外, Logistic回歸中的回歸系數和OR值,可對模型和變量具有較好的解釋性,從而量化影響因素對輸出變量的影響,可應用于慢病風險預測。采用Logistic回歸模型結果,可進一步編寫具有自學習能力的慢病風險預測手機APP軟件,利用手機APP軟件,公眾可把相關危險因素輸入軟件,即可自行簡便且免費獲得罹患該疾病風險的初步信息,并根據專業醫生建議制定不同的防控措施,以期降低糖尿病的發病率。

[參考文獻]

[1]? Nathan DM. Diabetes: advances in diagnosis and treatment[J]. JAMA, 2015, 314(10): 1052-1062.

[2]? 中華醫學會糖尿病學分會.新診斷2型糖尿病患者短期胰島素強化治療專家共識[J].中華醫學雜志,2013,93(20):1524-1526.

[3]? Bhushan R, Elkind-hirsch KE, Bhushan M, et al. Improved glycemic control and reduction of cardiometabolic risk factors in subjects with type 2 diabetes and metabolic syndrome treated with exenatide in a clinical practice setting[J]. Diabetes Technol Ther, 2009, 11(6): 353-359.

[4]? 吳偉,郭軍巧,安淑一,等.使用思維進化算法優化的神經網絡建立腎綜合征出血熱預測模型[J].中國衛生統計,2016,33(1):27-30.

[5]? 葉華容,楊怡,林萱,等.BP神經網絡在高頻彩超特征診斷乳腺癌中的應用[J].中國衛生統計,2016,33(1):71-72.

[6]? Tseng WT, Chiang WF, Liu SY, et al. The application of data mining techniques to oral cancer prognosis[J]. J Med Syst, 2015, 39(5): 59-66.

[7]? Gonzalez GH, Tahsin T, Goodale BC, et al. Recent advances and emerging applications in text and data mining for biomedical discovery[J]. Brief Bioinform, 2015, 17(1): 33-42.

[8]? 黃雅鈴,楊曉波,龍禹,等.廣西地區妊娠期糖尿病的危險因素分析及其風險預測模型的建立[J].廣西醫科大學學報,2017,34(6):835-838.

[9]? 呂喆,陳亦棋,沈麗君,等.2型糖尿病患者糖尿病視網膜病變風險預測模型的建立和初步驗證[J].中華眼底病雜志,2017,33(3).

[10]? 中華醫學會糖尿病學分會.中國2型糖尿病防治指南(2010年版)[J].中國實用鄉村醫生雜志,2011,20(6):4-5.

[11]? 中華醫學會心血管病學分會,中華心血管病雜志編輯委員會.非ST段抬高急性冠狀動脈綜合征診斷和治療指南[J].中華心血管病雜志,2012,40(5):353-367.

[12]? 黨樂,胡雅婷,張永莉.多種抗體檢測在甲狀腺疾病診斷中的應用價值[J].中國醫藥導報,2016,13(18):65-68.

[13]? 楊小軍,張雪超,李安琪.利用Excel和Tableau實現業務工作數據化管理[J].電腦編程技巧與維護,2017(12):66-68.

[14]? 陳春明,孔靈芝.中華人民共和國衛生部疾病控制司.中國成人超重和肥胖癥預防控制指南[M].北京:人民衛生出版社,2006.

[15]? 宋健,吳學森,張杰,等.三種統計學模型在糖尿病個體患病風險預測中的應用[J].中國衛生統計,2017(2):312-314.

[16]? 趙曉華.基于大數據下2型糖尿病及并發癥患者就診信息的挖掘研究[D].廣州:廣州中醫藥大學,2016.

[17]? Leon BM, Maddox TM. Diabetes and cardiovascular disease: Epidemiology, biological mechanisms, treatment recommendations and future research[J]. World J Diabetes, 2015, 6(13): 1246-1258.

[18]? 王東營,張琨,許天敏.宮頸癌患病危險因素及一級預防[J].現代腫瘤醫學,2017,25(11):1827-1830.

猜你喜歡
糖尿病模型
一半模型
糖尿病知識問答
中老年保健(2022年5期)2022-08-24 02:35:42
糖尿病知識問答
中老年保健(2022年1期)2022-08-17 06:14:56
糖尿病知識問答
中老年保健(2021年5期)2021-08-24 07:07:20
糖尿病知識問答
中老年保健(2021年9期)2021-08-24 03:51:04
糖尿病知識問答
中老年保健(2021年7期)2021-08-22 07:42:16
糖尿病知識問答
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 高清无码手机在线观看| 免费看av在线网站网址| 又爽又黄又无遮挡网站| 免费毛片全部不收费的| 国产福利大秀91| 香蕉国产精品视频| 亚洲熟女中文字幕男人总站| 欧美国产视频| 在线日韩日本国产亚洲| 国产日韩欧美一区二区三区在线| 亚洲国产成人精品一二区| 日韩欧美国产三级| 亚洲午夜综合网| 久久超级碰| 成人无码一区二区三区视频在线观看| 亚洲最大福利视频网| 欧美成人一级| 日韩精品毛片| 国内精自线i品一区202| 日韩大片免费观看视频播放| 久久综合九色综合97婷婷| 久久综合婷婷| 福利国产微拍广场一区视频在线| 久久精品人人做人人爽97| 一级爱做片免费观看久久| 免费精品一区二区h| 国产真实乱子伦视频播放| 天天爽免费视频| 国产高清无码麻豆精品| 伊人久久精品亚洲午夜| 国产亚洲精久久久久久久91| 国产精品七七在线播放| 国产天天射| 精品中文字幕一区在线| 在线中文字幕日韩| 538精品在线观看| 天堂亚洲网| 国产精品亚洲五月天高清| 成年人视频一区二区| 国产又色又爽又黄| 欧美不卡在线视频| 国产一区二区精品福利| 国产最爽的乱婬视频国语对白| 美女视频黄又黄又免费高清| 午夜性爽视频男人的天堂| 青青青视频蜜桃一区二区| 久久黄色毛片| 国产日韩精品一区在线不卡| 婷婷午夜天| 精品国产电影久久九九| 成人字幕网视频在线观看| 一级成人a做片免费| 精品国产Av电影无码久久久| 国产精品欧美日本韩免费一区二区三区不卡 | 久久久久九九精品影院| 成人另类稀缺在线观看| 91亚瑟视频| 国产欧美在线视频免费| 亚洲成人精品| 亚洲男人天堂久久| 日韩视频精品在线| 亚洲综合片| 一本二本三本不卡无码| 99青青青精品视频在线| 伊人久久大线影院首页| 视频二区中文无码| 97久久人人超碰国产精品| 在线a视频免费观看| 国产拍在线| 精品国产免费观看一区| 国产在线观看成人91| 日韩欧美中文| 99伊人精品| 亚洲av无码人妻| 欧美啪啪精品| 国产91丝袜在线播放动漫| 日韩欧美91| 亚洲欧美一级一级a| 99精品伊人久久久大香线蕉 | 久久99精品久久久久纯品| 高潮毛片免费观看| 午夜日本永久乱码免费播放片|