999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Apriori算法的高危人群2型糖尿病預測研究

2015-12-05 12:08:14于啟炟
中國醫學裝備 2015年1期
關鍵詞:數據挖掘關聯規則

韋 哲 于啟炟 辛 邁③

基于Apriori算法的高危人群2型糖尿病預測研究

韋 哲①②于啟炟②辛 邁②③

目的:利用數據挖掘中的關聯規則,為及早地在高危人群中發現和預防糖尿病。方法:選擇蘭州某大型三甲醫院的323例2型糖尿病及IFG、IGT患者的首次病程記錄,采用Apriori算法和SPSS Clementine 12軟件設計,建立2型糖尿病的預測模型。結果:共形成10條強關聯規則,其中蘊含著與2型糖尿病相關的一些因素之間的關聯關系。結論:通過這些關聯規則以實現對糖尿病高危人群簡便而準確的初判斷。

數據挖掘;Apriori算法;關聯規則;糖尿病,2型

[First-author’s address] Lanzhou General Hospital PLA Lanzhou Military Command, Lanzhou 730050, China.

糖尿病(diabetes mellitus,DM)已成為世界性疾病,據世界衛生組織(WHO)報道,目前全球已有DM患者1.75億,2025年將達到3億,而更嚴重的是與DM相關的病死率在過去的12年內增加了30%,全球DM相關的死亡人數為每年320萬[1]。隨著人們生活方式的巨變和生活水平的提高,DM發病年齡呈現低齡化,我國的DM患病率急劇增加。近5年的流行病學調查顯示,在我國經濟發達地區DM的患病率已高達9%~10%[2]。DM患者的平均壽命較非DM者少15年。因此,DM的早期發現和早期治療具有非常重要的意義。

本研究利用數據挖掘中的關聯規則,在DM患者首次病程記錄的基礎上,研究簡單易測(在家中獲得檢測數據)的關聯因素與2型糖尿病之間的關系,利用其規則使DM高危人群能夠及時準確地對自身情況做出初步判斷。首次病程記錄為患者進入醫院后未經過任何治療措施的真實記錄,在對2型DM高危人群的預測中比一般的電子病歷更具有普遍意義,本方法的先進意義就在于此。

1 Apriori算法基本概念

Apriori算法是一種最有影響的挖掘關聯規則頻繁項集的算法,其核心是基于兩階段頻繁集思想的遞推算法。其中,所有支持度大于最小支持度的項集稱為頻繁項集,簡稱頻集(使用遞推的方法生成所有頻集)[3]。Apriori(先驗的,推測的)算法,其基本思想是首先找出所有的頻集,這些項集出現的頻繁性至少和預定義的最小支持度一樣,然后由頻集產生強關聯規則(即同時滿足最小支持度闕值和最小置信度闕值的規則稱為強關聯規則),這些規則必須滿足最小支持度和最小置信度,然后應用所找到的頻集產生期望的規則,產生只包含集合的項的所有規則,一旦這些規則被生成,則只有那些支持度和置信度分別大于用戶所給定的最小支持度和最小置信度的關聯規則才能留下來。利用Apriori算法對數據進行分析能夠高效的產生頻繁項集,從而生成強關聯規則,發現隱藏在數據間的相關性。

為了生成所有頻繁項集,Apriori算法使用了遞推的方法[4]。其核心思想為:首先產生1-項集(L1),然后是頻繁2-項集(L2),直到有某個r值使得Ly為空,這時算法停止。在第k次循環中,其過程先產生候選k-項集的集合Ck,Ck中的每個項集是對兩個只有1個項集不同的屬于Lk-1的頻集做1個(k-2)連接而產生的[5]。Ck中的項集是用來產生頻集的候選集,最后的頻集Lk必須是Ck的一個子集。Ck中的每個項集需在數據庫中進行驗證來決定其是否加入。

2 信息資料的提取

本研究信息資料提取于蘭州某大型三甲醫院醫學信息數據庫,其中包括2009年1月至2014年3月2型DM、空腹血糖受損(impaired fasting glucose,IFG)及糖耐量受損(impaired glucose tolerance,IGT)患者的首次病程記錄,信息數據為患者住院號、性別、年齡、既往病史、家族病史、飲食習慣、職業及生理數據等指標。研究中病程指標為:①以空腹血糖≥7.0 mmol/L或餐后2 h血糖≥11.1 mmol/L為DM;②空腹血糖<7.0 mmol/L或餐后2 h在7.8~11.0 mmol/L為IGT;③空腹血糖在6.1~7.0 mmol/L或餐后2 h血糖<7.8 mmol/L為IFG[7]。

根據世界衛生組織(WHO)最新標準,DM高危人群的定義為:①年齡≥45歲且常年不參加體力活動;②體質量指數≥24 kg/m2;③以往有IGT或是IFG;④有DM家族史;⑤有高密度脂蛋白膽固醇降低或三酰甘油血癥;⑥有高血壓或是心腦血管病癥;⑦年齡≥30歲的妊娠婦女[8]。

3 關聯因素與2型DM之間的相關性挖掘

3.1 數據預處理

本研究根據數據挖掘專業知識對數據進行預處理,使數據記錄量和特征屬性的數量達到研究要求[9]。預處理過程分為2步:①數據選擇,從首次病程記錄中提取出性別、文化程度及創傷史等方面的信息。考慮到患者的姓名、出生年月及住院號等信息與本次研究關系不大,可以直接去掉。經過刪減的部分數據如圖1所示;②數據變換,按照數據挖掘中關聯分析的要求將本研究的數據轉變成布爾型的二值數據, 經過量化后得到的部分數據如圖2所示。

圖1 刪減后的患者部分數據電腦截圖

圖2 量化處理后的患者部分數據電腦截圖

有些屬性很容易量化,如性別中男性可設置為1,女性可設置為0;飲酒可用1代表平時飲酒,0代表平時不飲酒。但有些屬性則需要分段,然后再進行相應的量化,如患者的文化程度以初中為標準,初中以下屬于低文化水平用0表示;而初中及以上屬于高文化水平,用1表示。對于性格的量化,采用的方式為能控制自己情緒的用1表示,其他均用0表示。對于身體質量指數(body mass index,BMI)的量化,采用的方式為BMI<24 kg/m2的屬于正常用0表示,BMI>24 kg/m2的屬于肥胖用1表示。對于腰臀比(waist-hip ratio,WHR)的量化,采用的方式為男性WHR>0.8的用1表示,女性WHR>0.85的用1表示,其余均用0表示。

3.2 數據挖掘模型

利用Apriori算法,在Clementine下建立的數據挖掘模型,針對本次挖掘任務所設計流。流中將“數據源.xls”作為源文件節點,添加過濾節點和類型節點建立庫與模型間的數據傳輸,最后將Apriori算法執行模型和圖形節點填入流中[10](如圖3所示)。

圖3 基于Apriori算法的關聯規則挖掘模型圖

4 結果

在進行關聯分析時發現,當設置的最小支持度闕值為minsupport=0.10,最小置信度闕值為minconfidence=0.70時得到的關聯規則最佳,如果關聯規則的最小支持度和最小置信度不滿足事先設置最小支持度和最小置信度的要求,則會被“剪枝”處理,最終得到結果如圖4、圖5所示。

圖4 模型-數據挖掘部分結果示圖

圖5 圖形-數據挖掘結果示圖

本研究中圖4、圖5顯示:①男性人群中喝酒是造成DM的一個危險因素,女性人群中肥胖是造成DM的一個危險因素,其中女性DM患者的BMI和WHR指數普遍超標;②在最后的結果中并沒有看見“運動”這個因素,表明DM患病人群在平時的生活中堅持鍛煉的人數非常少,提示應加強DM的預防與教育工作,使公眾對DM不再陌生和輕視,患者要改變平時不利于DM健康的行為,形成高度的自我管理模式;③本研究中“創傷史”這個因素因為支持度低于預設值而被刪減,表明大量的DM患者是近年來隨著生活水平的改善而新增加的;④飲茶也可能導致DM,這個因素常常被患者所忽略;⑤本研究未考慮季節性對DM的影響,在后續的研究中會增加此項內容。以上結論與實際情況基本相符。

5 結論

關聯分析的目的是找出數據庫中隱藏的關聯網,是對數據庫中數據之間相關性的一種描述,基于關聯分析的計算機輔助醫學數據挖掘系統能夠對現有病歷數據庫中數據進行自動分析并提取有價值的知識,尤其適合DM的流行病學分析和全民健康評估。因此,Apriori算法與社區醫療和醫院信息系統結合是未來的發展方向。本研究嘗試將數據挖掘算法引入DM的發病規律研究中,期望從大量的DM數據中發現該病的發病規律,挖掘出有意義的規則,使高危人群能從這些規則中對自身的情況做出相應的判斷,引起自身足夠的重視并做出相應的調整,從而達到預防DM的目的。

[1]Gül?in YE,Karahoca A,U?ar T.Dosage planning for diabetes patients using data mining methods[J]. Procedia Computer Science,2011,3:1374-1380.

[2]李武成,王官權,金科.2型糖尿病并發高血壓的危險因素分析[J].實用醫學雜志,2010,26(17):3180-3181.

[3]劉敏嫻,馬強,寧以風,等.基于頻繁矩陣的Apriori算法改進[J].計算機工程與設計,2012,33(11):4235-4239.

[4]李良,米智偉,向新.基于FP-Growt的戰略績效關聯分析算法研究[J].微計算機應用,2011,32(2):1-8.

[5]Goethals B.Surveyon frequent pattern mining,HUT basic research unit[D].Helsinki:Department of Computer Science,University of Helsinki,2003:1-43.

[6]Patil BM,Joshi RC,Toshniwal D.Association rule for classification of type-2 diabetic patients[C].2010 Second International Conference on Machine Learning and Computing,2010:34-38.

[7]胡艷文,申紅.2型糖尿病及其并發癥QT期間及離散度變化的臨床意義[J].貴州醫藥,2007(5):542-543.

[8]張翠麗,高曉紅,李曉楓,等.2型糖尿病發病高危因素的分析[J].大連醫科大學學報,2005,27(2):99-100.

[9]嚴剛.中醫數據挖掘中數據預處理方法研究[J].遼寧中醫雜志,2010,7(11):2144-2147.

[10]元昌安,鄧松.李文敬,等.數據挖掘原理與SPSS Clementine應用寶典[M].北京:電子工業出版社,2009.

Study on prediction of high risk group of Type 2 diabetes based on Apriori algorithm

WEI Zhe, YU Qi-da, XIN Mai// China Medical Equipment,2015,12(1):45-47.

Objective: To discover and prevent diabetes early in high-risk group. Methods: Chose 323 records of type 2 diabetes or IFG,IGT patients with first course which come from a large hospital in Lanzhou between 2009 January to 2014 March; Use Apriori algorithm and the SPSS Clementine 12 software design; Set up prediction model of type 2 diabetes. Results: A total of 10 strong association rules are formed. The strong association rules contain some associations between factors and type 2 diabetes. Conclusion: Through the association rules, the initial judgment on the high-risk group of diabetes is simple and accurate.

Data mining; Apriori algorithm; Association rules; Diabetes mellitus, type 2

韋哲,男,(1963- ),博士,高級工程師。蘭州軍區蘭州總醫院醫學工程科,從事醫學信息檢測和處理方面的研究工作。

1672-8270(2015)01-0045-03

R197.324

A

10.3969/J.ISSN.1672-8270.2015.01.014

2014-05-28

①蘭州軍區蘭州總醫院醫學工程科 甘肅 蘭州 730050

②蘭州理工大學電氣工程與信息工程學院 甘肅 蘭州 730050

③解放軍94804部隊 上海 200000

猜你喜歡
數據挖掘關聯規則
撐竿跳規則的制定
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
數獨的規則和演變
探討人工智能與數據挖掘發展趨勢
奇趣搭配
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規則對我國的啟示
一種基于Hadoop的大數據挖掘云服務及應用
主站蜘蛛池模板: 国产微拍精品| 亚洲免费三区| 无码国产偷倩在线播放老年人| av色爱 天堂网| 免费无码AV片在线观看中文| 国产又大又粗又猛又爽的视频| 色精品视频| 国产精品嫩草影院av| 欧美色图第一页| 国产精品视频观看裸模| 久草青青在线视频| 人妻一区二区三区无码精品一区| 真人高潮娇喘嗯啊在线观看| 午夜性刺激在线观看免费| 国产午夜不卡| 国产乱子伦精品视频| 成人国产三级在线播放| 欧美国产日韩在线播放| 国产精品福利尤物youwu| 色老二精品视频在线观看| 91娇喘视频| 国内精品自在自线视频香蕉| 国产午夜看片| 亚洲黄色视频在线观看一区| 国产精品一区在线麻豆| 欧洲av毛片| 免费99精品国产自在现线| 中文字幕av无码不卡免费| 谁有在线观看日韩亚洲最新视频| 国产黑丝视频在线观看| 久久人午夜亚洲精品无码区| 亚洲国产日韩在线观看| 国产福利免费视频| 国产不卡网| 四虎成人精品在永久免费| 精品自窥自偷在线看| 97人妻精品专区久久久久| 综合社区亚洲熟妇p| 日本在线国产| 四虎亚洲精品| 第一区免费在线观看| 亚洲视频黄| 四虎国产在线观看| 国产成人一二三| 57pao国产成视频免费播放| 日韩免费毛片| 香蕉eeww99国产在线观看| 国产欧美日韩va| 秋霞午夜国产精品成人片| 日本高清免费不卡视频| 亚洲成人网在线播放| 中文字幕人妻无码系列第三区| 99re在线免费视频| 国产情侣一区二区三区| 四虎在线观看视频高清无码| 亚洲精品视频免费| 亚洲综合国产一区二区三区| 毛片网站在线播放| 视频二区国产精品职场同事| 色噜噜在线观看| 亚洲欧美日本国产综合在线 | 欧美有码在线| 99无码中文字幕视频| 国产人碰人摸人爱免费视频| 无码久看视频| 久久综合丝袜日本网| 国产无人区一区二区三区| 亚洲国产精品日韩专区AV| 日本欧美一二三区色视频| 亚洲午夜天堂| 国产性生交xxxxx免费| 亚洲精品男人天堂| 久久精品人人做人人爽| 在线免费无码视频| 欧美日韩国产在线观看一区二区三区| 亚洲欧美另类中文字幕| 好吊色妇女免费视频免费| 亚洲国产精品一区二区高清无码久久| 全部免费特黄特色大片视频| 国产成人高精品免费视频| 波多野结衣第一页| 精品小视频在线观看|