999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

關聯規則算法在臨床醫療診斷中的應用

2018-03-26 02:14:46姚旭升楊靜謝穎夫
軟件導刊 2018年3期
關鍵詞:關聯規則

姚旭升 楊靜 謝穎夫

摘要:

為了從臨床數據中挖掘出疾病之間的相關性,為疾病臨床診斷提供一種輔助方法,使用SPSS Statistics進行數據預處理,將數據轉化為布爾數據,最后應用SPSS Modeler搭建基于Apriori算法的關聯規則挖掘數據流,采用云南某醫院2013年住院病案首頁數據(共54 841條)建立疾病間的關聯規則模型。從227種疾病中挖掘出信度大于20%的關聯規則共40條,涉及20種疾病。關聯規則挖掘可以從大量臨床數據中發現疾病間潛在關聯,為相關疾病的臨床診斷提供輔助。

關鍵詞:

數據挖掘;關聯規則挖掘;SPSS Modeler;臨床輔助診斷

DOIDOI:10.11907/rjdk.172521

中圖分類號:TP319

文獻標識碼:A文章編號文章編號:16727800(2018)003016203

英文摘要Abstract:In order to dig out the correlation between diseases from clinical data, an auxiliary method is provided for the clinical diagnosis of disease. SPSS Statistics is used to preprocess the data and convert the data into Boolean data. Finally, SPSS Modeler is applied to build association rules mining data stream based on Apriori algorithm. An association rule model between diseases was established by using the first page of inpatient medical records(a total of 54 841) in a hospital in Yunnan in 2013. A total of 40 association rules with confidence setting greater than 20% were extracted from the 227 diseases, involving 20 diseases. Association rules mining can discover the latent association between diseases from a large amount of clinical data. This can provide an auxiliary method for the clinical diagnosis of related diseases.

英文關鍵詞Key Words:data mining; association rules; SPSS Modeler; clinical assistant diagnosis

0引言

隨著信息技術的發展,目前很多領域已經逐漸積累起海量數據,數據挖掘手段可以從這些數據中挖掘出一些人類不容易發現的潛在規律。數據挖掘可以概括為一種決策支持過程,主要基于人工智能、機器學習、統計學等技術,高度自動化地分析原有數據,作出歸納性推理,從中挖掘出潛在規律,預測分析對象的行為趨勢,從而幫助決策或調整策略[1]。

關聯規則算法是用來探索事務之間依賴關系的一種常用方法,最典型的應用是挖掘超市交易數據中售出商品間潛在關系,用于找出顧客購買行為模式,從而優化商品布置,以達到增長銷售額的目的[2]。目前關聯規則挖掘已廣泛應用于各個行業。在醫學領域,關聯規則廣泛應用于臨床用藥規律、疾病預測分析等方面[3]。關聯規則算法的特點是可以發現自然組合的關聯,將該方法應用于挖掘不同種疾病之間的相關性,對于疾病的主動預防以及臨床輔助診斷是有意義的[4]。

本文基于SPSS Modeler軟件提出一種針對住院病案首頁中診斷數據的疾病相關性挖掘方法,采用云南省昆明市某三甲醫院2013年住院病案首頁數據,力圖挖掘出一些疾病間可能的潛在關聯,為臨床診斷提供幫助。

1關聯規則挖掘

1.1關聯規則挖掘定義

關聯規則挖掘可描述如下:

設I={i1,i2,...,im}是有m個不同的項組成的集合,簡稱項集。給定一個事務集合D,其中每一個事務T是I中一組項的集合,即TI。若項集AI且AT,則事務T包含項集A[5]。關聯規則是形如A→B的關系式,其中A∪T,B∪T,且A∩B=;關聯規則挖掘是要在事務集合D中找出所有滿足最小支持度和最小置信度的關聯規則。

1.2Apriori算法

Apriori算法是一種最有影響的布爾關聯規則頻繁項集挖掘算法[6],其核心是基于兩階段頻集思想的遞推算法。該關聯規則在分類上屬于單維、單層、布爾關聯規則[7],所有支持度大于最小支持度的項集稱為頻繁項集,簡稱頻集。

該算法的基本思想:①找出所有頻集,這些項集出現的頻繁性至少與預定義的最小支持度一樣;②由頻集產生強關聯規則,這些規則必須滿足最小支持度與最小可信度;③使用第1步找到頻集產生期望的規則,產生只包含集合項的所有規則,其中每一條規則右部只有一項。一旦這些規則被生成,那么只有那些大于用戶給定的最小可信度的規則才被留下來。

3關聯規則挖掘方法

3.1研究對象

本文采用的數據是云南省某三甲醫院2013年全年的住院病案首頁數據,共54 841條,根據住院病案首頁國家標準,每個住院案例包含四大類指標,分別為患者基本信息、住院過程信息、診療信息與費用信息[8]。由于本文研究的是疾病間潛在的聯系,故選擇以下字段作為研究指標:住院病案號(為保護患者隱私,采用住院病案號作為患者身份標識)、疾病編碼(主要診斷編碼)、疾病編碼1(其它診斷1編碼)……疾病編碼16(其它診斷16編碼),共17個指標。

3.2數據預處理

2013年住院病案首頁數據中把本文不考察的其它指標過濾掉,僅留下研究對象。采用SPSS Statistics 22將數據轉化為事務處理格式,統計疾病頻數,疾病頻數小的疾病對于模型的影響微乎其微,故將疾病頻數小于100的案例刪除,提高建模效率。

3.3關聯規則挖掘模型構建

SPSS Modeler軟件的特點是采用數據流形式處理數據,可以直觀地分析數據處理過程、設置參數[910]。本文采用SPSS Modeler 14.1建立關聯規則挖掘數據流模型。模型如圖1所示。

其中,在“Statistic文件”節點中輸入預處理后的數據源;在“類型”節點中將納入模型的變量類型設為“輸入”;在“標志”節點中將“疾病代碼”設為標志字段。按照“住院病案號”進行匯總,其目的是將現有數據變成可以被布爾數據Apriori算法處理的數據。在“過濾”節點中將疾病編碼修改為疾病中文名,最后在“Apriori算法”節點中設置最小置信度為20%,最小支持度為2%,運行模型、輸出關聯規則結果40條。

4結果

關聯規則算法對疾病間相關性挖掘結果見表1。從227種疾病中挖掘出40條關聯規則。其中前項和后項的含義是若事件A存在的同時事件B存在,那么前項就是A,后項是B;支持度的含義是事件AB同時發生的實例占總案例的比例;置信度的含義是AB事件同時發生占事件A的比例。如第一條的意義是多發性腦梗死的患者同時患有高血壓的占總案例數的5.5%,多發性腦梗死患者中66.1%的人同時患有高血壓。其關聯的內在原因有待醫學專家進一步研究。

5結語

數據挖掘在醫學領域的應用前景十分廣闊,本文應用SPSS Modeler軟件,通過對某醫院2013年住院病案首頁數據的疾病相關性進行挖掘,給出了一個可行的關聯規則挖掘實施方案,挖掘出一些可能有價值的關聯規則。當數據量增大時,可能會從中挖掘出更多有價值的潛在聯系。以上挖掘出部分關聯可以為臨床診斷提供輔助參考,同時對于疾病預防、宣傳也有一定的積極作用。

參考文獻參考文獻:

[1]應振潭.數據挖掘技術在生源質量分析中的應用[J].軟件導刊,2009(8):172173.

[2]林獷.慢性腎小球腎炎的中醫癥狀證候藥物關聯規則挖掘的研究[D].成都:電子科技大學,2016.

[3]趙佳璐.基于關聯規則挖掘的出生缺陷預警系統的研究與實現[D].北京:北京郵電大學,2012.

[4]鄭傳生,蔡偉鴻.一種關聯規則挖掘算法及其在醫療信息挖掘中的應用[J].計算機與現代化,2007(7):1012.

[5]SAHOO J, DAS A K, GOSWAMI A. An efficient approach for mining association rules from high utility itemsets[J]. Expert Systems With Applications, 2015,42(13):57545778.

[6]AGRAWAL R, SRIKANT R. Mining sequential patterns[C]. IEEE Computer Society, 1995:314.

[7]P TANNA, Y GHODASARA. Using apriori with WEKA for frequent pattern mining[J]. International Journal of Engineering Trends and Technology, 2014,12(3):127131.

[8]國家衛生計生委辦公廳.住院病案首頁數據填寫質量規范(暫行)[R].北京:2016

[9]張文彤,鐘云飛.IBM SPSS數據分析與挖掘實戰案例精粹[D].北京:清華大學出版社,2013.

[10]季聰華,曹毅,張穎,等.基于SPSS Clementine軟件的關聯規則算法的應用[J].中醫藥管理雜志,2014(1):3133.

責任編輯(責任編輯:劉亭亭)

猜你喜歡
關聯規則
撐竿跳規則的制定
不懼于新,不困于形——一道函數“關聯”題的剖析與拓展
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
數獨的規則和演變
“一帶一路”遞進,關聯民生更緊
當代陜西(2019年15期)2019-09-02 01:52:00
規則的正確打開方式
幸福(2018年33期)2018-12-05 05:22:42
奇趣搭配
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規則對我國的啟示
主站蜘蛛池模板: 亚洲第一精品福利| 亚洲一级色| 亚洲五月激情网| 试看120秒男女啪啪免费| 国产欧美日本在线观看| 亚洲色成人www在线观看| 伊人久综合| 97亚洲色综久久精品| 一本大道香蕉久中文在线播放| 中文字幕欧美日韩| 欧美午夜在线播放| 久久久久国产一级毛片高清板| 精品视频一区在线观看| 国产网站免费看| 在线免费无码视频| 亚洲男人的天堂网| 久久精品电影| 国产在线精品99一区不卡| 亚洲 欧美 偷自乱 图片| 日韩视频精品在线| 黄色三级网站免费| 一区二区三区国产| 中文字幕在线播放不卡| 97se亚洲综合在线| 波多野结衣无码视频在线观看| 免费a级毛片视频| 人妻中文字幕无码久久一区| 自拍偷拍一区| 久久无码av一区二区三区| 国产成人综合日韩精品无码首页 | 综合色区亚洲熟妇在线| 亚洲日韩高清无码| 国产屁屁影院| 国产乱人激情H在线观看| 久久精品无码一区二区日韩免费| 91亚洲精选| 日韩av无码DVD| 中文字幕va| 中文字幕无码制服中字| 91青青草视频| 久久91精品牛牛| 国产成人精品亚洲日本对白优播| 啦啦啦网站在线观看a毛片| 亚洲精品国产综合99| 狠狠躁天天躁夜夜躁婷婷| 欧美日韩国产在线人| 国产成人91精品免费网址在线| 日本精品视频| 91蜜芽尤物福利在线观看| 蜜臀AV在线播放| 麻豆精品在线播放| 99在线免费播放| 亚洲品质国产精品无码| 亚洲欧洲日本在线| 在线亚洲精品福利网址导航| 国产成人av一区二区三区| 日韩在线播放中文字幕| 精品国产美女福到在线不卡f| 久无码久无码av无码| 久久精品视频一| 天天综合网亚洲网站| 蜜桃臀无码内射一区二区三区| 老司机精品99在线播放| 国产网友愉拍精品| 精品五夜婷香蕉国产线看观看| …亚洲 欧洲 另类 春色| 青青操视频在线| 无码av免费不卡在线观看| 国产成人高清精品免费软件| 自偷自拍三级全三级视频| 午夜久久影院| 国产精品播放| 色视频国产| 呦视频在线一区二区三区| 亚洲色欲色欲www网| 99国产精品国产| 国产欧美在线| 国产精品无码翘臀在线看纯欲| 伊伊人成亚洲综合人网7777| 无码久看视频| 精品无码一区二区三区电影| 真人免费一级毛片一区二区|