999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

R語言在關聯規則算法(Apriori)中的實現

2016-09-03 07:27:31劉靜頤朱桂玲云南大學
科學中國人 2016年23期
關鍵詞:關聯規則癥狀

劉靜頤,朱桂玲云南大學

R語言在關聯規則算法(Apriori)中的實現

劉靜頤,朱桂玲
云南大學

一、關聯分析的原理

關聯規則(Association):揭示數據之間的相互關系,而這種關系沒有在數據中直接表示出來。

關聯關系的任務就是發現事物之間的關聯規則或稱相關程度。關聯規則的一般形式是:如果A發生,則B有百分之C的可能發生。C稱關聯規則的置信度(Confidence)

利用關聯分析能尋找數據庫中大量數據的相關聯系或相互依賴性,如分析客戶在超市買牙刷的同時又買牙膏的可能性。

二、關聯規則算法

常用關聯規則算法見下表:

算法名稱Apriori FP-Tree灰色關聯度HotSpot算法描述一種最有影響的挖掘布爾關聯規則頻繁項集的算法,其核心是基于兩階段頻集思想的遞推算法針對Apriori算法的固有缺陷,J.Han等提出了不產生碗蕨頻繁項集的方法,FP-樹頻集算法以分析和確定各因素之間的影響程度或若干子因素(子序列)對主因素(母序列)的貢獻程度二進行的一種分析方法挖掘得到樹形結構顯示的感興趣的目標最大化/最小化的一套規則,最大化/最小化的利益目標變量/值。

在此我們只介紹Apriori?;镜乃惴ú襟E如下:(1)選出滿足支持度最小閾值的所有項集,即頻繁項集;(2)從頻繁項集中找出滿足最小置信度的所有規則。

三、R中Apriori的實現

在此數據分析中我們用兩個專用于關聯分析的軟件包——arules和arulesViz.

前一個用于關聯規則的數字化生成,而另一個arulesViz軟件包作為arules的擴展包,提供了關聯規則的可視化技術,使得關聯分析從算法運行到結果呈現一體化。

(一)相關函數

在R中實現Apriori算法,其核心函數為apriori(),來源于arules軟件包,函數基本格式為:

apriori(data,parameter=NULL,apprearance=NULL,control= NULL)

其中parameter參數可以對支持度(support)、置信度(Confi?dence0、沒個項集所含項數的最大最小值(maxlen/minlen),以及輸出結果(target)等重要參數進行設置。

參數appearance可以對先決條件X和關聯結果Y中具體包含哪些項進行限制。

Control參數則用來控制函數性能,如可以設定對項集進行升序(sort=1)還是降序(sort=-1)排序,是否向使用者報告進程(ver?bose=FALSE/TRUE)等

(二)數據提取和處理

R中提取數據如下:

1.數據整合

將數據轉化為疏散矩陣形式,有取1,無取0(疏散矩陣),之后將疏散矩陣轉化為apriori函數可用的數據結構。如下所示:

癥狀與中藥的關聯關系。

運用關聯算法時,我們先嘗試對apriori函數以最少的限制,來觀察它的輸出,再以此決定下一步操作。這里將支持度的最小閾值(minsup)設置為0.5,,置信度最小閾值(mincon)設為0.6,其他參數不進行設定取默認值,并將所得關聯規則名記為rules0,并使用inspect函數展示詳細的關聯規則,代碼如下所示:

在上述結果中,lhs列是關聯規則的左側,rhs列是關聯規則的右側,support、confidence、lift分別是支持度、信任度和提升度。

在兩參數共同調整過程中,如果更注重關聯項集在總體中所占的比例,則可以適當的多提高支持度,若是更注重規則本身的可靠性,則可多提高一些置信度值。

提升度表示在含有X的條件下同時含有Y的可能性與沒有這個條件下項集中含有Y的可能性之比,即在Y自身出現可能性P (Y)的基礎上,X的出現對于Y的“出鏡率”P(Y|X)的提升程度:

該指標與置信度同樣用于衡量規則的可靠性,可以看做置信度的一種互補指標。

當lift值為1時表示X與Y相互獨立,X對Y出現的可能性沒有提升作用,而其值越大(>1)則表明X對Y的提升程度越大,即表明關聯性越強。

由于上述理論知識,我們知道提升度可以說是關聯規則最可靠的指標,且得到的結論也是有用的,所以在設置參數時,我們依據lift只進行升序排序來選出最有用的幾條關聯規則。

規則一:{舌紅、生石膏、杏仁、甘草}=>{魚腥草}

規則二:{胸痛、舌紅、杏仁、甘草}=>{魚腥草}

規則三:{發熱、舌紅、杏仁、甘草}=>{魚腥草}

說明癥狀有舌紅和胸痛或發熱,服用過生石膏、杏仁、甘草的患者,之后會服用魚腥草。

癥狀與癥狀之間的關聯關系。

規則一:{胸痛、口渴、脈滑數}=>{苔黃}

規則二:{胸痛、口渴、咳黃(稠)粘痰}=>{苔黃}

規則三:{胸痛、口渴、咳黃(稠)粘痰、脈滑數}=>{苔黃}

說明有胸痛、口渴、咳黃(稠)粘痰、脈滑數的癥狀的,絕大可能性會出現苔黃的癥狀。

關聯規則的可視化。

1、癥狀與癥狀之間的關聯關系

按lift參數為a52和a47關聯強度最強,即苔黃和脈滑數的關聯強度最大,而從support參數(即按size大小來看)a4和a4關聯強度最大,這沒什么意思,a52和a4次之,即胸痛和脈滑數關聯強度最強。

2、癥狀與中藥之間的關聯關系

按lift參數(即按color顏色深度來看)為a52和c39關聯強度較強,即蘆根和脈滑數的關聯強度較大,而從support參數(即按size大小來看)a4和a11關聯強度最大,即胸痛和咳黃(稠)粘痰關聯強度最大。

劉靜頤,女,單位:云南大學(數學與統計學院),研究生,研究方向:科技統計。

猜你喜歡
關聯規則癥狀
Don’t Be Addicted To The Internet
保健醫苑(2022年1期)2022-08-30 08:39:40
撐竿跳規則的制定
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
數獨的規則和演變
可改善咳嗽癥狀的兩款藥膳
奇趣搭配
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規則對我國的啟示
主站蜘蛛池模板: 久久久91人妻无码精品蜜桃HD | 蜜芽一区二区国产精品| 波多野结衣在线一区二区| 国产在线视频福利资源站| 亚洲欧美人成电影在线观看| 欧美成人一区午夜福利在线| 亚洲无码A视频在线| 免费福利视频网站| a毛片免费观看| 午夜视频免费试看| 高清免费毛片| 97av视频在线观看| 美女被狂躁www在线观看| 国产交换配偶在线视频| 欧美激情视频二区| 欧美精品三级在线| 国产精品久久久久久搜索| 热久久综合这里只有精品电影| 在线高清亚洲精品二区| 久久精品中文字幕少妇| 亚洲天堂区| 国产亚洲欧美日韩在线一区| 2020极品精品国产| 无码高潮喷水专区久久| 在线观看免费国产| 丁香六月激情综合| 99久久精品无码专区免费| 国产成人禁片在线观看| 女人av社区男人的天堂| 成人亚洲天堂| 国产精品播放| 国产成人免费| 91口爆吞精国产对白第三集| 亚洲高清在线天堂精品| 色欲色欲久久综合网| a级毛片一区二区免费视频| 国产原创演绎剧情有字幕的| 美女无遮挡免费网站| 久久综合五月| 日韩二区三区无| 国产三区二区| 国产无人区一区二区三区| 一级爆乳无码av| 国产无码精品在线| 日韩精品一区二区三区免费| 国产午夜福利片在线观看| 国产成人av大片在线播放| 91精品啪在线观看国产91| 手机永久AV在线播放| 国产成人91精品| 国产丝袜无码精品| 国产精品浪潮Av| 久久国产精品77777| 黄色污网站在线观看| 国产亚洲美日韩AV中文字幕无码成人| 中文字幕不卡免费高清视频| 久久网综合| 午夜无码一区二区三区| 久久免费成人| 四虎影视8848永久精品| 日韩a级毛片| 91最新精品视频发布页| 99精品免费在线| 美女扒开下面流白浆在线试听 | 97一区二区在线播放| 亚洲免费毛片| 亚洲中文字幕av无码区| 国产精品美女网站| 中文国产成人精品久久| 国产精品网曝门免费视频| 在线看国产精品| 在线免费无码视频| 一级片一区| 中文成人在线视频| 高潮爽到爆的喷水女主播视频| 国产人成在线观看| 无码中文字幕乱码免费2| 欧美成a人片在线观看| 毛片手机在线看| 国内精品久久人妻无码大片高| 51国产偷自视频区视频手机观看 | 国产swag在线观看|