999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于R語言的關聯規則應用實例

2018-04-09 01:13:37
福建質量管理 2018年6期
關鍵詞:關聯規則數據庫

(四川大學 四川 成都 610000)

一、關聯規則

關聯規則是美國IBM Almaden Research Center Rakeesh Agrawal等人于1993年首先提出來的KDD研究的一個重要課題。關聯規則挖掘本質是從大量的數據中或對象間抽取關聯性,它可以揭示數據間的依賴關系,根據這種關聯性就可以從某一數據對象的信息來推斷另一個的信息。

二、關聯規則在股票市場中的應用

在證券交易市場中,每天都有以交易行情為主的大量數據匯入數據庫。如果把同一天股票的上升(或下降)事件看成是被放入同一個貨籃的貨物,那么一個時期的股票交易數據就會形成多個貨籃數據。既然可以挖掘出規則:“如果一個貨籃中有嬰兒紙尿布,那么該貨籃中有啤酒的概率是80%”,也可以挖掘出同一時期內股票上升(或下跌)的聯動規則。Apriori 算法恰好是解決這類問題的有效方法,但是,由于股票行情數據是以時間序列方式存儲在數據庫中,無法直接用Apriori 算法進行數據挖掘;要在股票行情數據庫中挖掘出根據時間而前后聯動的關聯規則,需要在貨籃數據中多引入一個參數:時間間隔。

另外,為了提高挖掘過程的有效性,還應確定目標關聯規則(即元規則)的形式。根據上面給出的用戶感興趣的規則形式:“T時間內,當A股票價格上漲時,B股票價格也會隨之上漲”。所以我們主要關心的是股票交易的時間和漲跌幅,其他如開盤價、成交量等可以認為是一些無關信息。

(一)數據來源

本文從國泰君安數據庫中選取從2016年8月至2017年8月所有交易日下編號靠前的部分股票作為測試樣本,以探求關聯規則在股票市場中的應用,剔除停盤日后初始下載樣本數為52109條。

(二)數據預處理

1.導入數據

首先,我們將包含編號(gtacode)、股票名稱(Title)、交易日期(accpertime)、開盤價(Opnprc_JY)、收盤價(Clsprc_JY)和漲跌幅在內的原始數據通過txt的形式導入到R語言中。

>setwd(“/Users/zhongzhong/Documents”)

>mydata

導入數據后,使用View(mydata)將會在軟件中顯示出所導入的數據。

2.數據的檢驗

(1)缺失值

①識別缺失值

我們首先用is.na()函數識別數據中的缺失值。

②探究缺失值

然后我們用sum(is.na())函數計算上海這個數據框中缺失值的數目,得到為1。

(2)錯誤值

除了缺失值以外,我們還需要檢驗數據中有沒有不符合實際的情況,比如漲跌幅中不可能有超過+10%和-10%的股票。經檢驗,沒有出現這種情況。

(3)變量類型

在數據錄入過程中,我們通過str()函數發現gtacode為數值型(int),Title和時間為(Factor),其余都為類別型(chr),所有在后面的數據清理當中需要進行類型的轉換。

3.數據的清理

(1)缺失值的處理

通過na.omit()移除所有含有缺失值的觀測,使得數據中不再含有缺失值。

(2)類型的轉換

通過as.character()對Title進行轉換為字符型,然后通過as.Data()對時間進行轉換。

4.數據的規整

考慮到主要關鍵信息是股票交易的時間和漲跌幅,所以只篩選出編號、時間和漲幅三列有效數據:

>mydata<-mydata[,c(1,3,6)]

為了清晰明了的挖掘出用戶感興趣的規則形式:“T時間內,當A股票價格上漲時,B股票價格也會隨之上漲”,我們首先設定出一個時間間隔,同時限定最小漲幅來減少工作量。

定義1 設最小漲幅Zmin,|Zmin|<10%

定義2 設過票交易集T={T1,T2,…,Ts},其中T1=2016-08-02,Ts=2017-08-02

按最小漲幅篩選之后,可以由下圖看到,之前5萬多條數據驟減到了1345條,故時間段上我們將不做篩選調整,保留一年交易日的數據:

>mydata1<-subset(mydata,漲跌幅>=0.05)

>view(mydata1)

5.apriori算法運用

這樣之后,我們將mydata1讀出為txt格式,為后面讀入成transactions數據格式做準備。然后使用read.transactions函數轉換成事務型數據,可以利用dim(trans)和summary(trans)來查看數據集的基本情況。

圖1 apriori算法代碼展示

上圖得到前五個item的支持度分別為0.10169492、0.10169492、0.09322034、0.08898305、0.08898305。

這里我們所做的是在生成規則:知道了頻繁項集,過濾掉非頻繁項集,并找出第一步的頻繁項集中的規則:

>sum(itemFreq)

>trans[size(trans)>1]

>myrules=apriori(trans,parameter=list(support=0.01,confidence=0.1,minlen=2,maxlen=20,target=“rules”))

接下來我開始使用apriori算法生成一條關聯規則myrules如上圖:支持度為0.01,置信度為0.1,這里的minlen和maxlen是指規則的LHS+RHS的并集的元素個數,具體的規則顯示在下圖中。

圖2 apriori算法顯示

從返回結果中看,可以看到總共有1299條規則生成。同時,有236條交易記錄的transaction,225個商品item等信息。然后使用summary(myrules)可以查看規則匯總信息如下,包括每個籃子(交易)中含有的股票數目以及支持度、置信度的最小值、最大值和中位數等信息。

圖3 規則匯總信息

第一部分:規則的長度分布:就是minlen到maxlen之間的分布。如上例,len=2有492條規則,len=3有372條規則…

第二部分:quality measure的統計信息

第三部分:挖掘的相關信息。

了解了這些信息以后,我們所最關心的就是具體規則了,使用inspect()函數進行查看具體的規則,下面我們先展現前十條規則:

圖4規則的具體展示

三、相關結果

本文選擇了國泰安數據庫中的部分股票進行關聯規則的應用實驗分析,得到了許多有意義的規則。如上圖,在支持度為1%,置信度為10%的條件下,代碼為000026和000678的兩只股票有同時上漲的趨勢,在上述挖掘結果的基礎上,我們可以進行二次挖掘,進一步分析各支股票之間趨勢變化的周期性和多維相似性等,得到更多有用的結果。

【參考文獻】

[1]Usama Fayyad,Gregpru Oatesdu-Shapiro,Padhraic Smyth,RAMASACY UTHURU SAMYMY,ETAL.Advances in Knowledge Discovery and Data Mining[M].AAAI Press/The MIT Press,1996.

[2]Gregory Piatesdy-Shapiro,Willam J Frawley,Editors.Knowledge Discovery in Databases[M].AAAI Press,1991.

[3]陸麗娜,陳亞萍,揚麥順,等.挖掘關聯規則算法的優化處理[J].計算機工程與應用,2000,(8):99~102.

[4]鄭朝霞,劉延建.關聯規則在股票分析中的應用[J].成都大學學報,2002,(12),46-49.

猜你喜歡
關聯規則數據庫
撐竿跳規則的制定
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
數獨的規則和演變
奇趣搭配
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
數據庫
財經(2017年2期)2017-03-10 14:35:35
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規則對我國的啟示
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
主站蜘蛛池模板: 国产无遮挡猛进猛出免费软件| 久久永久精品免费视频| 国产高清又黄又嫩的免费视频网站| 国产一级二级三级毛片| 最近最新中文字幕免费的一页| 精品国产成人国产在线| 国产成人91精品| 免费精品一区二区h| 国产精品免费p区| A级毛片无码久久精品免费| 国产精品久久精品| 久久夜色精品| 一级黄色欧美| a毛片在线免费观看| 日本在线亚洲| 青青久久91| 欧美色视频日本| 欧美精品xx| 99国产精品国产| a国产精品| 精品色综合| 91小视频版在线观看www| 嫩草影院在线观看精品视频| www成人国产在线观看网站| 69视频国产| 人人爱天天做夜夜爽| 亚洲天堂777| 无码人中文字幕| 久久免费看片| 18禁不卡免费网站| 国产成人综合日韩精品无码不卡| 人妻中文字幕无码久久一区| 欧美日本一区二区三区免费| 国产一级裸网站| 欧美亚洲激情| 在线欧美a| 手机在线看片不卡中文字幕| 高清无码手机在线观看| 国产av一码二码三码无码| 十八禁美女裸体网站| 在线观看国产精美视频| 亚洲av无码牛牛影视在线二区| 欧美一区二区三区香蕉视| 精品视频一区在线观看| www.99在线观看| 中文精品久久久久国产网址| 亚洲 成人国产| 国产一级毛片高清完整视频版| 麻豆国产精品视频| 亚洲欧美在线综合一区二区三区| 天天婬欲婬香婬色婬视频播放| 亚洲一区二区三区麻豆| 久久国产热| 人妻夜夜爽天天爽| a在线亚洲男人的天堂试看| 国产免费黄| 国产美女人喷水在线观看| A级毛片无码久久精品免费| 国产av剧情无码精品色午夜| 国产性生大片免费观看性欧美| 亚洲色图在线观看| 婷婷色在线视频| 综合五月天网| 久热这里只有精品6| 免费亚洲成人| 国产精品亚洲一区二区三区在线观看| 少妇人妻无码首页| 欧美天天干| 九九九精品视频| 欧美日韩精品一区二区视频| 国产免费自拍视频| 午夜啪啪福利| 2021国产v亚洲v天堂无码| 2020国产在线视精品在| 国产成人永久免费视频| 免费精品一区二区h| 妇女自拍偷自拍亚洲精品| 欧美日韩国产一级| 免费中文字幕一级毛片| 国产欧美精品午夜在线播放| 国产精品成人久久| 亚洲娇小与黑人巨大交|