999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于粗糙集的數(shù)據(jù)挖掘算法研究

2018-12-24 15:06:05許曉燕三門峽職業(yè)技術學院
數(shù)碼世界 2018年7期
關鍵詞:數(shù)據(jù)挖掘規(guī)則

許曉燕 三門峽職業(yè)技術學院

引言:粗糙集理論是由波蘭著名數(shù)學家Pawlak Z所提出的,該理論在分析與表達不完整與不準確數(shù)據(jù)中非常適用,粗糙集理論是通過對一個或一組機構中所產(chǎn)生的信息數(shù)據(jù)進行測量與觀察,以實現(xiàn)對信息數(shù)據(jù)的分類,并從中找出數(shù)據(jù)所具備的某些特點、對象及過程等,以為認知科學與信息科學提供可靠的研究方法與全新的科學邏輯,其也是實現(xiàn)信息智能化處理的重要處理技術。通常來說,數(shù)據(jù)挖掘作為知識發(fā)現(xiàn)中的關鍵環(huán)節(jié),其是在某種約束的基礎上,通過數(shù)據(jù)發(fā)現(xiàn)與數(shù)據(jù)分析算法的應用,以從中找出特定模式。對數(shù)學挖掘進行研究的主要方法有回歸、分類、歸納及聚類等,正是由于數(shù)據(jù)挖掘中存在諸多不準確與不完整的數(shù)據(jù),這也使粗糙集理論成為數(shù)據(jù)挖掘中的重要方法之一。不過,由于大量數(shù)據(jù)的產(chǎn)生,使數(shù)據(jù)集也變得越來越復雜,僅僅采用粗糙集理論來對數(shù)據(jù)集進行分類,其結果的穩(wěn)定性與精度也往往較差,而且在交互驗證方面的能力較為欠缺,因此需要將其與其他方法進行結合應用才能取得更好的應用效果。為此,本文便針對上述不足,對基于粗糙集的數(shù)據(jù)挖掘算法進行了研究,并將決策樹與粗糙集結合起來,以提高數(shù)據(jù)挖掘算法的各方面性能。

1 粗糙集理論分析

粗糙集理論是以現(xiàn)有知識來劃分特定問題中的論域,并根據(jù)劃分后論域中各個組成對概念的支持程度來進行分類,這種支持程度包括肯定支持、不支持與可能支持。其通過上下限定域與邊界這三個近似集合來對上述三種支持程度進行表示。

1.1 粗糙集定義

在粗糙集理論中共包含三大定義,在第一定義中,論域由U進行表示,該論域屬于一個對象集合,在論域U上存在一個劃分R,由此可稱<U,R>是近似空間,當并且時,則任何滿足該條件的 ,其均為論域 中的等價關系,由此可判定為和P之間具備不可分辨關系,可利用 來對這種關系進行表示。當時,則 的下近似集與上近似集分別可表示為與,而X的邊界域則可表示成。在第二定義中,在某一知識系統(tǒng)中,可將其表示為 ,并且在該知識系統(tǒng)中,其對象集合、屬性集合以及屬性值集合分別由U、Ω與進行表示,各個滿足的均存在一個映射函數(shù),可由對其進行表示,對于來說,可將其表示為,其代表對象中第個屬性所具備的值。在第三定義中,可將論域U的分辨矩陣進行定義,使其表述為,而在該知識表述中的,可表示為,通過該分辨矩陣的定義,能夠對粗糙集Ind(Ω)進行轉換,使其成為M(Ω)。

1.2 粗糙集在數(shù)據(jù)挖掘中的知識表達

精糙集在數(shù)據(jù)挖掘的知識表達中,主要是通過決策系統(tǒng)來表達知識的,其也是數(shù)據(jù)挖掘中對知識進行表達的重要方式,可以說,決策系統(tǒng)自身便是一個包含有決定域的系統(tǒng)。設定,由 來表示決策知識系統(tǒng),即在 中包含有一個特定子集 ,該子集代表條件屬性集合,而在 中還包括一個特定子集 ,該子集可用來對決策屬性集合進行表示。在該決策系統(tǒng)中,可將其分辨矩陣進行定義,即其中可表示為決策系統(tǒng)中,當Ind(C,D)表示為時,其在該決策系統(tǒng)中具備不可分辨關系。在決策系統(tǒng)所包含的條件屬性C中,與其相對應的約減集則屬于非空子集,則相等,其約減可表示成,而全部約減集之間的交集則可表示為之間相等。

2 基于粗糙集的數(shù)據(jù)挖掘算法研究

在基于粗糙集的數(shù)據(jù)挖掘算法中,其挖掘數(shù)據(jù)庫中存在的規(guī)則需要通過以下步驟來實現(xiàn),第一步為預處理步驟,預處理能夠實現(xiàn)數(shù)據(jù)庫中所包含的初始數(shù)據(jù)與粗糙集之間的形式轉換,同時對決策與條件屬性進行確定;第二步為數(shù)據(jù)約減,通過對不可分辨矩陣的生成以得到相應的約減屬性集;第三步是挖掘規(guī)則,首先要根據(jù)約減屬性集來建立約減信息表,然后通過可信度閾值來對規(guī)則進行挖掘。基于粗糙集的數(shù)據(jù)挖掘算法共分為兩種,第一種為分辨矩陣生成算法,該算法將 輸入到數(shù)據(jù)庫當中,以使初始數(shù)據(jù)和粗糙集進行形式轉換,進而輸出相應的分辨矩陣,即 。該算法共分為六步,第一步是將 進行轉換,從而得到一個維度為 的空屬性集矩陣;第二步是根據(jù)得出的空屬性集矩陣來生成分辨矩陣,并由分辨矩陣得到 ;第三步是對分辨矩陣進行求核,如果 ,在 中添加 ;第四步是把包含 的矩陣進行元素置空;第五步是得出矩陣中次數(shù)出現(xiàn)最多的屬性,用 來表示該屬性,然后將其添加到 當中,并將矩陣中包含的 屬性進行元素置空;第六步是假如 不等于 ,則需要返回到第五步中進行求核,如果相等,則算法結束。第二種為規(guī)則挖掘算法,該算法的輸入內(nèi)容包括可信度的閾值,由 來對該閾值進行表示,此外輸入內(nèi)容還包括條件屬性。規(guī)則挖掘算法的最終輸出為規(guī)則集。規(guī)則挖掘算法在應用過程中共分為三個步驟,第一步是將條件屬性 作為輸入條件;第二步是在 中獲得和C1屬性相一致的元素,并對元素的數(shù)量進行統(tǒng)計,由N代表元素數(shù)量,然后找到和屬性D與C1均一致的元素,并對元素數(shù)量進行統(tǒng)計,由M代表元素數(shù)量;第三步是如果劃分大小與N之間的商比可信度閾值高,并且挖掘出的規(guī)則不處于規(guī)則表中,則對該規(guī)則進行輸出。

決策系統(tǒng)通過計算能夠生成該系統(tǒng)的分辨矩陣,通過該分辨矩陣能夠得出 與 相等,并以約減作為出發(fā)點,以此衍生出相應的節(jié)點,并通過決策系統(tǒng)將各個節(jié)點中滿足 的節(jié)點規(guī)則進行記錄,然后將其存儲到規(guī)則集當中。粗糙理論是根據(jù)等價關系來生成近似空間的,在該近似空間中所包含的上近似集與下近似集能夠為人們在找出確定與不確定區(qū)域中帶來幫助,從而使該理論能夠適用于數(shù)據(jù)挖掘工作中。

3 基于粗糙集的數(shù)據(jù)挖掘算法的優(yōu)劣勢及解決策略

通過上述分析可知,基于粗糙集的數(shù)據(jù)挖掘算法是利用等價關系來對集合中的對象實施分類的,通過對集合進行某種形式的劃分,以使其能夠和等價關系相對應,并根據(jù)等價類粒度來進行信息處理,從而使信息得到簡化。基于粗糙集的數(shù)據(jù)挖掘算法在應用方面具備以下優(yōu)勢,其一,其可通過固定算法來對問題進行表達與解決,并且能夠通過軟計算的方式來對不確定、不完整與不精確的數(shù)據(jù)進行處理,從而使算法具備成本低與魯棒性強的優(yōu)勢;其二,基于粗糙集的數(shù)據(jù)挖掘算法不需預先提供某種屬性或特征來進行數(shù)學描述,其能夠對問題所具備的潛在規(guī)律進行直接挖掘,同時其在不確定性問題的描述方面較為客觀;其三,基于粗糙集的數(shù)據(jù)挖掘算法能夠適用于各種確定與不確定的數(shù)據(jù)分析,并且能夠對不完整與不精確的多變量數(shù)據(jù)進行分析,使數(shù)據(jù)得到簡化的同時,找出數(shù)據(jù)中存在的知識與推理決策規(guī)則,其數(shù)學意義非常清晰;其四,基于粗糙集的數(shù)據(jù)挖掘算法是對不確定性與模糊性問題進行處理的重要工具,其能夠通過上下近似集差來對問題的不確定性進行描述,并且能夠計算含糊元素的數(shù)量,有效降低了算法的隨意性。雖然粗糙集的數(shù)據(jù)挖掘算法具備非常明顯的應用優(yōu)勢,但其自身也存在一定的不足,隨著數(shù)據(jù)量的不斷增長,決策表規(guī)模也不斷擴大,僅僅通過粗糙集的應用是難以滿足各種類型數(shù)據(jù)集處理的,而且采用粗糙集理論來對數(shù)據(jù)進行挖掘后分類,其分類結果常常是確定的,這也使算法的交互驗證能力較差,造成數(shù)據(jù)挖掘的結果穩(wěn)定性較差,精度較低。因此,需要在基于粗糙集的數(shù)據(jù)挖掘算法中引入其他方法來對該問題進行解決。

4 基于粗糙集與決策樹結合的數(shù)據(jù)挖掘算法

為了解決基于粗糙集的數(shù)據(jù)挖掘算法交互驗證能力差、結果穩(wěn)定性不足、精度較低的問題,需要將決策樹引入到該算法當中,以使粗糙集理論能夠和決策樹進行結合應用,決策樹作為一種歸納推理算法,其在各個領域中的應用十分廣泛,決策樹的分類精度較高,并且其構造也較為簡單,非常適用于噪聲數(shù)據(jù)的處理,同時考慮到單變量決策樹往往具備較大的規(guī)模,處理全部的數(shù)據(jù)集是無法實現(xiàn)的,因此需要通過多變量決策樹來降低決策樹的規(guī)模,以使分類精度得到相應的提高。具體實施如下:首先是對決策表進行預處理,采用基于粗糙集的數(shù)據(jù)挖掘算法來對數(shù)據(jù)集進行屬性約減,以使冗余屬性得以清除,進而使決策表的維度降低,然后通過聚類技術的應用來劃分等價類對象,以使同組對象的相似性更大,并從各個組中提取一個對象當作處理樣本,以使數(shù)據(jù)量減少,然后將屬性作為權重,并引入到相似度求解公式中,這樣能夠使數(shù)據(jù)對象具備更高的相似度,此外,還需要將屬性集的重要程度當作決策樹中節(jié)點的衡量標準,并將兩等價類之間的相對泛化當作決策樹中節(jié)點檢驗的標準,同時確保各個節(jié)點的屬性個數(shù)不能超過兩個。

5 結束語

綜上所述,本文通過對粗糙集理論進行分析,明確了粗糙集的定義及其知識表達,并對基于粗糙集的數(shù)據(jù)挖掘算法進行了深入的研究,闡述了粗糙集理論在數(shù)據(jù)挖掘算法中的具體應用,分析了其應用的可行性,在此基礎上分析了基于粗糙集的數(shù)據(jù)挖掘算法的優(yōu)勢與不足,并針對其不足之處提出了相應的解決策略,通過粗糙集與決策樹兩種方法的結合來進行數(shù)據(jù)挖掘,不僅能夠改善數(shù)據(jù)挖掘算法的交互驗證能力,還能提高數(shù)據(jù)挖掘結果的精度與穩(wěn)定性,從而使基于粗糙集的數(shù)據(jù)挖掘算法更能滿足人們的數(shù)據(jù)挖掘需求。

猜你喜歡
數(shù)據(jù)挖掘規(guī)則
撐竿跳規(guī)則的制定
數(shù)獨的規(guī)則和演變
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
規(guī)則的正確打開方式
幸福(2018年33期)2018-12-05 05:22:42
讓規(guī)則不規(guī)則
Coco薇(2017年11期)2018-01-03 20:59:57
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
TPP反腐敗規(guī)則對我國的啟示
數(shù)據(jù)挖掘技術在中醫(yī)診療數(shù)據(jù)分析中的應用
搜索新規(guī)則
一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
主站蜘蛛池模板: 久久毛片网| 人妻精品全国免费视频| 无码 在线 在线| 97se亚洲综合不卡 | 亚洲日韩高清在线亚洲专区| 综合色区亚洲熟妇在线| 亚洲日韩在线满18点击进入| 中文字幕av一区二区三区欲色| 中文字幕在线观看日本| 爆乳熟妇一区二区三区| 国产91小视频| 天天综合亚洲| 色老二精品视频在线观看| 中美日韩在线网免费毛片视频| 宅男噜噜噜66国产在线观看| 国产99免费视频| 无码中文字幕加勒比高清| 毛片免费观看视频| 久久国产精品嫖妓| 毛片手机在线看| 国产欧美性爱网| 天天摸天天操免费播放小视频| 最新日韩AV网址在线观看| 国产女主播一区| 国产男女免费完整版视频| 亚洲热线99精品视频| 夜夜操天天摸| 99在线视频精品| 99热线精品大全在线观看| 国产中文一区a级毛片视频| 88国产经典欧美一区二区三区| 日本一区二区不卡视频| 欧美一区二区精品久久久| 婷婷综合色| 欧美视频在线播放观看免费福利资源| 人妻少妇久久久久久97人妻| 国产视频大全| 无码粉嫩虎白一线天在线观看| 成人va亚洲va欧美天堂| 久久亚洲黄色视频| 欧美另类第一页| 中文字幕在线永久在线视频2020| 特级aaaaaaaaa毛片免费视频| 亚洲国产精品人久久电影| 91美女视频在线观看| 精品一区二区三区波多野结衣| 国产99免费视频| 毛片久久久| 欧美成人一级| 999国内精品久久免费视频| 免费观看亚洲人成网站| 谁有在线观看日韩亚洲最新视频| 国产主播在线观看| 亚洲国产第一区二区香蕉| 免费国产福利| 99999久久久久久亚洲| 久久综合婷婷| 国产成人你懂的在线观看| 一本二本三本不卡无码| 亚洲第一黄片大全| 另类专区亚洲| 久久伊人久久亚洲综合| 尤物亚洲最大AV无码网站| 亚洲一级毛片| 亚洲系列无码专区偷窥无码| 日韩精品免费一线在线观看| 亚洲侵犯无码网址在线观看| 亚洲精品777| 日本成人一区| 日韩av高清无码一区二区三区| 国产精品hd在线播放| 久久久噜噜噜| 免费在线国产一区二区三区精品| 久久久受www免费人成| 国产精品久久久久久久伊一| 性喷潮久久久久久久久| 亚洲第一成网站| 亚洲91在线精品| 日韩av无码DVD| 99re在线视频观看| 午夜福利网址| 久久黄色小视频|