999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

決策樹算法及其改進

2014-11-10 14:37:32蔡星
科技創新導報 2014年12期
關鍵詞:數據挖掘

蔡星

摘 要:該文對傳統的C4.5決策樹數據挖掘算法進行了改進,提出了一種雙重熵平均決策樹算法。傳統的C4.5決策樹算法易出現無意義分枝,過度擬合等問題,針對該類問題,基于雙重熵平均決策樹算法,通過兩次對樣本子集熵平均值的計算、排序、合并處理,得到修正后的屬性信息增益,并以此作為屬性選擇的依據,從而解決了傳統C4.5決策樹算法可解釋性差、易產生碎片等問題。

關鍵詞:C4.5決策樹 算法 熵 平衡因子

中圖分類號:TP311.13 文獻標識碼:A 文章編號:1674-098X(2014)04(c)-0040-02

數據聯機分析功能是通過對數據的處理發現已知要素與分析度量值之間的關系,而數據挖掘則是從大量的數據中發現隱藏的規律。數據挖掘包括多種挖掘算法,為了研究畢業生不同屬性與其就業狀況之間的潛在知識和規律,該文采用決策樹方法對高校畢業生數據進行分析,主要選用的是C4.5決策樹算法。

1 C4.5算法思想

決策樹的優點在于原理簡單,發現知識較快;計算較為簡單,運算速度較快,對于訓練數據的處理和待決策數據的處理效率相對較高;適用于大量數據的綜合處理,有利于挖掘數據中的重要屬性;最終得到的挖掘結果是有意見的規則,有利于用戶的理解。決策樹的主要缺點包括:對數據的時間屬性較為敏感,需要大量的預處理工作;對于非離散的連續性數據值處理效率和準確率不佳;易出現過度擬合的情況,產生大量的決策分支,導致決策規則過于龐大。

C4.5決策樹算法是決策樹算法的主流,它繼承于傳統的ID3算法,繼承了其優勢,改進了其缺點。但C4.5決策樹算法依然存在著較多的問題,其中最為突出的是過度擬合情況,以及決策準確性方面的問題。針對上述問題,本課題提出了一種改進的C4.5決策樹算法,在算法構建過程中,以樹分枝的信息熵為研究對象,將熵值較高的部分和熵值較低的部分進行合并和平衡處理,從而達到減少決策樹分支數量的目的;與此同時,考慮到C4.5算法在決策分支的確定過程中采用的是局部最優的方法,在準確性方面從整體上看有所欠缺,所以引入了了平衡因子控制算法的整體最優化性。

C4.5決策樹算法設研究對象數據集為,該數據集中包括個類別,每一個類別表示為,選取該數據集中的一個屬性數據,則可以被劃分為多個子集,設有個取值,則被劃分的子集可表示為。設為的例子總數,而為的例子數,為的例子總數,是的所有例子中所包括的的例子數,基于上述的設定,則可以得到如下定義:

(1)類別在出現的概率如式(1)所示:

(1)endprint

摘 要:該文對傳統的C4.5決策樹數據挖掘算法進行了改進,提出了一種雙重熵平均決策樹算法。傳統的C4.5決策樹算法易出現無意義分枝,過度擬合等問題,針對該類問題,基于雙重熵平均決策樹算法,通過兩次對樣本子集熵平均值的計算、排序、合并處理,得到修正后的屬性信息增益,并以此作為屬性選擇的依據,從而解決了傳統C4.5決策樹算法可解釋性差、易產生碎片等問題。

關鍵詞:C4.5決策樹 算法 熵 平衡因子

中圖分類號:TP311.13 文獻標識碼:A 文章編號:1674-098X(2014)04(c)-0040-02

數據聯機分析功能是通過對數據的處理發現已知要素與分析度量值之間的關系,而數據挖掘則是從大量的數據中發現隱藏的規律。數據挖掘包括多種挖掘算法,為了研究畢業生不同屬性與其就業狀況之間的潛在知識和規律,該文采用決策樹方法對高校畢業生數據進行分析,主要選用的是C4.5決策樹算法。

1 C4.5算法思想

決策樹的優點在于原理簡單,發現知識較快;計算較為簡單,運算速度較快,對于訓練數據的處理和待決策數據的處理效率相對較高;適用于大量數據的綜合處理,有利于挖掘數據中的重要屬性;最終得到的挖掘結果是有意見的規則,有利于用戶的理解。決策樹的主要缺點包括:對數據的時間屬性較為敏感,需要大量的預處理工作;對于非離散的連續性數據值處理效率和準確率不佳;易出現過度擬合的情況,產生大量的決策分支,導致決策規則過于龐大。

C4.5決策樹算法是決策樹算法的主流,它繼承于傳統的ID3算法,繼承了其優勢,改進了其缺點。但C4.5決策樹算法依然存在著較多的問題,其中最為突出的是過度擬合情況,以及決策準確性方面的問題。針對上述問題,本課題提出了一種改進的C4.5決策樹算法,在算法構建過程中,以樹分枝的信息熵為研究對象,將熵值較高的部分和熵值較低的部分進行合并和平衡處理,從而達到減少決策樹分支數量的目的;與此同時,考慮到C4.5算法在決策分支的確定過程中采用的是局部最優的方法,在準確性方面從整體上看有所欠缺,所以引入了了平衡因子控制算法的整體最優化性。

C4.5決策樹算法設研究對象數據集為,該數據集中包括個類別,每一個類別表示為,選取該數據集中的一個屬性數據,則可以被劃分為多個子集,設有個取值,則被劃分的子集可表示為。設為的例子總數,而為的例子數,為的例子總數,是的所有例子中所包括的的例子數,基于上述的設定,則可以得到如下定義:

(1)類別在出現的概率如式(1)所示:

(1)endprint

摘 要:該文對傳統的C4.5決策樹數據挖掘算法進行了改進,提出了一種雙重熵平均決策樹算法。傳統的C4.5決策樹算法易出現無意義分枝,過度擬合等問題,針對該類問題,基于雙重熵平均決策樹算法,通過兩次對樣本子集熵平均值的計算、排序、合并處理,得到修正后的屬性信息增益,并以此作為屬性選擇的依據,從而解決了傳統C4.5決策樹算法可解釋性差、易產生碎片等問題。

關鍵詞:C4.5決策樹 算法 熵 平衡因子

中圖分類號:TP311.13 文獻標識碼:A 文章編號:1674-098X(2014)04(c)-0040-02

數據聯機分析功能是通過對數據的處理發現已知要素與分析度量值之間的關系,而數據挖掘則是從大量的數據中發現隱藏的規律。數據挖掘包括多種挖掘算法,為了研究畢業生不同屬性與其就業狀況之間的潛在知識和規律,該文采用決策樹方法對高校畢業生數據進行分析,主要選用的是C4.5決策樹算法。

1 C4.5算法思想

決策樹的優點在于原理簡單,發現知識較快;計算較為簡單,運算速度較快,對于訓練數據的處理和待決策數據的處理效率相對較高;適用于大量數據的綜合處理,有利于挖掘數據中的重要屬性;最終得到的挖掘結果是有意見的規則,有利于用戶的理解。決策樹的主要缺點包括:對數據的時間屬性較為敏感,需要大量的預處理工作;對于非離散的連續性數據值處理效率和準確率不佳;易出現過度擬合的情況,產生大量的決策分支,導致決策規則過于龐大。

C4.5決策樹算法是決策樹算法的主流,它繼承于傳統的ID3算法,繼承了其優勢,改進了其缺點。但C4.5決策樹算法依然存在著較多的問題,其中最為突出的是過度擬合情況,以及決策準確性方面的問題。針對上述問題,本課題提出了一種改進的C4.5決策樹算法,在算法構建過程中,以樹分枝的信息熵為研究對象,將熵值較高的部分和熵值較低的部分進行合并和平衡處理,從而達到減少決策樹分支數量的目的;與此同時,考慮到C4.5算法在決策分支的確定過程中采用的是局部最優的方法,在準確性方面從整體上看有所欠缺,所以引入了了平衡因子控制算法的整體最優化性。

C4.5決策樹算法設研究對象數據集為,該數據集中包括個類別,每一個類別表示為,選取該數據集中的一個屬性數據,則可以被劃分為多個子集,設有個取值,則被劃分的子集可表示為。設為的例子總數,而為的例子數,為的例子總數,是的所有例子中所包括的的例子數,基于上述的設定,則可以得到如下定義:

(1)類別在出現的概率如式(1)所示:

(1)endprint

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 国产精品久久自在自线观看| 伊人色天堂| 久久美女精品| 亚洲a免费| 日韩少妇激情一区二区| 亚洲天堂高清| 亚洲国产精品无码AV| 国产精品99久久久久久董美香| 91亚洲精品第一| 亚洲自偷自拍另类小说| 97视频在线精品国自产拍| 第九色区aⅴ天堂久久香| 另类综合视频| 国产精品第一区| 亚洲综合久久一本伊一区| 91娇喘视频| 色噜噜狠狠狠综合曰曰曰| 老色鬼欧美精品| www.亚洲色图.com| 欧美日韩中文国产| 91丨九色丨首页在线播放| 91丝袜美腿高跟国产极品老师| 免费看美女毛片| 国产精品无码作爱| 欧美成人日韩| 国产小视频a在线观看| 久久国产精品夜色| 国产aⅴ无码专区亚洲av综合网 | 婷婷99视频精品全部在线观看| 日韩亚洲综合在线| 特级毛片8级毛片免费观看| www亚洲天堂| 日韩美一区二区| 国产噜噜噜视频在线观看 | 91久久国产热精品免费| 精品99在线观看| 亚洲精品视频免费看| 天天综合色网| 亚洲av无码专区久久蜜芽| 国产无码精品在线播放| 国产精品网址在线观看你懂的| 国产欧美日本在线观看| 免费日韩在线视频| 天堂成人av| 欧美国产日韩一区二区三区精品影视| 亚洲制服丝袜第一页| 欧美精品H在线播放| 中文字幕永久视频| 久草视频福利在线观看| 在线精品欧美日韩| 亚洲一区二区三区中文字幕5566| 免费国产小视频在线观看| 91热爆在线| 亚洲欧美国产高清va在线播放| 亚洲精品黄| 国产高清又黄又嫩的免费视频网站| 日韩成人高清无码| 国产成年女人特黄特色毛片免| 国产av无码日韩av无码网站| 亚洲有码在线播放| 亚洲一区二区三区国产精华液| 国产乱码精品一区二区三区中文| 久久精品一卡日本电影| 丁香五月婷婷激情基地| 91精品国产丝袜| 久久99国产乱子伦精品免| 久久美女精品| 国产在线视频欧美亚综合| 福利小视频在线播放| a毛片基地免费大全| 欧类av怡春院| 成人在线欧美| 久久久久人妻一区精品色奶水| 视频一区视频二区日韩专区| 中文字幕自拍偷拍| 久久精品只有这里有| 国产真实二区一区在线亚洲| 中文字幕啪啪| 伊人91视频| 色婷婷国产精品视频| 72种姿势欧美久久久久大黄蕉| 午夜无码一区二区三区在线app|