999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于灰狼優(yōu)化的隨機森林模型的研究

2022-04-22 08:08:04范昊東
電子測試 2022年6期
關鍵詞:分類優(yōu)化模型

范昊東

(黑龍江科技大學,黑龍江哈爾濱,150022)

0 引言

隨機森林是一種組合分類器技術。既可以用于處理分類、回歸問題,也適用于降維問題。隨機森林對噪音有很好的容忍度且不易出現(xiàn)過擬合,穩(wěn)健性強。隨機森林算法中采用的bootstrap重采樣技術是有放回的隨機采樣,即從原始的訓練樣本集中隨機有放回地抽取與其等數(shù)量的樣本組成1個采樣集,重復n輪得到n個相互獨立的采樣集;然后利用每個采樣集分別生成決策樹,n個決策樹共同構成森林。即把多個決策樹的預測組合成一個模型。

由于隨機森林算法中存在的一些問題,為了改進隨機森林算法國內外學者們提出了很多方案,孫光民[1]通過優(yōu)化群投票原理,使用分類與回歸樹進行預測,將預測結果從小到大排序,只取中間較好的CART用于最終的預測,縮短運算時間,減少預測誤差。Mashayekhi等[2]基于爬山策略的貪婪方法,增刪決策樹來保證隨機森林的多樣性。Ishwaran等[3]通過引入生存樹的概念,提出隨機生存森林算法,構建生存函數(shù),生成分析樹的內容和預測結果進行綜合,提高其分類的性能。薛銘龍等[4]通過設置不同的懲罰項因子可以在訓練隨機森林中生成結構不同的決策樹。

上述改進算法均能有效提升分類精度,但改變決策樹的結構,會增加算法的復雜性。增刪決策樹,雖然計算簡單,但會導致隨機森林陷入局部最優(yōu)。所以需要一種簡單高效的方法來計算出決策樹間的相關性,豐富隨機森林的多樣性,進而提升隨機森林的分類精度。為解決上述隨即森林的問題,本文提出了一種基于狼群優(yōu)化算法優(yōu)化的隨機森林模型,通過迭代優(yōu)化決策樹棵數(shù)、剪枝閾值等參數(shù)來實現(xiàn)對隨機森林模型的優(yōu)化。

1 隨機森林模型及其優(yōu)化

1.1 隨機森林模型

隨機森林算法中采用的bootstrap重采樣技術是一種有放回的隨機采樣,從原始的訓練樣本集中隨機有放回地抽取與其等數(shù)量的樣本組成1個采樣集,重復n輪得到n個相互獨立的采樣集;然后利用每個采樣集分別生成決策樹,這n個決策樹連接形成“森林”。即由多個決策樹的預測組合成的模型。

本文選用隨機森林作為分類器,隨機森林的學習過程可以用以下步驟描述:

(1)首先重采樣采用Bootstrap方法,隨機產生m個訓練子集。

(2)然后基于劃分好的訓練子集生成對應的決策樹。從特征變量中隨機選擇部分特征組成特征子集,在其中選取最優(yōu)特征作為決策樹節(jié)點的分裂屬性。

(3)最后采用投票的方法集成各決策樹對訓練子集的預測結果,將m個決策樹中輸出最多的類別作為測試集樣本所屬的類別。

隨機森林是讓每一棵決策樹進行分類,然后取所有決策樹中分類結果最多的那類作為最終的結果。因此是一個包含多個決策樹的分類器,并且其輸出的類別是由個別樹輸出的類別的眾數(shù)而定。該模型的優(yōu)點包括對高維數(shù)據(jù)無需提前進行特征選擇、有效克服單一預測器易陷入過擬合。隨機森林模型的實質是一個有許多棵互不相關決策樹的分類器。所有決策樹都采用Bootstrap方法進行采樣,從所有的決策屬性中隨機挑選出幾個屬性進行分類。訓練完成后,當測試樣本輸入時,每棵決策樹均對測試樣本進行分類,通過投票的方法來決定測試樣本的最終分類結果。

2 隨機森林模型及其優(yōu)化

隨機森林與傳統(tǒng)決策樹算法不同,其具有不剪枝也能避免數(shù)據(jù)過擬合的特點,同時具有較快的訓練速度,且參數(shù)調整簡單,在默認參數(shù)下即具有較好的回歸預測效果[5-6]。以上算法中,剪枝閾值、決策樹棵數(shù)、預測試樣本數(shù)等參數(shù)對隨機森林模型的輸出都有一定的影響。常用的群體智能算法有粒子群算法、人工魚群算法、蟻群算法等。狼群優(yōu)化算法也屬于群體智能算法,狼群優(yōu)化算法通過模擬灰狼群體捕食,快速選取最優(yōu)解.本文通過將狼群優(yōu)化算法引入隨機森林模型,迭代優(yōu)化隨機森林算法中的參數(shù),達到了較好的分類效果。

狼群優(yōu)化隨機森林算法的步驟如下∶

(1)確定隨機森林算法的參數(shù),隨機設定出剪枝閾值、決策樹棵數(shù)、預測試樣本數(shù)、隨機屬性個數(shù)的初值;

(2)采用Bootstrap算法采樣,隨機生產訓練集,并在每個訓練集中選出預測試樣本;

(3)利用每個訓練集剩下的樣本分別生成決策樹;

(4)當結點內包含的樣本數(shù)少于閾值時,將該結點作為葉結點,返回其目標屬性的眾數(shù)作為該決策樹的分類結果;

(5)計算出模型的分類結果作為適應度值,采用狼群優(yōu)化算法對其中的參數(shù)進行迭代優(yōu)化,從而確定最終模型的參數(shù)。

3 實驗驗證及分析

本文利用加利福尼亞大學的UCI數(shù)據(jù)庫的實驗數(shù)據(jù)來驗證隨機森林模型中的參數(shù)對分類準確率的影響,選取Abalone數(shù)據(jù)集作為驗證數(shù)據(jù)集,分別對剪枝閾值和決策樹棵數(shù)進行驗證.在實驗部分上述UCI數(shù)據(jù)集上選取abalone數(shù)據(jù),共包含8個屬性。將數(shù)據(jù)集進行拆分,其中75%的數(shù)據(jù)作為訓練集,25%的數(shù)據(jù)作為測試集。灰狼優(yōu)化隨機森林中的迭代優(yōu)化的結果如圖1所示。訓練集預測結果如圖2示.測試集預測結果如圖3所示。

圖1 灰狼優(yōu)化隨機森林中的迭代優(yōu)化

圖2 訓練集預測結果

圖3 測試集預測結果

本文采用狼群優(yōu)化算法對模型進行優(yōu)化,并在5組數(shù)據(jù)集上進行測試。將其訓練結果傳統(tǒng)隨機森林(RF)、支持向量機(SVM)進行對比,結果如表1所示。表1中記錄了所有算法對5個數(shù)據(jù)集的平均分類正確率。

表1 不同算法分類性能比較

4 結束語

本文提出了一種基于灰狼優(yōu)化算法的隨機森林模型。在5個驗數(shù)據(jù)集上該模型都取得了良好的表現(xiàn)。通過對比不同算法對分類性能的影響,選擇出最優(yōu)的算法。經(jīng)過與傳統(tǒng)隨機森林算法和SVM的分類結果的對照,本文提出的基于灰狼優(yōu)化的隨機森林模型分類正確率均比傳統(tǒng)隨機森林算法和SVM高。

猜你喜歡
分類優(yōu)化模型
一半模型
超限高層建筑結構設計與優(yōu)化思考
房地產導刊(2022年5期)2022-06-01 06:20:14
民用建筑防煙排煙設計優(yōu)化探討
關于優(yōu)化消防安全告知承諾的一些思考
分類算一算
一道優(yōu)化題的幾何解法
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
分類討論求坐標
數(shù)據(jù)分析中的分類討論
主站蜘蛛池模板: 91亚洲免费视频| 国产最新无码专区在线| 久久成人免费| 国产欧美日韩精品综合在线| 欧美日韩一区二区在线播放| 九九九国产| 欧美激情第一区| 免费国产一级 片内射老| 91麻豆国产视频| 亚洲天堂成人| 亚洲性影院| 亚洲色婷婷一区二区| 国产精品七七在线播放| 亚洲欧洲一区二区三区| 91久久精品日日躁夜夜躁欧美| 亚洲天堂高清| 日韩高清一区 | 亚洲系列无码专区偷窥无码| 国产精品林美惠子在线观看| 国产成人一区在线播放| 亚洲av日韩av制服丝袜| 亚洲国产日韩一区| 欧美成人免费午夜全| 72种姿势欧美久久久久大黄蕉| 免费无码在线观看| 国产精品永久久久久| 国产情侣一区二区三区| 91精品国产自产在线观看| 中文无码精品A∨在线观看不卡| 黄色网站不卡无码| 亚洲色欲色欲www网| 亚洲IV视频免费在线光看| 成人字幕网视频在线观看| 青青草原国产精品啪啪视频 | 九九九精品视频| 免费福利视频网站| 国产成人无码久久久久毛片| 动漫精品中文字幕无码| 亚洲午夜天堂| 国产AV无码专区亚洲精品网站| 99国产精品国产高清一区二区| 欧美色99| 亚洲第一在线播放| 欧美激情视频二区| 91精品国产综合久久不国产大片| 免费网站成人亚洲| 萌白酱国产一区二区| 欧美乱妇高清无乱码免费| 免费无码AV片在线观看中文| 小说 亚洲 无码 精品| 国产成人精品视频一区二区电影| 久久久黄色片| 中文字幕佐山爱一区二区免费| 中文字幕乱妇无码AV在线| 国内精品一区二区在线观看| 美女内射视频WWW网站午夜| 国内嫩模私拍精品视频| 亚洲综合二区| 国产美女自慰在线观看| 国产91丝袜在线播放动漫| 欧美69视频在线| 亚洲无码精彩视频在线观看| 天天综合网色中文字幕| 国产香蕉一区二区在线网站| 久久中文字幕不卡一二区| 欧美a级在线| 国产91视频免费观看| 熟妇人妻无乱码中文字幕真矢织江 | 国产成人AV综合久久| 一级毛片高清| 国产剧情国内精品原创| 日本亚洲最大的色成网站www| 亚洲第一成年免费网站| 国产JIZzJIzz视频全部免费| 成人午夜网址| 亚洲黄色高清| 国产不卡网| 这里只有精品在线播放| 国产成人免费高清AⅤ| 色哟哟国产精品| 国产美女免费网站| 欧洲熟妇精品视频|