999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于灰狼優(yōu)化的隨機森林模型的研究

2022-04-22 08:08:04范昊東
電子測試 2022年6期
關鍵詞:分類優(yōu)化模型

范昊東

(黑龍江科技大學,黑龍江哈爾濱,150022)

0 引言

隨機森林是一種組合分類器技術。既可以用于處理分類、回歸問題,也適用于降維問題。隨機森林對噪音有很好的容忍度且不易出現(xiàn)過擬合,穩(wěn)健性強。隨機森林算法中采用的bootstrap重采樣技術是有放回的隨機采樣,即從原始的訓練樣本集中隨機有放回地抽取與其等數(shù)量的樣本組成1個采樣集,重復n輪得到n個相互獨立的采樣集;然后利用每個采樣集分別生成決策樹,n個決策樹共同構成森林。即把多個決策樹的預測組合成一個模型。

由于隨機森林算法中存在的一些問題,為了改進隨機森林算法國內外學者們提出了很多方案,孫光民[1]通過優(yōu)化群投票原理,使用分類與回歸樹進行預測,將預測結果從小到大排序,只取中間較好的CART用于最終的預測,縮短運算時間,減少預測誤差。Mashayekhi等[2]基于爬山策略的貪婪方法,增刪決策樹來保證隨機森林的多樣性。Ishwaran等[3]通過引入生存樹的概念,提出隨機生存森林算法,構建生存函數(shù),生成分析樹的內容和預測結果進行綜合,提高其分類的性能。薛銘龍等[4]通過設置不同的懲罰項因子可以在訓練隨機森林中生成結構不同的決策樹。

上述改進算法均能有效提升分類精度,但改變決策樹的結構,會增加算法的復雜性。增刪決策樹,雖然計算簡單,但會導致隨機森林陷入局部最優(yōu)。所以需要一種簡單高效的方法來計算出決策樹間的相關性,豐富隨機森林的多樣性,進而提升隨機森林的分類精度。為解決上述隨即森林的問題,本文提出了一種基于狼群優(yōu)化算法優(yōu)化的隨機森林模型,通過迭代優(yōu)化決策樹棵數(shù)、剪枝閾值等參數(shù)來實現(xiàn)對隨機森林模型的優(yōu)化。

1 隨機森林模型及其優(yōu)化

1.1 隨機森林模型

隨機森林算法中采用的bootstrap重采樣技術是一種有放回的隨機采樣,從原始的訓練樣本集中隨機有放回地抽取與其等數(shù)量的樣本組成1個采樣集,重復n輪得到n個相互獨立的采樣集;然后利用每個采樣集分別生成決策樹,這n個決策樹連接形成“森林”。即由多個決策樹的預測組合成的模型。

本文選用隨機森林作為分類器,隨機森林的學習過程可以用以下步驟描述:

(1)首先重采樣采用Bootstrap方法,隨機產生m個訓練子集。

(2)然后基于劃分好的訓練子集生成對應的決策樹。從特征變量中隨機選擇部分特征組成特征子集,在其中選取最優(yōu)特征作為決策樹節(jié)點的分裂屬性。

(3)最后采用投票的方法集成各決策樹對訓練子集的預測結果,將m個決策樹中輸出最多的類別作為測試集樣本所屬的類別。

隨機森林是讓每一棵決策樹進行分類,然后取所有決策樹中分類結果最多的那類作為最終的結果。因此是一個包含多個決策樹的分類器,并且其輸出的類別是由個別樹輸出的類別的眾數(shù)而定。該模型的優(yōu)點包括對高維數(shù)據(jù)無需提前進行特征選擇、有效克服單一預測器易陷入過擬合。隨機森林模型的實質是一個有許多棵互不相關決策樹的分類器。所有決策樹都采用Bootstrap方法進行采樣,從所有的決策屬性中隨機挑選出幾個屬性進行分類。訓練完成后,當測試樣本輸入時,每棵決策樹均對測試樣本進行分類,通過投票的方法來決定測試樣本的最終分類結果。

2 隨機森林模型及其優(yōu)化

隨機森林與傳統(tǒng)決策樹算法不同,其具有不剪枝也能避免數(shù)據(jù)過擬合的特點,同時具有較快的訓練速度,且參數(shù)調整簡單,在默認參數(shù)下即具有較好的回歸預測效果[5-6]。以上算法中,剪枝閾值、決策樹棵數(shù)、預測試樣本數(shù)等參數(shù)對隨機森林模型的輸出都有一定的影響。常用的群體智能算法有粒子群算法、人工魚群算法、蟻群算法等。狼群優(yōu)化算法也屬于群體智能算法,狼群優(yōu)化算法通過模擬灰狼群體捕食,快速選取最優(yōu)解.本文通過將狼群優(yōu)化算法引入隨機森林模型,迭代優(yōu)化隨機森林算法中的參數(shù),達到了較好的分類效果。

狼群優(yōu)化隨機森林算法的步驟如下∶

(1)確定隨機森林算法的參數(shù),隨機設定出剪枝閾值、決策樹棵數(shù)、預測試樣本數(shù)、隨機屬性個數(shù)的初值;

(2)采用Bootstrap算法采樣,隨機生產訓練集,并在每個訓練集中選出預測試樣本;

(3)利用每個訓練集剩下的樣本分別生成決策樹;

(4)當結點內包含的樣本數(shù)少于閾值時,將該結點作為葉結點,返回其目標屬性的眾數(shù)作為該決策樹的分類結果;

(5)計算出模型的分類結果作為適應度值,采用狼群優(yōu)化算法對其中的參數(shù)進行迭代優(yōu)化,從而確定最終模型的參數(shù)。

3 實驗驗證及分析

本文利用加利福尼亞大學的UCI數(shù)據(jù)庫的實驗數(shù)據(jù)來驗證隨機森林模型中的參數(shù)對分類準確率的影響,選取Abalone數(shù)據(jù)集作為驗證數(shù)據(jù)集,分別對剪枝閾值和決策樹棵數(shù)進行驗證.在實驗部分上述UCI數(shù)據(jù)集上選取abalone數(shù)據(jù),共包含8個屬性。將數(shù)據(jù)集進行拆分,其中75%的數(shù)據(jù)作為訓練集,25%的數(shù)據(jù)作為測試集。灰狼優(yōu)化隨機森林中的迭代優(yōu)化的結果如圖1所示。訓練集預測結果如圖2示.測試集預測結果如圖3所示。

圖1 灰狼優(yōu)化隨機森林中的迭代優(yōu)化

圖2 訓練集預測結果

圖3 測試集預測結果

本文采用狼群優(yōu)化算法對模型進行優(yōu)化,并在5組數(shù)據(jù)集上進行測試。將其訓練結果傳統(tǒng)隨機森林(RF)、支持向量機(SVM)進行對比,結果如表1所示。表1中記錄了所有算法對5個數(shù)據(jù)集的平均分類正確率。

表1 不同算法分類性能比較

4 結束語

本文提出了一種基于灰狼優(yōu)化算法的隨機森林模型。在5個驗數(shù)據(jù)集上該模型都取得了良好的表現(xiàn)。通過對比不同算法對分類性能的影響,選擇出最優(yōu)的算法。經(jīng)過與傳統(tǒng)隨機森林算法和SVM的分類結果的對照,本文提出的基于灰狼優(yōu)化的隨機森林模型分類正確率均比傳統(tǒng)隨機森林算法和SVM高。

猜你喜歡
分類優(yōu)化模型
一半模型
超限高層建筑結構設計與優(yōu)化思考
房地產導刊(2022年5期)2022-06-01 06:20:14
民用建筑防煙排煙設計優(yōu)化探討
關于優(yōu)化消防安全告知承諾的一些思考
分類算一算
一道優(yōu)化題的幾何解法
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
分類討論求坐標
數(shù)據(jù)分析中的分類討論
主站蜘蛛池模板: 91色国产在线| 欧美不卡二区| 日本91在线| 精品无码一区二区在线观看| 国产va在线观看免费| 亚洲国产欧美国产综合久久 | 第一页亚洲| 99精品伊人久久久大香线蕉| 22sihu国产精品视频影视资讯| 欧美高清国产| 中文字幕波多野不卡一区| 亚洲综合精品第一页| 亚洲精品另类| 久99久热只有精品国产15| 亚洲精品国产成人7777| 少妇高潮惨叫久久久久久| 在线永久免费观看的毛片| 噜噜噜久久| 欧美一级色视频| 青青青视频免费一区二区| 久久永久视频| 在线播放91| 麻豆精品在线播放| 久久亚洲天堂| jizz国产在线| 欧美性猛交一区二区三区| 狠狠色丁香婷婷| 丁香六月综合网| 精品综合久久久久久97超人| 天天爽免费视频| 国产精品无码在线看| 中国丰满人妻无码束缚啪啪| 午夜福利免费视频| 色首页AV在线| 日韩欧美国产成人| 毛片免费在线| jizz国产视频| 99九九成人免费视频精品 | 在线五月婷婷| 日日噜噜夜夜狠狠视频| 国产亚洲视频在线观看| 综合色亚洲| 特级做a爰片毛片免费69| 手机在线国产精品| 亚洲成a人在线观看| 久久 午夜福利 张柏芝| 国产精品美女自慰喷水| 精品一区二区三区自慰喷水| 欧美精品色视频| 亚洲免费毛片| 国产幂在线无码精品| 欧美综合在线观看| 久久免费视频播放| 欧美日韩午夜| 欧美日韩中文国产| 一本综合久久| 精品福利网| 欧日韩在线不卡视频| 日韩AV无码一区| 日本精品视频| 高清色本在线www| 亚洲天堂成人在线观看| 一级香蕉人体视频| 亚洲欧美天堂网| 亚洲美女一区| 欧美午夜视频| 91国内视频在线观看| 国产女主播一区| 精品亚洲麻豆1区2区3区| 国产精品久久久久久搜索| 青青青亚洲精品国产| 538国产视频| 国产黄视频网站| 美女无遮挡免费视频网站| 国产成在线观看免费视频| 在线色综合| 亚洲无码视频喷水| 又爽又大又黄a级毛片在线视频 | 婷婷亚洲最大| 伊人成人在线| 国产一区二区三区在线观看视频| 亚洲五月激情网|