999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于PSO優化的葉節點加權隨機森林算法

2022-04-24 09:15:22胡明祺張森昶
現代計算機 2022年4期
關鍵詞:分類優化模型

胡明祺,張森昶

(鄭州大學網絡空間安全學院,鄭州 450000)

0 引言

隨機森林(random forest)由加利福尼亞大學的Leo Breiman提出,后來經過YL Pavlov的改善, 提高了隨機森林算法的基本性能,并在研究和工業等各領域得到廣泛應用。傳統隨機森林算法的隨機性來自于兩個隨機化過程:一是從原始數據集中隨機生成若干訓練集,二是用來分支的最優特征屬性是從隨機生成的部分特征屬性中選擇的,最終其輸出結果為一個包含分類能力各不相同的決策樹的集合。由于傳統的隨機森林算法隨機程度高且對每棵決策樹的分類能力不做評估,因此極易出現同一集合中同時存在權重相同的、分類能力較強和較弱的決策樹分類器,使隨機森林的整體性能下降。這也導致傳統隨機森林算法準確度不高,易出現過擬合現象。

目前,對隨機森林中的決策樹加權以區分不同決策樹的投票性能成為提高隨機森林算法分類精度的一個研究方向。本文提出了一種基于PSO 優化的葉節點加權隨機森林算法,通過bagging 算法進行抽樣和特征選擇,并在每棵樹的葉節點上進行加權,從而賦予每個葉節點不同的投票權重,提高分類的精確度。此外,我們引入粒子群算法(PSO)對權重向量進行優化,使加權不再由人工設置,提高算法的科學性與合理性,在整體上改善了算法的性能。

1 相關工作

近年來,大量學者從各個方面對傳統隨機森林算法進行了許多優化。林楓等提出了用果蠅算法進行優化的隨機森林算法, 解決了傳統參數選擇方法存在主觀干擾性的問題, 該算法有利于較大數據集的提取,但無法作用于較小數據集且未對隨機森林算法的重要問題,即投票問題,進行優化。莊巧蕙對隨機森林算法的泛化能力進行提升,使其能夠參與實際應用,但是僅僅提高泛化能力會在某些情況下降低隨機森林算法的準確性。楊彪使用基于誤判率比較的二次訓練的方法對決策樹的葉結點進行加權,提高了隨機森林算法的性能,但在權重優化方面仍有提升的空間。

2 粒子群算法

自適應優化算法可以根據當前數據的處理特征,自動調整模型參數或處理辦法,以達到增強模型分類性能的目的。粒子群算法是一種性能較好的自適應優化算法。本文采用粒子群算法對隨機森林進行葉節點權重優化,使權重向量更加科學合理。

粒子群優化算法可以處理連續優化問題和組合優化問題。在傳統粒子群算法中,模型會初始化一群隨機解,將這些潛在的解稱作粒子,這些粒子通過跟蹤兩個極值來更新自己。

此時,每個粒子的優劣性可以由目標函數來得到,將第個粒子的“飛翔”速度記為

將第個粒子的個體極值記為

第個粒子的全局極值記為

更新每個粒子為

其中= 1,2,…,,= 1,2,…,;和為非負的常數;和是介于[ 0,1] 之間的隨機數。v∈[ -,];是常數。以上操作迭代進行直至滿足迭代終止條件。

3 加權的隨機森林算法

3.1 隨機森林算法

隨機森林是一個以若干決策樹為其基分類器的組合分類器,傳統的隨機森林算法主要由三步組成:①采用bootstrap抽樣的方法從原始數據集中隨機生成若干訓練集。②用各訓練集分別訓練決策樹,并不進行剪枝,其用來分支的最優特征屬性是從隨機生成的部分特征屬性中選擇的。③各個決策樹分類器的集合構成一片隨機森林,此隨機森林的模型輸出為:

其中為測試集,為類別數,為隨機森林模型的規模,f()表示第棵決策樹的分類結果,(?)是一個判斷函數,當基分類器的輸出結果滿足條件時為1,不滿足時為0。

對于隨機森林中決策樹的生成算法,我們選擇CART決策樹算法,此算法遞歸地在每個內部節點處進行基于基尼指數的特征分割,最終生成一棵二叉樹。CART決策樹對特征值的選取及特征取值的數目有很好的適應性,因此被廣泛使用。

3.2 基于PSO優化的葉加權隨機森林算法

作為一種分類器的組合方法,隨機森林算法在訓練數據集選取和特征值選取時的隨機化可以有效避免決策樹易于過擬合的缺點,增強模型的泛化能力。但實際上,正是由于決策樹生成算法的兩個隨機化過程,各個決策樹甚至同一決策樹的每個葉節點的分類精度都有較大的差異。在傳統隨機森林模型中,每棵決策樹的投票權重都是相等的,這就導致一些性能較差的決策樹或葉節點的投票會影響整個隨機森林分類器的最終分類結果。因此,本文提出基于PSO 優化的葉加權隨機森林算法,對隨機森林中每棵決策樹的每片葉節點加以不同權值,并使用PSO 算法進行自適應優化,進而達到提高隨機森林分類器整體性能的目的。

此外,針對隨機森林分類器在某些噪聲較大的分類或回歸問題上會出現過擬合的問題,我們通過bagging 算法對特征集和訓練集進行特征選取,以此來訓練分類器,并提升算法在特征選取方面的準確性。在特征選取之后,我們為每個子葉隨機分配初始可信度,構成可信度向量,并使用PSO 算法對可信度向量進行優化,直至其性能達到預先設置的完成閾值。最后,我們記錄葉節點可信度向量,并將其作用于測試中最終得到的葉節點,以此來對子葉加權,最終采取投票法得出隨機森林的結果。

算法步驟如下:

其中為測試集,為類別數,為隨機森林模型的規模,f()表示第棵決策樹的分類結果,(?)是一個判斷函數,當基分類器的輸出結果滿足條件時為1,不滿足時為0。

4 實驗結果與分析

為了檢驗此算法的性能,我們使用標準UCI測試數據集對算法進行測試。選擇的數據集詳細信息如表1所示。

表1 數據集

為了測試算法的可靠性,我們在每一個數據集中加入30%的隨機噪聲,隨后用上述數據集對隨機森林算法和加權隨機森林算法分別進行了十折交叉驗證,以達到對比效果。測試結果如表2所示。

表2 分類精度

可以看出,相較于原本的隨機森林算法,PSO 優化的加權隨機森林算法在各數據集上的分類精度都有明顯的提升。通過對比可以發現,PSO 優化的加權隨機森林算法對于大數據集的適應性更好,性能提升度可達19.1%。

此外,為了測試PSO 優化過程對本算法分類精度的影響,我們嘗試改變PSO 算法的種群數量和最深迭代次數兩個參數,并進行了多次對比實驗,測試選用的數據集為Bank Marketing數據集。在Python 環境下測試的輸出結果如圖1所示。

圖1 Python環境下測試的輸出結果

其中,var 表示最深迭代次數iter=60+2×pop 的情況;cons 表示iter=150 的情況。從實驗結果可以看出,pop 和iter 對PSO 性能并無明顯影響,PSO 優化的加權隨機森林算法有較好的適應性和穩定性。

5 結語

本文提出了一種基于PSO 優化的葉加權隨機森林算法。這種算法針對決策樹生成算法的兩個隨機化過程,對隨機森林中每棵決策樹的每片葉節點加以不同的權值,使各個葉節點的投票權重與其分類精度達到平衡。利用PSO 算法全局搜索能力強、收斂速度快的優勢,我們對葉節點權值進行優化,以此提高分類性能較強的葉節點的投票權重,降低分類性能較弱的葉節點的投票權重,有效避免決策樹易于過擬合的缺點,增強模型的泛化能力,進而達到提高隨機森林分類器整體性能的效果。

理論分析和實驗結果表明,基于PSO 優化的葉加權隨機森林算法是可行的。與傳統的隨機森林算法相比,該算法在分類精度及模型穩定性上都有明顯提升,且對于大數據集的適應性更好,性能可比傳統的隨機森林算法提升19.1%,有一定的研究和應用價值。

目前,本文算法在提高模型適應性方面還存在改進的空間,在降低算法時間復雜度方面仍需作進一步的研究。

猜你喜歡
分類優化模型
一半模型
超限高層建筑結構設計與優化思考
房地產導刊(2022年5期)2022-06-01 06:20:14
民用建筑防煙排煙設計優化探討
關于優化消防安全告知承諾的一些思考
分類算一算
一道優化題的幾何解法
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
分類討論求坐標
數據分析中的分類討論
主站蜘蛛池模板: 成人va亚洲va欧美天堂| 无码免费试看| 中文字幕在线日本| 91色综合综合热五月激情| 久久免费视频6| 日本欧美成人免费| 国产三级a| 成人精品午夜福利在线播放| 在线播放91| 国产一在线观看| 成人国产精品视频频| 爱色欧美亚洲综合图区| 国产欧美日韩91| 亚洲午夜国产精品无卡| 欧美www在线观看| 亚洲毛片一级带毛片基地 | 欧美日韩精品综合在线一区| 嫩草国产在线| 国产精品欧美亚洲韩国日本不卡| 亚洲天堂视频网站| 国产永久免费视频m3u8| 亚洲熟妇AV日韩熟妇在线| 亚洲第一香蕉视频| 综合色区亚洲熟妇在线| 国产永久免费视频m3u8| 成人中文字幕在线| 国产va视频| 一级毛片在线播放免费| 国产精品无码久久久久久| 第九色区aⅴ天堂久久香| 成人字幕网视频在线观看| 中国成人在线视频| 日韩欧美视频第一区在线观看 | 色老二精品视频在线观看| 欧美精品伊人久久| 久久综合九色综合97婷婷| 无码一区中文字幕| 欧美一级在线看| 国产亚洲欧美在线人成aaaa | 最新国产成人剧情在线播放| 97se亚洲综合在线| 91精品啪在线观看国产91| 99在线观看国产| 一本久道久综合久久鬼色| 国产一国产一有一级毛片视频| 国内精品一区二区在线观看| 国产经典免费播放视频| 国产成人麻豆精品| 韩日午夜在线资源一区二区| 日韩精品一区二区三区大桥未久| 色婷婷成人| 免费全部高H视频无码无遮掩| 亚洲综合色婷婷| 在线观看热码亚洲av每日更新| 久久香蕉欧美精品| 亚洲成在人线av品善网好看| 欧美亚洲一二三区| 久久精品国产一区二区小说| 自慰网址在线观看| 自拍偷拍欧美日韩| 国产乱子伦一区二区=| 亚洲三级a| 中国国产一级毛片| 青草视频免费在线观看| 亚洲男人天堂2020| 丝袜国产一区| 91九色国产porny| 欧美日韩亚洲综合在线观看| 青草91视频免费观看| 亚洲高清国产拍精品26u| 老司机精品99在线播放| 国产网友愉拍精品| 日本午夜视频在线观看| 亚洲精品高清视频| 一级毛片免费观看不卡视频| 手机在线看片不卡中文字幕| 亚洲一区二区三区香蕉| 国产全黄a一级毛片| 精品偷拍一区二区| 制服丝袜 91视频| 亚洲精品无码不卡在线播放| 呦视频在线一区二区三区|