999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于特征聚類優化的KM-FCM-RF算法研究

2022-02-15 02:48:18彭玉濤
信息記錄材料 2022年12期
關鍵詞:特征優化

羅 超,彭玉濤

(井岡山大學網絡信息中心 江西 吉安 343009)

0 引言

在常用的決策樹算法中,最常見的算法是隨機森林算法。隨機森林算法的優點在于通過對數據噪聲的高度容忍度來得到較高預測精確度。Chai[1]將隨機森林算法運用到化工故障分類,提高了故障檢測精度;Cheng[2]在網絡安全方面運用隨機森林算法,極大提升了網絡安全監測正確率;Zafari[3]在化工項目評估管理領域運用隨機森林算法,得到了更加準確的評估預測結果。

在具有明顯優點的同時,隨機森林算法也存在一些缺點,例如對數據集的特點相近似聚類的檢索效率比較低,對數據集的動態聚類數據泛化特征時造成的誤差估值往往比較大。針對這些缺陷,也有很多學者做了大量的研究以改進。王德軍等[4]、劉曙光等[5]、王磊[6]分別采用時間序列特征泛化聚類、遙感數據多時相動態聚類、加權平均泛化數據后聚類的方法,得到了對精度不同程度的提高,并且聚類的效率也得到了相應的改善。對隨機森林算法提出了非常有用的改進和補充。

本文將嘗試采用將特征聚類KM算法與FCM算法相結合,對隨機森林算法進行優化,形成KM-FCM-RF算法優化模型。對多模動態K均值聚類和模糊C均值互相融合與補充的方法,采用對多模動態數據集的特征數據進行聚類,對傳統的隨機森林算法進行優化后,再計算特征優化的差異化DBI的值,重新對DBI序列值進行排序,篩選相關的特征,在聚類多模動態數據時達到提高效率的目的。

1 傳統隨機森林算法

如果研究人員用Ntree表示決策樹中多維特征的數量,OOBi表示第i棵決策樹的多模動態數據的特征數據,ErrOOBi代表的是OOBi中錯誤數據樣本的數量,如果有一個數據集的特征有d個,那么這個數據集可以稱之為數據集D,XJ(j=1,2,…,d)表示該數據特征集的度量,其算法步驟如下:

步驟1:首先基礎得到多霧的樣本數量ErrOOBi的值;

步驟2:置換后,得到了XJ,

再次置換后得到;

步驟3:均值計算得到的值,可以表示為

步驟4:重復以上步驟1到步驟3,執行次數限定為Ntree次,循環結束后可以得到{ErrOOBi,i=1,2,L,Ntree}

步驟5:根據以上兩個輸出結果,可計算粗聚類變化的均值:

則可以認為多模動態數據集的聚類集合就是VI(XJ)。

通過步驟1到步驟5,可以看到隨著多模特征集中特征維度的增加,循環訓練需要更多的時間,結果就必然減緩了訓練速度,進而降低多模數據特征集的訓練效果。本文擬采用高維多模聚類的方法,對以上的算法進行優化改進,已加快訓練速度和提高性能。

2 基于多模高維聚類優化的方法

2.1 聚類方法介紹

將K均值聚類(KM聚類)和模糊C均值聚類結合后,劃分多模動態特征族,排序后進行聚類。優化后得到訓練誤差均值DBI,DBI中最小值的聚類特征則為最終的結果,也是最佳結果。

2.1.1K均值聚類

根據春花等[7]的研究,K均值算法中,多模數據集中數據特征樣本的距離與相似度是反比關系。已知出事聚類和聚類中心,分別用K和C表示,則(C={μi,1≤i≤K})。

迭代計算的步驟為:

步驟1:得到每一個多維動態特征樣本的中心聚類值;

步驟2:重新聚類分簇,并計算DBI。

重復執行步驟1和步驟2,

步驟3:計算誤差平方和(SSE),一直到符合收斂條件。(SSE)的計算公式為:

2.1.2 模糊C均值算法(FCM)

模糊C均值算法主要計算數據集中樣本與聚類中心的關聯隸屬度,來完成對多維特征數據分類[8]。存在多維動態數據集Dn×p,其中的樣本數量為n,隸屬度矩陣U的計算公式為:

再計算每個樣本集聚類中心V,計算公式為:

則J(U,V)可以用下式表示:

||xi-vj||表示樣本各個聚類中心的均值。

2.1.3 離散相關度計算

使用KM和FCM算法對動態多模數據集的特征計算中心差異聚類時,計算出DBI的值,用來表示離散相關度索引的值。利用以下的公式來計算聚類中心最佳值:

(1)均值離散相關隸屬度:

(2)各聚類中心的距離值:

根據樸尚哲等[9]的研究,此時DBI的值為最佳聚類中心的值。

2.2 HDC-RF算法

2.2.1 KM-FCM-RF特征評估算法

對多維數據集進行聚類,并且根據聚類中心值的均值誤差來進行排序。

步驟1:采用傳統隨機森林算法,計算出樣本數據多維特征,并以此為排序的根據。

根據Alon[10]的研究,使用皮爾遜相關性系數ρxy來衡量族內特征與分類信息的相關性。

在上式中,特征x的均值用Zx來表示,特征y的均值則用Zy來表示,

ρxy表示皮爾遜相關系數,系數越大,則表示數據集特征之間具有越大的相關程度。

步驟2:根據閾值δ,篩選出相關系數ρxy>δ的高維特征。本文改進的閾值δ計算公式表示為:

根據式(9)計算出多維動態數據集特征,采用排序的規則為簇內優先、簇間其次。最終,計算得出了多維動態數據集的特征簇序列。

2.2.2K均值和C均值優化的隨機森林算法流程

在以上算法的基礎上,將K均值C均值優化的隨機森林算法優化流程用下圖1表示。

圖1 算法流程圖

3 實驗分析

3.1 實驗準備

采用Alon等[10]和Golub等[11]提供的高維多模動態特征數據集作為輸入的樣本數據集。輸入之前,先將數據和特征清除冗余,最終數據表征如下表1所示:

表1 實驗數據集

根據表1的結果可以看出,多個高維特征數據集差別不大時,KddCup99由于具有更小的特征數,可以更方便地對數據集中的少量非高位數據集進行特征提取,并進行輸出對比。反之,Minst則由于具有更多的特征數和更高維度,更適用于高維數據集的特征提取和對比。

在進行仿真實驗時,決策樹采用的是具有200個決策樹的C4.5基本分類器,并將其最佳聚類范圍設置為實驗結果的預測閾值評價采用ACC標準。如果閾值越大,則算法的優化效果越好、聚類數據集的性能就越高。

3.2 實驗結果

將本文的優化算法與傳統的隨機森林算法分別運行在KddCup99和Minst數據集進行比較,為了得到更穩定的結果,將算法運行30次的均值作為最終結果。實驗結果對比如下圖2、圖3所示:

圖2 KddCup99中KM-FCM-RF、RF預測精度對比

圖3 Minst中KM-FCM-RF、RF預測精度對比

根據以上兩圖可以得到如下結論:

(1)根據圖2的結果可知,在KddCup99的中低維數據集訓練中,KM-FCM-RF算法在前200個樣本時,預測精度略比RF略小,但從2 000個樣本開始,預測精度一直高于傳統RF算法。

(2)圖3表明,在Minst的高維數據集上的訓練過程中,KM-FCM-RF的精度自始至終都比傳統RF算法高。

4 結論

針對傳統的隨機森林算法在多維特征數據集預測精度不高,本文提出了一種基于K均值和C均值優化聚類的隨機森林算法,即在對多維特征數據集樣本聚類后,集合K均值模糊C-均值算法結合,計算得到DBI指標并對該指標排序后,進一步得到的閾值δ比較,最終得到多維特征數據集的特征序列。實驗結果表明,經過本文優化后基于K均值和C均值優化聚類的隨機森林算法,具有更好的聚類效果、預測精度更高,具備良好的可行性。

猜你喜歡
特征優化
抓住特征巧觀察
超限高層建筑結構設計與優化思考
房地產導刊(2022年5期)2022-06-01 06:20:14
民用建筑防煙排煙設計優化探討
關于優化消防安全告知承諾的一些思考
一道優化題的幾何解法
由“形”啟“數”優化運算——以2021年解析幾何高考題為例
新型冠狀病毒及其流行病學特征認識
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
主站蜘蛛池模板: 亚洲精品视频免费观看| 亚洲精品无码专区在线观看| 国产欧美高清| 亚洲成人高清无码| 日本不卡在线播放| 福利姬国产精品一区在线| 国产在线精品美女观看| 5388国产亚洲欧美在线观看| 亚洲综合一区国产精品| 亚洲欧美一区二区三区图片| 一级爆乳无码av| av大片在线无码免费| 久久永久精品免费视频| 国产精品网曝门免费视频| 精品久久久久久久久久久| 一边摸一边做爽的视频17国产| 国产97视频在线观看| 蝌蚪国产精品视频第一页| 伊人91在线| 国产在线第二页| 久久精品女人天堂aaa| 欧美中文字幕在线视频| 色综合狠狠操| 四虎亚洲国产成人久久精品| 国产精品久久自在自2021| 色婷婷啪啪| 国产在线视频自拍| 亚洲色婷婷一区二区| 国产精品久久国产精麻豆99网站| 亚洲欧洲一区二区三区| 国产制服丝袜91在线| 亚洲VA中文字幕| 欧美成人精品高清在线下载| 欧美精品一区二区三区中文字幕| 欧美日本在线| 欧美国产在线一区| 制服丝袜无码每日更新| 午夜免费视频网站| 国产乱子伦视频在线播放| 亚洲欧美在线看片AI| 91 九色视频丝袜| 四虎在线观看视频高清无码| 青草午夜精品视频在线观看| 欧美啪啪精品| 欧美激情视频二区三区| 国产国产人成免费视频77777 | 亚洲91精品视频| 国产成人精品一区二区免费看京| 成人小视频在线观看免费| 欧美色综合网站| 精品国产中文一级毛片在线看 | 亚洲日韩精品无码专区97| 欧美成人日韩| 日本AⅤ精品一区二区三区日| 国产福利在线免费| 亚洲福利片无码最新在线播放| 啪啪啪亚洲无码| 99热国产在线精品99| 91色国产在线| 制服丝袜亚洲| 99精品热视频这里只有精品7| 91人妻日韩人妻无码专区精品| 精品国产aⅴ一区二区三区 | 日本成人一区| 国产成人三级| 精品国产91爱| 国产v欧美v日韩v综合精品| 亚洲天堂日韩在线| 亚洲无码37.| 操美女免费网站| 日韩专区欧美| 国产欧美综合在线观看第七页| 精品超清无码视频在线观看| 久久国语对白| 91美女视频在线| 日韩a在线观看免费观看| 红杏AV在线无码| 亚洲av中文无码乱人伦在线r| 精品91自产拍在线| 国产免费观看av大片的网站| 波多野结衣在线一区二区| 毛片最新网址|