999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

隨機(jī)森林算法中數(shù)據(jù)切分方法研究

2021-07-23 01:24:18路佳佳
關(guān)鍵詞:分類

路佳佳

(山西工商學(xué)院 計(jì)算機(jī)信息工程學(xué)院,山西 太原 030006)

隨機(jī)森林是一種可以處理分類問題和回歸問題的算法,該算法一般采用bootstrap sampling 方法進(jìn)行抽樣,但是在抽樣中存在“包外估計(jì)”。為了減少包外估計(jì)的誤差,本文考慮對(duì)樣本進(jìn)行合理的數(shù)據(jù)切分[1]來有效提高模型的性能,減少誤差。本文應(yīng)用簡單隨機(jī)抽樣的方法將大小為n的數(shù)據(jù)集分成不相交的兩份,并且進(jìn)行相同的抽樣P次,得到2P份大小為的數(shù)據(jù)集。然后從中選擇一份建立隨機(jī)森林,其中的個(gè)樣本作為訓(xùn)練集,另外的個(gè)樣本作為驗(yàn)證集,通過誤差來分析[2-4]驗(yàn)證切分方法的有效性。

1 改進(jìn)的隨機(jī)森林算法及其計(jì)算步驟

隨機(jī)森林是含有多個(gè)決策樹的集成分類器[5],其中{αk}是獨(dú)立同分布的隨機(jī)向量,k表示隨機(jī)森林中決策樹的個(gè)數(shù)。改進(jìn)的隨機(jī)森林算法主要是從數(shù)據(jù)切分的角度來改進(jìn)隨機(jī)森林。本文研究的改進(jìn)的隨機(jī)森林方法應(yīng)用于回歸任務(wù)和分類任務(wù)中。

隨機(jī)森林回歸的方法一般針對(duì)連續(xù)型隨機(jī)變量,也就是研究輸出變量y和輸入變量X之間的關(guān)系建立數(shù)學(xué)模型。隨機(jī)森林中的參數(shù)一般有兩個(gè),一個(gè)是樹的棵目數(shù)Ntree,另一個(gè)是隨機(jī)特征數(shù)Mtry。即

隨機(jī)森林分類的方法一般針對(duì)離散型隨機(jī)變量[3],假設(shè)輸入變量X,通過樹的分類結(jié)果進(jìn)行投票,將多數(shù)的投票結(jié)果作為最終的預(yù)測(cè)結(jié)果,即

其中L(x)為聯(lián)合分類的結(jié)果,Pi(x)為第i個(gè)分類樹的結(jié)果。

改進(jìn)的隨機(jī)森林算法預(yù)測(cè)步驟包括以下三步。

(1)產(chǎn)生數(shù)據(jù)集。

(2)應(yīng)用簡單隨機(jī)抽樣的方法對(duì)數(shù)據(jù)集進(jìn)行切分,抽取的一半數(shù)據(jù)記為D1,剩余的另一半數(shù)據(jù)記為D2,D1與D2互不相交。進(jìn)行相同的抽取P次,將數(shù)據(jù)集切分成2P份。

(3)切分之后選取的數(shù)據(jù)中一半作為訓(xùn)練集,另一半作為驗(yàn)證集建立隨機(jī)森林模型。將數(shù)據(jù)集中的輸入變量X輸入到使用訓(xùn)練集得到的模型中,在回歸任務(wù)中采用簡單平均法計(jì)算出的平均值作為預(yù)測(cè)值。在分類任務(wù)中采用投票法將分類結(jié)果中出現(xiàn)次數(shù)最多的結(jié)果作為最終分類結(jié)果。

在具體實(shí)驗(yàn)過程中借助R 統(tǒng)計(jì)軟件中的包random forest 庫函數(shù)實(shí)現(xiàn)上述步驟。

2 實(shí)驗(yàn)分析

模擬出n=1 000,p=150(數(shù)據(jù)個(gè)數(shù)為1 000,維數(shù)為150)的多元正態(tài)數(shù)據(jù)集,x為150 維,y為標(biāo)準(zhǔn)正態(tài)分布下的隨機(jī)數(shù),然后對(duì)模擬的數(shù)據(jù)集進(jìn)行3 次切分,其中250 個(gè)樣本作為訓(xùn)練集,另外的250 個(gè)樣本作為驗(yàn)證集,設(shè)置隨機(jī)森林中樹的棵目數(shù)ntree的值,從2 到500 變化。通過UCI數(shù)據(jù)集下載的iris 數(shù)據(jù)集作為真實(shí)數(shù)據(jù)。該數(shù)據(jù)集包含150 個(gè)樣本,每個(gè)數(shù)據(jù)包含四個(gè)特征和對(duì)應(yīng)的樣本類別信息。

2.1 模擬數(shù)據(jù)處理結(jié)果

均方根誤差從一定程度上可以描述偏差,設(shè)obi(i=1,2,…,n)表示觀測(cè)值,用ti表示預(yù)測(cè)值,則均方根誤差的計(jì)算公式為

隨機(jī)切分情況下模擬實(shí)驗(yàn)的結(jié)果如圖1 所示。

從圖1 可以看出隨著樹的棵目數(shù)的增加,均方根誤差rsme逐漸減少,當(dāng)樹的棵數(shù)在100 左右時(shí),隨機(jī)森林的rsme幾乎穩(wěn)定在0.96。圖2 是切分情況下計(jì)算的偏差和樹的棵數(shù)的散點(diǎn)圖,可以看出當(dāng)樹的棵數(shù)在100 時(shí),偏差穩(wěn)定在10 左右。

圖3 是不進(jìn)行隨機(jī)切分的情況下,模擬實(shí)驗(yàn)結(jié)果。從圖中可以看出,隨著樹的棵數(shù)的增加,均方根誤差rsme逐漸減少,當(dāng)增加到一定程度時(shí)rsme穩(wěn)定在1.00。表明對(duì)數(shù)據(jù)進(jìn)行隨機(jī)切分對(duì)隨機(jī)森林的偏差有一定程度的影響,可以減少偏差,并且當(dāng)樹的棵數(shù)在100 左右和500 時(shí)可以達(dá)到幾乎相同的偏差。

圖3 不切分時(shí)ntree 與rsme 關(guān)系圖

對(duì)于分類問題,模擬數(shù)據(jù)集x為150 維,y為0 或1 的二分類任務(wù),不進(jìn)行隨機(jī)切分的情況下,樹的棵目數(shù)(ntree)與分類準(zhǔn)確率(accuracy)的關(guān)系圖如圖4 所示,進(jìn)行隨機(jī)切分的數(shù)據(jù)處理結(jié)果如圖5 所示。從圖4 可以看出,不進(jìn)行切分的隨機(jī)森林的準(zhǔn)確率隨著樹的棵目數(shù)的增大穩(wěn)定在0.85。從圖5 可以看到,隨著樹的棵目數(shù)的增加,分類的準(zhǔn)確率在逐漸增大,當(dāng)樹的棵目數(shù)增大到100 時(shí),分類的準(zhǔn)確率逐漸穩(wěn)定在0.9。

圖4 不進(jìn)行切分ntree 與accuracy 關(guān)系圖

圖5 進(jìn)行切分ntree 與accuracy 關(guān)系圖

用隨機(jī)切分的隨機(jī)森林做100 次實(shí)驗(yàn),平均誤差率,典型結(jié)果見圖7。從圖中可見,平均誤差率為4.974 2%;用沒有隨機(jī)切分的隨機(jī)森林做100次實(shí)驗(yàn),典型結(jié)果見圖8。從圖中可知,平均誤差率為6.595 2%。

圖7 切分處理情況下的誤差率

圖8 不進(jìn)行切分情況下的誤差率

2.2 iris 數(shù)據(jù)集數(shù)據(jù)處理結(jié)果

繪制不經(jīng)切分處理的隨機(jī)森林和經(jīng)切分處理的隨機(jī)森林情況下的均方差圖,見圖9 和圖10。從兩個(gè)圖中可以看出,經(jīng)過切分的均方差圖誤差較為穩(wěn)定,誤差值也較小。

圖9 不進(jìn)行切分情況下的均方差

圖10 進(jìn)行切分情況下的均方差

3 結(jié)論

應(yīng)用隨機(jī)切分?jǐn)?shù)據(jù)集的方法對(duì)分類任務(wù)的準(zhǔn)確率的提高和回歸任務(wù)的偏差都有一定的提高。方法應(yīng)用與iris 數(shù)據(jù)集表現(xiàn)出較高的穩(wěn)定性。

猜你喜歡
分類
2021年本刊分類總目錄
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
星星的分類
我給資源分分類
垃圾分類,你準(zhǔn)備好了嗎
分類討論求坐標(biāo)
數(shù)據(jù)分析中的分類討論
按需分類
教你一招:數(shù)的分類
主站蜘蛛池模板: 欧美一级高清免费a| 亚洲成aⅴ人在线观看| 夜夜拍夜夜爽| 久久婷婷五月综合97色| 91成人免费观看| 麻豆精品国产自产在线| 国产专区综合另类日韩一区| 国产高清国内精品福利| 国产人成在线视频| 亚洲码在线中文在线观看| 日本日韩欧美| 亚洲精品日产AⅤ| 国产无码性爱一区二区三区| 亚洲国产综合自在线另类| 日韩国产一区二区三区无码| 日韩午夜福利在线观看| 日本福利视频网站| 日韩精品一区二区三区大桥未久| 亚洲天堂首页| 黄色网址免费在线| 久久鸭综合久久国产| 精品国产香蕉伊思人在线| 99re在线免费视频| 欧美激情伊人| 欧美日韩资源| 亚洲国内精品自在自线官| 日韩一级二级三级| 伊人中文网| 久久久久国产精品免费免费不卡| 日本在线视频免费| 日韩123欧美字幕| 中文字幕无码电影| 国产一区二区福利| 精品国产Av电影无码久久久| 欧美一级黄色影院| 毛片久久网站小视频| 亚洲欧美国产高清va在线播放| 免费一看一级毛片| 一级成人a毛片免费播放| 99视频在线看| 国产网站一区二区三区| 综合久久五月天| 精品国产黑色丝袜高跟鞋| 国产成人高清精品免费| 99精品热视频这里只有精品7| 国模极品一区二区三区| 亚洲人精品亚洲人成在线| 亚洲av无码久久无遮挡| 久久精品人妻中文视频| 波多野结衣一二三| 国产成人成人一区二区| 国产午夜一级淫片| 亚洲国产欧美国产综合久久 | 久久一本精品久久久ー99| 国产永久免费视频m3u8| 人与鲁专区| 欧美不卡视频在线| 男女精品视频| 亚洲欧美在线综合图区| 亚洲无码高清免费视频亚洲| 久久这里只有精品66| a级毛片毛片免费观看久潮| 国产成人精品18| 久久免费视频播放| 在线视频一区二区三区不卡| 亚州AV秘 一区二区三区| 亚洲乱码精品久久久久..| 精品国产福利在线| 中文字幕有乳无码| 国产在线专区| 91亚洲免费视频| 香蕉久人久人青草青草| 在线看片国产| 久久精品亚洲专区| 国产一区二区丝袜高跟鞋| Aⅴ无码专区在线观看| 中文字幕第1页在线播| 欧美www在线观看| 天天操天天噜| 国产粉嫩粉嫩的18在线播放91| 日本午夜影院| 精品久久国产综合精麻豆|