999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于不平衡數(shù)據(jù)的蛋白質(zhì)結(jié)晶偏好性改進SVM集成預測

2014-12-13 08:51:18敖培趙四方馮志鵬李延強
數(shù)字技術(shù)與應用 2014年8期

敖培++趙四方++馮志鵬++李延強

摘要:針對不平衡數(shù)據(jù)集分類問題,本文提出一種基于改進ROF的集成SVM分類方法。實驗結(jié)果表明,采用本文提出的方法預測蛋白質(zhì)結(jié)晶偏好性,可以有效提高預測精度。

關(guān)鍵詞:支持向量機集成算法 旋轉(zhuǎn)森林 蛋白質(zhì)結(jié)晶

中圖分類號:TM715 文獻標識碼:A 文章編號:1007-9416(2014)08-0091-01

1 引言

為了解決數(shù)據(jù)的不平衡性和增強集成SVM基分類器之間的差異性,提出了一種基于改進的旋轉(zhuǎn)森林算法SVM訓練基分類器,并將此方法應用在蛋白質(zhì)結(jié)晶偏好預測上,取得了較好的預測效果。

2 基于不平衡數(shù)據(jù)集的SVM集成算法改進

為了處理不平衡數(shù)據(jù),這里采用了一種改進的SMOTE。為了提高SVM集成泛化的性能,這里采用隨機投影(RP)方法作為旋轉(zhuǎn)森林的線性變換方法。具體算法如下:

步驟1:利用改進的SMOTE算法減小數(shù)據(jù)的不平衡性。具體算法如下:

(1)對少數(shù)類中的每個樣本Xj求它的k個最近鄰的樣本。

(2)對每個少數(shù)類樣本Xj的k個最近鄰進行判斷,當這k個樣本均為少數(shù)類實例時,保留Xj,否則從少數(shù)類樣本中刪除Xj。

(4)剔除產(chǎn)生的可能噪聲樣本,即當所產(chǎn)生的虛擬樣本的最鄰近樣本屬于少數(shù)類時,其才是滿足條件的虛擬少數(shù)樣本,否則,將其刪除。

(5)循環(huán)執(zhí)行(3)和(4),直到產(chǎn)生足夠多的樣本數(shù),即達到過抽樣參數(shù)T%。

步驟2:將樣本的特征隨即劃分為K個特征子集(無重復抽取),每個特征子集的特征數(shù)為M=D/K。

步驟3:采用RP方法,將原始數(shù)據(jù)通過投影矩陣R投影到d維空間上,獲得各投影矩陣中的每個元素采用Binary方法產(chǎn)生[1]。

步驟4:重復以上步驟L次,就可以得到各個分類器的訓練集。這里的基分類器選擇為SVM。

步驟5:分別使用L個SVM分類器對測試樣本集進行分類,獲得預測函數(shù){f;}和預測標記{h;}。

步驟6:對預測函數(shù)和預測標記進行投票處理,獲得SVM集成分類器最終預測標記Hend。

3 基于改進SVM集成方法的蛋白質(zhì)結(jié)晶偏好性預測

本文實驗數(shù)據(jù)來源于PepcDB數(shù)據(jù)庫中的蛋白質(zhì)鏈,特征選取和計算方法見文獻[2]。經(jīng)過篩選,分別將166955條和5721條蛋白質(zhì)實驗序列作為不可結(jié)晶數(shù)據(jù)集合和可結(jié)晶數(shù)據(jù)集合。采用第3部分所提出的的方法進行預測,T取2000,K取3,采用3折交叉驗證法來估計預測誤差。為了驗證采用本文算法進行預測的效果,選擇集成RBF神經(jīng)網(wǎng)絡模型進行對比,集分類器個數(shù)均選擇為10。在數(shù)據(jù)集上進行10次實驗,實驗結(jié)果取10次實驗的平均值,如表1所示。從表中可以看出,采用本文方法的平均預測準確率達到85.24%,而集成RBF神經(jīng)網(wǎng)絡模型的測試準確率僅為79.04%。

4 結(jié)語

對于不平衡數(shù)據(jù)集分類問題,本文提出一種基于改進旋轉(zhuǎn)森林算法的SVM集成分類方法,并將改進的方法用于對蛋白質(zhì)結(jié)晶偏好性進行預測。實驗結(jié)果表明,與集成RBF神經(jīng)網(wǎng)絡模型相比,本文方法具有較高預測精度。

參考文獻

[1]姚旭,王曉丹,張玉璽,等.結(jié)合Rotation Forest和MultiBoost的SVM集成方法[J].計算機科學,2013,40(3):266-270,290.

[2]王同友.基于集成學習的蛋白質(zhì)結(jié)晶偏好性預測 [D].吉林大學碩士學位論文,2014.endprint

摘要:針對不平衡數(shù)據(jù)集分類問題,本文提出一種基于改進ROF的集成SVM分類方法。實驗結(jié)果表明,采用本文提出的方法預測蛋白質(zhì)結(jié)晶偏好性,可以有效提高預測精度。

關(guān)鍵詞:支持向量機集成算法 旋轉(zhuǎn)森林 蛋白質(zhì)結(jié)晶

中圖分類號:TM715 文獻標識碼:A 文章編號:1007-9416(2014)08-0091-01

1 引言

為了解決數(shù)據(jù)的不平衡性和增強集成SVM基分類器之間的差異性,提出了一種基于改進的旋轉(zhuǎn)森林算法SVM訓練基分類器,并將此方法應用在蛋白質(zhì)結(jié)晶偏好預測上,取得了較好的預測效果。

2 基于不平衡數(shù)據(jù)集的SVM集成算法改進

為了處理不平衡數(shù)據(jù),這里采用了一種改進的SMOTE。為了提高SVM集成泛化的性能,這里采用隨機投影(RP)方法作為旋轉(zhuǎn)森林的線性變換方法。具體算法如下:

步驟1:利用改進的SMOTE算法減小數(shù)據(jù)的不平衡性。具體算法如下:

(1)對少數(shù)類中的每個樣本Xj求它的k個最近鄰的樣本。

(2)對每個少數(shù)類樣本Xj的k個最近鄰進行判斷,當這k個樣本均為少數(shù)類實例時,保留Xj,否則從少數(shù)類樣本中刪除Xj。

(4)剔除產(chǎn)生的可能噪聲樣本,即當所產(chǎn)生的虛擬樣本的最鄰近樣本屬于少數(shù)類時,其才是滿足條件的虛擬少數(shù)樣本,否則,將其刪除。

(5)循環(huán)執(zhí)行(3)和(4),直到產(chǎn)生足夠多的樣本數(shù),即達到過抽樣參數(shù)T%。

步驟2:將樣本的特征隨即劃分為K個特征子集(無重復抽取),每個特征子集的特征數(shù)為M=D/K。

步驟3:采用RP方法,將原始數(shù)據(jù)通過投影矩陣R投影到d維空間上,獲得各投影矩陣中的每個元素采用Binary方法產(chǎn)生[1]。

步驟4:重復以上步驟L次,就可以得到各個分類器的訓練集。這里的基分類器選擇為SVM。

步驟5:分別使用L個SVM分類器對測試樣本集進行分類,獲得預測函數(shù){f;}和預測標記{h;}。

步驟6:對預測函數(shù)和預測標記進行投票處理,獲得SVM集成分類器最終預測標記Hend。

3 基于改進SVM集成方法的蛋白質(zhì)結(jié)晶偏好性預測

本文實驗數(shù)據(jù)來源于PepcDB數(shù)據(jù)庫中的蛋白質(zhì)鏈,特征選取和計算方法見文獻[2]。經(jīng)過篩選,分別將166955條和5721條蛋白質(zhì)實驗序列作為不可結(jié)晶數(shù)據(jù)集合和可結(jié)晶數(shù)據(jù)集合。采用第3部分所提出的的方法進行預測,T取2000,K取3,采用3折交叉驗證法來估計預測誤差。為了驗證采用本文算法進行預測的效果,選擇集成RBF神經(jīng)網(wǎng)絡模型進行對比,集分類器個數(shù)均選擇為10。在數(shù)據(jù)集上進行10次實驗,實驗結(jié)果取10次實驗的平均值,如表1所示。從表中可以看出,采用本文方法的平均預測準確率達到85.24%,而集成RBF神經(jīng)網(wǎng)絡模型的測試準確率僅為79.04%。

4 結(jié)語

對于不平衡數(shù)據(jù)集分類問題,本文提出一種基于改進旋轉(zhuǎn)森林算法的SVM集成分類方法,并將改進的方法用于對蛋白質(zhì)結(jié)晶偏好性進行預測。實驗結(jié)果表明,與集成RBF神經(jīng)網(wǎng)絡模型相比,本文方法具有較高預測精度。

參考文獻

[1]姚旭,王曉丹,張玉璽,等.結(jié)合Rotation Forest和MultiBoost的SVM集成方法[J].計算機科學,2013,40(3):266-270,290.

[2]王同友.基于集成學習的蛋白質(zhì)結(jié)晶偏好性預測 [D].吉林大學碩士學位論文,2014.endprint

摘要:針對不平衡數(shù)據(jù)集分類問題,本文提出一種基于改進ROF的集成SVM分類方法。實驗結(jié)果表明,采用本文提出的方法預測蛋白質(zhì)結(jié)晶偏好性,可以有效提高預測精度。

關(guān)鍵詞:支持向量機集成算法 旋轉(zhuǎn)森林 蛋白質(zhì)結(jié)晶

中圖分類號:TM715 文獻標識碼:A 文章編號:1007-9416(2014)08-0091-01

1 引言

為了解決數(shù)據(jù)的不平衡性和增強集成SVM基分類器之間的差異性,提出了一種基于改進的旋轉(zhuǎn)森林算法SVM訓練基分類器,并將此方法應用在蛋白質(zhì)結(jié)晶偏好預測上,取得了較好的預測效果。

2 基于不平衡數(shù)據(jù)集的SVM集成算法改進

為了處理不平衡數(shù)據(jù),這里采用了一種改進的SMOTE。為了提高SVM集成泛化的性能,這里采用隨機投影(RP)方法作為旋轉(zhuǎn)森林的線性變換方法。具體算法如下:

步驟1:利用改進的SMOTE算法減小數(shù)據(jù)的不平衡性。具體算法如下:

(1)對少數(shù)類中的每個樣本Xj求它的k個最近鄰的樣本。

(2)對每個少數(shù)類樣本Xj的k個最近鄰進行判斷,當這k個樣本均為少數(shù)類實例時,保留Xj,否則從少數(shù)類樣本中刪除Xj。

(4)剔除產(chǎn)生的可能噪聲樣本,即當所產(chǎn)生的虛擬樣本的最鄰近樣本屬于少數(shù)類時,其才是滿足條件的虛擬少數(shù)樣本,否則,將其刪除。

(5)循環(huán)執(zhí)行(3)和(4),直到產(chǎn)生足夠多的樣本數(shù),即達到過抽樣參數(shù)T%。

步驟2:將樣本的特征隨即劃分為K個特征子集(無重復抽取),每個特征子集的特征數(shù)為M=D/K。

步驟3:采用RP方法,將原始數(shù)據(jù)通過投影矩陣R投影到d維空間上,獲得各投影矩陣中的每個元素采用Binary方法產(chǎn)生[1]。

步驟4:重復以上步驟L次,就可以得到各個分類器的訓練集。這里的基分類器選擇為SVM。

步驟5:分別使用L個SVM分類器對測試樣本集進行分類,獲得預測函數(shù){f;}和預測標記{h;}。

步驟6:對預測函數(shù)和預測標記進行投票處理,獲得SVM集成分類器最終預測標記Hend。

3 基于改進SVM集成方法的蛋白質(zhì)結(jié)晶偏好性預測

本文實驗數(shù)據(jù)來源于PepcDB數(shù)據(jù)庫中的蛋白質(zhì)鏈,特征選取和計算方法見文獻[2]。經(jīng)過篩選,分別將166955條和5721條蛋白質(zhì)實驗序列作為不可結(jié)晶數(shù)據(jù)集合和可結(jié)晶數(shù)據(jù)集合。采用第3部分所提出的的方法進行預測,T取2000,K取3,采用3折交叉驗證法來估計預測誤差。為了驗證采用本文算法進行預測的效果,選擇集成RBF神經(jīng)網(wǎng)絡模型進行對比,集分類器個數(shù)均選擇為10。在數(shù)據(jù)集上進行10次實驗,實驗結(jié)果取10次實驗的平均值,如表1所示。從表中可以看出,采用本文方法的平均預測準確率達到85.24%,而集成RBF神經(jīng)網(wǎng)絡模型的測試準確率僅為79.04%。

4 結(jié)語

對于不平衡數(shù)據(jù)集分類問題,本文提出一種基于改進旋轉(zhuǎn)森林算法的SVM集成分類方法,并將改進的方法用于對蛋白質(zhì)結(jié)晶偏好性進行預測。實驗結(jié)果表明,與集成RBF神經(jīng)網(wǎng)絡模型相比,本文方法具有較高預測精度。

參考文獻

[1]姚旭,王曉丹,張玉璽,等.結(jié)合Rotation Forest和MultiBoost的SVM集成方法[J].計算機科學,2013,40(3):266-270,290.

[2]王同友.基于集成學習的蛋白質(zhì)結(jié)晶偏好性預測 [D].吉林大學碩士學位論文,2014.endprint

主站蜘蛛池模板: 青青青国产精品国产精品美女| 国产成人精品免费视频大全五级| 国产二级毛片| 亚洲国产精品美女| 无码高潮喷水专区久久| 91福利免费| 波多野结衣第一页| 欧美国产在线一区| www.日韩三级| 久久久噜噜噜| 免费一级无码在线网站| 亚洲日韩久久综合中文字幕| 国产精品久久久久久久久久久久| 香蕉色综合| 日韩欧美91| 91福利国产成人精品导航| AV天堂资源福利在线观看| 日韩中文无码av超清| 亚洲无码高清免费视频亚洲| 国产精品成人AⅤ在线一二三四| 最新加勒比隔壁人妻| 国产亚洲精品无码专| 91精品伊人久久大香线蕉| 日韩无码白| 日韩精品成人网页视频在线| 亚洲国产清纯| 国产亚洲精品精品精品| 国产精品毛片一区视频播| 久久国产精品夜色| 久青草免费在线视频| 九月婷婷亚洲综合在线| 亚卅精品无码久久毛片乌克兰 | 欧美区一区| 成人看片欧美一区二区| 全部免费特黄特色大片视频| 视频二区中文无码| 欧美三級片黃色三級片黃色1| 国产精品无码AV中文| 在线色国产| 另类欧美日韩| 天堂在线亚洲| 亚洲日韩高清在线亚洲专区| 91久久精品国产| 国产裸舞福利在线视频合集| 国产成人亚洲毛片| 欧美激情伊人| 天堂岛国av无码免费无禁网站| 亚洲国产成人自拍| 久久网欧美| 欧美影院久久| 久久这里只有精品66| 女人18一级毛片免费观看| 五月激情婷婷综合| 毛片视频网| 亚洲无码精彩视频在线观看 | 欧洲亚洲欧美国产日本高清| 国产免费好大好硬视频| 国产一在线| 国产精品人莉莉成在线播放| 不卡午夜视频| 婷婷午夜天| 国产成人91精品免费网址在线| 国产十八禁在线观看免费| 日韩欧美色综合| 在线精品视频成人网| 在线看AV天堂| 一级不卡毛片| 国产福利一区二区在线观看| WWW丫丫国产成人精品| 91久久天天躁狠狠躁夜夜| 日韩精品毛片人妻AV不卡| 国产黄色片在线看| 久久综合亚洲色一区二区三区| 国产高清无码第一十页在线观看| 思思热在线视频精品| 国产拍在线| h网站在线播放| 88国产经典欧美一区二区三区| 国产精品99久久久久久董美香| 91区国产福利在线观看午夜| swag国产精品| 亚洲综合二区|