999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于P-tree的多決策樹基因表達(dá)數(shù)據(jù)分類

2007-07-05 01:40:06石永昆
關(guān)鍵詞:精確度分類方法

黃 金 石永昆

摘要:提出基于P-tree的多決策樹分類基因表達(dá)數(shù)據(jù)方法PTMDT(P-tree multi-decision tree)。

關(guān)鍵詞:基因表達(dá)分類P-tree

中圖分類號(hào)TP311.132.3文獻(xiàn)標(biāo)識(shí)碼A文章編號(hào):1002-2422(2007)03-0050-02

使用The Peano Count Tree(P-tree)結(jié)構(gòu)和的邏輯運(yùn)算操作,快速地構(gòu)造出基因表達(dá)數(shù)據(jù)的決策樹,用于基因表達(dá)數(shù)據(jù)的分類。實(shí)驗(yàn)結(jié)果表明PTMDT方法不但可以取得良好的分類精確度,而且在計(jì)算速度方面遠(yuǎn)遠(yuǎn)好于其它方法。

1基因表達(dá)數(shù)據(jù)的裁減和離散化

1.1基因表達(dá)數(shù)據(jù)的裁減

基因表達(dá)數(shù)據(jù)是通過基因芯片實(shí)驗(yàn)獲得的。通常基因表達(dá)數(shù)據(jù)以矩陣形式保存,矩陣第i行對(duì)應(yīng)于第i個(gè)基因,第i列對(duì)應(yīng)于第j個(gè)實(shí)驗(yàn)樣本,而矩陣的每個(gè)元素aij記錄了第i個(gè)基因在第j個(gè)樣品中的表達(dá)水平。

在基因數(shù)據(jù)中,有一部分基因表現(xiàn)的特征在不同類別中差別不明顯,被稱為不相關(guān)基因,因?yàn)椴幌嚓P(guān)基因?qū)Ψ诸惒黄鹱饔茫钥梢圆脺p掉這些不相關(guān)基因。具體裁減方法是:先把一個(gè)基因的表達(dá)數(shù)據(jù)按照已知類別分組,分別計(jì)算每組數(shù)據(jù)的期望和方差。然后計(jì)算期望的最大值和最小值的差值,如果這個(gè)基因各個(gè)類別的方差值都小于這個(gè)差值,那么認(rèn)為這個(gè)基因的特征表現(xiàn)在不同類別下是明顯的,要保留這個(gè)基因,否則認(rèn)為是不相關(guān)基因,把它裁減掉。

1.2離散基因表達(dá)數(shù)據(jù)

為了利用P-tree結(jié)構(gòu)建立決策樹,首先需要對(duì)給定的基因表達(dá)數(shù)據(jù)進(jìn)行離散化處理。例如基因表達(dá)數(shù)據(jù),根據(jù)對(duì)數(shù)據(jù)大小范圍的觀測(cè),把它們離散成Io、l1、I2、I3四個(gè)部分,Io=[0,1]、I1=[1,2]、12=[2,3]、13=[3,4],每一部分用一個(gè)二進(jìn)制比特串表示,設(shè)Io=00,I1=01,I1=10,I3=11。通過這樣的離散化處理,表l中的基因表達(dá)數(shù)據(jù)轉(zhuǎn)變成表2中的形式,這樣就可使用P-tree結(jié)構(gòu)表示基因表達(dá)數(shù)據(jù)了。

PTMDT方法基于P-tree結(jié)構(gòu),結(jié)合決策樹實(shí)現(xiàn)了對(duì)基因表達(dá)數(shù)據(jù)的分類。使用P-tree結(jié)構(gòu)的目的主要有兩點(diǎn)。第一,使用P-tree結(jié)構(gòu)計(jì)算信息增益時(shí)只需使用P-tree的AND操作,AND操作速度快,減少了建立決策樹的時(shí)間;第二,在使用P-tree結(jié)構(gòu)建立決策樹的過程中,不需要重復(fù)掃描數(shù)據(jù)集獲得決策樹中間結(jié)點(diǎn)包括的子數(shù)據(jù)集,這是因?yàn)楹蜆渲薪Y(jié)點(diǎn)相對(duì)應(yīng)的P-tree就表示了這個(gè)結(jié)點(diǎn)包含的數(shù)據(jù)集,即P-tree中表示為1比特的位置對(duì)應(yīng)的數(shù)據(jù)就是被該結(jié)點(diǎn)包含的數(shù)據(jù)。

決策樹是數(shù)據(jù)挖掘分類常用的一種方法,決策樹中的每個(gè)非葉結(jié)點(diǎn)選擇具有最大信息增益的屬性作為測(cè)試屬性。使用P-tree表示的數(shù)據(jù),可以通過如下方法計(jì)算一個(gè)屬性的信息增益值。假設(shè)Bo是類別屬性,B1,B2,B3是非類別屬性.決策樹中的每個(gè)結(jié)點(diǎn)都存儲(chǔ)相應(yīng)的決策路徑信息,即存儲(chǔ)從樹根結(jié)點(diǎn)到本結(jié)點(diǎn)所經(jīng)過的決策屬性和相應(yīng)的屬性值,如圖l中結(jié)點(diǎn)N09的決策路徑是“B2,,0011,B3,1000”。使用RC表示P-tree根結(jié)點(diǎn)的數(shù)值。對(duì)于給定決策路徑B[1],V[l],B[2],V[2],…,B[t],V[t]的結(jié)點(diǎn)N,結(jié)點(diǎn)N對(duì)應(yīng)的P-tree使用下面的公式計(jì)算結(jié)點(diǎn)N的I(P)

在構(gòu)造決策樹時(shí),首先計(jì)算每個(gè)基因的信息增益值,選擇具有最大信息增益的基因作為決策樹根結(jié)點(diǎn)的測(cè)試屬性。根據(jù)這個(gè)基因所有的屬性值,把結(jié)點(diǎn)劃分為多個(gè)孩子結(jié)點(diǎn),然后遞歸地計(jì)算每個(gè)孩子結(jié)點(diǎn)。

針對(duì)單決策樹分類精度低的問題,PTMDT方法采用了多決策樹分類方法。構(gòu)建多棵決策樹時(shí)對(duì)樹根結(jié)點(diǎn)決策基因的選擇是依照從最優(yōu)逐漸遞減的原則,即第一棵決策樹選擇信息增益最大的基因作為根結(jié)點(diǎn)的決策基因,第二棵決策樹選擇信息增益第二大的基因作為根結(jié)點(diǎn)的決策基因,以此類推。不同的決策樹對(duì)同一測(cè)試數(shù)據(jù)可能得到不同的分類結(jié)果,取出現(xiàn)次數(shù)最多的類型作為測(cè)試數(shù)據(jù)的分類結(jié)果。

3實(shí)驗(yàn)結(jié)果

為了驗(yàn)證PTMDT方法的有效性,實(shí)驗(yàn)應(yīng)用small roundrole-cell tumors(SRBCT)數(shù)據(jù)集進(jìn)行,其中包含63個(gè)訓(xùn)練樣本和25個(gè)測(cè)試樣本,每個(gè)樣本包含2303個(gè)基因表達(dá)值,分成四個(gè)類別:EWS(23),RMS(20),NB(12),BL(8)。

對(duì)63個(gè)訓(xùn)練樣本,PTMDT方法的訓(xùn)練精度是100%。表3是用PTMDT方法對(duì)20個(gè)測(cè)試樣本進(jìn)行多決策樹分類的時(shí)間和精確度,其中運(yùn)行時(shí)間是指PTMDT方法開始運(yùn)行直到得到最終分類結(jié)果總共花費(fèi)的時(shí)間。

給出了PTMDT方法與基于SVM的OVA方法、TSS方法的運(yùn)行時(shí)間和分類精確度的比較。從比較結(jié)果可知PTMDT算法在運(yùn)行時(shí)間方面明顯優(yōu)于OVA和TSS方法,在精確度方面接近TSS方法,略高于OVA方法。

4結(jié)束語

文中提出了一個(gè)基因表達(dá)數(shù)據(jù)分類方法PTMDT。利用p-tree結(jié)構(gòu),使得構(gòu)建決策樹的時(shí)間大大縮短,并結(jié)合多決策樹技術(shù),提高了分類的精確度。從實(shí)驗(yàn)結(jié)果可看出,PT-MDT方法與目前已知優(yōu)秀分類基因表達(dá)數(shù)據(jù)方法相比,具有良好的分類精確度,并且運(yùn)行速率較快。

猜你喜歡
精確度分類方法
分類算一算
“硬核”定位系統(tǒng)入駐兗礦集團(tuán),精確度以厘米計(jì)算
分類討論求坐標(biāo)
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
用對(duì)方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
易錯(cuò)題突破:提高語言精確度
主站蜘蛛池模板: 一级黄色片网| 亚洲国产第一区二区香蕉| 国产欧美日韩一区二区视频在线| 不卡无码h在线观看| 98超碰在线观看| 精品国产成人国产在线| 久久中文字幕2021精品| 国产成人无码AV在线播放动漫| 亚洲精品欧美重口| 91精品专区国产盗摄| 国产精品手机在线观看你懂的 | av无码久久精品| 中文字幕人妻无码系列第三区| 亚洲成人高清无码| 午夜视频www| 亚洲91在线精品| 亚洲色图狠狠干| 国产精品亚洲αv天堂无码| 精品无码一区二区三区电影| 国产免费一级精品视频 | yjizz视频最新网站在线| 国产福利免费在线观看| 欧洲av毛片| 亚洲第一色网站| 国内精品九九久久久精品| 国产喷水视频| 丰满的少妇人妻无码区| 在线免费无码视频| 伊人久久精品无码麻豆精品 | 中文字幕欧美成人免费| 99色亚洲国产精品11p| 在线观看91香蕉国产免费| 国产精品视频公开费视频| 日韩国产黄色网站| 国产99久久亚洲综合精品西瓜tv| 国产精品hd在线播放| 亚洲天堂首页| 91丝袜乱伦| 亚洲中文在线看视频一区| 亚洲乱码视频| 亚洲高清在线天堂精品| 精品少妇人妻一区二区| 国产成人亚洲无吗淙合青草| 99热亚洲精品6码| 专干老肥熟女视频网站| 91精品亚洲| 综合色婷婷| 一级成人a做片免费| 伊人网址在线| 国产99精品久久| 久久这里只有精品国产99| 久久综合色天堂av| 全部免费毛片免费播放| 国产成人永久免费视频| 国产成人精品一区二区秒拍1o| 四虎影视国产精品| 欧洲欧美人成免费全部视频 | 91年精品国产福利线观看久久| 久久精品国产电影| 日本在线国产| 国产精品55夜色66夜色| 五月激情婷婷综合| 天天躁夜夜躁狠狠躁图片| 欧美影院久久| 国产精品护士| 日本a级免费| 色婷婷色丁香| 国产白浆视频| 久久亚洲美女精品国产精品| 99久久精品免费看国产电影| 亚洲欧美自拍中文| 免费日韩在线视频| 国产精品视频a| av天堂最新版在线| 婷婷午夜天| 日本手机在线视频| 少妇人妻无码首页| 日韩大片免费观看视频播放| 国产成人高清亚洲一区久久| 国产网站免费看| 伊人丁香五月天久久综合| 国产人成在线观看|