999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種基于高相關(guān)性特征集選擇技術(shù)的病歷大數(shù)據(jù)分類方法

2020-04-06 09:25:28胡俊承
數(shù)字通信世界 2020年3期
關(guān)鍵詞:分類特征方法

胡俊承

(桂林醫(yī)學(xué)院,桂林 541001)

0 引言

分類是根據(jù)需求對(duì)數(shù)據(jù)進(jìn)行最有效使用的分組過程。數(shù)據(jù)分類可分為兩個(gè)步驟,學(xué)習(xí)過程和分類過程。有效的分類技術(shù)可以幫助人們非常輕松地檢索到需要的數(shù)據(jù),本文將以龐大的病例數(shù)據(jù)分類為例。不同的疾病可采取不同的治療方法,治療方法取決于病人自身的健康標(biāo)準(zhǔn)。處理如此繁復(fù)的病例數(shù)據(jù)需要巨大的工作量,分層學(xué)習(xí)方法在處理這些數(shù)據(jù)時(shí)表現(xiàn)可圈可點(diǎn),在過去的研究當(dāng)中有所體現(xiàn)。L.Cai and T.Hofmann[1]提出將支持向量機(jī)(SVM)標(biāo)準(zhǔn)分類與分層方法相結(jié)合,提高支持向量機(jī)分類精度,減少支持向量機(jī)測試的計(jì)算量。T.Gao and D.Kollar[2]探討了層次聚類在高維生物醫(yī)學(xué)光譜分類中的有效性。

然而分層學(xué)習(xí)的性能很大程度上取決于特征選擇的質(zhì)量。特征子集選擇按照評(píng)價(jià)標(biāo)準(zhǔn)和方法的不同可分為四種類型,分別為過濾式(Filter)[3]、封裝式(Wrapper)、混用式(Hybrid)和嵌入式(Embeded)。利用過多的特征進(jìn)行分類會(huì)導(dǎo)致性能瓶頸,因此正確謹(jǐn)慎地選擇特征子集顯得尤為重要。本文設(shè)計(jì)了一種基于高相關(guān)性特征選擇技術(shù)的過濾式特征選擇方法,可以更正確有效地結(jié)合分層學(xué)習(xí)識(shí)別較好的特征子集,提高對(duì)病例數(shù)據(jù)中宮頸癌信息分類的性能。

1 分層學(xué)習(xí)方法

在對(duì)高維病歷進(jìn)行分類時(shí),采用分層學(xué)習(xí)的方法可以得到較好的分類結(jié)果。該分類器以特征作為輸入,從宮頸癌數(shù)據(jù)集中檢索各種類別的記錄,包括患者信息和宮頸癌疾病的治療信息。對(duì)于分類高維病歷,分層學(xué)習(xí)算法體現(xiàn)出更好的性能。在此實(shí)驗(yàn)中,分類器將從病例數(shù)據(jù)檢索出的特征作為輸入。首先評(píng)估患者治療類別之間的類別間相關(guān)性,評(píng)估過程可以以一下方程式定義

2 高相關(guān)特征集選擇(HCFS)算法

這里我們設(shè)計(jì)一個(gè)高相關(guān)特征集選擇(HCFS)算法以及步驟。使用這一算法可以幫助系統(tǒng)選擇更合適的特征,這一算法可與已有的分層學(xué)習(xí)算法相結(jié)合,使得數(shù)據(jù)分類性能得到提升。圖1大致描述了HCFS算法的工作原理。

其輸入為病例數(shù)據(jù)集(D)以及特征和類標(biāo)簽(f1,f2,f3……c1,……cn),輸出為特征子集(s)。該算法首先設(shè)置相關(guān)閾值(t),該閾值是通過查找特征和類標(biāo)簽之間的關(guān)聯(lián)來估計(jì)的。尋找特征之間相關(guān)性(fi,fj),特征與類之間相關(guān)性(fi,cj),相關(guān)值(v)。然后將屬性或特征表示為節(jié)點(diǎn),將估計(jì)的相關(guān)值作為邊緣權(quán)重(e1,e2,……,en),在此基礎(chǔ)上形成決策樹。

通過將相關(guān)值與初始設(shè)定的預(yù)定義閾值進(jìn)行比較,對(duì)構(gòu)建的樹進(jìn)行劃分。如果計(jì)算出的相關(guān)值(v)<閾值(t),則該特定邊緣將被排除。

在此過程之后,將生成特性集群(稱為簇),從這組特征中可以確定簇頭。該算法從宮頸癌數(shù)據(jù)集中檢索出高質(zhì)量的特征簇,并將這些特征輸入到分層學(xué)習(xí)方法中運(yùn)算,以獲得更好的分類性能。

圖1 HCFS算法的工作原理

3 實(shí)驗(yàn)結(jié)果

在表1中,實(shí)驗(yàn)對(duì)兩種不同的分類方法進(jìn)行精確性的比較。實(shí)驗(yàn)采用宮頸癌的治療數(shù)據(jù)作為數(shù)據(jù)集,對(duì)比結(jié)合HCFS的分層學(xué)習(xí)算法與單一的分層學(xué)習(xí)算法,可以明顯得看出在不同的病人分類中,結(jié)合了HCFS的分層學(xué)習(xí)算法的精確度都有明顯地提升。

表1 結(jié)合HCFS的分層學(xué)習(xí)算法與分層學(xué)習(xí)算法的精確度對(duì)比

4 結(jié)束語

已有的分層學(xué)習(xí)算法雖然在分類上效率較高,但是性能受制于所選的特征。HCFS算法可為分層學(xué)習(xí)算法確定質(zhì)量更可靠的特征子集,使得分類性能有所提高,尤其是應(yīng)用在大規(guī)模數(shù)據(jù)分析中。本文設(shè)計(jì)了一種基于分層學(xué)習(xí)技術(shù)結(jié)合HCFS的算法,應(yīng)用在病例宮頸癌數(shù)據(jù)的分類問題。實(shí)驗(yàn)的統(tǒng)計(jì)結(jié)果驗(yàn)證了本文算法的有效性,并使得分類性能得到提高。

猜你喜歡
分類特征方法
分類算一算
如何表達(dá)“特征”
不忠誠的四個(gè)特征
分類討論求坐標(biāo)
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
抓住特征巧觀察
用對(duì)方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
主站蜘蛛池模板: 欧美色99| 国产伦精品一区二区三区视频优播 | 又黄又爽视频好爽视频| 蜜桃视频一区二区三区| 黄色网站在线观看无码| 在线欧美日韩| 久久婷婷人人澡人人爱91| 国产午夜不卡| 久久免费视频6| 97超爽成人免费视频在线播放| 成人福利在线免费观看| 国内视频精品| 午夜精品久久久久久久99热下载 | 国产精品污视频| av尤物免费在线观看| 国产精品污视频| 91在线国内在线播放老师| 99久久成人国产精品免费| 一级全免费视频播放| 国产成人综合日韩精品无码不卡| 色成人亚洲| 97视频在线观看免费视频| 在线观看免费国产| 无码高潮喷水专区久久| 亚洲天堂精品视频| 亚洲日本www| 中文字幕人妻无码系列第三区| 就去色综合| 久久精品欧美一区二区| 69精品在线观看| 91欧美亚洲国产五月天| 男女精品视频| 亚洲精品大秀视频| 日韩av资源在线| 精品色综合| 欧美色综合网站| 无码AV日韩一二三区| 一级做a爰片久久毛片毛片| 91国内外精品自在线播放| 天堂在线视频精品| 欧美成人看片一区二区三区| 日韩在线视频网站| 91热爆在线| 亚洲国产天堂在线观看| 色香蕉网站| 一区二区理伦视频| 99视频在线观看免费| 91麻豆国产视频| 亚洲欧美综合在线观看| 97久久人人超碰国产精品| 九色视频最新网址 | 国产精品香蕉| 狠狠色丁婷婷综合久久| 高清码无在线看| 欧美在线网| 国产xx在线观看| 日本黄色不卡视频| 日韩精品专区免费无码aⅴ| 欧美日本在线播放| 亚洲av成人无码网站在线观看| 亚洲精品另类| 亚洲国产AV无码综合原创| 91在线播放免费不卡无毒| 广东一级毛片| 亚洲伊人天堂| 日本三级精品| 国产十八禁在线观看免费| 国产精品主播| 午夜天堂视频| 伊人久久久大香线蕉综合直播| 久久亚洲国产最新网站| 98超碰在线观看| 国产美女无遮挡免费视频| 精品亚洲麻豆1区2区3区| 日韩欧美国产另类| 亚洲第一精品福利| 三级国产在线观看| 91麻豆久久久| 亚洲欧美激情另类| 国产成年无码AⅤ片在线| 日韩无码视频网站| 91精品视频在线播放|