999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

癌癥基因表達數據的集成分類器設計與分析

2016-05-30 14:41:04宋年豐
無線互聯科技 2016年7期

宋年豐

摘 要:基因表達水平對癌癥診斷起到重要的作用。文章提出了一種基于SVM(Support Vector Machine)的集成分類算法,從基因表達水平的微陣列數據中對癌癥和正常群體進行分類。文章提出了一種結合Adaboost算法和遞歸特征消除(Recursive Feature Elimination,RFE)算法,選取最顯著的特征并設計與之適合的分類器。該方法已應用于癌癥病人的基因表達微陣列數據的分類中,其分類結果在成功率方面有極大的提升。

關鍵詞:SVM;集成方法;ROC;微陣列;基因表達

基因的表達模式對于疾病的診斷具有特征性。到目前為止,在機器學習領域,有眾多分類或預測方法已經被提出來,其中許多已被應用到基于基因表達水平的微陣列數據的癌癥分類。但是,由于高維微陣列數據容易帶來過擬合、性能差和效率低等缺陷,因此,將傳統的學習算法應用到這類數據中將會遇到極大的挑戰。為了降低這種所謂的“高維小樣本”的問題所帶來的不足,近年來,一些改進和綜合比較的算法已經被提出來。這些算法都已表現出有效性和成為可行的解決方案。盡管很多研究人員對癌癥分類已經做了很多研究,但是鮮有研究者關注基于支持向量機的綜合集成方法來處理這類問題和特征如何影響分類器的性能。

本文試圖引入綜合遞歸特征消除(RFE)算法連同基于SVM的Adaboost算法作為學習算法來極為顯著地改善樣本分類的準確性和魯棒性。結合分類器的特征選擇可以利用樣本的更多信息同時移除分類中的特征噪聲。通過使用集成支持向量機,本文能夠更有效地結合這些特征并改善結果的穩定性和魯棒性。

1 方法與數據

1.1 實驗流程

基于基因表達微陣列數據的預處理和標準化。用RFE算法選擇特征,基于選擇的特征、訓練和建立一個基于SVM的集成分類器作為學習算法。最后,通過競爭性的集成算法,魯棒性大大改善。這里,本文用多數表決來結合Adaboost算法中的結果。所有處理框架的完成都通過MATLAB來實現。

1.2 數據描述

在本研究中,采用了2個來自不同群組的基因表達微陣列數據集。這2個數據集有不同的特性(其中一個數據集可以線性地分開,而另一個則不行)。第一個數據集來自患白血病的癌癥病人(急性髓細胞性白血病-AML和急性淋巴細胞白血病-ALL)。這個數據集有兩個子集,訓練集包含38個骨髓樣本,測試集包含34個樣本(其中20個All樣本,14個AML樣本)。所有樣本共7129個特征,對應一些從微陣列圖像中提取出來被標準化的基因表達水平值。

第二個數據將來自正常的和癌變的乳腺組織。這個數據集包含295個樣本,8141個特征。病人有217個樣本,正常人只有78個樣本,為了數據的均勻化,本文從第一類中抽取了61個樣本,從第二類中抽取65個樣本作為訓練集。在第一類中抽取27個樣本在第二類中抽取26個樣本作為測試集。

2 結果與討論

2.1 分類器的分類性能

將SVM和基于SVM的集成算法應用于乳腺癌數據中。盡管核函數為線性的SVM比核函數為RBF的效果更好,達96.23%,但前者需要更多的特征和時間來運行程序。SVM-RBF的成功率只有90.566%,但集成方法的成功率是94.3396%,且只需要更少的特征數量,所以可以得出結論基于SVM的集成算法可以改進分類器的性能。當基因數量為34時,訓練集和測試集的成功率最高,這些基因被稱為與分類最相關的標記基因(見圖1)。

2.2 不同參數對分類器性能的影響

2.2.1 核函數選擇的重要性

首先,本文應用SVM算法(核函數為RBF)的白血病數據集,但分類結果很差,成功率只有58.8235%。如果本文設置內核函數為線性核函數類型時,分類成功率得到了極大的提高,達到82.3529%。同樣的情況也發生在乳腺癌的數據中。當應用SVM算法的基因表達數據集進行分類,核函數的選擇對分類結果有著重要的影響(見表1)。

2.2.2 特征選擇的重要性

本文將SVM或者基于SVM的集成算法應用到白血病數據集,結果如表2所示。在選擇特征之前,測試集的成功率很低。當使用了重要的特征,無論核函數是否合適,成功率都改善了很多,因此特征選擇是實驗的關鍵因素。由于數據特征維數比數據集的樣本維數更多,會導致過擬合。這些特征中可能包含了噪聲,也會對分類有影響。實驗中,本文發現集成方法對于白血病數據沒那么有效。原因是當只使用了SVM時,已經獲得了91.1764%的結果。如果SVM已表現出很好的性能,那么集成方法將失去它的優勢。

3 結語

本文應用特征選擇改善Adaboost算法,通過RFE方法選取基因,得出結論:(1)集成方法在某種程度上改善了SVM分類器的性能。(2)如何選擇和提取特征子集對基因分類有至關重要的影響。(3)如果支持向量基的效果在某些數據集上更好,那集成將變得沒有作用。本文將在今后繼續探究導致基于支持向量基的集成算法變得無效的因素。

[參考文獻]

[1]Boulesteix AL,Strobl C,Augustin T,et al. Evaluating microarray-based classifiers:an overview[J].Cancer Informatics,2008(6):77-97.

[2]Liu H,Sun J,Liu L,et al. Feature selection with dynamic mutual information[J].Pattern Recognition,2009(42):1330-1339.

[3]Freund Y,Schapire RE.A decision-theoretic generalization of on-line learning and an application to boosting[J]. Journal of computer and system sciences,1997(55):119-139.

[4]Golub TR,Slonim DK,Tamayo P,et al.Molecular classification of cancer: class discovery and class prediction by gene expression monitoring[J].Science,1999(286):531-537.

Design and Analysis of Ensemble Classifier for Gene Expression Data of Cancer

Song Nianfeng

(Automation Department, Xiamen University, Xiamen 361005, China)

Abstract: Gene expression levels are important for disease, such as, Cancer diagnosis. This paper proposed a SVM-based ensemble classifier to classify the control and cancer groups based on gene expression levels from microarray data. A combinational Recursive Feature Elimination in conjunction with the Adaboost algorithm was developed to select significant features and design the proper classifier. The method is applied to microarray data of cancer patients, and the results show improvements on the success rate.

Key words: SVM; ensemble methods; ROC; microarray; gene expression

主站蜘蛛池模板: 日韩无码精品人妻| 久久 午夜福利 张柏芝| 国产乱子伦无码精品小说| 欧美综合在线观看| 狠狠亚洲婷婷综合色香| 999精品色在线观看| 国产毛片不卡| 久久国产精品影院| 色欲不卡无码一区二区| 最新亚洲人成网站在线观看| 99久久婷婷国产综合精| 久久精品免费看一| 亚洲日韩AV无码精品| 欧美日韩综合网| 福利国产微拍广场一区视频在线| 国产成人欧美| 亚洲综合片| 欧美亚洲国产视频| 国产丝袜无码精品| 91在线国内在线播放老师| 97精品国产高清久久久久蜜芽| 五月婷婷亚洲综合| 国产欧美综合在线观看第七页| 波多野吉衣一区二区三区av| 亚洲国产成人超福利久久精品| 精品少妇人妻无码久久| 欧美一区二区福利视频| www.91在线播放| 2021国产精品自产拍在线观看| 刘亦菲一区二区在线观看| 2021国产精品自产拍在线观看 | 欧美人与动牲交a欧美精品| 亚洲成人动漫在线| 亚洲无码高清视频在线观看| 久久国产精品夜色| 日本欧美一二三区色视频| 69视频国产| 热99re99首页精品亚洲五月天| 久久9966精品国产免费| 男人天堂伊人网| 亚洲精品动漫| 日本在线国产| 自拍偷拍一区| 内射人妻无码色AV天堂| 精品无码一区二区在线观看| 中国一级毛片免费观看| 欧美国产在线看| 影音先锋丝袜制服| 再看日本中文字幕在线观看| 亚洲精品麻豆| 天天色天天综合网| A级毛片高清免费视频就| 99热这里只有精品免费| 国产美女自慰在线观看| 1级黄色毛片| 欧美一区二区三区香蕉视| 毛片久久久| 国产剧情一区二区| 91美女在线| 98精品全国免费观看视频| 91麻豆精品国产高清在线| 九色在线观看视频| 高h视频在线| 91视频精品| 日本亚洲最大的色成网站www| 中文字幕av无码不卡免费| 99r在线精品视频在线播放| 欧美在线天堂| 日本爱爱精品一区二区| 国产在线观看99| 亚洲综合第一页| 亚洲欧洲日韩久久狠狠爱| 久久中文字幕2021精品| 国产爽妇精品| 黄片在线永久| 一本大道东京热无码av| 国产主播在线一区| v天堂中文在线| 91在线丝袜| 99成人在线观看| 97视频在线精品国自产拍| 日韩欧美91|