999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

使用K近鄰算法診斷乳腺癌

2020-10-21 12:24:09趙宇
大東方 2020年3期
關鍵詞:數據挖掘標準化乳腺癌

趙宇

摘 要:隨著信息技術的不斷發展,醫療大數據的概念也逐漸被人類所熟知。通過對數據挖掘技術在乳腺癌各領域的研究現狀(乳腺癌基因研究、乳腺癌早期輔助檢查、力學藥物靶點識別、乳腺癌新中醫治療方法)的分析,展望數據挖掘技術應用于乳腺癌領域的前景,為數據挖掘技術在乳腺癌疾病的研究提供新思路。

關鍵詞:數據挖掘;乳腺癌

一、前言

乳腺癌已成為當前社會的重大公共衛生問題。全球乳腺癌發病率自20世紀70年代末開始一直呈上升趨勢。美國8名婦女一生中就會有1人患乳腺癌。中國不是乳腺癌的高發國家,但不宜樂觀,近年我國乳腺癌發病率的增長速度卻高出高發國家1~2個百分點。

二、數據源

我們將使用來自UCI的乳腺癌診斷數據集,該乳腺癌數據包括569例乳腺細胞活檢樣本,每個樣本包含32個變量。其中id變量是樣本識別ID,diagnosis變量是目標變量(M代表惡性,B代表良性)。其他30個變量都是由10個數字化細胞核的10個不同特征的均值、標準差和最大值構成。這10個基本特征為:

三、數據探索和預處理

.3.1 ?數據的探索

首先,搜集數據集如下圖所示,由于數量問題,只顯示其中部分,共計569個樣本,32個變量。

將整個數據集導入SPSS軟件中。

第一個變量為ID,無法為實際的模型構建提供有用的信息,所以需要將其刪除。diagnosis變量是我們的目標變量,我們首先統計一下其取值分布。觀察在我們的數據集中,惡性(M)和良性樣本(B)的分布情況。在正式建模之前需要將其進行整數編碼,將良性(B)編碼為0,將惡性(M)編碼為1。

通過統計我們的569個樣本中,良性樣本(B)和陰性樣本分別有212個,占比分別為62.7%和37.3%。其中作為示例,我們主要選取所有變量中的三個:radius_mean,area_mean和smoothness_mean。

通過SPSS軟件生成圖形對三個變量進行分析:觀察這三個變量的統計信息,發現它們的取值范圍不大一致。radius_mean取值范圍為6.981~28.110,area_mean取值范圍為143.5~2501.0,smoothness_mean取值范圍為0.05263~0.16340。不同變量的測量尺度不一致會影響K近鄰算法中的樣本距離計算。例如,如果上述三個變量直接參與距離計算,則area_mean變量將會對距離計算影響最大,從而會導致我們構建的分類模型過分依賴于area_mean變量。在應用K近鄰等涉及距離計算的算法構建預測模型之前,需要對變量取值進行標準化。常見的標準化方法有min-max標準化和Z-score標準化等。

3.2數據的標準化:

為了將自變量進行min-max標準化,使用min_max_normalize函數。該函數輸入為數值型向量x,對于x中的每一個取值,減去x的最小值,再除以x中數值的取值范圍。結果如下可見所有的變量都已經正確地標準化到0和1之間:

四、模型性能提升

4.1 測試不同k取值對模型效果的影響

我們將分別測試 k = 1,5,9,11時模型的效果。由于模型整體預測準確率已經很高。我們通過觀察假陰性(False Negative)和假陽性(False Positive)的數目和正確率(Accuracy)來對比不同k取值下模型的效果。

可見,當 k = 5 時,假陽性數量最少,且假陰性數量僅為1,正確率達到最高。當然,這也只是在171個測試樣本上的結果。

參考文獻

[1]MOURADC,LOPEZMA G.An evaluation of imagedescriptors combined with clinical data for breast cancer diagnosis [J].Intemational Joumal of computer Assisted Radiology and Surgery,2013,8(4):561-57.

[2]張旭東,孫圣力,王洪超.基于數據挖掘的觸診成像乳腺癌智能診斷模型和方法[J].大數據,2019,5(01):68-76.

[3]侯公楷.中醫藥防治乳腺癌進展[J].遼寧中醫藥大學學報,2016,18(05):249-253.

(作者單位:河北大學 生命科學學院)

猜你喜歡
數據挖掘標準化乳腺癌
絕經了,是否就離乳腺癌越來越遠呢?
中老年保健(2022年6期)2022-08-19 01:41:48
標準化簡述
探討人工智能與數據挖掘發展趨勢
乳腺癌是吃出來的嗎
胸大更容易得乳腺癌嗎
別逗了,乳腺癌可不分男女老少!
祝您健康(2018年5期)2018-05-16 17:10:16
標準化是綜合交通運輸的保障——解讀《交通運輸標準化體系》
中國公路(2017年9期)2017-07-25 13:26:38
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
一種基于Hadoop的大數據挖掘云服務及應用
論汽車維修診斷標準化(上)
主站蜘蛛池模板: 天天摸夜夜操| 色悠久久综合| 欧美综合一区二区三区| 亚洲AV永久无码精品古装片| 国产日韩欧美一区二区三区在线| 日韩区欧美国产区在线观看| 亚洲中文字幕23页在线| 波多野结衣在线一区二区| 激情网址在线观看| 久久精品亚洲中文字幕乱码| 国产最新无码专区在线| 99久久精品免费视频| 麻豆国产精品一二三在线观看| AV无码国产在线看岛国岛| 日本三级黄在线观看| 日韩在线成年视频人网站观看| 精品久久久久久中文字幕女| 国产丝袜91| 91午夜福利在线观看| 国产精品免费p区| 91免费在线看| 久996视频精品免费观看| 91青青视频| 亚洲成年网站在线观看| 亚洲人成亚洲精品| 国产在线观看91精品| 欧美特黄一级大黄录像| 一级毛片在线播放免费| 日日噜噜夜夜狠狠视频| 欧亚日韩Av| 老司机精品久久| 亚洲永久免费网站| 制服丝袜 91视频| 老司机午夜精品网站在线观看 | 91精品国产91久久久久久三级| 久久99国产综合精品女同| 午夜不卡福利| 欧美人在线一区二区三区| 亚洲人成网址| 四虎影视无码永久免费观看| 国产精品私拍99pans大尺度| 日韩黄色精品| 麻豆精品国产自产在线| www欧美在线观看| 国产区成人精品视频| 一区二区欧美日韩高清免费| 中文字幕免费在线视频| 黄色网在线| 免费一级大毛片a一观看不卡| 亚洲国产高清精品线久久| 九九九精品成人免费视频7| 色综合五月婷婷| 欧美.成人.综合在线| 国产在线八区| 日韩高清一区 | 日韩无码真实干出血视频| 欧洲亚洲欧美国产日本高清| 美女毛片在线| 国产精品永久久久久| 国产剧情一区二区| 欧美日本二区| 天堂成人av| 国产情侣一区二区三区| 熟妇人妻无乱码中文字幕真矢织江| 精品无码一区二区三区电影| 国产午夜精品一区二区三| 国产成人精品日本亚洲| 一级香蕉视频在线观看| 在线永久免费观看的毛片| 国产成本人片免费a∨短片| 国产成+人+综合+亚洲欧美| 无码AV高清毛片中国一级毛片| 欧美成人日韩| 67194亚洲无码| 国产成人AV大片大片在线播放 | 四虎成人免费毛片| 国产不卡网| 69视频国产| 国产菊爆视频在线观看| 伊人色在线视频| 色噜噜综合网| 亚洲人成网站18禁动漫无码|