999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

使用K近鄰算法診斷乳腺癌

2020-10-21 12:24:09趙宇
大東方 2020年3期
關鍵詞:數據挖掘標準化乳腺癌

趙宇

摘 要:隨著信息技術的不斷發展,醫療大數據的概念也逐漸被人類所熟知。通過對數據挖掘技術在乳腺癌各領域的研究現狀(乳腺癌基因研究、乳腺癌早期輔助檢查、力學藥物靶點識別、乳腺癌新中醫治療方法)的分析,展望數據挖掘技術應用于乳腺癌領域的前景,為數據挖掘技術在乳腺癌疾病的研究提供新思路。

關鍵詞:數據挖掘;乳腺癌

一、前言

乳腺癌已成為當前社會的重大公共衛生問題。全球乳腺癌發病率自20世紀70年代末開始一直呈上升趨勢。美國8名婦女一生中就會有1人患乳腺癌。中國不是乳腺癌的高發國家,但不宜樂觀,近年我國乳腺癌發病率的增長速度卻高出高發國家1~2個百分點。

二、數據源

我們將使用來自UCI的乳腺癌診斷數據集,該乳腺癌數據包括569例乳腺細胞活檢樣本,每個樣本包含32個變量。其中id變量是樣本識別ID,diagnosis變量是目標變量(M代表惡性,B代表良性)。其他30個變量都是由10個數字化細胞核的10個不同特征的均值、標準差和最大值構成。這10個基本特征為:

三、數據探索和預處理

.3.1 ?數據的探索

首先,搜集數據集如下圖所示,由于數量問題,只顯示其中部分,共計569個樣本,32個變量。

將整個數據集導入SPSS軟件中。

第一個變量為ID,無法為實際的模型構建提供有用的信息,所以需要將其刪除。diagnosis變量是我們的目標變量,我們首先統計一下其取值分布。觀察在我們的數據集中,惡性(M)和良性樣本(B)的分布情況。在正式建模之前需要將其進行整數編碼,將良性(B)編碼為0,將惡性(M)編碼為1。

通過統計我們的569個樣本中,良性樣本(B)和陰性樣本分別有212個,占比分別為62.7%和37.3%。其中作為示例,我們主要選取所有變量中的三個:radius_mean,area_mean和smoothness_mean。

通過SPSS軟件生成圖形對三個變量進行分析:觀察這三個變量的統計信息,發現它們的取值范圍不大一致。radius_mean取值范圍為6.981~28.110,area_mean取值范圍為143.5~2501.0,smoothness_mean取值范圍為0.05263~0.16340。不同變量的測量尺度不一致會影響K近鄰算法中的樣本距離計算。例如,如果上述三個變量直接參與距離計算,則area_mean變量將會對距離計算影響最大,從而會導致我們構建的分類模型過分依賴于area_mean變量。在應用K近鄰等涉及距離計算的算法構建預測模型之前,需要對變量取值進行標準化。常見的標準化方法有min-max標準化和Z-score標準化等。

3.2數據的標準化:

為了將自變量進行min-max標準化,使用min_max_normalize函數。該函數輸入為數值型向量x,對于x中的每一個取值,減去x的最小值,再除以x中數值的取值范圍。結果如下可見所有的變量都已經正確地標準化到0和1之間:

四、模型性能提升

4.1 測試不同k取值對模型效果的影響

我們將分別測試 k = 1,5,9,11時模型的效果。由于模型整體預測準確率已經很高。我們通過觀察假陰性(False Negative)和假陽性(False Positive)的數目和正確率(Accuracy)來對比不同k取值下模型的效果。

可見,當 k = 5 時,假陽性數量最少,且假陰性數量僅為1,正確率達到最高。當然,這也只是在171個測試樣本上的結果。

參考文獻

[1]MOURADC,LOPEZMA G.An evaluation of imagedescriptors combined with clinical data for breast cancer diagnosis [J].Intemational Joumal of computer Assisted Radiology and Surgery,2013,8(4):561-57.

[2]張旭東,孫圣力,王洪超.基于數據挖掘的觸診成像乳腺癌智能診斷模型和方法[J].大數據,2019,5(01):68-76.

[3]侯公楷.中醫藥防治乳腺癌進展[J].遼寧中醫藥大學學報,2016,18(05):249-253.

(作者單位:河北大學 生命科學學院)

猜你喜歡
數據挖掘標準化乳腺癌
絕經了,是否就離乳腺癌越來越遠呢?
中老年保健(2022年6期)2022-08-19 01:41:48
標準化簡述
探討人工智能與數據挖掘發展趨勢
乳腺癌是吃出來的嗎
胸大更容易得乳腺癌嗎
別逗了,乳腺癌可不分男女老少!
祝您健康(2018年5期)2018-05-16 17:10:16
標準化是綜合交通運輸的保障——解讀《交通運輸標準化體系》
中國公路(2017年9期)2017-07-25 13:26:38
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
一種基于Hadoop的大數據挖掘云服務及應用
論汽車維修診斷標準化(上)
主站蜘蛛池模板: 久久网欧美| 亚洲国产成人在线| 国产成人精品18| 国产成人综合在线视频| 欧美在线观看不卡| 国产丝袜无码一区二区视频| 欧美午夜久久| 国产在线日本| 国产高清精品在线91| 美女国产在线| 天天做天天爱夜夜爽毛片毛片| 欧美激情视频二区| 国产亚洲视频免费播放| 亚洲一本大道在线| 天堂网亚洲系列亚洲系列| 色噜噜狠狠色综合网图区| 蜜桃视频一区| 亚洲午夜福利在线| 久久久久无码国产精品不卡| 国产亚洲精久久久久久无码AV| 亚洲色婷婷一区二区| 国产激情无码一区二区三区免费| 国产综合精品一区二区| 97国产精品视频人人做人人爱| 久久精品嫩草研究院| jizz亚洲高清在线观看| 久久综合成人| 91无码国产视频| 日韩欧美中文| 99热这里只有精品在线观看| 精品偷拍一区二区| 高清不卡一区二区三区香蕉| 亚洲精品无码不卡在线播放| 国产色婷婷| 日本免费精品| 72种姿势欧美久久久大黄蕉| 国产成人一区| 在线精品视频成人网| 免费观看男人免费桶女人视频| 欧美另类图片视频无弹跳第一页| 97久久超碰极品视觉盛宴| 少妇极品熟妇人妻专区视频| 欧美色视频网站| 欧美专区日韩专区| 国产啪在线91| 亚洲一区二区在线无码| 99在线观看精品视频| 免费一级毛片在线播放傲雪网| 亚洲最新网址| 精品一区二区无码av| 亚洲视频四区| 园内精品自拍视频在线播放| 波多野结衣第一页| 国产日韩精品欧美一区喷| 5555国产在线观看| 国产Av无码精品色午夜| 欧美成人免费午夜全| 国产美女在线观看| 2022国产无码在线| 最新国产午夜精品视频成人| 亚洲首页在线观看| 久久性视频| 午夜限制老子影院888| 国产精品第一区| 欧美一级专区免费大片| 亚洲男女在线| 国产女人在线观看| 日韩av电影一区二区三区四区| 色综合久久88| 亚洲最大福利视频网| 无码一区中文字幕| 亚洲v日韩v欧美在线观看| 夜精品a一区二区三区| 中国特黄美女一级视频| 一边摸一边做爽的视频17国产 | 国产欧美精品一区二区| 手机永久AV在线播放| 亚洲伊人久久精品影院| 欧美日韩国产成人高清视频| 日韩久草视频| 91免费观看视频| 久久6免费视频|