999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于特征權值的缺失數據修復方法

2018-12-27 11:35:58
無線互聯科技 2018年20期
關鍵詞:數據挖掘特征效果

鄭 潔

(貴陽職業技術學院,貴州 貴陽 550081)

近年來,數據挖掘技術得到了蓬勃的發展,人們能夠從海量的數據信息中提取或“挖掘”出有用的知識,這些知識可提供給相關領域使用,因此,將數據挖掘技術看作是信息技術自然演化的結果[1]。在現實生活中,我們面臨著各種各樣的數據問題,通常,我們將數據預處理作為進行數據挖掘的一個前期工作。缺失數據的處理問題作為數據預處理領域的一個研究熱點[2],為了能夠更加充分地利用已經搜集到的數據,對缺失數據的處理是非常必要的。

1 特征權值計算

Relief算法以類內和類間的距離作為基礎來評判該特征屬性的重要性,作為一種重要的機器學習方法,廣泛應用于數據的特征選擇、分類等方面[3],本文的研究工作是在基于Relief算法的思想上來求解屬性特征權值。

對于一個含有決策屬性的數據集,假設x是數據集合中的任一個樣本,如果x'是與同類距離最近的樣本,y是與x異類距離最近的樣本,考慮x與x',y的距離在各個特征上的投影,記為pin(a,x,x')與pout(a,x,y),其中a是屬性特征集合中的一個特征。對于連續型的數值變量,Relief算法給出了計算特征權值的規則:

其中:pin(a, x, x ')=| x -x′|, pout(a, x, y) =|x -y|,初始化特征權值wk= 1/m;對于數據集中每一個樣本數據按照公式(1)更新每一維屬性權值,即可輸出屬性集的特征權值

2 基于屬性權值的數據修復

在殼近鄰計算方法(Shell Neighbors Imputation,SNI)中[4],我們把每一個選擇出來的左、右近鄰對數據修復的結果影響程度看作是相同的,但實際上,由于每一維屬性的重要程度是不同的,因此,我們將特征權值引入數據填充計算,采取如下公式:

3 實驗與結果分析

3.1 預測準確率和數據缺失率

為了說明本文提出的修復方法的有效性,我們引入一個衡量預測準備率的參數:均方根誤差(Root Mean Square Error,RMSE),它的定義如下:

其中:ei是原來的屬性值,是填充值,n是數據集中缺失值的個數,對數據進行填充后,通過計算得出RMSE的值可以驗證數據的修復效果,RMSE的值越大,表示預測準確率就越低,即數據的修復效果越不好,相反則說明修復效果越好。

3.2 實驗方法與數據集

本章的實驗數據來源是UCI標準數據集[5]中的兩個真實數據集,為了測試預測的準確率,我們選擇完整的數據集,每次隨機地將其中部分的數據設為缺失,對其進行填充后,再與原本的值一起計算RMSE的值來比較修復效果。每一個數據集上進行500次實驗,表1是實驗數據集的基本信息。

表1 數據集基本信息

3.3 實驗結果與分析

將本文提出的修復方法與殼近鄰計算方法分別在表1描述的兩個真實的UCI數據集上進行模擬實驗,結果如圖1—2所示。

根據上述實驗結果,我們可以得到以下結論:

(1)隨著數據集中數據缺失程度不斷提高,兩種填充算法計算所得的RMSE的值會逐漸增大,即數據填充準確率隨著數據缺失率的增加會逐漸降低。尤其是當數據缺失率超過20%以后,兩種算法數據修復的準確率明顯下降。

圖1 Iris數據集上的填充效果對比

圖2 Pen-Based數據集上的效果對比

(2)在大數據集Pen-Based的RMSE值明顯小于小數據集Iris的RMSE值,也就是說,我們可以認為在數據缺失率相同的情況下,數據集越大,計算過程中可以利用的已知信息會越多,由此可能會使得缺失數據的修復準確率更高。

(3)在兩個數據集上,本文提出的方法對缺失數據修復的效果都優于SNI,由此我們可知:如果對屬性的特征權值計算合理,將其引入數據填充計算中,可以提升數據修復的效果。

猜你喜歡
數據挖掘特征效果
按摩效果確有理論依據
探討人工智能與數據挖掘發展趨勢
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
迅速制造慢門虛化效果
抓住“瞬間性”效果
中華詩詞(2018年11期)2018-03-26 06:41:34
抓住特征巧觀察
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
模擬百種唇妝效果
Coco薇(2016年8期)2016-10-09 02:11:50
一種基于Hadoop的大數據挖掘云服務及應用
主站蜘蛛池模板: 精品国产黑色丝袜高跟鞋| 国产资源免费观看| 国产一区亚洲一区| 精品国产一区91在线| 国产一二三区视频| 国产在线精品人成导航| 国产91导航| 欧美视频二区| 免费无码又爽又黄又刺激网站 | 成年人福利视频| 亚洲国产亚洲综合在线尤物| 亚洲成a人片77777在线播放| 色网站在线视频| 久久天天躁狠狠躁夜夜2020一 | 欧美日韩国产精品va| 欧美激情视频一区| 亚洲精品卡2卡3卡4卡5卡区| 久久人妻xunleige无码| 亚洲欧美不卡视频| 视频二区国产精品职场同事| 国产欧美专区在线观看| 99一级毛片| 91原创视频在线| 中文字幕有乳无码| 在线视频一区二区三区不卡| 青青草原国产av福利网站| 日本三级黄在线观看| 亚洲AⅤ无码日韩AV无码网站| 麻豆国产精品一二三在线观看| 国产在线精品人成导航| 99在线视频网站| 欧美日韩在线第一页| 亚洲精品图区| 热99re99首页精品亚洲五月天| 69视频国产| 狠狠操夜夜爽| 欧美伊人色综合久久天天| 天天综合网亚洲网站| 极品尤物av美乳在线观看| 手机精品视频在线观看免费| 91福利在线看| 久久综合国产乱子免费| 国产一区二区三区在线观看视频 | 亚洲国产成人在线| 国产成人精品男人的天堂下载 | 国产美女91视频| 亚洲色精品国产一区二区三区| 久久超级碰| 国产成人精品第一区二区| 久久成人免费| 激情无码视频在线看| 国产精品自在拍首页视频8| 久久一级电影| 一级爆乳无码av| 色偷偷综合网| 青青青草国产| 日本国产在线| 成·人免费午夜无码视频在线观看| 国产日产欧美精品| 婷婷色丁香综合激情| 四虎影视国产精品| 日韩免费毛片| 狠狠亚洲五月天| 全色黄大色大片免费久久老太| 2019年国产精品自拍不卡| 欧美成人精品高清在线下载| 国产免费怡红院视频| 国产在线小视频| 国产区在线观看视频| 国产人成网线在线播放va| 伊人久久综在合线亚洲91| 国产精品 欧美激情 在线播放| jizz在线观看| 亚洲毛片网站| 色吊丝av中文字幕| 中文字幕亚洲乱码熟女1区2区| 超薄丝袜足j国产在线视频| 欧美日韩精品一区二区在线线 | 亚洲AV无码一区二区三区牲色| 午夜人性色福利无码视频在线观看| 欧美中文字幕在线播放| 精品国产网站|