999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于近鄰穩(wěn)定性的離群點檢測算法

2019-07-16 11:55:38黃馨玉陳曉東
電子技術與軟件工程 2019年8期
關鍵詞:定義

黃馨玉 陳曉東

摘要:本文提出了基于近鄰穩(wěn)定性的離群點檢測算法。實驗證明本文提出的算法具有較高的精確度。

[關鍵詞]離群點鄰域質心不穩(wěn)定因子

離群點是指那些明顯偏離其它數據、不滿足數據的一般模式或行為,與存在的其它數據不一致的數據。物理學中質心與穩(wěn)定性間存在聯系,離質心越近的點,穩(wěn)定性越強,反之穩(wěn)定性越弱。JihyunHa等人受這一性質的啟發(fā)提出了使用不穩(wěn)定因子的健壯離群點檢測算法(INS算法)。該算法容易將處于稀疏區(qū)域與稠密區(qū)域的交界處的正常點誤判為離群點。為解決該問題本文提出了基于近鄰穩(wěn)定性的離群點檢測算法(NSINS算法)。

1基于近鄰穩(wěn)定性的離群點檢測算法

1.1算法思想

本文提出了基于近鄰穩(wěn)定性的離群點檢測算法。該算法的主要思想是:數據集中任意一"點p的k個最近鄰組成p的k個鄰域,其中第i個鄰域包含了p和距離p最近的前i個點。每個鄰域計算兩個質心。一個質心與p相關,即鄰域中包括點p時的質心;另一個質心與p無關,即鄰域中不包括點p時的質心。最后會得到兩類質心,每類都有k個。比較這兩類質心的位置變化,最終確定p的不穩(wěn)定程度。定義與p無關的質心考慮到了近鄰的穩(wěn)定性對p不穩(wěn)定因子的影響。

1.2相關定義

定義1鄰域(neighborhood)。點p的鄰域表示距離點p最近的k個點的集合,用6:(p)表示,即:

其中d(p,q)表示p,q之間的距離,Pr是p的第k個最近鄰。當P點計入6r(p)中時,6.(p)的基數是k+1;當p點不計入6r(p)中時,6,(p)的基數是k。

定義2相關鄰域質心(relatedcentreofmass)。點p的相關鄰域質心表示p的鄰域包括點p時的質心,用rm,(p)表示:

其中(...q.)是點q在d維空間中的坐標。

定義3無關鄰域質心(unrelatedcentreofmass)。點p的無關鄰域質心表示p的鄰域不含p時的質心,用urmx(p)表示:

其中點q代表第k個鄰域中除p以外的任意一點,xq=(x**",xx)是點q在d維空間中的坐標

定義4相關質心距離(distance of unrelated center mass)。相關質心距離表示兩個相鄰的相關質心之間的距離。用rm_d(p)表示:

定義5無關質心距離(distanceofunrelatedcentermass)。無關質心距離表示兩個相鄰的無關質心之間的距離。用urm_d:(p)表示:

定義6不穩(wěn)定因子(instabilityfactor)不穩(wěn)定因子定義為相關質心距離之和與無關質心距離之和的比,用INSF表示:

INSF(P)值為1,說明p與鄰域內各點均勻分布;值大于1,說明p的加入使得鄰域質心的變化加劇,從而說明p的不穩(wěn)性較強;值小于1,說明p的加入使得鄰域質心的變化減緩,從而說明p的穩(wěn)定性較強。比值越大,p離群可能性越高。

2實例分析

數據集采用INS算法中的葡萄酒質量數據集。該數據集包括1599個紅葡萄酒樣本數據和4898個白葡萄酒樣本數據。品質差的葡萄酒和品質高的葡萄酒數據量很少,是離群點檢測的目標。紅葡萄酒數據集中K取值50時,INS準確率88.9%,NSINS準確率94.4%;K取值100時,INS準確率88.9%,NSINS準確率100%。白葡萄酒數據集中K取值50時,INS準確率65%,NSINS準確率85%;K取值100時,INS準確率70%,NSINS準確率80%。

3結束語

本文提出的算法改進了使用不穩(wěn)定因子的健壯離群點檢測算法,考慮到了近鄰的穩(wěn)定性對被檢測點的影響,該算法綜合兩類質心的變化情況來決定不穩(wěn)定因子大小。在數據集分布不規(guī)則的情況下優(yōu)勢明顯。

參考文獻

[1]Xia Huo-Song. Data warehouse anddata mining technolo [M]. Beijing: Science Press, 2004: 229-231.

[2]Jihyun Ha, Seulgi Seok, Jong-SeokLee. Robust outlier detection us ingthe instability factor [J]. Knowledge-Based Systems. 2014(63): 15-23.

猜你喜歡
定義
以愛之名,定義成長
活用定義巧解統(tǒng)計概率解答題
例談橢圓的定義及其應用
題在書外 根在書中——圓錐曲線第三定義在教材和高考中的滲透
永遠不要用“起點”定義自己
海峽姐妹(2020年9期)2021-01-04 01:35:44
嚴昊:不定義終點 一直在路上
華人時刊(2020年13期)2020-09-25 08:21:32
定義“風格”
成功的定義
山東青年(2016年1期)2016-02-28 14:25:25
有壹手——重新定義快修連鎖
修辭學的重大定義
當代修辭學(2014年3期)2014-01-21 02:30:44
主站蜘蛛池模板: 伊人久久大香线蕉影院| 国产精品成人免费视频99| 亚洲天堂网站在线| 自拍中文字幕| 亚洲三级视频在线观看| 五月丁香伊人啪啪手机免费观看| 国产精品夜夜嗨视频免费视频| 55夜色66夜色国产精品视频| 亚洲swag精品自拍一区| 亚洲美女一区二区三区| 国产一区二区网站| 国产福利不卡视频| 国产美女丝袜高潮| 欧美日韩午夜| 女人18毛片一级毛片在线| 美女毛片在线| 国产香蕉在线视频| 国模私拍一区二区| 日韩区欧美国产区在线观看| 亚洲天堂视频在线观看免费| 免费无码AV片在线观看国产| 九色综合视频网| 婷五月综合| 国产H片无码不卡在线视频 | 久久精品人妻中文系列| 曰AV在线无码| 亚洲天堂色色人体| 高清免费毛片| 亚洲综合天堂网| 99久久精品国产精品亚洲| 欧美成人h精品网站| 久久99国产综合精品1| 日韩东京热无码人妻| 美女无遮挡拍拍拍免费视频| 亚洲午夜福利精品无码不卡 | 色久综合在线| 五月婷婷综合色| 毛片网站观看| 欧美在线网| 欧美成人精品高清在线下载| 不卡色老大久久综合网| 欧美不卡在线视频| www亚洲天堂| 97国产精品视频自在拍| 91 九色视频丝袜| 欧美性天天| 99久久精品国产自免费| 美女高潮全身流白浆福利区| 97青草最新免费精品视频| 国产麻豆va精品视频| 精品久久综合1区2区3区激情| 666精品国产精品亚洲| 重口调教一区二区视频| 久久96热在精品国产高清| av一区二区三区高清久久| 亚洲欧美不卡视频| 国产69精品久久久久孕妇大杂乱| 亚洲三级影院| 亚洲国产系列| 国产农村妇女精品一二区| 国产亚洲精品91| 91亚洲视频下载| 成人午夜天| 国产成人精品高清不卡在线 | 国产在线第二页| 在线免费无码视频| 久久精品波多野结衣| 欧美成人二区| 操操操综合网| 波多野结衣中文字幕一区二区| 午夜高清国产拍精品| 黄片在线永久| 久久香蕉国产线看精品| 欧美成人综合视频| 首页亚洲国产丝袜长腿综合| 成人在线欧美| 国产a在视频线精品视频下载| 国产精品毛片在线直播完整版| 亚洲欧州色色免费AV| 国产精品偷伦视频免费观看国产| 制服丝袜无码每日更新| 成人福利在线视频|