999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

在移動通信數(shù)據(jù)分析上孤立點(diǎn)檢測的研究與應(yīng)用

2016-10-13 18:17:03
移動信息 2016年10期
關(guān)鍵詞:分析檢測研究

魯 琳

?

在移動通信數(shù)據(jù)分析上孤立點(diǎn)檢測的研究與應(yīng)用

魯 琳

中國聯(lián)合網(wǎng)絡(luò)通信有限公司廣東分公司,廣東 廣州 510627

移動通信數(shù)據(jù)最為凸出的特點(diǎn)便是高維度及大規(guī)模,常規(guī)數(shù)據(jù)分析便具有一定的難度,而異常數(shù)據(jù)分析更為困難。因此,分析了孤立點(diǎn)檢測在移動通信數(shù)據(jù)分析中的研究與應(yīng)用,旨在指導(dǎo)實(shí)踐,逐步提高分析的有效性與準(zhǔn)確性。

移動通信;數(shù)據(jù)分析;孤立點(diǎn)檢測

1 孤立點(diǎn)檢測的概況

國外學(xué)者[1]指出,孤立點(diǎn)是與數(shù)據(jù)集中正常數(shù)據(jù)不同的數(shù)據(jù),從聚類算法角度出發(fā),孤立點(diǎn)為噪音數(shù)據(jù)。通常,它是由各異機(jī)制引起的,具有一定的現(xiàn)實(shí)意義。孤立點(diǎn)檢測方法主要有兩種,一種為基于距離檢測法,主要是對數(shù)據(jù)對象間的距離進(jìn)行計算,以此檢測孤立點(diǎn)。對于任何數(shù)據(jù)對象而言,如果其周圍鄰居較少,則可視為孤立點(diǎn)范圍,具體方法有基于索引、嵌套循環(huán)算法以及基于單元算法。上述檢測法存在一定的不足,其均為0(kN2)復(fù)雜度,與數(shù)據(jù)維數(shù)k與數(shù)據(jù)模型N有一定的關(guān)系,未能滿足大規(guī)模數(shù)據(jù)集分析需求,此外,該方法對用戶有一定要求,需要提供參數(shù)d,但通常情況下,該參數(shù)確定難度較大。另一種為基于密度檢測法,其彌補(bǔ)了基于距離檢測法的不足,通過觀察對象周圍密度實(shí)現(xiàn)的,一旦數(shù)據(jù)對象周圍存在較多的鄰居,則非孤立點(diǎn),而鄰居不足時,則為孤立點(diǎn),為了呈現(xiàn)各數(shù)據(jù)孤立程度,有關(guān)學(xué)者對孤立程度與周圍鄰居偏離程度進(jìn)行了研究,二者保持著緊密聯(lián)系,經(jīng)研究提出了局部孤立因子算法,此外,經(jīng)研究,逐漸提出了基于聚類、神經(jīng)網(wǎng)絡(luò)等方法[2]。

2 在移動通信數(shù)據(jù)分析上孤立點(diǎn)檢測的研究與應(yīng)用

2.1 基于劃分檢測法

根據(jù)移動通信數(shù)據(jù)特點(diǎn),本文提出了基于劃分檢測法,此方法是對原始數(shù)據(jù)進(jìn)行劃分,借助剪枝策略,剪枝各劃分中的非孤立點(diǎn),隨之形成候選孤立點(diǎn)集,再使用孤立點(diǎn)檢測技術(shù)進(jìn)行判斷,經(jīng)計算獲得度量值,明確平衡隸屬度,從而實(shí)現(xiàn)對異常信號數(shù)據(jù)點(diǎn)的檢測。

2.2 孤立點(diǎn)檢測

在實(shí)際分析中對候選孤立點(diǎn)距離進(jìn)行計算,借助相應(yīng)的距離函數(shù)計算公式,獲得數(shù)據(jù)對象的基于距離的局部離群因子(LDOF)值,根據(jù)此數(shù)值的大小進(jìn)行排序,同時充分利用平衡隸屬度,經(jīng)綜合判斷,以此明確是否為孤立點(diǎn)。

在距離函數(shù)方面,使用LDOF度量孤立點(diǎn),通常,LDOF值越大,其越偏離鄰居,其成為孤立點(diǎn)的可能性更大。以數(shù)據(jù)對象p為例,其LDOF公式為:

在實(shí)際應(yīng)用中面對海量數(shù)據(jù),所有數(shù)據(jù)集均要計算LDOF值,在此情況下,計算復(fù)雜度將明顯增加,可達(dá)到0(N2),為了減少計算量,需要使用有效的方法,具體為:剪枝非孤立點(diǎn)對象,再計算候選孤立點(diǎn),從而提高了計算效率,減少了用時。

在平衡隸屬度方面,關(guān)于某一對象的隸屬函數(shù)構(gòu)造尚無統(tǒng)一性,實(shí)踐中僅依賴經(jīng)驗,即便是同一概念,不同學(xué)者所建立的隸屬函數(shù)各異,主要是因其切入點(diǎn)不同造成的,但對實(shí)際問題的處理效果基本一致。常見的方法如下:統(tǒng)計法、二元對比排序法或者專家評審法,待確定隸屬函數(shù)后,可根據(jù)生活實(shí)踐對其進(jìn)行改進(jìn)與完善。在分析移動通信數(shù)據(jù)過程中,隸屬函數(shù)判斷可依據(jù)信號平衡等級判斷,并根據(jù)通信數(shù)據(jù)具體情況,利用模糊處理法,判斷信號強(qiáng)弱,具體的公式如下:信號強(qiáng)度=下行電平-上行電平-參數(shù)X,經(jīng)計算分析顯示,平衡隸屬度為0.8時為孤立,對其進(jìn)行模糊處理,顯示孤立點(diǎn)判斷具有一定的準(zhǔn)確性。

2.3 實(shí)驗研究

為了證實(shí)孤立點(diǎn)檢測法的實(shí)際價值,將其應(yīng)用于移動通信數(shù)據(jù)分析,但其數(shù)據(jù)規(guī)模偏大,并且數(shù)據(jù)呈不均勻分布,從而增加了檢測難度。實(shí)際研究中以偏離程度較大的數(shù)據(jù)為研究對象,根據(jù)數(shù)據(jù)特性,利用剪枝法,獲得了與中心偏離,并且稀疏的數(shù)據(jù),將其視為候選孤立點(diǎn)集,此后計算其LDOF值及平衡隸屬度,并展開了專業(yè)分析,進(jìn)而指導(dǎo)了實(shí)際應(yīng)用,如:用戶投訴問題處理、用戶行為分析等。

2.3.1 選取數(shù)據(jù)

選取某移動通信網(wǎng)絡(luò)公司為研究對象,經(jīng)處理后,保證了數(shù)據(jù)集質(zhì)量,隨機(jī)抽取路測數(shù)據(jù),其均與平均接受電平(RXLEV)有關(guān),具體屬性有兩個,分別為上行鏈路與下行鏈路,參數(shù)取值為-110~-48 dBm,通信信號電平數(shù)值被映射到某個RXLEV值,具體范圍為0~63,在非連續(xù)性發(fā)射環(huán)境下,RXLEV屬性分別FULL與SUB兩種,前者為測量所用載頻所有時隙均值,后者為測量特定通話時隙均值,經(jīng)調(diào)查發(fā)現(xiàn),用戶提交的報告中FULL缺少準(zhǔn)確性。因此,本研究選用了SUB[4]。

2.3.2 分析結(jié)果

孤立點(diǎn)檢測主要考慮檢測時間、檢測準(zhǔn)確性,隨機(jī)抽取6組數(shù)據(jù),數(shù)量呈遞增趨勢,分別為10000,15000,30000,50000,75000與100000,其檢測時間分別為90.43、17.454、25.743、40.432、52.463、78.354s,與傳統(tǒng)檢測法相比,孤立點(diǎn)檢測時間明顯縮短、檢測效率大幅度提高,主要是因?qū)嶒炛惺褂眉糁Σ呗裕瑴p少了計算量。此外實(shí)驗中選取領(lǐng)域中的m個樣本,經(jīng)孤立點(diǎn)檢測發(fā)現(xiàn),5、8、10、13、15的準(zhǔn)確率分別為0.67、0.79、0.87、0.86、0.86,此結(jié)果表明,m為10以后,準(zhǔn)確率基本未變,因此,m確定為10。

3 總結(jié)

綜上所述,移動通信數(shù)據(jù)分析中僅有少部分為信號異常數(shù)據(jù),通過孤立點(diǎn)檢測法展開挖掘分析,提升了檢測水平,為管理決策奠定了堅持基礎(chǔ)。日后實(shí)踐中應(yīng)大力推廣孤立點(diǎn)檢測法。

[1]張凱書,李志剛,吳慧芳,等.孤立點(diǎn)檢測在移動通信數(shù)據(jù)分析上的研究與應(yīng)用[J].信息系統(tǒng)工程,2014(11):38.

[2]林國華.時間序列分析法在移動通信數(shù)據(jù)分析中的研究與應(yīng)用[D].廣州:廣東工業(yè)大學(xué),2013.

Research and Application of outlier Detection in Mobile Communication Data Analysis

LuLin

China United Network Communications Limited Guangdong Branch, Guangdong Guangzhou 510627

The most protruding characteristics of mobile communication data is high dimension and large scale, conventional data analysis has a certain degree of difficulty, and abnormal data analysis more difficult. Therefore, this paper analyzes the research and application of outlier detection in mobile communication data analysis, to guide the practice, gradually improve the effectiveness and accuracy of analysis.

mobile communication; data analysis; outlier detection

TP311.13

A

1009-6434(2016)10-0016-02

猜你喜歡
分析檢測研究
FMS與YBT相關(guān)性的實(shí)證研究
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
遼代千人邑研究述論
隱蔽失效適航要求符合性驗證分析
視錯覺在平面設(shè)計中的應(yīng)用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統(tǒng)研究
電力系統(tǒng)不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
電力系統(tǒng)及其自動化發(fā)展趨勢分析
主站蜘蛛池模板: 日韩乱码免费一区二区三区| 2021国产精品自产拍在线观看| 国产免费福利网站| 日本在线视频免费| 欧美激情首页| 狠狠躁天天躁夜夜躁婷婷| 久久国产高清视频| 日韩a级片视频| 97久久精品人人做人人爽| 亚洲成aⅴ人在线观看| 中文国产成人久久精品小说| 国产精品私拍99pans大尺度| 亚洲日韩精品伊甸| 国产亚洲视频免费播放| 欧美日韩国产在线观看一区二区三区| 久久美女精品| 狂欢视频在线观看不卡| 制服丝袜亚洲| 午夜国产在线观看| 97国产精品视频人人做人人爱| 亚洲成人在线免费观看| 亚洲人在线| 国产高潮流白浆视频| Jizz国产色系免费| 日本人妻丰满熟妇区| 欧美性久久久久| 97狠狠操| 国产精品区网红主播在线观看| 亚洲成A人V欧美综合| 亚洲精品手机在线| 色成人综合| 天天色综网| 国产一区二区三区在线精品专区| 香蕉eeww99国产精选播放| 2020最新国产精品视频| 91精品国产自产在线老师啪l| 亚洲欧美人成人让影院| 精品夜恋影院亚洲欧洲| 激情午夜婷婷| 都市激情亚洲综合久久| 夜夜爽免费视频| 国语少妇高潮| 伦精品一区二区三区视频| 五月婷婷精品| 日韩欧美高清视频| 亚洲福利一区二区三区| 亚洲精品无码抽插日韩| 99国产精品一区二区| 免费高清a毛片| 国产一区二区免费播放| 亚洲第一精品福利| 亚洲午夜国产精品无卡| 成人免费午夜视频| 亚洲视频影院| 2048国产精品原创综合在线| 2021精品国产自在现线看| 国产成人精品在线| 2021精品国产自在现线看| 亚洲第一黄片大全| 婷婷六月激情综合一区| 国产情精品嫩草影院88av| 国国产a国产片免费麻豆| 美女啪啪无遮挡| 91九色最新地址| 亚洲成人一区在线| 欧美性久久久久| 欧美日一级片| 国产精品视频久| 日韩a级毛片| 国产麻豆精品久久一二三| 国产视频 第一页| 亚洲色欲色欲www网| 国产极品美女在线| 久久婷婷六月| 国产婬乱a一级毛片多女| 找国产毛片看| 国产亚洲第一页| 手机精品福利在线观看| 久久天天躁夜夜躁狠狠| 在线观看国产精品第一区免费| 97久久精品人人做人人爽| 91国内外精品自在线播放|