999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

共享局部算法的數(shù)據(jù)分析

2018-03-29 09:03:10崔鵬宇
關(guān)鍵詞:數(shù)據(jù)挖掘

崔鵬宇

摘要:本文針對(duì)單一關(guān)系的數(shù)據(jù)挖掘方案不能精準(zhǔn)的發(fā)現(xiàn)網(wǎng)絡(luò)中隱藏的問題,通過提出異構(gòu)網(wǎng)絡(luò)數(shù)據(jù)挖掘的算法達(dá)到網(wǎng)絡(luò)節(jié)點(diǎn)的初步劃分目標(biāo)的實(shí)并且能夠初步此得到各數(shù)據(jù)子集。

關(guān)鍵詞:異構(gòu)網(wǎng)絡(luò);數(shù)據(jù)挖掘;共享局部結(jié)構(gòu)

中圖分類號(hào):TP311.13 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2018)01-0138-02

隨著社會(huì)網(wǎng)絡(luò)分析的進(jìn)一步發(fā)展,人們逐漸發(fā)現(xiàn)單一的關(guān)系網(wǎng)絡(luò)并不能很好的刻畫出實(shí)體間的真實(shí)結(jié)構(gòu)[1]。在現(xiàn)實(shí)的社會(huì)網(wǎng)絡(luò)中,實(shí)體之間往往是多種關(guān)系交織在一起的[2]。每種關(guān)系對(duì)應(yīng)一個(gè)關(guān)系圖,僅僅利用一種關(guān)系圖分析網(wǎng)絡(luò)結(jié)構(gòu)有可能會(huì)造成重要信息的缺失,從而不能精準(zhǔn)地挖掘其隱含的數(shù)據(jù)結(jié)構(gòu)[3-4]。將含有多種關(guān)系的網(wǎng)絡(luò)稱之為“異質(zhì)網(wǎng)絡(luò)”或者多關(guān)系網(wǎng)絡(luò)[5]。以信息共享為代表的各種異構(gòu)網(wǎng)絡(luò)應(yīng)用蓬勃發(fā)展,使得人們與互聯(lián)網(wǎng)間的聯(lián)系更加緊密與多向,由簡(jiǎn)單單項(xiàng)的信息檢索轉(zhuǎn)變?yōu)橐杂脩魹橹鲗?dǎo)的信息的創(chuàng)建與傳播。隨著用戶之間的互交越來越密切與深入,異構(gòu)網(wǎng)絡(luò)下的數(shù)據(jù)挖掘研究逐漸成為復(fù)雜網(wǎng)絡(luò)分析的一大熱點(diǎn)[6]。

本文提出一種基于共享局部結(jié)構(gòu)的異質(zhì)網(wǎng)絡(luò)數(shù)據(jù)挖掘算法,該模型利用各維關(guān)系網(wǎng)絡(luò)間的共性信息,根據(jù)各關(guān)系圖的初始聚類結(jié)果,找出那些在多個(gè)關(guān)系網(wǎng)中都同屬于一個(gè)類型的節(jié)點(diǎn)簇,即數(shù)據(jù)子集,并對(duì)其中的節(jié)點(diǎn)進(jìn)行標(biāo)記,然后根據(jù)某種劃分原則依次將剩余未標(biāo)記的節(jié)點(diǎn)并入相應(yīng)的數(shù)據(jù)子集中,從而完成整個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)的劃分。通過在模擬計(jì)算機(jī)合成網(wǎng)絡(luò)數(shù)據(jù)集上的比較試驗(yàn),證明了所提出算法的魯棒性和有效性。

1 異構(gòu)網(wǎng)絡(luò)下的數(shù)據(jù)結(jié)構(gòu)

一個(gè)包含種關(guān)系的異構(gòu)網(wǎng)絡(luò)可以抽象地表示為,,其中表示含有個(gè)元素的節(jié)點(diǎn)集合,表示第維關(guān)系網(wǎng)絡(luò)的鄰接矩陣。將異構(gòu)網(wǎng)絡(luò)中的不同關(guān)系看作是從不同角度對(duì)網(wǎng)絡(luò)節(jié)點(diǎn)的描述。此外,各維關(guān)系網(wǎng)并不是獨(dú)立存在的。本文的任務(wù)就綜合實(shí)體間的多種關(guān)系并從中挖掘其隱含的數(shù)據(jù)結(jié)構(gòu),引入了共享局部結(jié)構(gòu)和節(jié)點(diǎn)簇凝聚度思想,提出了新的異構(gòu)網(wǎng)絡(luò)挖掘算法。

2 基于局部共享結(jié)構(gòu)的異構(gòu)網(wǎng)絡(luò)數(shù)據(jù)挖掘

2.1 共享局部信息的提取

異構(gòu)網(wǎng)絡(luò)的實(shí)體間存在的對(duì)應(yīng)的關(guān)系為。由網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)劃分可以得到如下集合:,這里—第維網(wǎng)絡(luò)劃分出來的數(shù)據(jù)結(jié)構(gòu)。如果將被假定的關(guān)系網(wǎng)格都劃分成為個(gè)數(shù)據(jù)集,并且在聚類時(shí),隨機(jī)分配(1~k)數(shù)據(jù)標(biāo)號(hào)。

目標(biāo)是提取有關(guān)異質(zhì)網(wǎng)絡(luò)之間的共享信息,有必要找到在劃分的方式不盡相同的情況下的數(shù)據(jù)標(biāo)號(hào)的相互對(duì)應(yīng)關(guān)系,其公式如下:

其中表示由關(guān)系劃分出來的標(biāo)號(hào)為的數(shù)據(jù)集,為節(jié)點(diǎn)被劃分到的概率而則表示節(jié)點(diǎn)在關(guān)系與關(guān)系中分別被劃分到與中的概率。

2.2 共享局部結(jié)構(gòu)的更新

將劃分的結(jié)果一并加入到各維網(wǎng)絡(luò)劃分的數(shù)據(jù)結(jié)構(gòu)的集合之中,這時(shí)分集合將擴(kuò)充為,算法的主要步驟可以歸納如下:

維度改進(jìn)算法:

輸入:維異質(zhì)關(guān)系網(wǎng)絡(luò)、數(shù)據(jù)集個(gè)數(shù);

輸出:各節(jié)點(diǎn)所屬的數(shù)據(jù)集標(biāo)號(hào);

(1)分別對(duì)各單維網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)集劃分,得到種不同的劃分結(jié)果;

For ;

(2)將未標(biāo)記節(jié)并入使節(jié)點(diǎn)簇的凝聚度增益最大的數(shù)據(jù)子集中;

(3)對(duì)未標(biāo)記節(jié)點(diǎn)進(jìn)行相應(yīng)劃分,將劃分結(jié)果也并入集合()。

3 實(shí)驗(yàn)數(shù)據(jù)集及對(duì)比結(jié)果

通過對(duì)比實(shí)驗(yàn)來驗(yàn)證有效性及魯棒性。選取的方法有如下兩種方式:一、各單一的異構(gòu)網(wǎng)絡(luò)下的數(shù)據(jù)集挖掘;二、關(guān)系矩陣加權(quán)組合的方法WAMM以及PMM算法。

為了比較各算法的數(shù)據(jù)集劃分性能,我們使用了兩種經(jīng)典的指標(biāo):歸一化互信息(NMI)與準(zhǔn)確率(Ac)。兩者的取值都在0-1之間,如果它們的值越大的話,說明結(jié)果越接近真實(shí)。

我們?cè)谟?jì)算機(jī)的合成數(shù)據(jù)上進(jìn)行試驗(yàn)分析的目的是為了驗(yàn)證算法是否有效。這種合成網(wǎng)絡(luò)一共包括350個(gè)節(jié)點(diǎn),將其劃分成了三個(gè)大小各不相同的數(shù)據(jù)集,并且各個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)間存在4種關(guān)系,各關(guān)系圖的可以用對(duì)應(yīng)圖1中的來表示。

圖2指出了每種算法在合成網(wǎng)絡(luò)中數(shù)據(jù)集劃分的性能,從圖中我們可以看出異質(zhì)網(wǎng)絡(luò)的算法性能明顯比單一的關(guān)系網(wǎng)的數(shù)據(jù)集挖掘性能要好,并且基本上能實(shí)現(xiàn)了正確的劃分。

4 結(jié)語

針對(duì)異構(gòu)網(wǎng)絡(luò)中多元化的節(jié)點(diǎn)關(guān)系,本文提出一種基于共享局部結(jié)構(gòu)的異質(zhì)網(wǎng)絡(luò)數(shù)據(jù)集挖掘算法。該算法將網(wǎng)絡(luò)節(jié)點(diǎn)通過提取多種關(guān)系間共享的局部信息基本實(shí)現(xiàn)了網(wǎng)絡(luò)節(jié)點(diǎn)的局部劃分,最后在通過在計(jì)算機(jī)合成的數(shù)據(jù)集上驗(yàn)證了該算法的有效性。

參考文獻(xiàn)

[1]張春英,郭景峰.集對(duì)社會(huì)網(wǎng)絡(luò)α關(guān)系社區(qū)及動(dòng)態(tài)挖掘算法[J].計(jì)算機(jī)學(xué)報(bào),2013,(8):1682-1692.

[2]孫榮德,邵峰晶,孫仁誠(chéng).一種基于復(fù)合網(wǎng)的面向微博關(guān)注的推薦算法[J].計(jì)算機(jī)光盤軟件與應(yīng)用,2013,(24):132-133.

[3]王會(huì)梅,鮮明,王國(guó)玉.基于擴(kuò)展網(wǎng)絡(luò)攻擊圖的網(wǎng)絡(luò)攻擊策略生成算法[J].電子與信息學(xué)報(bào),2011,(12):3015-3021.

[4]黃光球,李艷.基于粗糙圖的網(wǎng)絡(luò)風(fēng)險(xiǎn)評(píng)估模型[J].計(jì)算機(jī)應(yīng)用,2010,(1):190-195.

[5]榮智海,吳枝喜,王文旭.共演博弈下網(wǎng)絡(luò)合作動(dòng)力學(xué)研究進(jìn)展[J].電子科技大學(xué)學(xué)報(bào),2013,(1):10-22.

[6]劉鈺峰,李仁發(fā).異構(gòu)信息網(wǎng)絡(luò)上基于圖正則化的半監(jiān)督學(xué)習(xí)[J].計(jì)算機(jī)研究與發(fā)展,2015,(3):606-613.

猜你喜歡
數(shù)據(jù)挖掘
基于數(shù)據(jù)挖掘的船舶通信網(wǎng)絡(luò)流量異常識(shí)別方法
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
數(shù)據(jù)挖掘技術(shù)在打擊倒賣OBU逃費(fèi)中的應(yīng)用淺析
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
數(shù)據(jù)挖掘在高校圖書館中的應(yīng)用
數(shù)據(jù)挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數(shù)據(jù)挖掘研究
利用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)LIS數(shù)據(jù)共享的開發(fā)實(shí)踐
主站蜘蛛池模板: 欧美激情首页| 国产 日韩 欧美 第二页| 在线免费无码视频| 国产99视频免费精品是看6| 亚洲精品午夜无码电影网| 国产91麻豆免费观看| 欧美日韩专区| 亚洲Va中文字幕久久一区 | 国产在线视频自拍| 手机永久AV在线播放| 欧美在线伊人| 亚亚洲乱码一二三四区| 免费在线一区| 日韩免费成人| 欧美亚洲一区二区三区导航| 日韩午夜片| 亚洲福利视频一区二区| 五月婷婷丁香综合| 天堂成人在线| 国产视频一区二区在线观看| 成人va亚洲va欧美天堂| 2020亚洲精品无码| 波多野结衣一区二区三视频| 麻豆国产精品| 中文无码精品A∨在线观看不卡| 72种姿势欧美久久久大黄蕉| 国产精品一区二区久久精品无码| av一区二区三区高清久久| 亚洲视频二| 欧美一级夜夜爽www| 国产毛片一区| 欧美在线视频不卡第一页| 欧美97色| 免费看黄片一区二区三区| 40岁成熟女人牲交片免费| 欧美精品在线看| 91麻豆精品国产高清在线| 麻豆精品国产自产在线| jizz在线免费播放| 免费精品一区二区h| 久久久噜噜噜久久中文字幕色伊伊| 欧美www在线观看| 免费一级成人毛片| 午夜一级做a爰片久久毛片| 亚洲最大情网站在线观看| 久久伊人久久亚洲综合| 国产精品无码AⅤ在线观看播放| 国产日韩精品欧美一区喷| 色综合五月婷婷| 国产白浆在线| 人妻少妇乱子伦精品无码专区毛片| 亚洲av无码人妻| 亚洲欧美一级一级a| 香蕉伊思人视频| 久草网视频在线| 国产福利大秀91| 国产高颜值露脸在线观看| 色成人综合| 无码一区二区波多野结衣播放搜索| 国产凹凸视频在线观看| 成人一区专区在线观看| 亚洲成年人网| 免费在线a视频| 国产尤物jk自慰制服喷水| 亚洲国产系列| 欧美丝袜高跟鞋一区二区| 福利国产在线| 有专无码视频| 亚洲人成日本在线观看| 四虎永久在线视频| 极品国产一区二区三区| 日本午夜在线视频| 国产毛片一区| 亚洲中字无码AV电影在线观看| 自慰高潮喷白浆在线观看| 国产97色在线| 亚洲视频影院| 国产打屁股免费区网站| 欧美在线综合视频| 亚洲黄网视频| 久久久久免费精品国产| 国产成人综合日韩精品无码不卡|