999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于PageRank改進(jìn)算法的微博影響力排名

2015-09-27 08:22:55王東升
現(xiàn)代計(jì)算機(jī) 2015年29期
關(guān)鍵詞:分配用戶

王東升

(上海海事大學(xué)信息工程學(xué)院,上海 201306)

基于PageRank改進(jìn)算法的微博影響力排名

王東升

(上海海事大學(xué)信息工程學(xué)院,上海201306)

0 引言

PageRank算法是在微博用戶影響力研究領(lǐng)域相對(duì)普遍及重要的算法。近年來(lái),對(duì)基于PageRank算法提出的微博用戶影響力改進(jìn)算法日漸得到完善:①馮典等人利用微博用戶關(guān)系結(jié)構(gòu)提出來(lái)基于相對(duì)權(quán)威度(根據(jù)粉絲的質(zhì)量和用戶本身權(quán)威度為評(píng)價(jià)依據(jù))和用戶活力(用戶發(fā)布和評(píng)論微博的次數(shù)為評(píng)價(jià)依據(jù))兩個(gè)方面改進(jìn)了PageRank算法,迭代求出微博用戶影響力[1]。盡管能夠快速實(shí)現(xiàn)算法收斂,減少迭代次數(shù),但是這種宏觀的根據(jù)重要粉絲和用戶活躍度來(lái)分配權(quán)值會(huì)改變?cè)械挠脩艋?dòng)行為。②王琛等人基于PageRank算法,根據(jù)用戶活力和粉絲參與活力(粉絲轉(zhuǎn)發(fā)、評(píng)論關(guān)注者微博的比例)提出了user influence rank用戶影響力排名算法[2]。這個(gè)算法本質(zhì)上基本體現(xiàn)微觀粉絲和關(guān)注用戶之間的互動(dòng)。但用戶活力這個(gè)因素基本有作用,相反還會(huì)改變用戶之間的互動(dòng)關(guān)系,考慮不完善。

1 算法原型

PageRank由Google創(chuàng)始人拉里·佩奇和謝爾蓋·布林提出,其基本思想是利用網(wǎng)頁(yè)的超鏈接結(jié)構(gòu)判定網(wǎng)頁(yè)重要性,即網(wǎng)頁(yè)a有個(gè)只向網(wǎng)頁(yè)b的鏈接,則認(rèn)為a投了網(wǎng)頁(yè)b一票,算法根據(jù)網(wǎng)頁(yè)收到的投票數(shù)量來(lái)衡量該網(wǎng)頁(yè)的重要性。這種網(wǎng)頁(yè)鏈接和微博中的關(guān)注和被關(guān)注用戶關(guān)系式相似的,但是忽略了用戶與用戶本身的互動(dòng)關(guān)系及客觀的作用域。

2 改進(jìn)UI-Rank算法設(shè)計(jì)

綜合用戶j的影響力值為:

其中I(j)表示用戶j的粉絲集合;UA(i)表示用戶i的影響力;d為阻尼系;

OUT(i,j)=a×HUA(i,j)+b×FUA(i,j)+c×IUA(i,j)

OUT(i,j)用戶i的用戶影響力分配給其關(guān)注者j的權(quán)值比例,HUA(i,j)表示基于粉絲參與度的粉絲i分配給其關(guān)注者j的權(quán)值比例,F(xiàn)UA(i,j)則基于微博影響度時(shí)用戶i分配給其關(guān)注者j的權(quán)值比例,IUA(i,j)表示基于用戶活客觀躍度時(shí)用戶i分配給其關(guān)注者j的權(quán)值比例。a,b,c為對(duì)應(yīng)的權(quán)重。

2.1粉絲參與度

一個(gè)粉絲轉(zhuǎn)發(fā)和評(píng)論關(guān)注者微博的多少,直接反映了被關(guān)注者所發(fā)微博對(duì)其粉絲的吸引力。粉絲轉(zhuǎn)發(fā)和評(píng)論其微博的次數(shù)越多,粉絲和關(guān)注者直接的互動(dòng)越多,說(shuō)明粉絲對(duì)其關(guān)注的用戶越感興趣。

一個(gè)用戶的微博總體上分為原創(chuàng)微博和轉(zhuǎn)發(fā)微博。粉絲轉(zhuǎn)發(fā)關(guān)注者的原創(chuàng)微博,說(shuō)明粉絲對(duì)其關(guān)注者自己的思想和態(tài)度的肯定;而粉絲轉(zhuǎn)發(fā)其關(guān)注者的轉(zhuǎn)發(fā)微博,說(shuō)明粉絲對(duì)關(guān)注者轉(zhuǎn)發(fā)的微博原主人態(tài)度或者思想的肯定,并不是被關(guān)注者本人所吸引。

粉絲對(duì)關(guān)注者的評(píng)論,同樣體現(xiàn)了其對(duì)關(guān)注者互動(dòng)的程度,表現(xiàn)了對(duì)其所發(fā)微博的興趣,評(píng)論越多,程度越深。但粉絲對(duì)關(guān)注者的評(píng)論并不能被粉絲自己的粉絲所看到,即評(píng)論的態(tài)度和思想不能傳播給自己的粉絲。

所以在本算法思想的分配原則來(lái)說(shuō),粉絲分配給其關(guān)注者的權(quán)值時(shí),應(yīng)該更加看重粉絲是否轉(zhuǎn)發(fā)關(guān)注者的微博,轉(zhuǎn)發(fā)的微博是否是其關(guān)注者的原創(chuàng)微博。

基于粉絲參與度的粉絲i分配給其關(guān)注者j的比例為:

F(i)表示用戶i的關(guān)注者集合,即全部好友集合,

其中H(i,j)為用戶i與其關(guān)注者j互動(dòng)程度。h1,h2,h3為對(duì)應(yīng)參數(shù)的權(quán)重。

Y(i,j)表示在統(tǒng)計(jì)周期內(nèi)(T=30天)用戶i轉(zhuǎn)發(fā)其關(guān)注者j原創(chuàng)微博的數(shù)目(Yn)和用戶i轉(zhuǎn)發(fā)和評(píng)論別人微博總數(shù)(Tn)的比值。

Z(i,j)表示統(tǒng)計(jì)周期內(nèi)(T=30天)用戶i轉(zhuǎn)發(fā)其關(guān)注者J轉(zhuǎn)發(fā)微博的數(shù)目(Zn)和用戶i轉(zhuǎn)發(fā)和評(píng)論別人微博總數(shù)(Tn)的比值。

P(i,j)表示統(tǒng)計(jì)周期內(nèi)(T=30天)用戶i評(píng)論其關(guān)注者j的微博數(shù)目(Pn)和用戶i轉(zhuǎn)發(fā)和評(píng)論別人微博總數(shù)(Tn)的比值。

2.2用戶活客觀躍度

粉絲參與度在很大程度上表明了粉絲和關(guān)注者直接的互動(dòng),用戶傳遞給其粉絲的信息狀態(tài),但是這種互動(dòng)只是局限的展示了粉絲轉(zhuǎn)發(fā)和評(píng)論其關(guān)注者的微博上,但事實(shí)上一個(gè)用戶發(fā)布和轉(zhuǎn)發(fā)的微博給用戶傳遞的信息不僅僅是體現(xiàn)在轉(zhuǎn)發(fā)上,還體現(xiàn)在一個(gè)粉絲在閱讀其關(guān)注者的微博時(shí)不經(jīng)意間產(chǎn)生的信息量。

因?yàn)橛脩魧?duì)其關(guān)注者或者他人的評(píng)論信息無(wú)法傳播給自己粉絲,所以這個(gè)因素新算法不做考慮。用戶發(fā)布的原創(chuàng)微博和轉(zhuǎn)發(fā)微博是決定的因素。但原創(chuàng)微博和轉(zhuǎn)發(fā)的微博傳遞給其粉絲的思想和態(tài)度的意義是不同的,所以算法對(duì)原創(chuàng)微博數(shù)和轉(zhuǎn)發(fā)微博數(shù)同樣有不同的衡量參數(shù)標(biāo)準(zhǔn)i1,i2。

在一個(gè)統(tǒng)計(jì)周期范圍內(nèi),用戶發(fā)布原創(chuàng)微博數(shù)以及轉(zhuǎn)發(fā)微博數(shù)越多,越能說(shuō)明該用戶的活力越高,粉絲閱讀該用戶的微博條數(shù)的可能就越多。更深入地,客觀地,一個(gè)用戶發(fā)表的原創(chuàng)微博數(shù)越多,用戶傳遞給其粉絲自己的思想觀念信息就越大。

用戶j的客觀活躍度為:

其中CNj表示用戶j統(tǒng)計(jì)周期內(nèi)(T=30天)發(fā)布的原創(chuàng)微博數(shù),TNj表示統(tǒng)計(jì)周期內(nèi)(T=30天)用戶j轉(zhuǎn)發(fā)他人的微博數(shù)。

基于用戶活客觀躍度時(shí)用戶i分配給其關(guān)注者j的比例為:

其中F(i)表示用戶i的關(guān)注者集合,即全部好友集合,v,j F(i)。

2.2微博影響度

微博是一個(gè)開放的信息交流平臺(tái),任何人都可以瀏覽、轉(zhuǎn)發(fā)和評(píng)論自己感興趣的用戶的微博,這個(gè)用戶不一定是自己的關(guān)注者(好友),可能是自己隨意瀏覽發(fā)現(xiàn)的,可能是系統(tǒng)推薦,也有可能是某個(gè)時(shí)間段比較有社會(huì)效益的話題等。這些不定因素所造成的不是自己粉絲轉(zhuǎn)發(fā)或者評(píng)論的影響,基于粉絲參與度和基于用戶客觀活躍度分配比例值解決不了,針對(duì)這種情況,算法提出來(lái)基于微博影響度分配方法。

其中WTn是在在統(tǒng)計(jì)時(shí)間內(nèi)微博w被轉(zhuǎn)發(fā)次數(shù);WPn是微博w在統(tǒng)計(jì)時(shí)間內(nèi)被評(píng)論的次數(shù)。用戶j在統(tǒng)計(jì)時(shí)間內(nèi)發(fā)布微博的總影響度,其中f(j)表示用戶j在統(tǒng)計(jì)時(shí)間內(nèi)發(fā)布的原創(chuàng)微博和轉(zhuǎn)發(fā)微博的集合。

則基于微博影響度時(shí)用戶i分配給其關(guān)注者j的比例為:

其中F(i)表示用戶i的關(guān)注者集合,即全部好友集合,v,j∈F(i)。

3 實(shí)驗(yàn)結(jié)果及分析

利用層次分析法[3]我們可以確定一級(jí)權(quán)重a,b,c分別為0.45,0.30,0.25;二級(jí)權(quán)重h1,h2,h3,i1,i2分別0.25,0.2,0.15,0.22,0.18。利用新浪微博API接口獲得真實(shí)用戶數(shù)據(jù),帶入算法得到下表1兩種算法的排名前十的用戶。

根據(jù)實(shí)驗(yàn)結(jié)果可以看出兩種算法的結(jié)果發(fā)生了變化。在上表中我們可以大概看出PageRank算法的排名中基本依靠粉絲的數(shù)量來(lái)取決。顯著的特征是在原算法排名第3的郭德綱在新算法中已經(jīng)不在前十中,盡管粉絲數(shù)量很多,但其粉絲的影響力值普遍都不高,所以分配在新算法中分配給他的值不高導(dǎo)致排名落后。而原本排名第八位的李開復(fù)在新算法中排名第二,主要原因是李開復(fù)雖然粉絲數(shù)量少,但發(fā)的微博基本都是原創(chuàng)微博,且很受粉絲歡迎,轉(zhuǎn)發(fā),并且粉絲的自身影響力值相對(duì)很高。

4 結(jié)語(yǔ)

本文給出了基于PageRank算法改進(jìn)的新算法的整體算法思路,相比PageRank算法得到的結(jié)果跟為準(zhǔn)確客觀,對(duì)解決一下實(shí)際微博排名問(wèn)題提供了一些新的思路,具有一定的意義。

表1兩種算法影響力排名前十的用戶

[1]馮典.面向微博的數(shù)據(jù)采集和分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].北京:北京郵電大學(xué),2013.

[2]王琛,陳庶櫵.一種改進(jìn)的微博用戶影響力評(píng)估算法[J].信息工程大學(xué)學(xué)報(bào),2013,14(3):380-384.

[3]鄧雪,李家銘,曾浩健等.層次分析權(quán)重計(jì)算方法分析及應(yīng)用研究[J].?dāng)?shù)學(xué)的實(shí)踐與認(rèn)識(shí),2012.24(7).

Micro-Blog;PageRank;User Influence;UI-Rank

A Ranking Algorithm Estimating Micro-Blog Influence Based on the Improved PageRank

WANG Dong-sheng
(Department of Information Engineering,Shanghai Maritime University,Shanghai 201306)

1007-1423(2015)29-0027-04

10.3969/j.issn.1007-1423.2015.29.007

王東升(1988-),男,江蘇淮安人,碩士研究生,研究方向?yàn)檐浖_發(fā)方法與軟件項(xiàng)目管理

2015-08-11

2015-09-15

針對(duì)微博用戶影響力排名問(wèn)題,對(duì)微博用戶影響力關(guān)聯(lián)要素進(jìn)行分析,將粉絲與關(guān)注者的互動(dòng)行為納入到影響力評(píng)定方法之中,提出一種基于PageRank的微博用戶影響力排名算法(UI-Rank算法)。實(shí)驗(yàn)表明算法的計(jì)算結(jié)果反映微博用戶自身影響力的實(shí)際效果,能夠提高微博用戶影響力排名的準(zhǔn)確度。

微博;PageRank;用戶影響力;UI-Rank算法

Accordance with user influence ranking issue of micro-blog,related factors consists in user influence of micro-blog have get analysis.Interactive behaviors between fans and followers are integrated into method of influence evaluation,presents the user influence ranking algorithm(UI-rank)of micro-blog based on PageRank.Experiment shows that computing result of the algorithm is quite consistent with actual effect of user themselves influence and it can improve accuracy of user influence ranking of micro-blog.

猜你喜歡
分配用戶
基于可行方向法的水下機(jī)器人推力分配
應(yīng)答器THR和TFFR分配及SIL等級(jí)探討
遺產(chǎn)的分配
一種分配十分不均的財(cái)富
績(jī)效考核分配的實(shí)踐與思考
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
Camera360:拍出5億用戶
100萬(wàn)用戶
主站蜘蛛池模板: 久久五月天国产自| www.国产福利| 亚洲综合色区在线播放2019| 伊人色综合久久天天| 国产乱子伦视频三区| 欧美国产精品不卡在线观看| 久无码久无码av无码| 国产网友愉拍精品| 天天躁狠狠躁| 欧美国产日产一区二区| 草草线在成年免费视频2| 免费看一级毛片波多结衣| 精品午夜国产福利观看| 99国产精品国产| 2022精品国偷自产免费观看| 国产精品无码影视久久久久久久| 亚洲一区免费看| 无码AV日韩一二三区| 噜噜噜久久| 久久婷婷五月综合色一区二区| 国产精品亚洲片在线va| 国产日韩欧美黄色片免费观看| 亚洲视频色图| 伊人精品成人久久综合| 亚洲一区二区在线无码| 2024av在线无码中文最新| 国产JIZzJIzz视频全部免费| 中国国语毛片免费观看视频| 国产网站一区二区三区| 日韩国产另类| av尤物免费在线观看| 69视频国产| 99偷拍视频精品一区二区| 黄色免费在线网址| 国产日本视频91| 免费看a级毛片| 亚洲AV无码精品无码久久蜜桃| www.av男人.com| 亚洲成年网站在线观看| 天天操精品| 亚洲色无码专线精品观看| 精品人妻无码中字系列| 免费a在线观看播放| 香蕉国产精品视频| 亚洲精品无码高潮喷水A| 在线国产资源| 91视频首页| 欧美中文字幕无线码视频| 亚洲综合九九| 亚洲色欲色欲www网| 99免费视频观看| 国产亚洲精品无码专| 免费毛片a| 毛片久久久| 日本爱爱精品一区二区| 欧美亚洲一二三区| 中文字幕在线一区二区在线| 日本精品视频一区二区| 午夜国产理论| 福利一区三区| 免费Aⅴ片在线观看蜜芽Tⅴ| 国产精品亚洲一区二区三区z| 亚洲精品无码久久毛片波多野吉| 白丝美女办公室高潮喷水视频| 91精品aⅴ无码中文字字幕蜜桃| 久久这里只精品热免费99| 国产成人麻豆精品| 欧美黄色a| 伊人成人在线| 国产成人久久777777| 一级全黄毛片| 国产在线小视频| 日韩a级毛片| 亚洲综合中文字幕国产精品欧美| 亚洲成肉网| 中文字幕日韩久久综合影院| 亚洲av成人无码网站在线观看| 国产超碰一区二区三区| 国产亚洲男人的天堂在线观看| 婷婷六月综合| 国内黄色精品| 日韩国产 在线|