999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于微博社區(qū)的用戶影響力評價研究

2019-05-22 11:18:06劉芳芳張婉婷
電腦知識與技術(shù) 2019年10期

劉芳芳 張婉婷

摘要:文章在微博用戶已分類的基礎(chǔ)上,提出一種基于社區(qū)內(nèi)用戶當前時間段的影響力計算方法,使得用戶影響力計算結(jié)果更加客觀、科學以及具有應用價值。文章提出一種新的影響力排名算法,對原有pagerank算法進行改進,加入時間和活躍度兩個因素計算用戶粉絲對用戶的影響力貢獻值。首先在數(shù)據(jù)抓取時,只抓取限定時間段內(nèi)微博數(shù)據(jù),確保數(shù)據(jù)能反應用戶最新動態(tài)。然后再把用戶的活躍度作為PR值計算的一個因子構(gòu)造PR值計算公式,活躍度越高則粉絲的貢獻值越大。除此以外,還對用戶自身的影響力進行計算,用戶最終的影響力值等于粉絲貢獻值與自身影響力之和。最后通過對新浪微博數(shù)據(jù)進行采集,將計算結(jié)果與傳統(tǒng)的pagerank進行比較,該算法能更準確更科學地反應社區(qū)內(nèi)用戶當前的影響力排名。

關(guān)鍵詞:微博社區(qū);影響力;pagerank

中圖分類號:TP311 文獻標識碼:A

文章編號:1009-3044(2019)10-0248-03

開放科學(資源服務(wù))標識碼(OSID):

隨著互聯(lián)網(wǎng)技術(shù)和信息傳播方式的不斷發(fā)展,微博從初始的社交網(wǎng)絡(luò)平臺逐漸發(fā)展成為一種新興的信息傳播媒體,在現(xiàn)實社會網(wǎng)絡(luò)中擁有巨大的影響力。新浪微博作為國內(nèi)最大的社交網(wǎng)絡(luò)平臺,通過名人效應吸引了一大批用戶,至2017年底,新浪微博月活躍用戶數(shù)已經(jīng)達到4億。經(jīng)過幾年的發(fā)展,新浪微博已經(jīng)積累了巨大的用戶量,用戶每天在平臺上發(fā)布新的狀態(tài)或者新聞事件,用戶傳播信息的能力等等,吸引了大批的研究者對其進行研究。研究者通過用戶公開的信息對其進行分類,也就是社區(qū)劃分,將相似的人群劃分為一個社區(qū),然后再對各個社區(qū)挖掘影響力較大的用戶。這種基于社區(qū)劃分的大“V”用戶的挖掘,對于商業(yè)廣告以及社會輿論、新聞傳播都有著重要的應用價值。

目前,微博用戶影響力的研究已經(jīng)取得一些成果。張琳等[1]在對用戶聚類后,提出一種微博魅力指數(shù)即用粉絲數(shù)/微博數(shù),簡單地計算用戶影響力??禃圼2]從復雜網(wǎng)絡(luò)學分析用戶行為,認為微博用戶的活躍度對其關(guān)注用戶的影響力計算具有重要作用,主要考慮好友轉(zhuǎn)發(fā)微博對其影響力的貢獻,提出一種改進的pagerank算法,將活躍度作為權(quán)值計算用戶轉(zhuǎn)發(fā)微博的能力作為影響力值。劉玲等[3],提出用戶的影響力應該由用戶自身的質(zhì)量指數(shù)與用戶的間接質(zhì)量指數(shù)構(gòu)成,用戶的自身質(zhì)量指數(shù)即用戶微博的轉(zhuǎn)發(fā)率、評論率,是否為認證用戶等,用戶間接質(zhì)量指數(shù)即用戶好友對其影響力的貢獻值。但現(xiàn)實中,大部分的微博用戶行為存在周期性和不穩(wěn)定性,如果拿所有的原始數(shù)據(jù)進行分析,得到用戶影響力是長時間以來積累的值,不能反映該用戶在最近一段時間內(nèi)的影響力。本文在以上算法的基礎(chǔ)上,加上時間因素,采集最近一段時間內(nèi)的數(shù)據(jù)對用戶自身質(zhì)量指數(shù)算法和間接質(zhì)量指數(shù)的算法進行改進,提出一種新的微博影響力計算方法,實驗結(jié)果分析表明,該算法更具科學性和準確性。

1 pagerank算法

pagerank算法[4]是一個網(wǎng)頁排名算法,基本思想是將網(wǎng)頁之間的連接看作是一種投票行為,如果網(wǎng)頁a鏈接到網(wǎng)頁b,則認為網(wǎng)頁a給網(wǎng)頁b投了一票。在微博中,也可以用來描述用戶與用戶好友之間的相互作用關(guān)系。如果用戶a轉(zhuǎn)發(fā)了用戶b的微博,如果用戶b是一個影響力非常大的大“V”用戶,則用戶a的影響力也會得到大幅提升[5]。Weng 等[6]的研究說明,如果將好友對其影響力貢獻的總值作為影響力評價公式的唯一指標應用在Twitter上,最后實驗的排序結(jié)果與經(jīng)典的 PageRank 算法排序結(jié)果總體上一致。但是微博用戶中,每個用戶的活躍度是不一樣的,對于同一個粉絲,用戶活躍度越高應該獲取到粉絲的影響力貢獻值越高,同時還要考慮時間因素,因此需要綜合多項指標進行評價。

經(jīng)典的PageRank算法是通過網(wǎng)頁的鏈接進行分析得到網(wǎng)頁的重要度,計算的網(wǎng)頁的重要度值稱為PR值。一個網(wǎng)頁的PR值取決于鏈接到頁面的數(shù)量及該被鏈接的頁面的質(zhì)量和重要度,最后該網(wǎng)頁的PR值會被平均分配給它鏈出的網(wǎng)頁。例如,一個網(wǎng)頁a指向一個網(wǎng)頁b,則網(wǎng)頁b的一部分PR值由網(wǎng)頁a的PR值除以鏈出數(shù)量,網(wǎng)頁a的影響力越大,則對網(wǎng)頁b的PR值貢獻值越大。PageRank算法的數(shù)學公式描述如下,設(shè)pi為一個網(wǎng)頁,L(pj)為網(wǎng)頁pj鏈出數(shù)目,M(pi)鏈出到pi的網(wǎng)頁集合,d為阻尼系數(shù),表示用戶在瀏覽某個頁面后以1-d的概率繼續(xù)瀏覽某一個鏈出的頁面,以d概率重新選擇一個隨機頁面進行瀏覽,那么頁面pi的PR值可以用以下公式表示:

其中阻尼系數(shù)d一般取值為0.15[45],加入阻尼系數(shù)是為了保證最后的計算結(jié)果總是收斂的。微博中用戶之間的關(guān)系可以看成一個有向圖,用戶看成是網(wǎng)絡(luò)中的網(wǎng)頁,好友關(guān)系可以看成是網(wǎng)頁的鏈入鏈出。但是,傳統(tǒng)的算法只考慮了鏈接, 沒有考慮網(wǎng)頁內(nèi)容和主題的相關(guān)影響,而將PR值均勻地傳遞給它所鏈出的頁面,因此計算結(jié)果不準確。后期很多研究者對算法進行了改進,比如加入時間因素,加入網(wǎng)頁的內(nèi)容因素和主題因素等。

2 微博用戶影響力計算模型

本文在基于滑動窗口多標記傳播算法[7]對用戶進行社區(qū)劃分后,再針對不同社區(qū)的用戶分別采集最近一段時間的數(shù)據(jù),計算影響力。在微博中[8],用戶影響力主要通過發(fā)布微博、轉(zhuǎn)發(fā)微博、評論、點贊等行為積累而成的,微博社區(qū)內(nèi)的用戶之間交互量非常大且活躍。假設(shè),用戶A關(guān)注了用戶B ,則用戶B發(fā)布的微博就可以被用戶A看到,如果用戶A轉(zhuǎn)發(fā)了用戶B的微博則用戶B的微博影響力被擴大,等同于用戶B的影響力擴大,用戶A的影響力越大,則對用戶B的影響力貢獻值就越大;如果用戶A 僅評論了用戶B的微博,則用戶B的微博僅影響到用戶A一人,因此用戶B中參與評論的粉絲數(shù)量越多,則影響的用戶量越大;如果用戶A點贊用戶B的微博,則影響如同評論。除此以外,用戶本身如果為認證用戶,則其發(fā)表微博更令人信服,因此,從這個角度,認證用戶自身的影響力指數(shù)高于非認證用戶。本文將用戶的影響力計算值為自身影響力與粉絲影響力貢獻值(間接影響力)之和,具體公式如下:

3 實驗分析

本文在微博用戶社區(qū)劃分[7]數(shù)據(jù)基礎(chǔ)上,對標簽為“裝修 家居 電器 臥室”社區(qū)用戶數(shù)據(jù)爬取。首先爬取該社區(qū)用戶2018年的微博、每條微博被轉(zhuǎn)發(fā)的數(shù)量和轉(zhuǎn)發(fā)的用戶id、 每條微博被評論的數(shù)量和評論的用戶id、每條微博被點贊的數(shù)量和點贊用戶的id、用戶是否為認證用戶。對用戶的轉(zhuǎn)發(fā)用戶id、評論用戶id、點贊用戶id統(tǒng)計并去重,得到的用戶id則認為是與該用戶有交互的粉絲,本文考慮為有效粉絲。然后再根據(jù)有效粉絲的id進行第二層數(shù)據(jù)爬取,計算這些用戶最近一年的微博數(shù)量,這些用戶所關(guān)注的所有用戶集合,以計算這些用戶的活躍度。

本文針對“裝修家居”類的社區(qū)3000個用戶數(shù)據(jù)進行分析,并且與傳統(tǒng)的pagerank算法按歷史累計數(shù)據(jù)對粉絲影響力平均分配進行計算的結(jié)果比較,分別得到不同的影響力評價結(jié)果。其中表1和表2分別代表pagerank算法和本文算法得到的影響力PR值,按照本社區(qū)的影響力PR排名結(jié)果對比。

由于算法不同,基礎(chǔ)研究數(shù)據(jù)不同,因此PR值計算結(jié)果不同,但是對所有用戶排名結(jié)果是有效的。通過兩種算法比較可以看出,本文的算法得到的社區(qū)內(nèi)影響力排名較傳統(tǒng)的pagerank算法發(fā)生了變化。比如用戶id為2354950807的用戶微博等級為LV43,被譽為2018年十大影響力家居LV,查看其微博的轉(zhuǎn)發(fā)量、評論數(shù)已經(jīng)點贊數(shù)相對較多。傳統(tǒng)pagerank排名第5,本文算法中排名第二,用戶2994476004情況也類似于2354950807用戶。比如用戶id為2143116435的用戶總的粉絲數(shù)和總的微博量都很大,但是其在最近一年內(nèi)發(fā)布的微博數(shù)量只有2070不到微博總數(shù)的10%,查看其微博的互動也非常少,本文的算法排名中它的排名后退了2位,用戶2517621301情況類似。因為本算法注重最近一段時間內(nèi)用戶的影響力,而不是對歷史累計的影響力,同時考慮用戶的活躍度,有些用戶或許過去影響力比較大,而隨著時間的延長,用戶發(fā)布微博數(shù)量越來越少,或者微博質(zhì)量降低,導致不再吸引用戶而影響力降低,該算法能夠更加準確客觀地反映用戶的影響力排名。

4 結(jié)語

新浪微博作為國內(nèi)最大的社交網(wǎng)絡(luò)平臺,其反應的人類的社交行為具有非常實際的代表性,研究微博社區(qū)用戶影響力對新聞傳播、社會輿論監(jiān)控已經(jīng)商業(yè)廣告都有非常重要的意義。本文提出計算微博用戶的影響力應該以最近時間段數(shù)據(jù)為基礎(chǔ),從人類的行為特征來分析,人類的活動具有周期性和不穩(wěn)定性,因此也把用戶發(fā)布微博的頻率作為用戶的活躍度用來構(gòu)造用戶影響力公式。本文把實際參與互動的粉絲作為有效粉絲計算用戶自身的影響力和間接影響力,最后通過在新浪微博數(shù)據(jù)集上進行試驗,驗證了該算法的有效性。但是目前該算法只能手動爬取用戶數(shù)據(jù)再進行用戶影響力計算,還不能實現(xiàn)實時滾動地計算用戶的影響力,而且本文在基于社區(qū)劃分的基礎(chǔ)上進行分析,只能對已分好的社區(qū)內(nèi)用戶進行排名,用戶數(shù)數(shù)量固定,不能實現(xiàn)自我擴展,因而排名的范圍受到一定限制,本文接下來將對這些內(nèi)容進行研究。

參考文獻:

[1] 張琳,謝忠紅.基于聚類的微博用戶類型與影響力研究[J].情報科學,2016,34(08):57-61.

[2] 康書龍.基于用戶行為及關(guān)系的社交網(wǎng)絡(luò)節(jié)點影響力評價——以微博研究為例[D].北京郵電大學,2011.

[3] 劉玲,楊長春.一種新的微博社區(qū)用戶影響力評估算法[J].計算機應用與軟件,2017,34(07):212-216.

[4] Matthew Richard,Pedro Domings.Combing link and content information in web scarch[EB/OL].http://www.cse.Lehigh.edu/.

[5] 馬俊.基于話題傳播的微博用戶影響力分析[D].解放軍信息工程大學,2013.

[6] Weng J,Lim E P,Jiang J,et al.Twitter Rank: finding top-ic-sensitive influential twitterersC]/ / International Confer-ence on Web Search and Web Data Mining,WSDM 2010,New York,Ny,Usa,F(xiàn)ebruary.2010: 261-270.

[7] 劉芳芳,谷瑞軍,張婉婷.滑動窗口多標記傳播算法在微博用戶聚類的應用.內(nèi)江科技,2018,39(12):42-44.

[8] 馬俊,周剛,許斌等.基于個人屬性特征的微博用戶影響力分析[J].計算機應用研究,2013,30(8):2483-2487.

【通聯(lián)編輯:梁書】

主站蜘蛛池模板: 在线看片中文字幕| 91视频首页| 免费无遮挡AV| 伊人AV天堂| 亚洲精品自在线拍| 国产理论一区| 高h视频在线| 最新亚洲人成网站在线观看| 国产一区成人| 国产18页| 日韩色图在线观看| 91成人试看福利体验区| 亚洲精品无码在线播放网站| 99视频在线看| 国产激爽大片在线播放| 久久精品中文无码资源站| 91精品在线视频观看| 欧美亚洲欧美| 亚洲天堂精品在线观看| 国产成人精品免费视频大全五级| 伊人成人在线视频| 国产第一页免费浮力影院| 亚洲高清国产拍精品26u| 国产 在线视频无码| 亚洲不卡av中文在线| 成人一区在线| 欧美精品一区二区三区中文字幕| 国产亚洲精品自在久久不卡| 亚洲欧美一级一级a| 久久www视频| 欧洲亚洲欧美国产日本高清| 国产成人综合在线观看| 黄色在线不卡| 第一页亚洲| 永久在线精品免费视频观看| 国产自在自线午夜精品视频| 国产成人精品2021欧美日韩| 91视频区| 91精品伊人久久大香线蕉| 亚洲大尺码专区影院| 波多野结衣在线一区二区| 久久久久人妻精品一区三寸蜜桃| 国产女人18水真多毛片18精品| 91娇喘视频| 无码专区国产精品一区| 国内精自线i品一区202| 国产办公室秘书无码精品| 国产av无码日韩av无码网站| 亚洲AⅤ无码日韩AV无码网站| 在线无码私拍| 午夜激情婷婷| 亚洲综合第一页| 国产精品yjizz视频网一二区| 夜夜操天天摸| 欧美翘臀一区二区三区| 欧美不卡二区| 亚洲av片在线免费观看| 欧洲精品视频在线观看| 亚洲欧洲免费视频| 香蕉久久国产超碰青草| 沈阳少妇高潮在线| 91福利免费| 四虎国产成人免费观看| 成人免费视频一区| 国产jizz| 97se综合| 成人永久免费A∨一级在线播放| 久久视精品| 亚洲日本www| 欧美成人a∨视频免费观看 | 99精品免费在线| 色欲色欲久久综合网| 91亚洲精选| 亚洲欧美日韩另类在线一| V一区无码内射国产| 蜜桃视频一区二区| 国产草草影院18成年视频| 91精品国产自产在线老师啪l| 亚洲综合精品第一页| 全午夜免费一级毛片| 亚洲看片网| 中文字幕丝袜一区二区|