999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于行為權值的微博用戶影響力度量算法

2014-07-08 08:32:30黎明文海英楊杰陳旭日
計算機工程與應用 2014年17期
關鍵詞:用戶信息

黎明,文海英,楊杰,陳旭日

湖南科技學院計算機系,湖南永州 425199

◎數據庫、數據挖掘、機器學習◎

基于行為權值的微博用戶影響力度量算法

黎明,文海英,楊杰,陳旭日

湖南科技學院計算機系,湖南永州 425199

用戶影響力度量是目前微博研究的基礎和熱點方向,為了提高微博傳播影響力度量的準確性,提出一種基于行為權值的微博用戶影響力度量算法。對網絡用戶的轉發、評論和提及等行為進行分析,將數據輸入到最小二乘支持向量機中進行學習找到最合理的權值,并建立傳播影響力度量模型,采用具體數據對算法的性能進行仿真測試。結果表明,相對于其他微博用戶影響力度量算法,該算法不僅提高了微博用戶影響力的度量準確性,而且可以準確刻畫各種用戶行為對網絡傳播力貢獻。

微博用戶;最小二乘支持向量機;傳播影響力;用戶行為;影響覆蓋率

1 引言

隨著Internet的迅速發展,微博作為一種新興的社交媒體,吸引人們的廣泛學者,微博不僅是個人自我表達、獲取信息的工具,還逐漸發展成為政府、企業、組織用于信息發布、公關營銷的手段[1-2]。用戶影響力度量是目前微博研究的基礎和熱點方向,其可以對輿情事件發酵、商家的產品推介等具有十分重要意義[3-4]。

當前微博網絡用戶影響力度量方法主要有:(1)文獻[5]將好友數量作為影響力度量指標,提出了一種基于UserRank的用戶影響力度量模型。(2)將用戶轉發、評論、提等行為作為影響力度量指標,提出了基于用戶行為的度量模型[6]。(3)將PageRank和用戶行為進行組合,提出了基于TURank的用戶影響力度量模型[7];文獻[8]將用戶轉發行為作為度量指標,提出一種基于WeiboRank的用戶影響力度量模型;文獻[9]綜合考慮了用戶發表微博活躍度和PageRank算法,提出了基于Behavior-Relationship Rank的用戶影響力度量模型。(4)文獻[10]提出了基于URL追蹤的用戶影響力度量模型,這些研究結果表明,將PageRank和用戶行為相結合,可以比較客觀、合理地對用戶影響力進行度量,但是它們只考慮單一用戶行為、或者用戶之間的好友關系,但是在實際應用中,一些好友關系對用戶影響力沒有什么影響,如僵尸粉絲,而用戶的轉發、評論和提及等行為對于微博傳播作用相對較大,因此需要對用戶行為進行全面分析,才能夠建立客觀、準確的用戶影響力度量模型[2,11]。

為了提高微博用戶影響力的度量準確性,提出基于一種基于行為權值的微博用戶影響力度量算法。首先對網絡用戶的轉發、評論和提及等用戶行為進行分析,然后采用最小二乘支持向量機(Least Squares Support Vector Machine,LSSVM)合理確定他人權值,建立傳播影響力度量模型,最后采用具體數據對模型性能進行仿真測試。

2 微博影響力的度量指標分析

在微博傳播過程中,主要通過用戶交互行為描述微博影響力強弱,用戶的發布、分享等行為也有一定的影響作用,同時,他人的微博轉發、評論等行為也對信息傳播起著推動作用。如果一條微博信息被轉發越多,那么其影響力更強,這樣,一條微博信息發出后,轉發、評論和提及等行為形成一個影響人群范圍,因此這些行為可以作為用戶影響力的度量標準,具體如圖1所示。

圖1 微博的信息傳播方式

對于不同用戶行為,它們在整個網絡人群中所占比例不同,為此可采用覆蓋率F描述為用戶的傳播能力,用戶ui覆蓋率定義如下:

式中,N為網絡中所有節點數;Rc、Cc、Mc分別表示用戶轉發、評論、提及所覆蓋的人群數。

3 PageRank算法及存在的不足

在當前Internet中,PageRank是一種基于網絡圖的網頁排名算法,其基本思想是將網頁之間的鏈接看作是一種投票行為,重要網頁的選票要比一般網頁的價值高,一個網頁選票越多,就表示其越重要,設Pi為一頁面,O(Pi)和I(Pi)分別為其鏈出、鏈入的鏈接個數,d為阻尼系數,d的取值一般為0.15,那么Pi的PR值計算方式為[12]:

在微博信息傳播過程中,將每個用戶類可以看作一個網頁,將用戶粉絲和用戶關注對象分別看作鏈入和鏈出的網頁,這樣,就可以采用PageRank算法對用戶影響力進行分析,然而PageRank算法存在以下不足:

(1)粉絲數和用戶影響力之間的關系難以準確描述用戶影響力,特別是粉絲中包含有大量的對戶影響力起著反作用的僵尸粉絲時,準確性比較低,因此不能將這部分粉絲作為用戶的鏈入網頁,因此,本文采用用戶活躍度這個指標對用戶粉絲進行篩選。假設在微博數據時間段T內,微博用戶ui發表的原創、轉發、評論微博數為Sum(ui),則用戶ui的活躍度uia定義為:

如果一個用戶的活躍度低于事先設定的閾值,那用該用戶就要剔除掉,則將用戶ui剩下粉絲的集合記為Fo(ui)。

(2)由于用戶個人原因,添加了一些關注對象,但是其沒有對關注對象的微博信息進行過轉發、評論或提及等行為,表明該用戶對該條微博信息傳播沒有任何貢獻,那么該對象應該被篩選掉。設微博用戶ui轉發、評論記錄以及提及中包含的關注對象集合記分別為UiR、UiC、UiM,那么用戶最終的關注對象集合Fe(vj)為:

4 本文的微博傳播影響力度量算法

為了解決傳統PageRank算法存存的缺陷,提高微博傳播影響力的度量準確性,提出一種基于行為權值分配的微博用戶影響力度量算法,其可以表示為:

式中,Fo(ui)為用戶ui最終粉絲集合;ui、vj為微博用戶;Bw(ui,vj)是分配給用戶ui的比例因子,PR(ui)為用戶ui的PR值。

通過用戶的轉發、評論、網絡行為可以構造3個有向權值的網絡。設節點為V,邊為E,邊權為R,那么轉發網絡就可以表示為:GR(V,E,R),權值Rji表示vj對ui的轉發貢獻,在微博數據獲取時間內,ui發布的微博總數為n,tjk表示vj對ui的第k條微博的轉發情況,其計算公式為:

相應的Rji計算為:

用戶vj轉發網絡的工作過程如圖2所示,在圖中,實心圓圈為vj的Fe(vj),兩個節點之間如果不存在邊連接,那么表示vj對另一個節點沒有轉發行為。

圖2 微博的轉發過程

對于評論和提及網絡來說,它們與轉發過程十分相似,設Cji、Mji分別表示評論和提及權值。構建了3個不同的有向權值網絡后,將它們進行合并,最后得到一個反映微博用戶影響力的網絡,具體如圖3所示。

圖3 三個單一網絡合并過程

在網絡合并過程中,由于轉發、評論和提及等用戶行為對微博傳播影響力的貢獻是不一樣的,因此需要給它們賦予不同權值,設權值為W(ui,vj),則有:

式中,用α、β、γ分別表示轉發、評論、提及的貢獻程度。

綜合上述可知,在微博用戶影響力度量模型中,α、β、γ的確定至關重要,在實際情況中,一條微博信息的轉發、評論和提及行為具有很大的偶然性,α、β、γ之間不是一種典型的線性關系,因此本文采用支持向量機確定α、β、γ的大小。對第j條微博信息,轉發、評論、提取影響人次分別為Rnij、Cnij、Mnij,那么對于n條微博信息,共獲得n個樣本,將Rnij、Cnij、Mnij作為樣本的輸入向量,α、β、γ作為輸出,通過LSSVM學習建立微博傳播影響力度量模型。LSSVM的回歸方程為:

通過引入拉格朗日乘子求解該具有等式約束的二次規劃的問題,即有:

對公式(9)進行優化,即令w,b,ek,αk的偏導數均等于0[13]。

因此,式(9)的分解可以通過解式(12)和(13)獲得,LSSVM回歸函數為:

采用RBF徑向基函數作為核函數,其定義如下:

5 仿真實驗

5.1 數據來源

為了測試本文微博度量算法的有效性和優越性,在CPU Intel酷睿2雙核E8600,4 GB RAM,window s XP的計算機上,采用SQL Server2005和Matlab 2012編程,選擇新浪微博“時事評論”的微群進行仿真實驗。新浪微博數據主要包含了三類信息:(1)用戶信息:用戶ID、粉絲數、微博數;(2)微博信息:微博數、轉發數、評論數、提及數;(3)關系信息:轉發列表、評論列表、提及列表。數據采集與預處理流程圖如圖4所示。

圖4 數據處理流程

對采集的數據進行處理,將構造轉發、評論、提及三個網絡,三個網絡的特征見表1。

表1 3個網絡的數據

5.2 對比算法

采用3個單獨立網絡和常用微博用戶影響力度量算法(TURank)進行對比分析,它們具體為:單一評論度量算法(Followers);單一轉發度量算法(Retweets);單一被提及度量算法(Attenders);TURank算法:通過構造基于鏈接分析的用戶-內容(User-Tweet Graph)來計算得分進行用戶排名[14]。TURank算法的實現流程如圖5所示。

圖5 TURank算法的工作流程

5.3 結果與分析

采用上述幾個算法對用戶影響力進行度量,然后根據度量結果進行排序,選擇影響力前十名的用戶影響人次覆蓋率進行對比,各算法的結果如圖6所示。從圖6可以得到如下結論:

(1)相對于TURank算法,本文算法的度量準確性更高,與真實用戶影響人次變化曲線十分接近。

(2)相對于單一特征的微博用戶影響力度量模型,本文算法的度量準確性大幅度提高。

對比結果表明本文算法綜合考慮用戶的轉發、評論、網絡行為,可以比較全面地描述微博用戶影響力變化趨勢,同時通過LSSVM確定權值,可以準確地描述用戶的轉發、評論、網絡行為對度量結果的貢獻,能夠更加準確客觀地反映用戶影響力排名,而單一特征或者其他算法難以建立準確描述用戶影響力的度量模型,度量準確性低,沒有什么實用價值。

6 結束語

微博作為一個近年來興起的在線社會網絡,既具有媒體傳播特性,又具有社交網絡特性,引起了人們廣泛的關注,為了更加準確度量微博用戶的傳播影響力,提出了一種基于行為權值分配的微博用戶影響力度量算法,并通過仿真對比實驗測試其性能。結果表明,本文算法可以準確描述各種用戶行為對網絡傳播力影響,提高了微博用戶影響力的度量準確性,具有廣泛的應用前景。

圖6 不同算法的性能對比

[1]Kwak H,Lee Changhyun,Park H,et al.What is Twitter,a social network or a new s media[C]//Proceedings of the 19th International Conference on World Wide Web. New York:ACM Press,2010:591-600.

[2]Weng Jianshu,Lim Eepeng,Jiang Jing,et al.Twitter rank:finding topic-sensitive influential Twitter[C]//Proceedings of the 3rd ACM International Conference on Web Search and Data mining.New York:ACM Press,2010:261-270.

[3]Ye Shaozhi,Wu Felix.Measuring message propagation and social influence on Twitter.com[C]//SocInfo’10,2010:216-231.

[4]Lee Changhyun,Kwak H,Park H,et al.Finding influential based on temporal order of information adoption in Twitter[C]//Proceedings of the 19th International Conference on World Wide Web.New York:ACM Press,2010:1137-1138.

[5]馬雯雯,魏文晗,鄧一貴,等.基于隱含語義分析的微博話題發現方法[J].計算機工程與應用,2014,50(1):96-100.

[6]李軍,陳震,黃霽崴.微博影響力度量研究[J].信息網絡安全,2012,27(3):10-13.

[7]袁毅.微博客信息傳播結構、路徑及其影響因素分析[J].圖書情報工作,2011,55(12):26-30.

[8]鐘帥.基于粒子群算法的微博用戶影響力研究[D].武漢:華中科技大學,2012.

[9]楊長春,俞克非,葉施仁,等.一種新的中文微博社區博主影響力的度量方法[J].計算機工程與應用,2012,48(25):229-233.

[10]吳陳鶴,杜友田,蘇暢.有限節點驅動的微博社會網絡話題推薦方法[J].計算機工程與應用,2013,49(15):141-146.

[11]苑衛國,劉云,程軍軍,等.微博雙向“關注”網絡節點中心性及傳播影響力的分析[J].物理學報,2013,62(3):38901-38910.

[12]郭浩,陸余良,王宇,等.基于信息傳播的微博用戶影響力度量[J].山東大學學報:理學版,2012,47(5):78-83.

[13]田海梅,黃楠.基于ACO-LSSVM的網絡流量預測[J].計算機工程與應用,2014,50(1):91-95.

[14]Yuto Yamaguchi.TURank:Twitter user ranking based on user-tweet graph analysis[C]//W ISE,2010:243-246.

LI M ing,WEN Haiying,YANG Jie,CHEN Xuri

Department of Computer Science,Science and Technology Institute of Hunan,Yongzhou,Hunan 425199,China

Information diffusion and influence modeling are hot topics in micro-blog research, in order to improve measure precision of micro-blog spreading influence, a novel measuring algorithm of micro-blog spreading influence is proposed in this paper. The retweet, comment, mention are analyzed, and then the data are input to least squares support vector machine to obtain weight values, and establish spreading influence measure model, the simulation experiment is carried out to test the model performance. The simulation results show that, compared with other measure algorithms, the proposed algorithm not only improves the measure precision accuracy of micro-log spreading influence, but also can be more accurately portray various user behavior on spreading influence.

micro-blog users; least squares support vector machine; spreading influence; user behavior; effect coverage rate

LI M ing,W EN Haiying,YANG Jie,et al.Measuring user in fluence of m icro-b log based on behavior weigh t.Computer Engineering and Applications,2014,50(17):130-133.

A

TP391

10.3778/j.issn.1002-8331.1402-0110

湖南省自然科學基金(No.11JJ6065);湖南省科技廳項目(No.2012FJ3051);湖南省教育廳項目(No.12C0681)。

黎明(1974—),講師,主要研究領域為計算機網絡安全、系統架構;文海英(1972—),副教授,主要研究領域為智能信息處理、知識發現與知識工程、軟件工程;楊杰(1976—),副教授,主要研究領域為計算機網絡安全、人工智能及數據挖掘;陳旭日(1971—),副教授,主要研究領域為計算機網絡、分布式系統。

2014-02-17

2014-05-13

1002-8331(2014)17-0130-04

猜你喜歡
用戶信息
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
100萬用戶
創業家(2015年10期)2015-02-27 07:54:39
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
信息
建筑創作(2001年3期)2001-08-22 18:48:14
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 青青操国产视频| 日韩中文欧美| 国产亚洲欧美在线人成aaaa| 国产丝袜第一页| 国产理论精品| 国产欧美日韩精品综合在线| 午夜激情婷婷| 国产成人精品午夜视频'| 一级片免费网站| 无码中文AⅤ在线观看| 午夜人性色福利无码视频在线观看| 国产成人精品三级| 欧美在线精品怡红院| 中文字幕第4页| 亚洲一区网站| 日本午夜视频在线观看| 国产青青草视频| 亚洲无码熟妇人妻AV在线| 国产午夜人做人免费视频中文| 欧美日韩第三页| 亚亚洲乱码一二三四区| 亚洲欧美激情小说另类| 草草影院国产第一页| 一级做a爰片久久免费| 亚洲欧美一区二区三区麻豆| www.99精品视频在线播放| 99爱在线| 第一页亚洲| 亚洲二三区| 日韩高清在线观看不卡一区二区| 国内精品自在自线视频香蕉| 亚洲视频免费在线| 一级毛片免费高清视频| 亚洲三级成人| 欧美97色| 视频国产精品丝袜第一页| 无码中文字幕加勒比高清| 这里只有精品国产| 啊嗯不日本网站| 亚洲无码高清视频在线观看| 国产在线第二页| 国产高清国内精品福利| 婷婷伊人久久| 亚洲v日韩v欧美在线观看| 亚洲人免费视频| 久久精品这里只有国产中文精品 | 一级毛片在线免费视频| 精品无码人妻一区二区| 欧美国产日产一区二区| 天天色天天综合| www.狠狠| 成人免费视频一区| 欧类av怡春院| 一本大道东京热无码av| 高清码无在线看| 91丝袜乱伦| 综合色亚洲| 青青热久免费精品视频6| 欧美国产精品不卡在线观看 | 无码区日韩专区免费系列| 久久九九热视频| 露脸一二三区国语对白| 国产日韩欧美在线视频免费观看 | 国内精品自在自线视频香蕉| 国产一在线| 国产尤物jk自慰制服喷水| 无码久看视频| 亚洲成a人片| 国产三级a| 欧美午夜久久| 国产在线精品香蕉麻豆| 国产日韩丝袜一二三区| 40岁成熟女人牲交片免费| 亚洲bt欧美bt精品| 先锋资源久久| 成人综合网址| 中文字幕免费播放| 91精品国产综合久久不国产大片| 国产91无码福利在线| 91欧美在线| 国产欧美一区二区三区视频在线观看| 2048国产精品原创综合在线|