999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于關聯關系的微博用戶可信度分析方法

2017-05-24 14:45:22李付民佟玲玲杜翠蘭李揚曦張仰森
計算機應用 2017年3期
關鍵詞:用戶評價信息

李付民,佟玲玲,杜翠蘭,李揚曦,張仰森

(1.北京信息科技大學 智能信息處理研究所,北京 100192; 2.國家計算機網絡應急技術處理協調中心,北京 100190) (*通信作者電子郵箱tongling300@sina.com)

基于關聯關系的微博用戶可信度分析方法

李付民1,佟玲玲2*,杜翠蘭2,李揚曦2,張仰森1

(1.北京信息科技大學 智能信息處理研究所,北京 100192; 2.國家計算機網絡應急技術處理協調中心,北京 100190) (*通信作者電子郵箱tongling300@sina.com)

隨著微博研究的深入,對微博用戶可信度的評價成為一個研究熱點。針對微博用戶可信度評價的問題,提出了一種基于關聯關系的用戶可信度分析方法。以新浪微博為研究對象,首先從用戶的資料信息、交互信息和行為信息三個方面出發,分析了用戶的7個相關特征,利用層次分析法(AHP),進而得到用戶自評價可信度;然后以用戶自評價作為基點,以用戶關系網絡作為載體,結合用戶之間潛在的用戶互評關系,通過改進PageRank算法,提出了用戶可信度評價模型User-Rank,進而,利用關系網絡中其他用戶對待分析用戶的可信度進行綜合評價。大規模的微博真實數據的實驗表明,所提方法能夠取得良好的用戶可信度評價效果。

用戶自評價;關系網絡;用戶可信度;用戶關聯關系;層次分析法;PageRank

0 引言

近年來,隨著社交網絡的快速發展,微博作為一種開放式社交網絡媒體,憑借其實時、簡潔、靈活、快捷的特點,快速地融入到人們生活的各個方面。它不僅具有社交媒體的特性,而且還具有今非昔比的社會服務價值。中國互聯網絡信息中心(China Internet Network Information Center, CNNIC)發布的《2015年中國社交應用用戶行為研究報告》[1]指出,微博是用戶獲取和分享最新資訊和興趣愛好的重要平臺。新華網發布《2015年全國政務新媒體綜合影響力報告》[2]統計數據顯示:截止到2015年12月,我國政務微博認證賬號(含新浪、騰訊兩大微博平臺)達到28.4萬個,累計覆蓋人次達45億以上。微博作為時下流行的大眾化信息傳播媒介,處于網絡輿論傳播中心地位。它不僅滿足用戶及時了解新聞熱點、興趣內容、對新聞熱點事件的評論等需求,同時在政府新聞機構也得到了廣泛的應用和極大的推廣。

由于微博的開放性和交互性等因素,越來越多的國內民眾注冊微博,成為微博這一草根媒體的一員。隨著微博的普及,微博用戶的可信度[3]問題成為亟待解決的問題。目前微博用戶可信度的研究大都是基于統計學的方法,通過統計微博用戶的粉絲數、原創或轉發微博數量、用戶交互頻率、用戶被@次數等特征來進行研究的,這些特征只是從靜態的角度反映了該微博用戶的可信度,并沒有考慮用戶關系網絡[4]中其他微博用戶的可信度對該用戶的可信度造成的影響,因此難以全面地評價微博用戶的可信度。

本文基于用戶關聯關系對用戶可信度評價方法進行研究,創新性工作主要包括:

1)從用戶資料信息、用戶交互信息、用戶行為信息[5-6]綜合考慮出發,分析了用戶可信度的相關度量特征,構建了用戶可信度自評價模型。

2)結合用戶自評價值,利用用戶關系網絡,完成對微博用戶可信度評價模型的構建。

1 相關工作

針對微博用戶可信度的問題,已有不少學者對微博用戶進行了研究探討。

Cha等[7]提出了三種度量用戶影響力的方法(被關注數量、被轉發次數、被提及次數),通過對三種方法的分析比較發現:被關注數量少的用戶的影響力一定很低,但是擁有較多關注者的用戶其影響力并不一定高。也就說,簡單通過統計關注者數量來度量用戶影響力的方法并不一定有效。

Bakshy等[8]把微博轉發樹作為用戶影響力的度量指標,通過分析消息傳播網絡中消息傳播的廣度和深度,使用回歸樹的方法,來度量用戶的社會影響力大小。該研究認為用戶發布微博的轉發規模決定了用戶影響力的大小。

Castillo等[9]提取用戶發布和轉發行為、微博文本信息和外部鏈接引用等三類特征,并利用決策樹來評估與相關的“趨勢”的主題的微博帖子的可信度。針對微博用戶,他們提取每個用戶微博發布數量、關注的好友數量、微博注冊時間和粉絲數量作為微博用戶特征,由于缺乏對用戶的權威性的考慮,因此,難以全面地衡量微博用戶的可信度。

毛佳昕等[10]考慮用戶行為因素和微博傳播網絡結構兩方面的信息,通過分析微博的時效性、用戶訪問微博的時間分布和用戶轉發微博的喜好等用戶行為因素的關系,提出了用戶所發微博在全局范圍內被轉發的次數這一影響因子,并結合社會影響力在微博關系網絡中的傳播情況,來度量用戶社會影響力。研究表明,用戶傳播信息能力的大小反映了用戶的社會影響力。

張紹武等[11]針對消息傳播過程中產生的影響力、用戶的活躍程度以及微博消息的價值,提出了三種影響力度量方法(用戶行為影響力、用戶活躍度影響力和微博影響力),通過分析影響力指標之間關聯程度,構建了一種融合上述三種度量方法的微博用戶影響力度量模型。研究表明,用戶影響力和用戶活躍度影響力與微博影響力之間的關聯較強,即活躍度較高的用戶,其發布的有價值的微博更能提升自身影響力。

縱觀國內外學者對于微博可信度的研究,大多集中研究了各種可能影響微博可信度的因素,但鮮有涉及用戶關系網絡對微博用戶可信度的潛在影響及其作用機制。基于此,本文將研究對象鎖定在國內新浪微博上,在國內外學者研究的基礎上,引入用戶關系網絡中的用戶關聯關系對微博用戶的可信度進行評價。

2 微博用戶可信度模型分析

2.1 用戶可信度的自評價模型

本文對新浪微博進行了詳盡的分析,從用戶資料信息、用戶行為信息和用戶交互信息三個方面出發,對影響微博用戶可信度的自評價效果的相關特征進行度量,提出微博用戶可信度的自評價模型。

2.1.1 用戶資料信息

一般地,如果用戶個人基本資料的公開程度越高,用戶發布、轉發以及評論微博時會保持較高的道德標準,公眾對這類用戶的信任程度通常也很高。用戶資料信息的完整度一定程度上反映了用戶的可信度。基于新浪微博對用戶資料信息進行提取,包括用戶資料信息中的10項標簽的內容:性別、生日、地區、騰訊QQ、博客、簡介、標簽、教育信息、職業信息和認證信息。

構建向量A用以表示用戶基本資料的填寫情況,如式(1)所示:

A=(x1,x2,…,xn)

(1)

其中xi表示序號為i的標簽是否包含信息:xi=0表示第i號標簽不存在有效信息;xi=1表示第i號標簽存在有效信息。

考慮到新浪微博用戶注冊時,用戶提交的用戶資料信息可能不準確,在數據預處理階段,本文對用戶提交的資料信息進行過濾預處理。對經過預處理的用戶資料信息,本文把其作為判斷用戶可信度的一個維度。用戶向量模型構建算法流程如圖1所示。

圖1 用戶向量模型構建算法流程

定義1 用戶資料完整度為用戶注冊微博平臺賬號時主觀意愿上向公眾公開的個人基本信息標簽所占所有信息標簽的比例。

通過計算向量A的稀疏度來確定用戶資料完整度(UserInfo Integrity, UI),如式(2)所示:

(2)

其中:UI(u)表示用戶資料完整度函數,n是用戶資料向量A的總維度。

2.1.2 用戶行為信息

從用戶行為信息出發,本文考慮用戶發布或轉發微博中非鏈接域比率、內容多樣性、微博活躍度和時間活躍度這四個特征。

1)非鏈接域比率。

通常情況下,每條微博文本都較為簡短,一些廣告用戶通常會選用“在微博消息中添加鏈接”的方式發布廣告推廣、產品營銷等垃圾微博信息。Al-Khalifa等[12]通過對Twitter的分析,考慮文本中是否含有鏈接這一特性。本文用“不含URL(UniformResoureLocator)微博比”來描述用戶微博中不含有鏈接的微博占比(NoURLRate,NR),如式(3)所示:

(3)

其中:NR(u)表示用戶u發布的所有微博中不含鏈接的微博比例;Num(u)表示用戶u的微博總數;函數Url(i)表示用戶u發布微博中第i條微博中是否包含鏈接,若包含鏈接返回值為1,反之返回值為0。

2)內容多樣性。

微博用戶中既有正常用戶也有僵尸用戶。正常用戶的微博內容富含用戶個人色彩,語言表達形式多樣;僵尸用戶是指那些虛假賬號,一般通過人為控制、自動轉發特定信息的賬號,目的性較強,發布的微博大多具有針對性。通過對廣告用戶、垃圾用戶等一些有目的性的微博用戶的分析,本文發現,這類用戶發布的微博內容在一段時間內比較集中,通常具有目的性。特別是廣告用戶,他們發布的微博內容重復率特別高。這類用戶發布的微博內容去重之后,有效字數較少。為了更好地區分正常用戶與垃圾用戶或者有目的性的用戶,本文認為,從微博用戶發布的歷史微博內容出發,考慮微博短文本的特性、微博內容有效字數,在一定程度上能反映微博用戶的差異性,進而對微博用戶的可信度進行分析。

基于微博文本的特性,以字為最小單位,計算微博用戶內容的多樣性(ContentDiversity,ConD),如式(4)所示:

(4)

其中:ConD(u)表示微博用戶內容的多樣性,Con(i)表示微博用戶第i條微博的內容,Num(u)表示用戶u的微博總數,Len(m)表示微博文本m的長度,Dis(C)表示微博文本集C去重后的字數。

3)微博活躍度。

該指標指的是用戶在更新微博、轉發微博的活躍程度。微博活躍度越高,說明該微博用戶經常借助微博互動行為,與其他用戶實現信息共享。一方面表明該用戶所發布的微博、評論等具有比較強的傳播能力,另一方面也說明該用戶的可信度比較高,其他用戶對其信任程度也較高。

定義2 用戶微博活躍度(ActivityDegree,AD)為微博用戶在一定時間內,通過發布或者轉發微博,與他人進行微博信息共享的頻率,如式(5)所示:

(5)

其中:AD(u)表示用戶微博活躍度,NumT(u)表示用戶u在時間T內的原創微博總數,ReblogT(u)表示用戶u在時間T內的轉發關注者的微博總數,AttT(u)表示用戶u在時間粒度T內的關注者數,常數T為時間粒度量,γ為用戶原創微博數的權重,δ為用戶轉發微博數的權重。

例如:用戶A有5個關注者,在一段時間內原創微博10條,轉發微博5條;用戶B有100個關注者,在相同時間內原創微博11條,轉發微博4條。可以看出,用戶A與他人進行信息共享頻率比用戶B的高。

4)時間活躍度。

定義3 時間活躍度(TimeActivityDegree,TD)是對用戶發布的最近N條微博消息跨越的天數的度量。對于正常用戶而言,這一特征值較低,而對于突然活躍的用戶,例如當某一話題在微博流行時,這些用戶會通過當前熱門話題來博得其他用戶的關注,這些用戶的該特征值較高,如式(6)所示:

(6)

其中:TD(u)表示用戶時間活躍度值,Num(u)表示用戶u的微博總數,Date(i)表示第i條微博發布的日期,Day(register)表示微博賬號注冊的天數。

2.1.3 用戶交互信息

1)微博傳播力度。

定義4 微博傳播力度(SpreadDegree,SD)是指微博用戶發布的原創微博中,被粉絲認可進而進行的轉發、評論、回復、點贊等互動行為的次數。一定程度上,用戶傳播力度反映了該用戶對關系網絡中的其他用戶的影響力的大小。用戶傳播力度越高,用戶發布的微博獲取的關注也就越多,參與的人數也會增加,用戶的影響力也越高,如式(8)所示:

(7)

SD(u)=(eμ×Total(u)-1)/(eμ×Total(u)+1)

(8)

其中:SD(u)表示微博傳播力度,Num(u)表示用戶原創微博數,Thu(i)表示用戶u的第i條微博被點贊的次數、Eval(i)表示用戶u的第i條微博被評論的次數、Rep(i)表示用戶u的第i條微博被回復的次數、Tran(i)表示用戶u的第i條微博被轉發的次數,Fans(u)表示用戶的粉絲數。

2)用戶有效交際廣度。

在用戶關系網絡中,微博用戶間通過關注成為彼此的粉絲。粉絲表明他人對用戶的關注,以期望得到用戶的微博行為信息,并將成為微博傳播的帶動者。擁有越多粉絲的用戶,與粉絲之間的交互能力越強,在粉絲中的影響力越高,用戶的可信度越高。在中文微博中,有的用戶為了追求高粉絲數,于是出現了一種特殊的“互粉”現象,即用戶關注了其他某個用戶,同時也希望該用戶關注自己。

定義5 針對這種特色現象,本文通過對純粉絲數和互粉數加權求和來統計用戶有效交際廣度(CommunicateDegree,ComD),如式(9)所示:

(9)

其中:ComD(u)表示用戶有效交際廣度;Pfans(u)表示用戶純粉絲數,Mfans(u)表示用戶互粉數,Fans(u)表示用戶粉絲數,且Fans(u)=Pfans(u)+Mfans(u);Att(u)表示用戶關注數,γ為用戶純粉絲數的權重系數,δ為用戶互粉數的權重系數。

2.1.4 用戶自評價可信度模型的構建

基于以上3方面7個指標特征,應用層次分析法(AnalyticHierarchyProcess,AHP)[13]進行指標權重系數的評價,進而度量用戶自評價可信度。

層次分析法是把復雜的多因素決策問題分解為多個層次上的子因素間相互比較和權重計算問題。它是美國運籌學家Saaty教授提出的一種多準則、單目標決策方法,是對定性事件作定量分析的一種靈活、適應性強、相當有效的方法。應用層次分析方法進行權重系數評價主要包括三部分。

1)層次結構模型的創建。

層次分析法的基本結構包括三層,分別是目標層、指標準則層以及方案層,如圖2所示。

圖2 層次結構模型

其中,第一層表示此次的目的是計算用戶的可信度,第二層表示存在7個指標來影響目標選取的準則層,第三層表示用戶信息的方案層。

2)模型比較矩陣的構建。

根據層次結構模型,相對于計算用戶可信度,比較準則層中的各個指標的相對性,得出的比較矩陣如表1所示。

表1 模型比較矩陣

3)權值向量的構建。

構建向量μ用以表示各個指標的權重系數,如式(10)所示:

μ=(μ1,μ2,…,μi)

(10)

根據比較矩陣,獲取各個指標間的相對重要程度,進而得到權值向量:

μ=(0.037 3,0.068 7,0.059 9,0.099 7,0.085 7,0.201 7,0.447 5)

本文自評價(Self Evaluate, SE)度量模型的量化計算方法,如式(11)所示:

SE(u)=(UI(u),NR(U),ConD(u),AD(u),TD(u),SD(u),ComD(u))×(μT)

(11)

其中:SE(u)表示用戶u的自評價可信度值。

2.2 用戶可信度評價模型

上節中,利用用戶自評價模型來描述微博用戶的可信度,但是從某種程度上來說基于自評價的可信度模型是可以被“灌水”的。為了盡可能避免這種情況,本文對用戶之間的關聯關系進行了分析,進而評價用戶可信度對其他用戶的可信度造成的影響。

2.2.1 微博關系網絡模型

作為以用戶為核心的微博社交網絡,微博用戶之間可以彼此任意關注對方,這種“關注”與“被關注”的關聯關系形成了有向圖,也就形成了一個巨大的用戶關系網絡,如圖3所示。

圖3 用戶關系網絡

2.2.2 基于User-Rank的用戶可信度網絡評價模型

PageRank是一種評價網頁的相關性以及重要性程度的算法,常常被用來衡量網頁之間鏈接指向的權威性。

從拓撲結構來說,微博用戶關系網絡與網頁之間的鏈接關系具有相似性,因此,PageRank算法對微博用戶在用戶傳播關系網絡中的評估有一定的借鑒意義。假設微博用戶A和用戶B擁有相同的粉絲數,并且所有粉絲的PageRank值相同,通過PageRank算法計算,用戶A和用戶B可信度值是相等的。由于微博中存在互粉現象,在粉絲數相同的情況下,擁有較多互粉的用戶的可信度值計算存在一定的偏差,因此,本文在對用戶可信度計算時,把粉絲分為通過互粉建立關系和通過純粉建立關系兩類用戶,在計算用戶可信度值時,在用戶關系之間引入權值,對PageRank算法進行改造,提出User-Rank用戶可信度評價算法,使其更加適用于微博關系網絡中用戶的可信度度量。

User-Rank算法分為兩個步驟。首先利用用戶自評價模型,得到每個微博用戶自評價可信度值。然后以用戶自評價值作為輸入,基于用戶關聯關系,計算用戶可信度值(UserCredibility,UC),如式(12)所示:

(12)

(13)

(14)

(15)

式(12)中,UC(i)表示用戶i的可信度評價值,Wm(k)表示用戶的互粉用戶k的可信度值,Wp(j)表示用戶的純粉用戶j的可信度值,f表示阻尼系數,由式(15)得到。

3 實驗結果與分析

本文的實驗數據來自新浪微博。采集信息包括微博用戶資料信息、微博文本信息、微博用戶關系信息三方面的信息。微博用戶資料信息包括用戶id、簡介、標簽、認證信息、粉絲數、關注數、互粉數等基本信息。微博文本信息包括微博文本內容、點贊次數、評論數、轉發數、@用戶等信息。微博用戶關系信息包括微博用戶id、用戶關注數、關注者id列表。基于新浪微博的應用程序編程接口(ApplicationProgrammingInterface,API),信息采集如下:

1)爬取微博種子用戶信息。

從某一用戶出發,爬取用戶的粉絲列表,以這些粉絲作為種子用戶。

2)獲取用戶關注關系信息。

從種子用戶出發,逐層爬取并記錄用戶之間的關注關系信息(每個單向關注作為一條記錄)。

3)獲取微博用戶語料。

從用戶關注關系出發,統計關注關系中所有的微博用戶,選取關注關系較為理想的微博用戶,進而爬取微博用戶的所有信息。其中本文選取微博文本的時間跨度為2014年10月-2016年4月,數據規模統計如表2所示。

表2 數據規模

3.1 實驗結果

在測試數據集上,通過對用戶信息的預處理,統計用戶可信度評價的各個指標,部分結果如表3所示。其中,表中的用戶指標是通過式(2)~(9)所得。為了減小各個指標的波動性,本文進行歸一化處理,使指標的范圍在[0-1]。表3中的用戶對應的可信度評價值如表4所示。表5列出利用本研究方法得到的用戶可信度排名和微博風云榜[14]給出的2016年4月9號微博用戶排名中共同用戶對比的Top10結果。

表3 部分用戶信息的對應指標

表4 部分用戶可信度評價值

3.2 模型分析

從表4中可以看出:知名人物、娛樂明星以及官方認證機構的微博用戶可信度值一般較高;而對于普通的個人微博用戶來說,其可信度值一般較低。

通過對表3和表4的綜合分析可以看出:對于一般用戶來說,其用戶完整度一般都不高,說明用戶的基本信息不全;微博活躍度不高和時間活躍度較大,說明了用戶近期大都沒有發布或轉發微博的行為;用戶的關注數與粉絲數較少,在一定程度上決定其交際廣度和傳播力度較低;正是由于普通的個人微博基本信息不全,并且其在微博信息網絡中沒有什么活躍性,那么微博用戶的可信度值必然較低。而對于知名人物的微博來說,由于其具有大量的粉絲,其發布的信息可以迅速地在微博關系網絡中得到其他用戶的響應,所以其可信度一般都較高。因此,模型的計算結果符合人們對不同類別的用戶群體的可信度認知,也符合本文計算用戶可信度得出的一般性結論。

對表4中記錄1和2、5和6、7和8兩兩比較,不難看出,在不考慮用戶關系網絡情況下,用戶粉絲較多的用戶,其自評價值相應地也較高。針對微博用戶關系網絡中用戶之間雙向指向的關聯關系,本文在用戶關系之間引入權值,對表4中記錄1和2、3和4、5和6兩兩比較,可以看出在考慮互粉對用戶可信度影響后,在粉絲數相同或差不多的情況下,擁有較多的互粉的用戶的可信度值較低,這是因為新浪微博中存在互粉現象,在對用戶粉絲數統計時,是存在“灌水”的可能性,所以在不考慮互粉影響下,用戶自評價的可信度模型的評價值不合理。這也證明了本文引入的用戶可信度評價模型,在一定程度上避免了用戶的可信度排名不合理的問題。

從表5可以看出,通過本文計算的用戶可信度排名具有一定的合理性。通過對比,可以看出,本文對用戶可信度的排名與微博風云榜給出的微博用戶的排名在趨勢上是一致的。然而模型的構建均是針對用戶歷史數據的計算,因此這個模型數值只能在一段時間內有效。

4 結語

本文主要研究了微博用戶可信度的問題。首先提取用戶的資料信息、交互信息和行為信息的7種特征,來度量用戶自評價可信度;隨后結合用戶關系網絡和用戶自評價可信度,提出了一種基于關系網絡中用戶權值分配的User-Rank用戶可信度評價方法。結合真實微博用戶數據進行相關實驗,結果表明,本文提出的用戶可信度評價方法,不僅考慮了用戶本身各類信息特征,而且綜合考慮關系網絡中其他用戶的可信度對該用戶的可信度度量的影響,為用戶可信度分析提供高性能評價方法。

在接下來的研究工作中,將從以下兩個方面進一步改進算法。

1) 探索其他因素對微博用戶可信度評價特征的影響。例如。對微博轉發、評論特征統計時,考慮與傳播學理論相結合,挖掘微博被轉發、評論的原因,對特征進一步綜合分析。

2) 進一步探究可信度分析方法。通過綜合評估分析各個指標對用戶可信度的影響,合理權衡對應的閾值,實現對用戶可信度更有效的度量。

表5 用戶可信度排名

)

[1] 中國互聯網絡信息中心.2015年中國社交應用用戶行為研究報告[EB/OL].[2016- 04- 08].http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/sqbg/201604/P020160722551429454480.pdf.(ChinaInternetNetworkInformationCenter.Chinasocialapplicationuserbehaviorresearchreport2015 [EB/OL]. [2016- 04- 08].http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/sqbg/201604/P020160722551429454480.pdf.)

[2] 新華網輿情監測分析中心.2015年上半年全國政務新媒體綜合影響力報告[EB/OL].[2015- 08- 18].http://news.xinhuanet.com/yuqing/128137211_14399521067501n.doc. (XinhuaPublicOpinionMonitoringandAnalysisCenter.Reportonthecomprehensiveinfluenceofthenationalgovernmentnewmediainthefirsthalfof2015 [EB/OL]. [2015- 08- 18].http://news.xinhuanet.com/yuqing/128137211_14399521067501n.doc.)

[3] 蔣盛益,陳東沂,龐觀松,等.微博信息可信度分析研究綜述[J].圖書情報工作,2013,57(12):136-142.(JIANGSY,CHENDY,PANGGS,etal.ResearchreviewofinformationcredibilityanalysisonMicroblog[J].LibraryandInformationService, 2013, 57(12): 136-142.)

[4] 文坤梅,徐帥,李瑞軒,等.微博及中文微博信息處理研究綜述[J].中文信息學報,2012,26(6):27-37.(WENKM,XUS,LIRX,etal.SurveyofMicroblogandChineseMicrobloginformationprocessing[J].JournalofChineseInformationProcessing, 2012, 26(6): 27-37.)

[5] 張成.社交網絡中的用戶行為特征分析與挖掘[D].北京:北京郵電大學,2014:15-46.(ZHANGC.Characteranalysisandminingofuserbehaviorinonlinesocialnetwork[D].Beijing:BeijingUniversityofPostsandTelecommunications, 2014: 15-46.)

[6] 徐恪,張賽,陳昊,等.在線社會網絡的測量與分析[J].計算機學報,2014,37(1):165-188.(XUK,ZHANGS,CHENH,etal.Measurementandanalysisofonlinesocialnetworks[J].ChineseJournalofComputers, 2014, 37(1): 165-188.)

[7]CHAM,HADDADIH,BENEVENUTOF,etal.Measuringuserinfluenceintwitter:themillionfollowerfallacy[C]//ICWSM2010:Proceedingsofthe4thInternationalAAAIConferenceonWeblogsandSocialMedia.MenloPark,CA:AAAIPress, 2010:10-17.

[8]BAKSHYE,HOFMANJM,MASONWA,etal.Everyone’saninfluencer:quantifyinginfluenceontwitter[C]//WSDM2011:Proceedingsofthe4thACMInternationalConferenceonWebSearchandDataMining.NewYork:ACM, 2011: 65-74.

[9]CASTILLOC,MENDOZAM,POBLETEB.Informationcredibilityontwitter[C]//Proceedingsofthe20thInternationalConferenceonWorldWideWeb.NewYork:ACM, 2011: 675-684.

[10] 毛佳昕,劉奕群,張敏,等.基于用戶行為的微博用戶社會影響力分析[J].計算機學報,2014,37(4):791-800.(MAOJX,LIUYQ,ZHANGM,etal.SocialinfluenceanalysisforMicro-bloguserbasedonuserbehavior[J].ChineseJournalofComputers, 2014, 37(4): 791-800.)

[11] 張紹武,尹杰,林鴻飛,等.基于用戶分析的微博用戶影響力度量模型[J].中文信息學報,2015,29(4):59-66.(ZHANGSW,YINJ,LINHF,etal.AMicro-bloguserinfluentialmodelbasedonuseranalysis[J].JournalofChineseInformationProcessing, 2015, 29(4): 59-66.)

[12]AL-KHALIFAHS,AL-EIDANRM.Anexperimentalsystemformeasuringthecredibilityofnewscontentintwitter[J].InternationalJournalofWebInformationSystems, 2011, 7(2): 130-151.

[13]SAATYTL.Howtomakeadecision:theanalytichierarchyprocess[J].EuropeanJournalofOperationalResearch, 1990, 48(1): 9-26.

[14] 微風云.微風云榜[EB/OL].[2016- 04- 09].http://www.tfengyun.com/rankings.php.(TFENGYUN.MicroChart[EB/OL]. [2016- 04- 09].http://www.tfengyun.com/rankings.php.)

ThisworkispartiallysupportedbytheNationalNaturalScienceFoundationofChina(61370139),theProjectofConstructionofInnovativeTeamsandTeacherCareerDevelopmentforUniversitiesandCollegesUnderBeijingMunicipality(IDHT20130519).

LI Fumin, born in 1990, M. S. candidate. His research interests include Chinese information processing, data mining.

TONG Lingling, born in 1984, Ph. D., senior engineer. Her research interests include multimedia content analysis and coding, natural language processing.

DU Cuilan, born in 1966. Her research interests include network information security, natural language processing.

LI Yangxi, born in 1982, Ph. D.candidate, senior engineer. His research interests include machine learning, data mining.

ZHANG Yangsen, born in 1962, Ph. D., professor. His research interests include Chinese information processing, artificial intelligence, Web content security.

Weibo users credibility evaluation based on user relationships

LI Fumin1, TONG Lingling2*, DU Cuilan2, LI Yangxi2, ZHANG Yangsen1

(1.InstituteofIntelligenceInformationProcessing,BeijingInformationScienceandTechnologyUniversity,Beijing100192,China; 2.NationalComputerNetworkEmergencyResponseTechnicalTeam/CoordinationCenterofChina,Beijing100190,China)

With the deepening of Weibo research, credibility evaluation of Weibo users has become a research hotspot. Aiming at the problem of Weibo users’ credibility evaluation, a user confidence analysis method based on association was proposed. Taking Sina Weibo as the research object, firstly, seven characteristics of the user from three aspects: user information, interactive information and behavior information were analyzed, and the user self-evaluation credibility was got by using Analytic Hierarchy Process (AHP). Then, by using the user self-evaluation as the base point, the user relationship network as the carrier, and the potential users’ evaluation relationship among the users, was improved the PageRank algorithm, and the user credibility evaluation model called User-Rank was proposed. The proposed model was used to evaluate comprehensively credibility of users by other users in relational network. Experiments on large scale Weibo real data show that the proposed method can obtain good evaluation results of user credibility.

user self-evaluation; relationship network; user credibility; user relationships; Analytic Hierarchy Process (AHP); PageRank

2016- 09- 30;

2016- 10- 20。

國家自然科學基金資助項目(61370139);北京市屬高等學校創新團隊建設與教師職業發展計劃項目(IDHT20130519)。

李付民(1990—),男,河南商丘人,碩士研究生,CCF會員,主要研究方向:中文信息處理、數據挖掘; 佟玲玲(1984—),女,遼寧阜新人,高級工程師,博士,主要研究方向:多媒體內容分析與編碼、自然語言處理; 杜翠蘭(1966—),女,湖北武漢人,主要研究方向:網絡信息安全、自然語言處理; 李揚曦(1982—),男,甘肅蘭州人,高級工程師,博士研究生,主要研究方向:機器學習、數據挖掘; 張仰森(1962—),男,山西臨猗人,教授,博士,CCF高級會員,主要研究方向:中文信息處理、人工智能、Web內容安全。

1001- 9081(2017)03- 0654- 06

10.11772/j.issn.1001- 9081.2017.03.654

TP393.092

A

猜你喜歡
用戶評價信息
SBR改性瀝青的穩定性評價
石油瀝青(2021年4期)2021-10-14 08:50:44
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
基于Moodle的學習評價
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
保加利亞轉軌20年評價
多維度巧設聽課評價表 促進聽評課的務實有效
體育師友(2012年4期)2012-03-20 15:30:10
主站蜘蛛池模板: 中文国产成人久久精品小说| 91香蕉视频下载网站| 国产成人精品一区二区| 国产精品自在在线午夜| 污网站免费在线观看| 四虎国产成人免费观看| 欧美精品v欧洲精品| 黄色网址手机国内免费在线观看| 国产福利不卡视频| 亚洲自偷自拍另类小说| 亚洲成人播放| 网友自拍视频精品区| 四虎AV麻豆| 欧美日在线观看| www.精品国产| AV天堂资源福利在线观看| 情侣午夜国产在线一区无码| 国产精品刺激对白在线| 热热久久狠狠偷偷色男同| 黄色网站不卡无码| 超薄丝袜足j国产在线视频| 中文字幕无码中文字幕有码在线| 午夜色综合| 欧美日韩在线亚洲国产人| 亚洲AⅤ无码国产精品| 久久a毛片| 91小视频在线| 五月婷婷欧美| 日韩成人高清无码| 国产丰满大乳无码免费播放| 精品免费在线视频| 久久香蕉国产线| 999在线免费视频| 欧美成人午夜影院| 无码中文AⅤ在线观看| 黄色网页在线观看| 欧美成人精品在线| 五月天天天色| 亚洲综合色吧| 久久久久久久久亚洲精品| 日本三级欧美三级| 亚洲娇小与黑人巨大交| 国产一区二区三区免费观看| 亚洲日本中文字幕乱码中文| 欧洲日本亚洲中文字幕| 97视频精品全国在线观看| 日本伊人色综合网| 99视频精品全国免费品| 亚洲福利视频一区二区| h网站在线播放| 国产97视频在线| 就去色综合| 制服丝袜一区| 久久黄色影院| 久久性妇女精品免费| 亚洲成肉网| 亚洲三级成人| 免费人成在线观看成人片| 97综合久久| 毛片久久久| 日韩乱码免费一区二区三区| 久久青草精品一区二区三区| 四虎免费视频网站| 国产区人妖精品人妖精品视频| 国产九九精品视频| 国产欧美另类| 谁有在线观看日韩亚洲最新视频| 亚洲欧洲日韩综合| 亚洲日韩AV无码一区二区三区人| 亚洲天堂成人在线观看| 亚洲床戏一区| 国产成人欧美| 免费在线播放毛片| Aⅴ无码专区在线观看| 在线观看亚洲成人| 久久婷婷综合色一区二区| 手机永久AV在线播放| 在线国产欧美| 久久午夜夜伦鲁鲁片无码免费| 欧美日本一区二区三区免费| 免费 国产 无码久久久| 久久狠狠色噜噜狠狠狠狠97视色|