999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

云計算環境下影響力優化研究與實現

2018-03-28 06:33:13紅,左
小型微型計算機系統 2018年1期
關鍵詞:定義用戶

孫 紅,左 騰

1(上海理工大學,上海 200093) 2(上海現代光學系統重點實驗室,上海 200093)

1 引 言

隨著互聯網的發展,社交作為互聯網應用發展的必備要素,不再局限于信息傳遞,而是與溝通交流、商務交易類應用融合,借助其他應用的用戶基礎,形成更強大的關系鏈,從而實現對信息的廣泛、快速傳播.作為社交網絡的一種重要形式,微博(Weibo)有著即時發布、互動性強、簡便易用等特點,微博迅速發展為最為主流的社交平臺.據CNNIC發布的第39次《中國互聯網絡發展狀況統計報告》數據顯示[1],截至 2016 年 12月,微博的使用率為37.1%,與2016 年6月相比略有上漲.

微博作為一種重要的社會平臺,在社會、政治、生活等各個方面都成為一種重要的社會輿論載體.每一個微博用戶可以通過微博獲取實時的新聞資訊,了解朋友及其他名人,社會媒體等等其它一些我們關心的實時動態.如果一則消息在微博里面迅速傳播開,有很多人轉播,評論,點贊,那么這則微博相關的話題就會上微博頭條,從而會有更多的人知道這個話題,從而影響到社會輿論情況.如果某個微博用戶有眾多的粉絲和關注度,那么他發布的微博消息就會得到廣泛的關注,那么該用戶就可以影響信息的傳播.所以,現在就會有很多人通過購買水軍,來提高自己微博信息傳播的影響力,然而這些所謂的粉絲是不能夠當作正常微博用戶來看的,他們會照成謠言和不良信息的的散布,給社會帶來不好的影響和輿論恐慌.

本文主要利用海量的新浪微博用戶數量來進行相關研究,面對如此龐大的數據量,就必須利用并行化的方式來處理這些數據.數據并行處理(Data Parallel Processing)是指計算機系統能夠同時執行兩個或者更多個處理機的一種計算方法.并行處理的主要目的是節省大型和復雜問題的解決時間[2].為使用并行處理,首先需要對程序進行并行化處理,也就是說將工作各個部分分配到不同處理機中[3].當前比較常用的大數據分布式計算應用最具有代表性的有:MapReduce,Spark和GraphX.由于MapReduce模型簡單、易于理解、易于使用,極大地簡化了程序員的開發工作.而且大量數據處理問題,包括很多機器學習和數據挖掘算法,都可以使用MapReduce實現.為了提高計算效率,同時考慮到企業級大量數據中心正在采用云計算環境,云計算越來越普遍,而且開源云計算平臺巳經被廣泛應用,因此我們采用基于開源云計算平臺Hadoop的MapReduce架構進行并行處理,以縮計算時間,提高計算的效率和實時性[4].

2 研究背景

2.1 相關研究

微博最早起源于國外的,所以相關的研究算法也起源于國外學者的研究.因為Twitter作為微博的鼻祖,國外對微博的研究主要集中在對Twitter 的研究.目前有關微博影響力分析算法主要參考Google 的PageRank[5]算法及其改進后的算法[6,7]和HITS[8]算法及其改進后算法[9,10].PageRank算法模型是為了實現網頁排名,該算法也是Google使用的搜索結果排名中的重要組成部分.事實上,PageRank模型本質上是用于有向圖的節點級的計算技術,因此應用于用戶對微博的影響是自然的.借鑒PageRank算法的思想,在文獻[11]中提出了TwitterRank算法,該算法主要是衡量一個用戶在某一話題內的影響力,主要思想是給定一個話題,用戶的影響力定義為他的所有粉絲的影響力之和.但是該算法僅考慮擁有相似話題的用戶間相互的影響力,不具有一般性.文獻[12]中,對Twitter的傳播特性進行了分析,使用粉絲數量和微博轉發數量比對研究用戶在話題傳播過程中的影響,結果發現擁有眾多粉絲數量的微博用戶所發的微博不一定會得到很多的轉發或者評論,他們在微博中的轉發和引并不起絕對的影響,這表明用戶的粉絲數量和用戶的影響力并沒有直接關系,但是那些有影響力的用戶能夠在各種話題中產生顯著的影響.在文獻[13]里面,Xun Chen等人提出來Personal Rank算法,該算法也可以用于計算微博用戶的影響力,但是在計算時還是需要依賴PageRank算法.在文獻[14]里面,Jun Zhou等人使用回歸模型來預測每個用戶的影響力分數分析個人財產及其內容消息,而且他們的研究揭示了個體大多數用戶的影響隨時間而變化.在文獻[15]里,吳渝等通過對不同時間段的數據進行分析提取出意見領袖.在文獻[16]里面,Guo-Jun Mao等人對用戶的活躍度進行了分析,但是該文章里面只對用戶的評論數進行了分析,并沒有深入分析也沒有剔除“僵尸粉”的干擾.

2.2 計算框架

本文主要用到的是基于Hadoop的MapReduce計算框架,該框架主要是通過簡單有力的接口來實現自動化的并行化和大規模分布式計算,結合這個接口的實現在大量普通的PC機上實現高性能計算[17].在Hadoop里面,數據存儲的核心是HDFS文件存儲系統,HDFS使用Block(存儲快)對文件的存儲進行操作.在Hadoop中,數據處理核心為MapReduce程序設計模型.MapReduce把數據處理分為兩個主要的階段,即Map階段和Reduce階段.MapReduce作業的輸入是一系列存儲在Hadoop分布式文件系統HDFS上的文件,在Map階段之前,首先要對數據進行分塊處理成split,之后將數據信息交給Map任務去進行讀取,然后進行分類寫入.一個Map任務的執行過程和數據輸入輸出的形式如下所示:

Map:data→→list

Map階段主要是對輸入進行整合,通過用戶自己定義Map函數,定義輸入格式獲取文件信息和類型,并且確定讀取方式,最終將讀取的Split內容,解析成以鍵值對的形式保存.然后自定義的算法,將符合的數據分類,根據相同的key值生成若干條列表,該表存儲著具有相同key值的value組成的鍵值對(list).

一個Reduce任務的執行過程和數據輸入輸出的形式如下所示:

Reduce:>→list

Reduce是用來對結果進行后續處理.系統框架自動對Map輸出結果進行Shuffle和Sort處理,根據相同的鍵將其對應的值組合成一個集合的形式輸入給Reduce函數.

圖1 MapReduce流程圖Fig.1 MapReduce flow chart

通過接收到的鍵值對數據對Map獲取內容的值進行二次整理和歸并排序,最后以形式將計算結果輸出到文件存儲系統HDFS.MapReduce的處理過程如圖1所示.

3 MR-UIRank微博用戶影響力模型

3.1 PageRank模型

最初的PageRank模型,是Google在搜索引擎結果中對網站排名的核心算法.PageRank通過計算頁面鏈接的數量和質量來確定網站的重要性的粗略估計,PageRank 是基于從許多優質的網頁鏈接過來的網頁,必定還是優質網頁的回歸關系,來判定所有網頁的重要性.

為了方便研究,現給出與本文相關的公式定義.

定義1.(PageRank算法)對所有研究的網頁給定一個有向圖G=,它是由頂點的集合 V和邊的集合 A組成.網頁Pi∈(G)的排名可以用下面的公式來計算.

(1)

其中Mpi是所有對Pi網頁有出鏈的網頁集合,L(Pi)是網頁Pi的出鏈數目,N是研究網頁總數,α代表的是阻尼因子,取值范圍是0-1.根據上面的公式,我們可以計算每個網頁的PR(下文的所有的PR代表PageRank)值,在不斷迭代趨于平穩的時候,即為最終結果.圖2顯示了運用PageRank算法時,網頁Pi與網頁Pj之間的關系.

圖2 網頁Pi和網頁Pj的關系Fig.2 Page pi and page pj relationship

在表現網頁之間鏈接關系時,Google使用了矩陣,即下面的定義2.

定義2.(Google初始矩陣)我們可以用一個矩陣來表示這張圖的出鏈入鏈關系,初始矩陣S=(si,j),其中si,j代表網頁j跳轉到頁面i的概率.也就是說,對于i,j∈G,與有向圖G相關的Google矩陣可以被設置如下:

(2)

其中L(j)是網頁j的出站鏈接總數.

現在給出N為4的一個例子(共有A、B、C、D、E、F、G七張網頁)幫助說明這個矩陣.對于圖3所示的有向圖,其Google初始矩陣可以通過公式(2)獲得,圖4給出了Google初始矩陣S計算結果.

圖3 頁面有向圖Fig.3 A directed graph for page

圖4 Google 初始矩陣Fig.4 Google initial matrix

定義3.(Google矩陣)得到初始矩陣后,我們就可以計算PR值了,當只有α概率的用戶會點擊網頁鏈接,剩下(1-α)概率的用戶會跳到無關的頁面上去,而訪問的頁面恰好是這7個頁面中A的概率只有(1-α)/7(α是阻尼系數,Google在計算網頁排名的時候取α等于0.85,所以本文在這里也取0.85),所以真正的Google矩陣由公式(3)計算.

(3)

定義4.(PR值計算)在有向圖G及其Google矩陣GM里面,其中n是G中的節點數然后.于是得到Pn=GM×Pn-1,可以通過以下公式(3)逐級地迭代更新秩向量,直到得到Pn=Pn-1時,才算迭代完成,這時的Pn就是PR的值.于是計算PR值的過程就變成了一個 Markov 過程.

Pn=GM×Pn-1

(4)

3.2 MR-UIRank模型

傳統的PageRank模型可以幫助評估微博用戶的影響力,但其有效性并不被大多數人認可.傳統的PageRank模型僅考慮鏈接關系,即用戶與用戶之間的關注與被關注關系.把微博用戶的粉絲看作網站的入站鏈接,微博用戶關注的人看作網站的出站鏈接,這樣就可以把PageRank模型應用到計算微博用戶影響力里面來[18].但是,在計算影響力的時候,那些擁有眾多“僵死粉”的微博用戶的影響力就會被虛假提高,從而計算出來的影響力并不準確,其實那些擁有眾多“水軍”的用戶影響力并沒有那么高.所以,首先要剔除微博用戶的僵尸粉,在進行粉絲篩選的時候,需要選取高質量的粉絲.需要選取長期關注博主的粉絲,而不是近期突然增加的粉絲.

定義5.(粉絲選取)認定選取的粉絲集合為F,其中選取的粉絲是關注博主三個月以上的用戶.而且這些用戶在三個禮拜以內有和別人互動,且評論或者轉發過該博主的微博等這樣的交互行為.

F(i)={j|(j,i)∈A∪FT>3m∪AT>3w}

(5)

F(i)代表用戶i的粉絲集合,j代表其中一個粉絲,FT代表的是粉絲j關注博主的時間,大于三個月,AT代表粉絲j活躍的天數是三周.這一步只是對粉絲進行了篩選,剔除了一些僵死粉的干擾.選取完粉絲后就需要計算用戶的活躍度了,下面的定義6代表粉絲活躍度計算公式.

定義6.(用戶活躍度計算)用戶的活躍度包括很多條件,如用戶發布的微博數,轉發微博數,點贊微博數,評論微博數,@別人的微博數,收藏微博數量以及在微博中的活躍的天數.本文設定的時間段是最近三個月內微博用戶的活動情況,綜合這些條件,下面給定微博用戶i其活躍度的計算公式:

(6)

其中nbi是微博用戶i三個月內發布的微博數量,NB是整個微博里面所有微博用戶三個月內發布的微博數量;nri是微博用戶i三個月內轉發的微博數量,NRi是三個月內整個微博里面所有微博用戶轉發微博數量;nci是微博用戶i三個月內評論微博數量,NCi是三個月內整個微博里面所有微博用戶評論微博數量;nli是微博用戶i三個月內點贊微博數量,NLi是三個月內整個微博里面所有微博用戶點贊微博數量;nai是微博用戶i三個月內“@”其他用戶微博數量,NAi是三個月內整個微博里面所有微博用戶“@”其他用戶微博數量;di是微博用戶i三個月內的活躍天數,Di是三個月內整個微博里面所有微博用戶平均活躍天數.

在研究了用戶的活躍度之后,但還需要對用戶的微博質量進行研究.微博的質量體現在微博的內容是否健康,真實,是否對我們整個社會有一定的影響.例如那些在微博里面散布廣告,發布虛假消息的微博用戶,那么他們的這些行為對于整個微博環境,對于整個社會帶來了負面的影響,應當予以否定.所以,在選取微博內容時,就需要剔除那些質量較差的微博,選取能夠對于社會產生正面影響的微博.因此,在篩選微博數據的時候,本文就選取了和社會話題相關的微博作為研究對象.同時對用戶微博被評論的數量,被轉發的數量,被點贊的數量,和被收藏數量進行研究.如果微博被眾多人評論,轉發,點贊和收藏自然說明該用戶的影響力要高.根據上面提出的思想,下面的定義7給出了在用戶微博質量的簡單評估計算方法.

定義7.(用戶微博質量計算)對由于用戶發布微博,有著不確定性,且微博的內容和每天發生的事情有關,所以,在選取微博內容的時候,本文選取了最近三個月的微博內容作為實驗的對象.于微博用戶i,選取的研究話題為社會話題為SI(Social Issues),用戶微博質量計算公式如下:

(7)

(8)

(9)

(10)

(11)

Quality(i)=QSI(i)+QR(i)+QC(i)+QL(i)+QF(i)

(12)

其中nsii是用戶i發布與主題SI相關的微博數量,Ni是用戶i在微博中發布的所有微博數量;rsii是用戶i發布與主題SI相關的微博被轉發的數量,Ri是在微博里面所有被轉發的微博數量;csii是用戶i發布與主題SI相關的微博被評論的數量,Ci是在微博里面所有被評論的微博數量;lsii是用戶i發布與主題SI相關的微博被點贊的數量,Li是在微博里面所有被點贊的微博數量.fsii是用戶i發布與主題SI相關的微博被收藏的數量,Fi是在微博里面所有被收藏的微博數量.研究的時間段是最近的三個月.

此外,還有另一個因素也可以在很大程度上反映用戶的影響力,就是微博用戶的可信度.比如微博里面的那些大V,一些經過官方認證博主,那么他們的發言就會很有影響力,人們愿意相信這些人所發布的微博.目前在新浪微博平臺上已經提供認證機制,共有四種認證方式.第一種是興趣認證,第二種是自媒體認證,第三種是身份認證,最后一種是官方認證.在此,本文利用微博上不同的認證,給出不同的用戶信譽度.定義8給出了在微博上用戶可信度的簡單計算方法.

定義8.(微博用戶可信度)對于微博用戶i,其可信度可以計算公式如下:

(13)

在進行運算PageRank算法之前還需要修改微博用戶的權重,由定義9給出.

定義9.(微博用戶權重)對于微博用戶i,它的權重w(weiht)計算公式如下:

w(i)=Activity(i)+Quality(i)+Credibility(i)

(14)

然后將用戶權重加入進原始PageRank模型計算.

定義10.(加權Google矩陣)對于有向圖G=,令其加權的Google矩陣Z=(zi,j),其中zi,j計算如下:

(15)

公式(15)中的zi,j是公式(3)中的值gmi,j與用戶權重w(i)的乘積,所以加權的Google矩陣考慮的用戶的鏈接結構包括用戶活躍度,用戶微博質量和用戶可信度等因素.假設已經獲得圖1中每個節點的評估參數,如令w(A)=w1,w(B)= w2,w(C)= w3,w(D)=w4,w(E)=w5,w(F)=w6,w(G)=w7那么通過計算,就可以獲得加權后的的Google矩陣Z.

4 實驗與分析

4.1 實驗數據

在獲取新浪微博數據時,首先要先注冊新浪微博賬號,然后利用該賬號在新浪微博開放平臺完成開發者的注冊,注冊身份為學生,然后在開放平臺上創建一個應用,創建完應用后,開發者會得到獲取兩個非常重要的參數App Key和Secret Key.在創建應用過程中需要填寫一個授權回調頁.應用創建完成后,就可以利用新浪官方API進行開發了.首先進入開放平臺,在文檔里面資源下載和API選項,首先需要在資源下載下面下載相關的SDK,本文用到的是JAVA SDK.下載完了JAVA SDK后就需要導入到eclipse里面,然后是配置下載下來的JAVA SDK.主要改一個文件,src文件夾下面的config.properties,配置如下參數.

1.client_ID:appkey 創建應用獲取到的appkey (App Key)

2.client_SERCRET:app_secret 創建應用獲取到的appsecret(Secret Key)

3.redirect_URI:回調地址 OAuth2的回調地址(就是在高級信息里面填寫的授權回調頁).

在配置好配置文件后就需要進行Oath2.0認證,這是在調用所有API之前都需要進行的操作.

調用example下面weibo4j.examples.oauth2包里面的 OAuth4Code.java.如果這個步驟完成了就可以任意調用微博API了.然后再微博API選項下面查閱相關的API文檔,就可以在eclipse里面下載到需要用到的數據.然后利用微博API獲取了64678個微博用戶,其中包含用戶的基本信息和用戶關系網絡和發布的微博信息等一些數據,然后從64678個用戶里面選擇3958個微博用戶作為實驗對象.雖然3958個用戶只是新浪微博用戶總數的一小部分,但這些用戶的關系是相對完整的,所以我們可以使用它們來測試我們的算法在本文中的有效性.

4.2 實驗環境

本次實驗采用4臺PC機搭建云計算Hadoop平臺,其中每臺機器的配置均為:Intel 酷睿i7 6700HQ 3.5GHz,內存DDR4 2133MHz 16GB,硬盤2TB.在每臺PC機操作系統為64位Centos7 linux,而且配置安裝Hadoop 的版本為2.7.3、JDK為jdk-8u111-linux-x64版本以及其他環境配置.

搭建的云計算hadoop平臺集群設置信息如圖5所示.

圖5 Hadoop集群設置Fig.5 Hadoop cluster settings

4.3 實驗結果

本文對實驗結果進行比較分析選取社會問題作為PageRank和MR-UIRank算法計算時的主題,分別對傳統的PageRank算法和本文提出的MR-UIRank算法計算出的用戶影響力進行排序,列出PageRank算法和MR-UIRank算法影響力排名前10的用戶.計算結果如表1和表2所示.表中的微博數是用戶最近三個月所發布的微博數量.

表1 PageRank算法計算結果
Table 1 Calculation by Pagerank

排名微博用戶名粉絲數微博數認證1新手指南172567565125官方2微博管理員15672263666官方3謝娜88124987159身份4陳坤8075713074身份5姚晨80321437172身份6趙薇7898828640身份7何炅82099269122身份8angelababy7802469630身份9人民日報509764113060官方10央視新聞485761653335官方

通過對表1的分析,可看傳統的PageRank算法在計算時的最注重的是粉絲數量,而忽略了用戶的自身行為活動,而且他們近期發布的微博數量也比較少.我們可以看出:排名靠前的都是影視大咖等這一些知名度較高的微博用戶,他們的歌迷,影迷,粉絲眾多從而導致他們的影響力很高.由此本文發現排名第一和第二微博用戶是新手指南和微博管理員,但是他們實際的影響力并沒有計算結果那么高.他們的排名之所以這么高是應為他們擁有眾多粉絲,他們擁有粉絲數量是排名第三微博用戶(謝娜)的將近兩倍,因為他們擁有這么多的粉絲數量,在傳統的PageRank算法計算影響力的時候就把他粉絲的影響力加權起來了,這樣影響力就比其他用戶的高了許多.擁有這么多粉絲數量的原因是在用戶最開始注冊微博的時候就系統就幫微博用戶就自動關注了他們,而且用戶也沒有去取消關注,還有就是當微博用戶不去用他們的微博賬號后,之前的微博賬號不能注銷,所以這樣在無形之中就產生了“僵尸用戶”,而且這些“僵尸用戶”也不會被系統清除,所以他們的粉絲才會這么多,但其活躍度相對而言不是很高.所以在目前微博里面就會有明星花錢去買粉絲,來提高自己的想象力,提高自己的知名度.在表1里面,我們還可以看到,人民日報和央視新聞也擠入了前十,雖然他們得粉絲數量和前面的微博用戶相差很大,但是發布的微博數量多.

表2 MR-UIRank算法計算結果
Table 2 Calculation byMR-UIRan

排名微博用戶名粉絲數微博數認證1中國新聞網310891102803官方2人民日報509764113060官方3央視新聞485761653335官方4新浪新聞106879172855官方5人民網371373675422官方6法制晚報161633113929官方7環球時報71063714877官方8中國經營報23364983075官方9成都商報274330323535官方10Vista看天下514359421898官方

分析表2可以發現MR-UIRank算法得到的結果和粉絲數量沒有呈現出正相關的關系.而微博用戶的自身的活動,他的微博數量,所發布微博的內容等一些他的動態行為成了評論影響力強有力的標準.排名靠前的是中國最具權威的報刊和新聞媒體人民日報和央視新聞,可以看到,他們的粉絲數量和微博數量都是非常高的.MR-UIRank算法的前10個用戶他們都是官方認證用戶,而且發布了足夠的微博,粉絲.此外,為了評估文章的質量,我們把主題放在社會問題上,所以MR-UIRank算法得到的前10個用戶,大多是官方認證的新聞媒體,他們具有更大的權威性,而且這10個用戶里面沒有一個娛樂明星,這也說明這些娛樂明星發布的微博很少與社會話題有關,通過查看他們的微博,他們發布的微博話題大多數都是他們的日常生活或者一些宣傳,因此在MR-UIRank算法里面他們都排不上名.PageRank算法在評估用戶影響力時沒有考慮到用戶自身的動態行為,而是依賴于粉絲數量,過于簡單片面,所以在一定程度上受到“僵尸粉的”干擾.

圖6 時間比較Fig.6 Time comparison

為了比較效率,本文用不同數量的用戶測試了傳統方式計算的時間和MR-UIRank算法執行時間的變化與比較.本文分了七個,分別包括1000,1500,2000,2500,3000,3500和4000個微博用戶數量.計算結果如圖6所示.

從圖6可以看出,MR-UIRank算法的執行時間明顯低于在相同數據容量下執行的傳統方式計算時間.這是因為與傳統計算方式算法相比,MR-UIRank算法利用了MapReduce計算框架,這樣就明顯提高了計算的效率,縮短了計算時間.而且,隨著計算數量的不斷增加,MR-UIRank算法的效率會明顯提高,優勢會越來越大.所以在進行大規模的計算時,運用MapReduce計算框架能夠明顯提高時效性,使得算法運行得到優化.

5 結束語

本文分析了微博社交網絡的用戶的關系網絡和自身的行為,結合傳統Pagerank算法,運用云計算平臺進行計算,結果表明本文的算充分法考慮用戶的實際活動行為以及用戶的粉絲,使得挖掘結果更客觀和準確,可以獲得更加全面,真實的結果,更好的反應微博用戶影響力.而且運用云計算后的計算效率比傳統的計算更加高效,節省時間.

在下一步的研究中,將會研究算法的高效性和準確性,在提高準確度的情況下提升效率,縮短計算時間,以便于應對更加規模龐大的數據量計算.

[1] The 39thstatistical report on Internet development in China[R].Beijing:China Internet Network Information Center,http://www.cnnic.net.cn/,2016.

[2] Fu Cheng-long.Study of parallel production technology of remote sensing product and its application[D].Zhengzhou: Henan University,2014.

[3] Sun H,Chen S P,Jin C,et al.Research and simulation of task scheduling algorithm in cloud computing[J].Telkomnika Indonesian Journal of Electrical Engineering,2013,11(11):6664-6672.

[4] Xu Ya-bin,Li Zhuo,Dong Yuan.The quick spam filtering method based on social computing and machine learning[J].Systems Engineering-Theory & Practice,2014(S1):179-186.

[5] Page L,Brin S,Motwani R,et al.The pagerank citation ranking:bringing order to the web[R].Stanford InfoLab,1999.

[6] Lamberti F,Sanna A,Demartini C.A relation-based page rank algorithm for semantic web search engines[J].IEEE Transactions on Knowledge & Data Engineering,2009,21(1):123-136.

[7] Jing Y,Baluja S.Pagerank for product image search[C].International Conference on World Wide Web,ACM,2008:307-316.

[8] Kleinberg J M.Authoritative sources in a hyperlinked environment[C].Acm-Siam Symposium on Discrete Algorithms,Society for Industrial and Applied Mathematics,1998.

[9] Liu Y,Lin Y.Supervised HITS algorithm for medline citation ranking[C].IEEE International Conference on Bioinformatics and Bioengineering,Bibe 2007,Harvard Medical School,Boston,Ma,Usa,2007:1323-1327.

[10] Asano Y,Tezuka Y,Nishizeki T.Improvements of HITS algorithms for spam links[C].Joint,Asia-Pacific Web and,International Conference on Web-Age Information Management Conference on Advances in Data and Web Management,Springer-Verlag,2007:200-208.

[11] Jianshu Weng,Ee-Peng Lim,Jing Jiang,et al.TwitterRank:finding topic-sensitive influential twitterers[C].ACM International Conference on Web Search and Data Mining (WSDM),2010.

[12] Cha M,Haddadi H,Benevenuto F,et al.Measuring user influence in twitter:the million follower fallacy[C].International Conference on Weblogs and Social Media (ICWSM),2010.

[13] Chen Xu,Wang Peng-fei,Qin Zheng,et al.HLBPR:a hybrid local Bayesian personal ranking method[C].International Conference Companion on World Wide Web,International World Wide Web Conferences Steering Committee,2016:21-22.

[14] Zhou Jun,Zhang Yan,Wang Bing,et al.Predicting user influence in microblogs[C].Computer Communication and the Internet (ICCCI),2016 IEEE International Conference on IEEE,2016:292-295.

[15] Wu Yu,Ma Lu-lu,Lin Mao,et al.Discovery algorithm of opinion leaders based on user influence[J].Journal of Chinese Computer Systems,2015,36(3):561-565.

[16] Mao G J,Zhang J.A pagerank-based mining algorithm for user influnces on micro-bloges [C].Pacific Asia Conference on Information Systems(PACIS),2016.

[17] Pan Quan,Guo Ming,Lin Peng.An algorithm for the maximum clique based on MapReduce[J].Systems Engineering-Theory & Practice,2011,(S2):150-153.

[18] Xu Wen-tao,Liu Feng,Zhu Er-zhou.Research on novel ranking algorithm of microblog user′s influence based on MapReduce [J].Computer Science,2016,43(9):66-70.

附中文參考文獻:

[1] 第39次中國互聯網絡發展狀況統計報告[R].北京:中國互聯網絡信息中心,http://www.cnnic.net.cn/,2016.

[2] 付成龍.遙感產品并行生產技術的研究及其應用[D].鄭州:河南大學,2014.

[4] 徐雅斌,李 卓,董 源.基于社會計算和機器學習的垃圾郵件快速過濾[J].系統工程理論與實踐,2014,(S1):179-186.

[15] 吳 渝,馬璐璐,林 茂,等.基于用戶影響力的意見領袖發現算法[J].小型微型計算機系統,2015,36(3):561-565.

[17] 潘 全,郭 鳴,林 鵬.基于MapReduce的最大團算法[J].系統工程理論與實踐,2011,(S2):150-153.

[18] 徐文濤,劉 鋒,朱二周.基于MapReduce的新型微博用戶影響力排名算法研究[J].計算機科學,2016,43(9):66-70.

猜你喜歡
定義用戶
永遠不要用“起點”定義自己
海峽姐妹(2020年9期)2021-01-04 01:35:44
定義“風格”
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
成功的定義
山東青年(2016年1期)2016-02-28 14:25:25
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
100萬用戶
創業家(2015年10期)2015-02-27 07:54:39
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
修辭學的重大定義
當代修辭學(2014年3期)2014-01-21 02:30:44
主站蜘蛛池模板: 亚洲精品天堂自在久久77| 国产玖玖视频| 欧美国产视频| 国产黄色爱视频| 国产精品天干天干在线观看| 亚洲AⅤ波多系列中文字幕| 久久国产黑丝袜视频| 人妻21p大胆| 亚洲国产精品一区二区第一页免| 国产精品不卡永久免费| 久久亚洲AⅤ无码精品午夜麻豆| 亚洲AV无码乱码在线观看裸奔 | 久久精品国产91久久综合麻豆自制 | 无码内射中文字幕岛国片| 午夜激情婷婷| 国产精品手机在线观看你懂的| 内射人妻无码色AV天堂| 欧洲成人在线观看| 国产成人精品一区二区三区| 国产人成乱码视频免费观看| 无码福利日韩神码福利片| 亚洲激情99| 中文字幕永久在线看| 欧美亚洲日韩中文| 香蕉综合在线视频91| 秘书高跟黑色丝袜国产91在线 | 99在线观看免费视频| 亚洲欧美一区二区三区图片| 国产99精品久久| 伊人久久婷婷| 亚洲色图另类| 久久综合一个色综合网| 成人亚洲国产| 亚洲福利一区二区三区| 欧美日韩免费| 国产喷水视频| 国产丰满大乳无码免费播放| 9久久伊人精品综合| 在线视频亚洲色图| av午夜福利一片免费看| 91麻豆国产视频| 成人午夜在线播放| 久久久久无码国产精品不卡| 国产一区免费在线观看| 欧美午夜理伦三级在线观看| 欧美日韩国产综合视频在线观看| 国产人成乱码视频免费观看| 亚洲国产黄色| 秋霞午夜国产精品成人片| 中文字幕一区二区人妻电影| 99精品免费在线| 91精品专区| 美女毛片在线| 女人18毛片一级毛片在线 | 综合久久五月天| 亚洲伦理一区二区| 日韩高清欧美| 久久亚洲欧美综合| 国产正在播放| 人人艹人人爽| 中文字幕伦视频| 午夜视频日本| 亚洲中文字幕手机在线第一页| 国产本道久久一区二区三区| 国产成人无码AV在线播放动漫 | 精品国产免费第一区二区三区日韩| 茄子视频毛片免费观看| 国产区在线观看视频| 超清人妻系列无码专区| 国产精品久久久久久久久kt| 97超碰精品成人国产| аⅴ资源中文在线天堂| 天堂av综合网| 亚洲欧美日韩另类在线一| 尤物特级无码毛片免费| 亚洲精品制服丝袜二区| 国产国拍精品视频免费看| 天天综合网色| 亚洲精品国产综合99| 美女视频黄频a免费高清不卡| 国产成人a毛片在线| 漂亮人妻被中出中文字幕久久|